タグ

AIに関するtoyaのブックマーク (216)

  • Hello GPT-4o

    GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, and image and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversation. It

    Hello GPT-4o
    toya
    toya 2024/05/14
  • 画像生成AIとしても超進化したChatGPT「GPT-4o」

    OpenAIは5月13日(現地時間)、「Spring Update」と題したオンラインプレゼンテーションを配信。新しい大規模言語モデル(LLM)「GPT-4o(オー)」がお披露目された。 プレゼンテーションではまるで人間と話しているような音声会話機能が話題になっているが、実はウェブサイトに掲載された記事を見ると画像生成機能も大幅に性能アップしていたことがわかった。 一貫性の保持。AIコミックが描けるぞ! 今回のプレゼンテーションではなぜかまったくと言っていいほど触れられていなかったが、画像生成AI「DALL-E 3」(おそらく)を使用した画像生成能力も大幅に進化しているようだ。 まず、いちばん驚いたのは画像の一貫性の保持だ。なぜなら、DALL-E 3やStable Diffusionなどの画像生成AIにとって「同じキャラクター」を生成するのは最も苦手な仕事だからだ。

    画像生成AIとしても超進化したChatGPT「GPT-4o」
    toya
    toya 2024/05/14
  • LLM時代のX情報収集術|べいえりあ

    AI for Everyoneについては日語版もあるのと、どちらのコースも日語字幕付きで見られる(多分機械翻訳での英語字幕からの翻訳だが、翻訳の質は悪くない)ので、英語分からなくてある程度何とかなるんじゃないかと思います。 あと、余力のある人、最新のNLP研究を理解したい人はこちらのを読むことをオススメします。アルゴリズムの詳細は必ずしも理解しなくても良いですが、どんなタスクがあるのかは理解しておいた方が良いかと思います。 NLPの知識がLLMを応用する上で実際にどう役に立つかですが、例えばで言うとNLP的には対話の中には「タスク指向型対話(task-oriented dialogue)」と「雑談(chit-chat dialogue)」があります。それぞれ対話の中で重要視されるものから評価の仕方まで全然違うのですが、NLPをやらずにLLMをやっている人と話しているとこれらをごっちゃ

    LLM時代のX情報収集術|べいえりあ
  • Google Geminiアプリが日本でも利用可能に

    Google Geminiアプリが日本でも利用可能に
    toya
    toya 2024/05/02
  • 【Copilot for Microsoft 365】企画書の草稿はAIにお任せ! イメージを伝えれば高速生成【残業を減らす!Officeテクニック】

    【Copilot for Microsoft 365】企画書の草稿はAIにお任せ! イメージを伝えれば高速生成【残業を減らす!Officeテクニック】
  • 【JDLA公式】Generative AI Test

    Generative AI Testで、 生成AI導入の推進者に 生成AIに関する知識を客観的に証明し、 自信とチャンスを手に入れませんか?

    【JDLA公式】Generative AI Test
    toya
    toya 2024/04/30
  • 文章作成のAIアシスタント | DeepL Write Pro

    DeepL Write Proは、文章作成で頼れるAIアシスタントです。英語ドイツ語で、自信を持って明確なコミュニケーションを取れるようになります。どこで作業していても、DeepL Write Proが文法の誤りを正し、最適な言い回しや目的に合った文体を提案してくれるため、文章を素早く改善できます。

    文章作成のAIアシスタント | DeepL Write Pro
    toya
    toya 2024/04/26
  • ChatGPTを使って一年、結局何に使ってる? - paiza times

    <この記事の著者> 大谷大 - Tech Team Journal ウェブデザイナー/映像クリエイター/作曲家/ギタリスト/ブロガー/YouTuber BGMや効果音を無料でダウンロードできるサービス「タダオト」を運営し、自らが作曲した楽曲を掲載。2023年に生成AIにハマり、さまざまな仕事でフル活用しながらそのノウハウをYouTubeやブログで情報発信している。 「普段ChatGPTで何してるの?」という質問を受けることがあります。 さまざまなことができる自由度の高いツールであるが故に、どう使っていいか迷ってしまうんでしょうね。 今回は、ChatGPTを一年以上使ってきた僕なりにいま特に使用頻度が高い使い方を羅列してみます。 【目次】 コードを書いてもらう ブログ記事でHTMLのマークアップ 画像生成AIのプロンプトを書いてもらう 誰かに相談をする前にChatGPTで要件を整理 雑なメモ

    ChatGPTを使って一年、結局何に使ってる? - paiza times
    toya
    toya 2024/04/25
  • メタ、オープンソースのAI「Llama 3」でOpenAIとグーグルに宣戦布告 | Forbes JAPAN 公式サイト(フォーブス ジャパン)

    インスタグラム、フェイスブック、WhatsAppの親会社であるメタは先にスタンドアロン型のAIチャットボットと高性能なオープンソースモデル「Llama 3」を発表し、AI分野への格参入を表明した。これにより、グーグルOpenAIなど、強力なAIシステム開発を競う企業間の競争が激化する。 メタはAIアシスタント「Meta AI」がフェイスブック、インスタグラム、WhatsApp、メッセンジャーアプリの検索バーに統合され、フェイスブックのメインフィードをスクロールする際にもアクセスできるようになったと発表した。 Meta AIはウェブサイトMeta.aiを通じてスタンドアロンツールとしても提供される予定だ。 Meta AIは、同社のアプリ内では数カ月前から利用可能だったが、今回の発表により、メタのソーシャルメディアエコシステム外で独立したプロダクトとして初めて利用可能になる。 これまでの制

    メタ、オープンソースのAI「Llama 3」でOpenAIとグーグルに宣戦布告 | Forbes JAPAN 公式サイト(フォーブス ジャパン)
    toya
    toya 2024/04/23
  • ChatGPTの Assistants API でPDFを要約 - Taste of Tech Topics

    こんにちは、安部です。 最近急に、暖かさを通り越して暑いぐらいになってきましたが、皆さまいかがお過ごしでしょうか。 季節外れかなとも思いつつ、もう半袖で過ごしたいくらいの気候ですね。 さて、今回は、OpenAIのAssistants APIの使い方を紹介していきます。 題材は「PDFを和訳して要約してもらう」としました。 これはWeb版のChatGPTでも単にPDFファイルを添付して依頼すればできますが、APIの使い方を示すサンプルとしてはちょうどよいと思います。 最新情報については以下の公式ドキュメントをご覧ください。 https://platform.openai.com/docs/assistants/overview https://platform.openai.com/docs/api-reference/assistants それでは早速、Assistants APIの使い方

    ChatGPTの Assistants API でPDFを要約 - Taste of Tech Topics
    toya
    toya 2024/04/18
  • LLM校正CIを自社のブログに導入してみた - NTT Communications Engineers' Blog

    マネージド&セキュリティサービス部サービスプラットフォーム部門の田中です。 2023年度の下期にダブルワークという社内施策で、イノベーションセンター生成AIチームに参加しました。 その取り組みとして、ブログの記事データを管理している GitHub リポジトリに LLM (大規模言語モデル) の1つである GPT-4 を用いた校正CIを導入してみました。 適切なプロンプトを得るための試行錯誤や、この記事自体を校正させてみた結果をお伝えします。 目次 目次 背景 LLM校正CIの詳細 プロンプトの試行錯誤 この記事の校正結果 おわりに 背景 ブログ記事のデータ管理やレビューには GitHub を利用しています。 投稿者は記事を執筆した後 PR (Pull Request) を出し、レビュアーが PRコメントで記事の修正を提案し、推敲していきます (なお、GitHubを活用した記事公開プロセ

    LLM校正CIを自社のブログに導入してみた - NTT Communications Engineers' Blog
    toya
    toya 2024/04/18
  • AIを使った論文の読み方

    近年の AI の進歩により、論文の読み方も大きく変化を遂げました。AI を活用することで以前と比べてはるかに簡単かつ早く論文が読めるようになりました。 以前私の個人ブログにて、論文の読み方やまとめ方を紹介しました。その時には要約ツールは用いていませんでしたが、最近はすっかり要約ツールを多用するようになりました。 稿では、最新の AI を使った論文の読み方を丁寧に紹介します。 基的な流れ 稿でおすすめするのは ChatGPT か Claude で要約を生成して論文の概要をつかみ、Readable で精読するという方法です。ChatGPT や Claude では単に全体の要約を生成するだけでなく、肝となる箇所を特定したり理解するためにも用います。具体的な手順については後の項で解説します。 私が特定のテーマについて調査を行う場合には、テーマに関係する論文を被引用数の多いものを中心に 10

    toya
    toya 2024/04/18
  • LLMを活用した大規模商品カテゴリ分類への取り組み | メルカリエンジニアリング

    こんにちは、メルカリの生成AIチームで ML Engineer をしている ML_Bear です。 以前の記事[1]では商品レコメンド改善のお話をさせていただきましたが、今回は、大規模言語モデル (LLM) やその周辺技術を活用して30億を超える商品のカテゴリ分類を行なった事例を紹介します。 ChatGPTの登場によりLLMブームに火がついたということもあり、LLMは会話を通じて利用するものだと認識されている方が多いと思いますが、LLMが有する高い思考能力はさまざまなタスクを解決するためのツールとしても非常に有用です。他方、その処理速度の遅さや費用は大規模なプロジェクトでの活用にあたっての障壁となり得ます。 記事では、こうしたLLMの課題を克服するためにさまざまな工夫を施し、LLM及びその周辺技術のポテンシャルを最大限に引き出して大規模商品データのカテゴリ分類問題を解決した取り組みについ

    LLMを活用した大規模商品カテゴリ分類への取り組み | メルカリエンジニアリング
    toya
    toya 2024/04/16
  • ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)

    3月4日の公開以来、「Claudeやばくない?」「GPT-4を越えた」と、界隈で話題の「Claude 3」は、OpenAIの元メンバーによって設立されたAIベンチャー「Anthropic」が開発する最新の大規模言語モデル(LLM)だ。今回はChatGPTのライバルClaude 3の有料版を2週間ほどヘビーに使ってみて感じたことを、良い点と悪い点どちらも書いていきたいと思う。 Claude 3とは? 既報の通り、Claude 3はAnthropicが開発する大規模言語モデルの名称だ。 パラメーターのサイズなどが異なる3つのモデルがラインアップされている。 「Claude 3 Opus」は最も知能が高く、複雑なタスクでも最高のパフォーマンスを発揮する強力なモデル。APIやデータベースを介した複雑なアクションの計画や実行、インタラクティブコーディングなどの高度な活用が想定されている。 「Clau

    ChatGPTのライバル「Claude 3」の使い方 良い点、悪い点まとめ (1/5)
    toya
    toya 2024/03/22
  • プロダクトマネージャーがChatGPTを使い倒してみた - ハウテレビジョンブログ

    はじめに 現在ハウテレビジョンで外資就活ドットコムという挑戦志向の学生向けの就活(キャリア)支援プロダクトのPdM(プロダクトマネージャー)とプロダクトチームのマネージャーをしております。 習うより慣れろ、ChatGPTSlack への導入で詳しく記載していますが、ハウテレビジョンでは全社にChatGPTを導入しました。 Slackに部門別にChatGPT API を呼び出す bot を用意して、全社員が利用できる状態となっております。 私自身も様々な業務シーンでChatGPT APIを使い、一部の業務では感動するレベルで生産性が高まったと強く実感しています。 記事では具体的にどういう業務で活用しているかを紹介できればと思います。 私と同じプロダクトマネージャーの方やそうでない職種の方に一つでも参考になれば嬉しいです。 実際にどういう使い方をしているのか 具体的な業務例をあげながら

    プロダクトマネージャーがChatGPTを使い倒してみた - ハウテレビジョンブログ
    toya
    toya 2024/03/22
  • claude3を使ってみたら、ライティングの仕事が無くなるかもしれない瞬間を目の当たりして、衝撃を受けた件|池田 亮平

    claude3を使ってみたら、ライティングの仕事が無くなるかもしれない瞬間を目の当たりして、衝撃を受けた件 ひと言で結論を言うと、昨日はclaude3に衝撃を受けて、興奮して眠れませんでした…。 四の五の言わずにアウトプットを見せちゃいたいんですが、 ●打合せをZoom録画 ↓ ●録音データをCLOVA noteに放り込んでテキスト化 ↓ ●出てきたテキストファイルをノールックでclaude3に添付して、たった4行のプロンプトで指示 CLOVA noteに放り込むところから、トータルの所要時間、長めに見積もっても10分。それで出てきたのがこれです ↓ 【タイトル】 SFプロトタイピングが拓く、KOBIRAの未来 ~物語を通じて、全社で創る10年後のビジョン~ 【文】 先日、「SFプロトタイピング」という新しい手法について、詳しくレクチャーを受ける機会がありました。講師を務めてくださったの

    claude3を使ってみたら、ライティングの仕事が無くなるかもしれない瞬間を目の当たりして、衝撃を受けた件|池田 亮平
    toya
    toya 2024/03/19
  • Claude 3 Opusを試してみました - karaage. [からあげ]

    Claude 3 Opusに課金しました Claude 3 Opusの評判があまりによいので、課金してしまいました。 色々試してみました。ベースにしたのは公式プロンプトです。 Claude 3 Opusに無茶ぶりで 「完全に完成した Web アプリゲームを 1 つの HTML ファイルとして作成してください。ヴァンパイアサバイバーみたいなゲームがいいです。」 ってお願いしたら、一発で脳汁ドバドバ出るゲーム作ってきたので笑っちゃった pic.twitter.com/2i5gGlICbN— からあげ (@karaage0703) 2024年3月17日 プロ驚かない屋として、初のYouTube配信もしてみました。 配信中に作ってみた、インタラクティブでクリエイティブなWebサイトです。 結果、何度も驚いたり、家族からかかってきて電話で中断し、しかもマイクの設定のせいでその会話がうっすら聞こえると

    Claude 3 Opusを試してみました - karaage. [からあげ]
    toya
    toya 2024/03/18
  • 高木浩光@自宅の日記 - Claude 3に例の「読了目安2時間」記事を解説させてみた

    ■ Claude 3に例の「読了目安2時間」記事を解説させてみた Anthropicの先日出たばかりのClaude 3(Opus)が、ChatGPTのGPT-4を超えてきたと聞いて、自分の原稿を解説させてみたところ、確かに革新的な進歩が見られる。もはや内容を「理解」しているようにしか見えない。GPT-4では、昨年11月に試した時には、そうは見えず、優れた文章読解補助ツールという感じでしかなかった。 一昨年のCafe JILIS「高木浩光さんに訊く、個人データ保護の真髄 ——いま解き明かされる半世紀の経緯と混乱」は、発表した当時、長すぎて読めないから誰か要約してという悲鳴があがっていた。その後、ChatGPTの登場で、その要約能力に期待されたが、冒頭のところしか要約してくれなかったり、薄い論点リストが出てくるだけで、その期待に応えられるものではなかった。 もっとも、GPT-4でも、質問力があ

    toya
    toya 2024/03/12
  • ChatGPTによるDALL・Eでの画像生成のプロンプトついての補足

    ChatGPTによる画像生成の仕組み 面倒なことはChatGPTにやらせようという書籍を書いています。 サポートサイトから加入できる書籍のコミュニティ(ChatGPTにやらせ隊)があるのですが、そこでの議論で話題になったので、ChatGPTでの画像生成に関して、書籍では触れなかった点について少し補足をしておきたいと思います。なお、自分が知る限り、このあたりのオフィシャルな仕様は公開されていないので、ChatGPTの挙動とDALL・Eおよび一般的な画像生成AIの仕様から推測したものになり、誤っている可能性あることはご了承ください。 ChatGPTによる画像生成のプロンプト ChatGPTでは、絵を生成することができます。内部ではDALL・Eという画像生成AIが動いています。 例えば以下のように「からあげの絵を描いてください」というプロンプトを使うと、からあげの絵が生成されます。 実は、このと

    ChatGPTによるDALL・Eでの画像生成のプロンプトついての補足
    toya
    toya 2024/03/12
  • AIイラスト始め方の網羅的案内 2024年版 / だいたい未経験者向け|かいりん

    前書き🤔これは何RIZさんという一見AIイラストレーターを装った風来のシレン廃人にそそのかされて作ったちちぷいチャレンジが多数の愉快犯たちにおもちゃにされた結果書かないといけなくなった記事です。 Stable DiffusionやMidjourney、Nijijourney、NovelAIの使い方を詳しく解説した文書は数あれど、ふだんパソコンを使わない一般の人向けまで踏み込んで網羅している解説記事って案外ないかもな?と思ったのもきっかけではある! 書く前からわかってたんだけどボリュームがヤバいので稚拙な表現や抜け漏れ多数だ。公開後もちょくちょく手を加える可能性大だから、もし更新が気になるようであれば筆者のX, Blueskyアカウントをフォローするなり、気が向いた時にこのnoteに戻ってきてくれよな!! しばらく前提条件を書いておくので、とっとと中身を読みたい人は飛ばしちゃってください。

    AIイラスト始め方の網羅的案内 2024年版 / だいたい未経験者向け|かいりん