AGIラボは、最高のAI情報をお届けするためのマガジン・コミュニティです。GPTsを筆頭にClaude 3やSoraなど注目のAIについても詳しく解説、今日から使えるAI活用情報を一番わかりやすくお伝えします。他に限定コミュニティへのアクセス、限定イベントへの参加権が含まれます。
こんにちは。ISID 金融ソリューション事業部の若本です。 先日、GPT-4から発展し、画像も扱うことができるGPT-4 with vision(GPT-4V)が発表されました。GPT-4Vは大規模マルチモーダルモデル(LMMs: Large multimodal models)と呼ばれるAIモデルの一種であり、GPT-4の入力として「画像」を拡張したものになります。 今日は Microsoft Researchの論文[1]を中心に、Open AIの発表したSystem Card[2]も踏まえ、GPT-4Vでできることや苦手とすること、そして実用上の制限について解説します。 GPT-4Vの特徴 ① 画像とテキストを入力にできる GPT-4Vでは、GPT-4のテキスト入力に加えて画像も入力することが可能になりました。 画像は複数枚入力することが可能であり、かつ、画像とテキストを任意に交互に組
ChatGPTの新しい画像生成AIのDALL-E 3は、かなり自由に画像をコントロールすることができます。 1.リアル画像のコントロール>20代の日本人女性の写真を作成してください。 生成された画像>3番目の女性の眼鏡をはずして、喜怒哀楽の表情を見せてください。 生成された画像※1枚目の画像以外は眼鏡をはずしてくれませんでした。また、喜、怒、哀の表情は描いてくれましたが、楽の画像は生成できませんでした。 >この女の子を、1.走らせてください。2.座らせてください。3.ジャンプさせてください。4.逆立ちさせてください。 生成された画像※3枚目までは上半身だけの画像なので、ジャンプしているかどうかはよく分かりません。4枚目はちゃんと逆立ちしています。 >縦長画像にして、全身を見せてください。 生成された画像4枚目の画像※これで、3枚目の画像がちゃんとジャンプしていることが分かります。4枚目は、
ChatGPTがついに、目と耳を手に入れました。 9月25日、OpenAIがChatGPTに、画像解析機能と音声出力機能のGPT-4Vが追加され、マルチモーダルAIになったと発表しました。 とうとうChatGPTで画像入力と音声出力ができるようになりました!GPT-4V機能を使うと実際にこんなことができちゃうんです! 今回は話題沸騰中のGPT-4Vの概要や新機能について、特徴を踏まえながら紹介いたします。是非最後までご覧ください! なお弊社では、生成AIツール開発についての無料相談を承っています。こちらからお気軽にご相談ください。 →無料相談で話を聞いてみる GPT 4Vの概要 GPT-4Vは、Open AI社が開発した従来のGPT-4に画像解析機能と音声出力機能を持たせたマルチモーダルAIです。 これは、つまりGPT-4を搭載したChatGPTに「目」と「声」が実装されるということ! テ
2. 苦手な人は受け流しちゃうな。だから、ストレスはゼロ 高田純次 3. よく“テキトー”なんて言われますが、僕自身はそう思ってやってきたことはないんですよ。言葉が独り歩きすると、何がテキトーなのか分からない 高田純次 4. 「なんで俺はダメな人間なんだ」そんなふうに思いはじめたらキリがない。それよりもはじめから、「イチローだって7割近くは失敗する。3割成功すれば一流なんだから」と思った方が気が楽になる。 高田純次 5. オレが好きな言葉は『木も見ず、森も見ず』だよ 高田純次 6. オレはエッチではないんだ。エロなんだ 高田純次 7. 世の中、分からないことが多いけど、街中を裸で歩いてはいけないということだけは分かってるんだ 高田純次 8. 隣の芝生っていうか、ないものねだりをするのが人間ってものだから。 高田純次 9. 「説教」、「自慢話」、「思い出話」、この3つを抑えていかないと自分は
生成AI専門メディア「PROMPTY」を運営する株式会社Bocek、国内外の生成AI関連サービス207社をまとめた「生成AI関連サービスカオスマップ 2023」を公開 生成AIメディア「PROMPTY」を運営し、生成AIの導入をワンストップで提供する生成AI特化戦略コンサルティングファームである株式会社Bocek(本社:東京都大田区、代表:沖村 昂志)は、生成AI基盤チャットボットや画像生成AIなど、生成AIに関連する企業やサービスをカテゴリ別にまとめた「生成AI関連サービスカオスマップ 2023」を発表しました。 カオスマップ公開の背景 東京都が生成AI ChatGPTのガイドラインを発表し、全局で業務利用を開始するなど、生成AIの急速な普及に伴い、企業における生成AI導入が加速していると言えます。 弊社で運営する生成AIメディア『PROMPTY』や弊社の主力事業である生成AI特化のコン
「”100年後の世界を良くする会社”を増やす」をミッションに掲げるコンサルティング会社 リブ・コンサルティングが、「自社プロダクトがキャズムを超えるためのGPT活用方法」をテーマとしたイベントを開催。今回は、同社シニアコンサルタントの島孝行氏が登壇したセッション「GPTがもたらす影響」の模様をお届けします。ChatGPTの登場で起きた市場環境の変遷や、日本市場におけるGPT活用企業のカオスマップなどが紹介されました。 ChatGPTの登場で起きた市場環境の変遷 司会者:さっそく、弊社リブ・コンサルティングの島から、第2章「GPTがもたらす影響」についてお話ができればと思います。それでは島さん、よろしくお願いします。 島孝行氏(以下、島):よろしくお願いいたします。私からはGPTの市場環境や、ベンチャー企業さんがどういったかたちでGPTをサービスに使っていけばいいかについて簡潔にお伝えさせて
9月6日に公開された Open Interpreterは、現在世界で最も注目を集めるGitHubのリポジトリです。公開から2日でデスクトップアプリの早期アクセスウェイトリストには5000人、さらにDiscordでのコミュニティ参加者は500人を超え、レポジトリには9月15日現在で、レポジトリには20K以上のスターが付いています。このツールは、自然言語の指示でさまざまなコードを書き、実行することができ、日常の作業を劇的に効率化します。この記事では、Open Interpreterという新時代のAIの力で、あなたの仕事もプライベートも次のステージへと進化させるための「活用事例25選」をご紹介していきます。 Open Interpreter の基本的な機能・情報はこちらの記事に分かりやすくまとめてくださっていますので、こちらもぜひご覧ください!! 👉 Today I’m launching O
LLMに狙いどおりの動きをさせるために内部で使われているプロンプトエンジニアリングから、LangChainに入門する「プロンプトエンジニアリングから始めるLangChain入門」。ここで大嶋勇樹氏が登壇。最後に、LangChainのモジュールである「Agents」について解説します。前回はこちらから。 LangChainのモジュール「Agents」 大嶋勇樹氏:最後に、一番おもしろいモジュールであるAgentsを見ていこうと思います。質問をまあまあもらっていますが、最後までいってから回答できればと思います。最後に、一番おもしろいのがこのAgentsです。 まずAgentsのモチベーションですが、Indexesを使ってVector Storeを検索する以外にも、LLMが必要に応じていろいろなことをしてくれたら夢が広がると思います。 例えば、必要に応じて知らない知識だったらGoogleで検索し
以下の記事を見て、早速「Open interpreter」を試してみたので、使い方や始め方をまとめておきます Open Interpreterとは Open Interpreterは、GPT-3.5、GPT-4、Code Llamaなどの大規模言語モデル(LLMs)を活用して開発されたオープンソースのツールです。 このツールは、OpenAIが提供するChatGPTの「Advanced Data Analysis(旧Code Interpreter)」のオープンソース版とも言える存在で、Python、Javascript、Shellなどのプログラミング言語のコードを自然言語による対話を通じてローカル環境で実行することができます。 このツールの最大の特徴は、ChatGPTの「Advanced Data Analysis」と違いローカル環境で動くため、ファイル容量やネット接続への制約がなく、Ch
こんにちは!逆瀬川 ( https://twitter.com/gyakuse ) こちらに引き続き、LangChainの解説をしていきたいと思います。 副読用Colab: 動かしながら遊びましょう。 前回のあらすじ Chatbotや言語モデルを使ったサービスを作ろうとしたときに生のOpenAI APIを使うのは以下の点でたいへん。 プロンプトの共通化や管理をすること 複数のドキュメントやWebの情報を参照して質問応答をすること 言語モデルにcsvやpdf等のプレーンテキストでないファイルを読ませること それらの処理を統括して管理すること 使い方まとめ(1)で説明したLangChainの各モジュールはこれを解決するためのものでした。 Prompt Templates : プロンプトの管理 LLMs : 言語モデルのラッパー(OpenAI::GPT-3やGPT-Jなど) Document L
Llamaindex を用いてCSVデータからchatGPTちゃんに回答させてみようと思います。 とりあえずやってみた系の記事なので、雑ですがご了承下さい。 準備 今回は居酒屋的のメニュー的なものを適当に作りました。 項目,タイトル,価格,説明 鴨料理,鴨フィレ肉のカシスソース,930円,鴨フィレ肉を浅めにソテーしロゼ色に。甘酸っぱいカシスと赤ワインのソースで。ピンクペッパーがとても合います。赤ワイン。 鴨料理,鴨刺し,860円,"皮面をパリッと焼き、肉にも焼き目をつけた状態をお刺身。" 鴨料理,鴨南蛮うどん,830円,"鴨と長ネギをごま油で炒め、味を出しています。 合わせだしも引いています。汁まで美味しい一品。小さめの為〆に最適です。" 馬料理,ユッケ,930円,"言わずと知れた生肉ユッケ。 ...
複雑なドメインを扱うプロダクトの探索フェーズではいつどのようにテストをするのか / How to testing during exploratory phase
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く