並び順

ブックマーク数

期間指定

  • から
  • まで

121 - 160 件 / 192件

新着順 人気順

AIの検索結果121 - 160 件 / 192件

  • 噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想|shi3z

    最近にわかに話題のLLMツール「Dify」を僕も使ってみた。 いいところと「?」となったところがあったので纏めておく Difyとは、GUIでワークフローを組むことができるLLM-OPSツールだ。 ComfyUIのようにワークフローが組めたり、GPTsのように自分専用のアシスタントを作れたりできる。 特に、OpenAIのGPTシリーズとAnthropicのClaude-3、そしてCohereのCommand-R+なんかを組み合わせて色々できるところは良いところだと思う。また、ローカルLLMにも対応しているので、企業内でのチャットボットを作るんだったらGPTsよりこっちの方がいいだろう。 元々色々なテンプレートが用意されているが、テンプレだけ使うとGPTsっぽいものを作れる(それだってすごいことだが)。テンプレを改造するだけでも欲しいものが作れる人はいるし、ここはノーコード環境と言える テンプ

      噂のノーコードAIシステム開発環境Difyを使ってツールを作ってみた。使った感想|shi3z
    • 詰将棋アルゴリズムdf-pnのすべて | やねうら王 公式サイト

      将棋AIで用いている詰将棋ルーチンにdf-pnというアルゴリズムがある。 これは、proof number(証明数)、disproof number(非証明数)を用いて効率的に探索を行い、その局面が詰むか、詰まないかを判定できるとても強力なアルゴリズムである。 将棋ファンなら『脊尾詰』と言う「ミクロコスモス」(1525手詰)を解く詰将棋専用ソフトについて一度ぐらいは聞いたことぐらいあるだろう。これは、脊尾さんが大学時代に作成されたプログラムである。そこに使われていたのが脊尾さんが考案されたdf-pnというアルゴリズムである。 df-pnに関しては、脊尾さん自身の論文(1998年)があるものの、要点しか書かれておらず、いまのようにGitHubにソースコードがあるわけでもなく、その詳細については長らく謎に包まれたままであった。(この脊尾さんの論文では、証明数のみを用いており、非証明数は陽には出

      • まるで現代の伊能忠敬――その極みにはAIもまだ辿り着けてない!? 地図データ整備の最前線を盛岡で見た【地図と位置情報】

          まるで現代の伊能忠敬――その極みにはAIもまだ辿り着けてない!? 地図データ整備の最前線を盛岡で見た【地図と位置情報】
        • アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援

          アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援 アトラシアンは、同社製品およびGoogleドライブやGitHubなどサードパーティのサービスを横断してAIが情報を学習し、統合的な検索やチャットによる回答を実現することでユーザーを支援してくれる新しいAIサービス「Atlassian Rovo」を発表しました。 AI breaks down yet another barrier! Today at Team '24 we announced Atlassian Rovo – a new product that unleashes a company’s knowledge so teams can make better decisions faster.

            アトラシアン、新AIサービス「Atlassian Rovo」発表。GoogleドライブやGitHub、Slack、Teamsなど同社内外のサービスを横断してAIが学習、ユーザーを支援
          • 「ChatGPT」「Copilot」「Gemini」「Claude」「Perplexity」の性能を日常的な会話で評価した結果が公開される

            AIの精度向上に伴って、ChatGPTやCopilot、Geminiなど日常会話を違和感なくこなせるチャットAIが続々と登場しています。しかし、一般ユーザーからはどのチャットAIが高性能なのかは判断しにくいものです。そんな中、ウォール・ストリート・ジャーナルが5種のチャットAIを対象に「日常会話への応答性能を人間が評価するテスト」を実施し、テスト結果を公開しました。 The Great AI Chatbot Challenge: ChatGPT vs. Gemini vs. Copilot vs. Perplexity vs. Claude - WSJ https://www.wsj.com/tech/personal-tech/ai-chatbots-chatgpt-gemini-copilot-perplexity-claude-f9e40d26 AI企業やAI研究者が自身の開発したA

              「ChatGPT」「Copilot」「Gemini」「Claude」「Perplexity」の性能を日常的な会話で評価した結果が公開される
            • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

              こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
              • AI活用、年金受給年齢決める「高齢者関数」 有識者団体が試案

                高齢化問題と年金制度改革について検討する有識者団体「日本自助会議」は31日、実年齢に応じて高齢者年齢が変化する「相対高齢者」制度と、相対高齢者年齢を算定する「高齢者関数」についての試案を公表した。 政府では高齢化率などを計算する際、65歳以上と高齢者と定義している。これに対し会議では「『高齢者』と考える年齢は世代ごとに異なる」と指摘。独自に行った調査では、10代の若者が親世代の40代を「ジジイ」「ババア」と呼んだり、90代が70代を「若造」と呼んだりするなど、高齢者の定義が世代の主観に依拠している実態が明らかになった。 会議では回答者の年齢と、回答者が高齢者だと思う年齢をまとめたデータをAIを使って分析。実年齢と高齢者年齢との差から「高齢者関数」を導いた。 関数のxに実年齢を入れると、その年齢が高齢者だと感じる年齢が求められる。10歳の場合は31歳以上が、60歳の場合は86歳以上がそれぞれ

                  AI活用、年金受給年齢決める「高齢者関数」 有識者団体が試案
                • 【Excel】PDFや画像を見ながら表を手入力する時代は終わった! 画像認識を活用しよう【いまさら聞けないExcelの使い方講座】

                    【Excel】PDFや画像を見ながら表を手入力する時代は終わった! 画像認識を活用しよう【いまさら聞けないExcelの使い方講座】
                  • 可能性が未知数だからAI導入は無理、なんてない。ー従業員の71.8%が「生成AI」を業務に活用。LIFULLが描く未来の住まい探しとはー|LIFULL STORIES

                    LIFULL全体の最高技術責任者(CTO)である長沢翼は、2022年11月に公開されたOpenAI社の対話型生成AI「ChatGPT」に「人とシステムのインターフェースが変わるかもしれない」と、時代の大きな変化を予感したという。そして長沢は2023年5月に生成AIに特化した専門チーム「ジェネレーティブAIプロダクト開発室」(現在は「ジェネレーティブAIプロダクト開発U」に名称を変更)を設立。以降、社内の業務効率化やLIFULLの事業に生成AIの活用を推進してきた。 LIFULLにとって既に良き仕事のパートナーとも言えるこの生成AIという技術は、どのように取り入れられ、また事業や業務にどのような変革をもたらしたのか。現在「ジェネレーティブAIプロダクト開発U」を統括するイノベーション開発室の室長も務める長沢に、LIFULLにおける生成AIのあり方を聞いた。 対話型生成AI「ChatGPT」は

                      可能性が未知数だからAI導入は無理、なんてない。ー従業員の71.8%が「生成AI」を業務に活用。LIFULLが描く未来の住まい探しとはー|LIFULL STORIES
                    • 「Copilot+ PC」とはなにか マイクロソフトが狙うUX変化とWindowsの再設計

                        「Copilot+ PC」とはなにか マイクロソフトが狙うUX変化とWindowsの再設計
                      • 出回っている「頂き女子マニュアル」をAIに要約してもらおうとしたら倫理的に問題があると断られた→頼み方を変えたらチョロかった

                        NISHIO Hirokazu @nishio Doctor of Science & Master of Tech Mgmt | Research Director of Cybozu | Board Member of Mitou Foundation | Contributor of ⿻Plurality mem.nhiro.org

                          出回っている「頂き女子マニュアル」をAIに要約してもらおうとしたら倫理的に問題があると断られた→頼み方を変えたらチョロかった
                        • オープンソースのRAGアプリ「RAGFlow」を試す

                          かなり新し目のフレームワークRAGプラットフォームアプリ RAGFlowとは? RAGFlowは、深い文書理解に基づいたオープンソースのRAG(Retrieval-Augmented Generation)エンジンである。LLM(大規模言語モデル)を組み合わせることで、様々な複雑なフォーマットのデータから根拠のある引用に裏打ちされた、真実味のある質問応答機能を提供し、あらゆる規模のビジネスに合理化されたRAGワークフローを提供する。

                            オープンソースのRAGアプリ「RAGFlow」を試す
                          • 生成AI時代のフロントエンド開発術

                            2022年11月にChatGPTがリリースされて、1年と約半年が経過しました。私はChatGPTが話題になった頃から、継続して利用しています。ChatGPTを使い続けていると、Webアプリケーションのフロントエンド開発に役立つことがありました。 そこで、本記事ではフロントエンド開発でChatGPTを活用して効率よく進める3つのパターンにまとめました。これらのパターンを紹介し、読者の皆さんの開発に役立ててもらえればと思います。 以下は、本記事で紹介するFigma、ソースコード、デプロイ先URLです。 Wireframing photo - Figma silverbirder/figma-photo-sample-app-for-ai - GitHub https://figma-photo-sample-app-for-ai.vercel.app ChatGPTを使う前に ChatGPTに

                              生成AI時代のフロントエンド開発術
                            • 日本のアニメなどから収集したデータセット「Sakuga-42M」 国際研究チームが公開 「学術研究でのみ使用可能」【更新済み】

                              このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高いAI分野の科学論文を山下氏がピックアップし、解説する。 X: @shiropen2 【更新履歴:2024年5月24日 午後1時50分更新 同時刻時点で論文は取り下げられ、GitHubのリポジトリ非公開となったことを確認しました。 カナダのアルバータ大学や中国の四川音楽学院に所属する研究者らが発表した論文「Sakuga-42M Dataset: Scaling Up Cartoon Research」は、AIモデルのトレーニング用に作成したアニメ動画データセットを提案した研究報告である。 Sakuga-42Mは、GitHubにおいてリポジトリが公開されており、学術研究の目的でのみ使用可能。また、データセット内の画像やビデオの著

                                日本のアニメなどから収集したデータセット「Sakuga-42M」 国際研究チームが公開 「学術研究でのみ使用可能」【更新済み】
                              • GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに

                                OpenAIが開発する大規模言語モデル(LLM)の「GPT-4」は、道徳テストで人間の大学生より優れたスコアをたたき出したり、セキュリティ勧告を読むことで実際の脆弱性を悪用できたりと、すでに一部の分野で人間の能力を超えることが示されています。そんなGPT-4が、プロのアナリストに匹敵する精度の財務諸表分析を行えることが実証されました。 Financial Statement Analysis with Large Language Models by Alex Kim, Maximilian Muhn, Valeri V. Nikolaev :: SSRN https://papers.ssrn.com/sol3/papers.cfm?abstract_id=4835311 The future of financial analysis: How GPT-4 is disrupting

                                  GPT-4は財務諸表から将来の収益の伸びを予測する点で人間のアナリストよりも優れていることが研究により明らかに
                                • GPT-4oをわかりやすく解説、専門家が「時代の転換点」と評価するヤバすぎる能力とは

                                  2024年5月に入ってすぐ、AI研究者の間ではOpenAIにまつわる複数の噂が流れていました。いわく「OpenAIが近日中に生成AIを使った検索サービスをするらしい」、「OpenAIが新型のGPTを発表するらしい」などといったものです。 それに先立ち、4月の後半からは、生成AIの性能を比較するサイトで、正体不明のモデル「gpt2-chatbot」なるものが出現し、制作者が不明である中、当時最高の性能を誇っていたGPT-4を上回る性能を見せつけていました(もちろんOpenAIはすでに「GPT-2」を数年前に発表済みです)。では今更このような名前をつけて暴れ回っているこれは何なのか。OpenAI製なのか、それとも別の機関が開発したのか。 この話は後々答えがわかるのですが、このようにAI研究者たちが落ち着かず、あれこれと噂してOpenAIの動向に注意している中、OpenAIは日本時間の5月11日

                                    GPT-4oをわかりやすく解説、専門家が「時代の転換点」と評価するヤバすぎる能力とは
                                  • 生成AIを巡る日本の現状は? 東大・松尾教授の考察資料が無料公開 「1年間、日本は最善手を指し続けている」

                                    内閣府は5月23日、「第9回 AI戦略会議」で取り扱った資料を公開した。同会議は22日に開催したもので、AI研究の権威として知られる東京大学の松尾豊教授が作成した「生成AIの産業における可能性」と題した全33ページの資料などを閲覧できる。資料は、ここ1年間での生成AIを取り巻く日本の動きをまとめており、各産業でどのようなAI活用方法があるか考察している。 資料内で松尾教授は、日本のAI政策について「デジタルの領域は、グローバルな競争の中で全般に苦しい戦いが続き、AI政策も厳しい状態からスタートしている」としつつ「ここ1年、日本は最善手を指し続けている」と説明。「広島AIプロセス」などグローバルの議論でリーダーシップを発揮している点や、AI関連予算費を増やしGPUの増強に当たっている点などを評価している。

                                      生成AIを巡る日本の現状は? 東大・松尾教授の考察資料が無料公開 「1年間、日本は最善手を指し続けている」
                                    • マイクロソフト、ARM版の新型Surfaceと『Copilot+ PC』発表。全部覚えるRecallなどWindows 11のローカルAI強化 | テクノエッジ TechnoEdge

                                      マイクロソフトがWindows 11『Copilot+ PC』イベントを開催し、Snapdragon X Elite / Plusプロセッサを搭載した新型 Surface Pro (第11世代)および Surface Laptop (第7世代)を発表しました。 新型 Surface Pro はシリーズ初の有機ELディスプレイを選択でき、性能は(二世代前の) Surface Pro 9比で90%高速。統合NPUのAI処理性能(TOPS)は、AppleのM4 iPad Proより約20%高速をうたいます。 新たな純正アクセサリとして、合体しても外しても使える新型キーボード Surface Pro Flex Keyboard を用意します。 ■ Windows PCの新たなカテゴリ『Copilot+ PC』新型 Surface シリーズを披露した一方で、イベントの主題はマイクロソフトが提唱する新

                                        マイクロソフト、ARM版の新型Surfaceと『Copilot+ PC』発表。全部覚えるRecallなどWindows 11のローカルAI強化 | テクノエッジ TechnoEdge
                                      • AI搭載エディタCursorの紹介と機械学習コンペでの使用レビュー

                                        社内の技術共有会での発表資料です。 AI搭載エディタCursorの機能の紹介とKaggle等の機械学習コンペで使ってみて役立った点などを共有します

                                          AI搭載エディタCursorの紹介と機械学習コンペでの使用レビュー
                                        • 怒る客の声、AIで穏やかに ソフトバンクがカスハラ対策 - 日本経済新聞

                                          ソフトバンクは15日、人工知能(AI)で客の通話音声を穏やかなトーンに変換する技術の事業化を目指すと発表した。顧客による迷惑行為「カスタマーハラスメント(カスハラ)」に対する取り組みの一環で、コールセンターの電話対応業務に利用する。2025年度中の事業化に向けて、東京大学と研究開発や検証を進める。ソフトバンクの新規事業提案制度「ソフトバンクイノベンチャー」から生まれた。電話口で怒鳴るなどの迷惑

                                            怒る客の声、AIで穏やかに ソフトバンクがカスハラ対策 - 日本経済新聞
                                          • [第2話]深層のラプタ - 空空北野田 | 少年ジャンプ+

                                            JASRAC許諾第9009285055Y45038号 JASRAC許諾第9009285050Y45038号 JASRAC許諾第9009285049Y43128号 許諾番号 ID000002929 ABJマークは、この電子書店・電子書籍配信サービスが、著作権者からコンテンツ使用許諾を得た正規版配信サービスであることを示す登録商標(登録番号 第6091713号)です。

                                              [第2話]深層のラプタ - 空空北野田 | 少年ジャンプ+
                                            • 「AIと共存すべき」人気声優・梶裕貴 自身の声で自由にしゃべれるAIソフト発売へ 「たくさん悩んで」決断

                                              「正直、たくさん悩みました」――人気声優の梶裕貴さんが、自身の声で自由にしゃべらせることができる音声合成ソフト「CeVIO AI 梵そよぎ(そよぎそよぎ) トークボイス」を製品化すると発表した。5月29日午後9時から、クラウドファンディングサイト「CAMPFIRE」で受注をスタートする。 ここ最近、AIを使って人気声優の声などを無断で再現したコンテンツが問題になっており(関連記事)、梶さんも頭を悩ませてきたという。だが「AIと敵対するのではなく、共存すべき」と結論づけ、「あえて私の声を持つ『梵そよぎ』を解禁することで、"正しい音声AIの在り方"を証明できるのではないか」と考えて開発を決断したという。 CeVIO AIは、ソニー・ミュージックエンターテインメントや名古屋工業大学発ベンチャーのテクノスピーチなど、複数の企業が参加する音声合成AIプロジェクト。 「CeVIO AI 梵そよぎ」は、

                                                「AIと共存すべき」人気声優・梶裕貴 自身の声で自由にしゃべれるAIソフト発売へ 「たくさん悩んで」決断
                                              • OpenAI、次世代AIモデル「GPT-4o」を発表

                                                日本時間2024年5月14日未明、OpenAIは新たなフラッグシップモデル「GPT-4o」を発表しました。このモデルは、音声、視覚、テキストのリアルタイム処理を可能とし、従来のAIモデルを大きく上回る性能を誇ります。OpenAIのCTOであるミラ・ムクティ氏は、「GPT-4oは、人間とマシンのインタラクションの未来を大きく変える一歩です。このモデルにより、コラボレーションがはるかに自然で簡単になります」と述べました。 「GPT-4o」の主な特徴を以下にまとめました。 他のモデルを凌駕する性能 GPT-4oは、OpenAIの以前のモデルであるGPT-4 Turboや、ライバル会社のClaude 3 Opusなどの大規模言語モデルと比較して、頭ひとつ抜けた性能向上を実現しました。サム・アルトマンCEOは、今年4月に "Chatbot Arena" でgpt2というコードネームでテストされていた

                                                  OpenAI、次世代AIモデル「GPT-4o」を発表
                                                • 「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】

                                                  主催の清風明育社は、コンピュータ専門学校「清風情報工科学院」を運営する学校法人。他ににじジャーニーの提供元や大阪府教育委員会などが協賛しているという。また、公式サイトには協力先として日本マイクロソフトの名前を記載している。当初は協賛にワコムも記載していたが、5月13日にネット上で批判の声が大きくなった後、同日中に記載がなくなった。 清風明育社は、コンテスト開催の背景について「(生成AIは)有料利用が前提とされることが多いため、若年層は手が出しにくい」「無料で利用できる高品質な生成AIアートのツールに触れることが、進路選択・職業選択において価値ある体験になる」と説明していた。 一方コンテストに対してはいくつかの批判も。まず「入賞作品の著作権は主催者に帰属する」点については「成果物を奪うつもりか」という批判が見られた。また、協賛社一覧にワコムの名前があったことから、同社に対し「クリエイター向け

                                                    「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】
                                                  • あのキャラの声、AIで勝手に再現「無断AIカバー」氾濫 声優と弁護士に聞く「声の守り方」と未来

                                                    自分の声やフリーの声素材、著作権フリーの楽曲などで作るのならば問題はない。関係者を悩ませているのは、声優や歌手などの声を勝手に使った“無断AIカバー”だ。 人気歌手や声優の声を無断でAIに学習させ、無関係な歌を歌わせたり、セリフを言わせたりする無断AIカバーは、アニメファンなどが好きなキャラの声で勝手に制作し、動画SNSなどで人気を集めている。 声そのものが商品である声優にとって、無断AIカバーが作られるのは深刻な問題だ。「早急に何とかしたいと思っているのですが……」。声優の甲斐田裕子さん(アニメ業界の立て直し・発展を目指す有志団体「日本アニメフィルム文化連盟(NAFCA)」理事)は、対策の難しさに頭を抱える。 声を守ることに特化した法律がないことや、作品の関係者が多岐にわたること、関係者の間でも意見が割れていることなどが、問題を複雑にしている。 声優が自らの声でAI音声を作り、新たなビジ

                                                      あのキャラの声、AIで勝手に再現「無断AIカバー」氾濫 声優と弁護士に聞く「声の守り方」と未来
                                                    • zenncast - 技術トレンドをAIがラジオに変換

                                                      Zennのトレンド記事をまとめてAIがラジオをつくります。毎朝7時に更新。 お便りも募集中。送っていただいたお便りはAIパーソナリティが読み上げます。

                                                        zenncast - 技術トレンドをAIがラジオに変換
                                                      • 「最高過ぎる」「すげー!」 ChatGPTに“手書きメモ”をアップすると…… 仕事がはかどる“衝撃の機能”に歓喜の声

                                                        ChatGPTで手書きメモをExcelシートに入力する、便利な活用例がX(Twitter)で紹介され話題を呼んでいます。これは捗りそう……! ChatGPTに“手書きメモ”をアップすると…… ChatGPTで手書きメモ→Excel入力! 活用例を投稿したのは、Xユーザーのゆとり脊椎外科医(@spine_surgeon_)さん。ChatGPTがリリースした無課金ユーザーも使える最新モデル「GPT-4o(GPT-4 Omni)」を使って、手書きのメモをExcelに転記する様子を紹介しています。 ゆとり脊椎外科医さんが、数値を記録した“ラフな手書きメモ”をアップし、「これをExcelシートに記入してください」と指示。するとGPT-4oは手書きメモの画像を解析してExcelシートのデータを生成しました。その数値は手書きメモと確かに一致しています。これは助かりすぎる……。 手書きメモと簡単な指示だけ

                                                          「最高過ぎる」「すげー!」 ChatGPTに“手書きメモ”をアップすると…… 仕事がはかどる“衝撃の機能”に歓喜の声
                                                        • ネコとAIだけが暮らす世界は幸せか? 遊びやエサを与える自律ロボとネコが過ごす実験 英国チームが検証

                                                          近年、ロボット掃除機の上で楽しそうに乗っている猫の動画がソーシャルメディアで話題になるなど、猫たちは動き回るロボットにも動じることなく、むしろその存在を楽しんでいるようにさえ見える。ロボット掃除機や芝刈り機など、ロボットによる支援が身近になりつつある中、研究チームはロボットが猫の飼育環境の質的向上に役立つ可能性について探った。 研究チームは「Cat Royale」と名付けられた、猫とAIロボットがインタラクションする特別な室内環境を設計。この空間には、おもちゃやキャットツリー、水飲み場、植物がふんだんに用意され、中央にはロボットアームを配置した。 ロボットアームは、猫じゃらし風のおもちゃやボールで獲物を追わせるゲームや玉転がしなど、500以上の遊びを提供し、おやつも与える。さらに、ロボットが特定の遊びを行った後、その遊びが各猫の幸福度にどのような影響を与えたかを計測し、その結果をAIシステ

                                                            ネコとAIだけが暮らす世界は幸せか? 遊びやエサを与える自律ロボとネコが過ごす実験 英国チームが検証
                                                          • 「PowerToys 0.81」公開、超強力なクリップボード加工ツールを追加/プレーンテキスト貼り付け、Markdown貼り付け、なんでもござれ、AIの力も!

                                                              「PowerToys 0.81」公開、超強力なクリップボード加工ツールを追加/プレーンテキスト貼り付け、Markdown貼り付け、なんでもござれ、AIの力も!
                                                            • グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

                                                                グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
                                                              • グーグル「Geminiの時代」宣言の意味 OSやサービスを持つ強さ【西田宗千佳のイマトミライ】

                                                                  グーグル「Geminiの時代」宣言の意味 OSやサービスを持つ強さ【西田宗千佳のイマトミライ】
                                                                • 小学館やJIC、AI翻訳で漫画5万点輸出へ スタートアップに29億円出資 - 日本経済新聞

                                                                  AI(人工知能)翻訳を使って日本の漫画輸出を5年間で3倍以上に増やす官民の取り組みが始まる。小学館や経済産業省所管の産業革新投資機構(JIC)系など10社はAIで漫画を翻訳する新興企業に29.2億円を出資した。翻訳速度を最大10倍に高めて漫画の輸出作品数を増やし、日本のコンテンツ産業の成長を促す。AI翻訳を担う新興企業のオレンジ(東京・港)が7日に小学館などからの出資の詳細や漫画の輸出計画の概

                                                                    小学館やJIC、AI翻訳で漫画5万点輸出へ スタートアップに29億円出資 - 日本経済新聞
                                                                  • 「ChatGPT」無料ユーザーが利用できる機能拡大、Webブラウジングや画像認識機能などを解放/GPT-4oの機能をお試し可能、利用回数制限には注意

                                                                      「ChatGPT」無料ユーザーが利用できる機能拡大、Webブラウジングや画像認識機能などを解放/GPT-4oの機能をお試し可能、利用回数制限には注意
                                                                    • 自分好みのAIチャット相手を簡単に作れる「Dify」が面白い (1/4)

                                                                      生成AI界隈で話題になっているAIサービス「Dify.AI」がなかなか面白いですよ。Dify.AIは、スタートアップの米LangGeniusが用意している大規模言語モデル(LLM)用のWebUI環境を利用して、いろいろなシステムを組み込むことで、プログラムを書くことなく簡単にチャットbotなどのネイティブAIアプリを開発できるサービスです。 Difyは大きく「チャットボット」、「エージェント」、「ワークフロー」の3つの機能に分かれており、簡単なチャットボットから、複数のLLMを組み合わせた複雑な動作をさせるように設計するものまで、多様なアプリを開発することが可能です。ChatGPTから、Claude 3、Geminiなどの主要なLLMをAPIから呼び出すことができるので、それらを組み合わせてサービスを作ることも可能です。例えばOpenAIのAPIキーを生成してDifyに入力すると「GPT-

                                                                        自分好みのAIチャット相手を簡単に作れる「Dify」が面白い (1/4)
                                                                      • 「Amazon Q Business」正式リリース。MS365やS3などの社内の情報源と接続、会社の経営情報から有給休暇の残りまでチャットAIが答えてくれる

                                                                        「Amazon Q Business」正式リリース。MS365やS3などの社内の情報源と接続、会社の経営情報から有給休暇の残りまでチャットAIが答えてくれる Amazon Web Servicesは、新たなAIサービス「Amazon Q Business」の正式リリースを発表しました。 Amazon Q Businessは企業向けのAIサービスで、Amazon S3やAmazon RDS、Amazon Auroraを始めとするAWSのサービスやMicrosoft 365、Salesforce、Dropbox、Google Drive、Gmailなどのさまざまな社内の情報源と接続可能です。 サードパーティのアプリケーションにAPI経由で接続するカスタムプラグインの構築が可能になります。これにより、ユーザーは自然言語のプロンプトを使用して、Amazon Q BusinessからAPIを通じてサ

                                                                          「Amazon Q Business」正式リリース。MS365やS3などの社内の情報源と接続、会社の経営情報から有給休暇の残りまでチャットAIが答えてくれる
                                                                        • 【西川和久の不定期コラム】 USB4接続のGeForce RTX 3090が突然認識されなくなったので、OCuLinkで復活させた話

                                                                            【西川和久の不定期コラム】 USB4接続のGeForce RTX 3090が突然認識されなくなったので、OCuLinkで復活させた話
                                                                          • GitHub - Mega-Gorilla/Index_PDF_Translation

                                                                            You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

                                                                              GitHub - Mega-Gorilla/Index_PDF_Translation
                                                                            • GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円

                                                                              画像認識が可能なオープンソースモデルの「Llama 3-V」が公開されました。Llama 3-Vは、OpenAIのマルチモーダルモデル「GPT4-V」よりも格段に小型で、事前トレーニングにかかる費用は500ドル(約78000円)程度なのにもかかわらず、ほとんどの指標で同等のパフォーマンスを示しています。 Llama 3-V: Matching GPT4-V with a 100x smaller model and 500 dollars | by Aksh Garg | May, 2024 | Medium https://aksh-garg.medium.com/llama-3v-building-an-open-source-gpt-4v-competitor-in-under-500-7dd8f1f6c9ee 今回発表されたLlama 3-Vは、 Metaが公開した言語モデルの「L

                                                                                GPT4-Vの100分の1のサイズで同等の性能を誇るマルチモーダルモデル「Llama 3-V」が登場、トレーニング費用はたった8万円
                                                                              • 「AI兵器」の衝撃 “機械は犠牲を理解できず”暗い未来の不安 | NHK | WEB特集

                                                                                冷戦のさなか、旧ソビエト軍の1人の中佐の判断が核戦争の勃発を防いだとされる出来事があった。アメリカ軍の核ミサイル攻撃を探知した監視システムの情報を、状況から誤作動と判断、ソビエト側の報復攻撃を防いだ。 しかし今、各国でAI=人工知能を使って、より自律性を高めた「AI兵器」の開発競争が激化している。 すでに戦地では20秒以内に攻撃の判断を求められるAIシステムの使用が伝えられている。 人間の判断が介在しない究極のAI兵器が登場したら、この世界はどうなるのだろうか。 (国際部記者 山下涼太) 2022年2月に始まったロシアによる軍事侵攻に対抗するウクライナ。物量で上回る大国との消耗戦になる中、遠隔操作型の無人機で偵察や監視・攻撃までを行い、善戦につなげてきた。 しかし、このところロシア側の電波妨害により、無人機の通信が途絶えて制御を失うケースが増え、無人機の損耗が増加。 このため、ウクライナ軍

                                                                                  「AI兵器」の衝撃 “機械は犠牲を理解できず”暗い未来の不安 | NHK | WEB特集
                                                                                • Zodスキーマでプロンプト生成を行い構造化データを自由自在に扱えて、LLMプロダクト開発が圧倒的に効率化した話 - Algomatic Tech Blog

                                                                                  最近はAIエンジニアを名乗ってるerukitiです。フロントエンドもバックエンドも、LLMを触るあれこれもやってるので、「AIエンジニア」くらいを名乗るとちょうどよさそうだなと思ってます。いずれLLM自体の開発なんかもやってるかもしれません。 LLMプロダクトを開発していると、構造化データを作りたいのに、Anthropic ClaudeのAPIにはJSONモードが無いことや、なんならJSONモードやfunction callingを使っても、データが正しい形式に従ってることは保証しがたい、みたいな自体に遭遇することがあります。 JSONが出力できたとしても、構造化データをうまく吐き出させるのは難しいものです。文字列を出力させたいけど、複数あるときは、配列なのか、それともカンマ区切りなのか?項目がオプショナルの場合はどうするか?項目が存在しない、空文字や 0 や undefined や nu

                                                                                    Zodスキーマでプロンプト生成を行い構造化データを自由自在に扱えて、LLMプロダクト開発が圧倒的に効率化した話 - Algomatic Tech Blog