タグ

情報科学に関するJULYのブックマーク (56)

  • 国産LLMが抱える“開発コスト”の課題 海外勢に安さで勝てるか、ELYZA代表の危機感

    東大発のAIスタートアップ企業ELYZA(東京都文京区)は3月12日、「GPT-3.5やGeminiに匹敵する」という日語特化型の大規模言語モデル(LLM)を発表した。同社の曾根岡侑也代表は「今回のニュースは日国内の状況を踏まえると当に喜ばしいこと」と語った。一方、国内でのLLM開発ビジネスにおいて“資金面”が大きな課題になっているともこぼした。 今回発表したLLM「ELYZA-japanese-Llama-2-70b」は700億パラメータを持ち、日語処理能力で米OpenAI製のGPT-4や、米Google製のGemini 1.0に匹敵する処理能力を有すると同社は強調する。曾根岡代表は「グローバルなプレイヤーが日語処理の性能でリードしている中で、何か一矢報いよう(として到達した)」と話す。 新モデルの対話形式のデモンストレーションサイトを公開しており、誰でも試すことができる。また

    国産LLMが抱える“開発コスト”の課題 海外勢に安さで勝てるか、ELYZA代表の危機感
    JULY
    JULY 2024/03/14
    気持ちはわかるけど、計算資源的な不利を覆せるとしたら、日本語での圧倒的なパフォーマンスを見せないとムリ。色々やって、グローバルなものと同等、では勝負にならない。何かブレイクスルーがないと...
  • 中学1年生250人の半数超、理科の課題で同じ間違い…教諭の違和感の正体は生成AIの「誤答」

    【読売新聞】 東京都内の私立中で2月、1年生の半数超が理科の課題に対する解答を間違う事態が起きた。原因となったのは、生成AI(人工知能)が表示した“誤答”。品大手「キユーピー」がホームページ(HP)に載せていた記述を基に生成し、生

    中学1年生250人の半数超、理科の課題で同じ間違い…教諭の違和感の正体は生成AIの「誤答」
    JULY
    JULY 2024/03/06
    逆にこの中学生達は、非常に重要な学びを得ている。「シンギュラリティは近い」などと能天気に AI を盲信する大人たちより、遥かに正しい現状認識を得られたと思う。
  • OpenAI幹部、社内メモでマスク氏による提訴を全面否定

    OpenAIの共同創業者でもある実業家のイーロン・マスク氏が2月29日にOpenAIとサム・アルトマンCEOを契約違反で提訴したことについて、同社幹部は社内メモで「マスク氏の主張は現実を反映していない」と語った──。このメモを入手した米Axiosなど複数のメディアが3月1日に報じた。 マスク氏は、OpenAI設立時、アルトマン氏が「人類のためにAIを開発するオープンソースの非営利企業を設立する」と語っていたにもかかわらず、米Microsoftが出資するOpenAIが営利を追求しており、また、GPT-4をオープンソースにしていないのは契約違反だと主張している。 OpenAIMicrosoftとの提携で、AGIの開発に成功した場合、AGIにはMicrosoftのライセンスは適用されなくなるという契約条件だが、GPT-4は既にAGIであり、ライセンスを適用するべきではないともマスク氏は主張す

    OpenAI幹部、社内メモでマスク氏による提訴を全面否定
    JULY
    JULY 2024/03/04
    とりあえず、GPT−4 がAGI だとする主張は、ずいぶん AGI 要件を低くしたなぁ、と思う。旧来の SF 的な AGI を指す別な言葉を用意しないと。
  • リレーショナル・データベースの世界

    序文 私の仕事は、DBエンジニアです。といっても別に望んでデータベースの世界へきたわけではなく、当初、私はこの分野が面白くありませんでした。「Web系は花形、データベースは日陰」という言葉も囁かれていました。今でも囁かれているかもしれません。 ですが、しばらくデータベースを触っているうちに、私はこの世界にとても興味深いテーマが多くあることを知りました。なぜもっと早く気づかなかったのか、後悔することしきりです。 もちろん、自分の不明が最大の原因ですが、この世界に足を踏み入れた当時、先生も、導きの書となる入門書もなかったことも事実です。 今でこそバイブルと仰ぐ『プログラマのためのSQL 第2版』も新入社員には敷居が高すぎました (2015年2月追記:その後、自分で第4版を訳出できたのだから、 人生は何があるか分からないものです)。 そこで、です。このサイトの目的は、データベースの世界に足を踏み

    JULY
    JULY 2024/02/29
    SQL 自体は好きで、専門ではないけど、そこそこ知っている方だと思うけど「以下の条件に当てはまる人」に8割ぐらい当てはまる。これはかなり良さそう。
  • AIの最も大きな懸念事項、日本だけが「システム障害」を挙げる KPMGコンサルティング

    AIの最も大きな懸念事項、日だけが「システム障害」を挙げる KPMGコンサルティング:AIへの社会的認識の変化について世界17カ国で調査 KPMGコンサルティングは、「AIは信頼できるか~AIへの社会的認識の変化に関するグローバル調査2023」を発表した。日は75%の人が「AIへの理解度が低い」と回答しており、調査対象国の中で最も低かった。

    AIの最も大きな懸念事項、日本だけが「システム障害」を挙げる KPMGコンサルティング
    JULY
    JULY 2024/02/13
    AI に対する懸念事項として、日本人が多く挙げた「システム障害」の意味がよくわからない。そのシステムが使えなくなる事を意味するなら AI 関係ないし。それだけ日本人の IT 全般の理解が進んでいない証左かなぁ。
  • 採用業務は“社内ChatGPT”で効率化できるか? SIerが実証実験 「年間400時間の工数削減となる試算」

    SIerトランスコスモス・デジタル・テクノロジー(東京都千代田区、以下TCDT)は2月7日、生成AIを使った採用業務に関する実証実験の結果を発表した。同社の中途採用にて、大規模言語モデル「GPT-3.5 Turbo」を利用した採用管理システムを構築。約1カ月半の間運用したところ、作業時間の削減を確認できたという。 TCDTでは複数の職種で中途採用を行っていたが、書類の記載形式が応募者ごとに異なる点や、募集職種ごとに確認したいスキルが異なる点などが影響し、書類選考に多くの時間を割いていたという。そこで生成AIを使い、作業時間を削減できるか検証するべく実証実験を行った。 従来の採用フローは「応募受付」「応募書類内容の確認・採否」「結果の通知」という順序で行っていた。今回の実験では「応募書類内容の確認・採否」を「AIを使った応募書類要約」と「人の手による応募書類の確認・採否」の2つのフローに分

    採用業務は“社内ChatGPT”で効率化できるか? SIerが実証実験 「年間400時間の工数削減となる試算」
    JULY
    JULY 2024/02/09
    もっと雑な話かと思ったら、どの業務に適用し、どんな要素に関して正しく判定でき、どういったときに問題が発生するか、と、意外にしっかりとした検証だった。ちゃんと「万能ではない」事を理解してやってる感じ。
  • 生徒「筆記試験にChatGPTを使ってもよいですか?」 教授「いいよ」 ブラジルの大学が検証 結果は?

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 この研究では、2023年にブラジルのラヴラス国立大学で行われたHCI(Human-Computer Interaction)の筆記試験において、ChatGPTの使用が許可されたことが背景にある。このHCIコースでは、5年以上にわたり筆記試験で教科書やスライドなどの資料を参照することが許されている(オープンブック試験)。研究の目的は、筆記試験においてChatGPTを学生支援ツールとして使用することの利点と欠点を探求することである。 研究では、試験中に学生がどのようにChatGPTを利用し、それが学生の学習プロセスや理解度にどのように影響を与え

    生徒「筆記試験にChatGPTを使ってもよいですか?」 教授「いいよ」 ブラジルの大学が検証 結果は?
    JULY
    JULY 2024/02/01
    列挙されている問題点を読むと、「人間が AI を信じてしまうリスク」が大きいなぁ。人間が勝手に「AI すごい! シンギュラリティ、キター!」と思い込むことが怖い。「所詮、確率計算の結果」ぐらいでちょうど良い。
  • AIは予想より“ポンコツ”だった? 共通テストの数学、ChatGPTでも平均点未満という結果に驚く

    点数を競ったのは、米OpenAIの「ChatGPT」(GPT-4)、米Googleの「Bard」、米Anthropicの「Claude2」の3つの文章生成AI。企業へのAI導入コンサルティングなどを手掛けるLifePrompt(東京都千代田区)による実験だ。 結果を一読して意外だったのは、数学の正答率の圧倒的な低さだ。どのAIも受験生の平均点予想を上回れず、正答率は最大で46%(ChatGPTの「数学2B」)。Bardの「数学1A」に至ってはわずか6%しか取れていない。英語や国語、歴史科目などに比べても、目に見えて低い数字だ。 AIやコンピュータ、ロボットが「できること」のイメージは、ChatGPT以降、大きく変わったように思う。それまでは、AIやコンピュータは、特に数字や計算に関しては「間違わない」イメージがあった。今回の実験ブログを読む前、筆者も「受験5教科の中なら、AI数学が一番得

    AIは予想より“ポンコツ”だった? 共通テストの数学、ChatGPTでも平均点未満という結果に驚く
    JULY
    JULY 2024/01/23
    数学の点数が低いのは、LLM としては当然の結果で驚きはない。あくまで言語データの確率処理、というのが LLM の中核であって、論理的思考に関わる処理を、どう組み合わせるかが大きな課題。
  • おさえておきたい生成AIのいま 国内第一人者に聞いてみた | NHK | ビジネス特集

    去年、一躍ブームとなった生成AI。世界中で開発競争が激化し、急速に進化を遂げている。 この先AIはどうなっていくのか。日は開発競争を生き抜くことはできるのか。 国内の研究で第一人者といわれる東京大学の松尾豊教授に教えてもらった。 (おはBizキャスター 渡部圭司/政経・国際番組部ディレクター 大川祐一郎) ・2024年 生成AIは次のステージに進む ・「日語のデータを増強したモデル」が鍵を握る ・研究開発を“オープン”にできるか ・AIが人間に“忖度”する? ・人間をだます? “AIが嘘をつく”=「ハルシネーション」とは ・AIは「いい道具」? あなたはどう使いますか?

    おさえておきたい生成AIのいま 国内第一人者に聞いてみた | NHK | ビジネス特集
    JULY
    JULY 2024/01/22
    松尾先生へのインタビュー記事。かなりバランスの取れた良い記事になっていると思う。
  • ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間

    「ごみ出し案内」業務にはChatGPTを“活用しない”と決断した──生成AIを使った業務効率化を検証してきた、香川県三豊市がそんな発表をした。ChatGPT登場から1年がたち、今や職場に導入する企業・自治体も増え、中にはすでに一定の成果を出した事例もある。三豊市でも、ごみ出し案内業務の効率化を図ろうとしたが、思うようにはいかなかった。 今回の事例では、日AI研究の権威である松尾豊教授の「東京大学大学院工学系研究科松尾研究室」(松尾研)も協力。約半年間、実証実験に取り組んできた。なぜ、三豊市ではChatGPTを使って業務効率化できなかったのか。三豊市に話を聞いた。 なぜ、ごみ出し案内をChatGPTに託したのか? 三豊市が実証実験を始めたのは6月1日。サービス内容は「市民からのごみの分別や収集日に関する問い合わせに対して、三豊市のごみに関する学習をしたAIが24時間自動応答する」というも

    ChatGPTでの業務効率化を“断念”──正答率94%でも「ごみ出し案内」をAIに託せなかったワケ 三豊市と松尾研の半年間
    JULY
    JULY 2023/12/18
    この記事より前に出ていた第一報の記事でも「99% は高すぎる」というブコメを見かけたけど、「自治体の回答」と「近所の人の回答」で求められる回答の質が違う事を理解できない人が多いなぁ。
  • AI回答機能(GPT-4版)テスト実施中 - Yahoo!知恵袋

    AIの回答は信用できますか? AIの回答は正確さや最新の情報を保証するものではありません。事実と異なる場合があります。 AI回答機能の回答にはOpenAI社のGPT-4を用いています。GPT-4の学習データは2021年9月までのデータで、最新の情報が反映されていない可能性があります。 AIの回答はどのように生成されるのですか? 今回提供するAI回答機能は、OpenAI社の大規模言語モデルGPT-4を用いています。投稿いただいた質問をOpenAI社に送り、生成されたAIによる回答を表示しています。 一度表示されたAIの回答を非表示にすることはできますか? AI回答機能の利用に同意して質問を投稿をすると、AIによる回答がされます。あとから非表示にできないため、AIの回答を希望されない場合は、AI回答機能に同意せずに質問を投稿してください。 もしも誤って投稿した際には、違反報告から削除依頼を行っ

    AI回答機能(GPT-4版)テスト実施中 - Yahoo!知恵袋
    JULY
    JULY 2023/11/15
    学習データが知恵袋の過去データなら、回答品質は推して知るべしになるけど...
  • まだChatGPTを使ってない人は「人生を悔い改めた方がいい」――孫正義節が炸裂

    ChatGPTは何回もテレビにも新聞にも雑誌にも出ているのに、それを自分自身で毎日活用してないと。もうそれは電気を否定するとか自動車を否定する人と同じ」――10月4日に東京都港区で開催された「Softbank World」の基調講演で登壇したソフトバンクグループ代表取締役会長兼社長の孫正義氏は、“孫節”を効かせながら生成AIの威力と、AGI(汎用人工知能)が登場する未来について語った。 10年以内に来るぞ「AGI」 「Stable Diffusion」や「ChatGPT」の登場以降、生成AI周りの進化が著しいが、孫氏も生成AIにのめり込んでいるようだ。ディベート相手として毎日GPT-4版のChatGPTと議論を重ね、そこで生まれたアイデアを特許として申請。「今月中に1000件を突破する。集中した日は1日30件申請している」という。今はそれぞれキャラクターを設定しChatGPT内でもディス

    まだChatGPTを使ってない人は「人生を悔い改めた方がいい」――孫正義節が炸裂
    JULY
    JULY 2023/10/05
    多層ニューラルネットワークと Eliza の話を知っていれば、過大な期待をしてしまったと悔い改めることはないよ。
  • 「AIが人類を支配したら?」が現実味を帯びてきた件 加速する“AIアライメント”議論の現在地

    AIが人類を支配したら?」が現実味を帯びてきた件 加速する“AIアライメント”議論の現在地(1/4 ページ) 「実は人類はAIに支配されていたんだ!」「な、なんだってー!?」とまではいかないものの、大規模言語モデルによる生成AI仕事に使えるほどのパフォーマンスを見せて以降、「人類は進化するAIとどう付き合っていくべきか」という議論が格化している。 ここでキーワードとなるのが「アライメント」(Alignment)だ。「整列、連携、調整」といった意味で、AIの文脈では「安全のための調整」という意味合いが強い。 例えば米OpenAIが「GPT-4」を発表した際の文中にも「align」は6回出てきており、抜き出して翻訳すると「GPT-4のアラインに6カ月間を費やした」「アライメント戦略」「50人以上の専門家に協力を依頼した、例えばAIアライメントリスク分野~」など、アライメントを重視している

    「AIが人類を支配したら?」が現実味を帯びてきた件 加速する“AIアライメント”議論の現在地
    JULY
    JULY 2023/09/27
    昨今の生成AIの進化を見ても、結局、多層ニューラルネットワークによる入出力装置に違いないし、汎用AIには程遠い。「AIが」という能動的な支配じゃなくて、人間が勝手にAIを絶対視して、支配されにいくのはありそう。
  • Google検索、生成AIまとめを日本でも開始 面倒な調べ物も“ざっくり解説”

    Google検索、生成AIまとめを日本でも開始 面倒な調べ物も“ざっくり解説”
    JULY
    JULY 2023/08/30
    タイトルを「面倒な調べ物も"ゆっくり解説"」と空目した。でも本当にそうなったら面白そう。
  • 「ChatGPT vs. Google」どっちで検索する? 95人を対象に米研究者らが違いを調査

    このコーナーでは、2014年から先端テクノロジーの研究を論文単位で記事にしているWebメディア「Seamless」(シームレス)を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 Twitter: @shiropen2 米マイアミ大学に所属する研究者らが発表した論文「ChatGPT vs. Google: A Comparative Study of Search Performance and User Experience」は、情報探索タスクに検索エンジン(Google)とAIチャットツールChatGPT)を使用する際のユーザーにおける行動や考え方の違いを調査した研究報告である。 Microsoftは2月、Bing検索エンジンに大規模言語モデル「GPT-4」ベースのチャットAIを統合。この後、Bingのトラフィックは2月から3月にかけて15.8%も増加

    「ChatGPT vs. Google」どっちで検索する? 95人を対象に米研究者らが違いを調査
    JULY
    JULY 2023/07/24
    想像通りかな。普通に検索するときに、適切なキーワードで正確性の高い記事を見つけられる人、分野の時は従来の検索で十分で、そうじゃない場合にギャップを埋める役割として有効、といった感じ。
  • 「もしよろしければ……」VS「やれ」 ChatGPTは丁寧にほめたほうがパフォーマンスがいい? 対応を変えて接してみた

    「もしよろしければ……」VS「やれ」 ChatGPTは丁寧にほめたほうがパフォーマンスがいい? 対応を変えて接してみた:AI相談だ!(1/2 ページ) どんな質問にも“それらしい答え”を返してくれるAIチャットサービス「ChatGPT」。3月には大規模言語モデル「GPT-4」を搭載するなど進化を続けている。では、人間には答えにくい質問や、答えのない問い、ひっかけ問題を尋ねてみたらどんな反応を見せるのか。 連載では、ChatGPTにさまざまな問題を投げかけて、どんな答えを返すか試してみる。その反応からAIの可能性、テクノロジーの奥深さ、AIが人間に与える“示唆”を感じ取ってほしい。 もしよろしければ……/やれ Twitterなどでは「ChatGPTは丁寧に話しかけたほうがパフォーマンスがいい」「ほめたほうがいい回答が出る」といったノウハウが共有されることがある。実際に「丁寧な口調でほめな

    「もしよろしければ……」VS「やれ」 ChatGPTは丁寧にほめたほうがパフォーマンスがいい? 対応を変えて接してみた
    JULY
    JULY 2023/07/18
    まぁ、仕組みと学習されたと考えられるデータの特性を考えたら当然の結果だと思うけど、この現象で「AI は既に感情を」と言い出す人は多いだろうなぁ。
  • ChatGPT新機能を使えば大学入学共通テストの数学も満点取れる? 「Code interpreter」検証

    OpenAIAIチャットサービス「ChatGPT」で「Code interpreter」という機能が登場した。チャット上でPythonのコードを実行できるのだが、これを使えば大学入学共通テストの数学くらいなら満点をとれるのではないか。実際に2023年度の問題を解かせて検証してみた。 Code interpreterは、ChatGPTCSV形式でまとめたデータやPDFファイル、画像などをアップロードして分析できる機能。分析や処理にはPythonを使う。現状はまだβ版という扱い。 これまでのChatGPTは、数学の問題を入力しても計算するのではなく、話の流れを見て正しそうな答えを出力していた。「雰囲気でなんとなく答えていた」といってもいいかもしれない。 しかし、Code interpreterを使えばPythonコードを実行して計算できる。

    ChatGPT新機能を使えば大学入学共通テストの数学も満点取れる? 「Code interpreter」検証
    JULY
    JULY 2023/07/11
    論理展開ができない事を示すわかりやすい例。これで「AI に仕事が奪われる」と言っている人は、論理的な判断をしてない人、と言ったら言い過ぎ?
  • 大規模言語モデルは相関関係から“本当の”因果関係を推定できるのか? 40万個の問題で研究者らが調査

    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。Twitter: @shiropen2 ドイツのMPI-IS、スイスのETH Zurich、米ミシガン大学、香港大学、米Meta AIに所属する研究者らが発表した論文「Can Large Language Models Infer Causation from Correlation?」は、大規模言語モデル(LLM)が相関関係から因果関係を推定する因果推論タスクでどの程度の性能を発揮できるかを調査した研究報告である。 推論の基的な考え方では、因果関係を得るために2つの方法がある。1つは、経験的な知識に基づくものだ。例えば、誕生日パーティーを友人のために準備すると、幸せになるということは常識

    大規模言語モデルは相関関係から“本当の”因果関係を推定できるのか? 40万個の問題で研究者らが調査
    JULY
    JULY 2023/06/23
    想像通りの結果。チューニングである程度、言葉は悪いが「ごまかす」ことはできるから、分野を絞れば良い近似は得られ、実用的な使い方はできると思うが、そこを超えるには、別のブレイクアウトが必要。
  • 文化庁の「AIと著作権」の解釈が話題に AIに詳しい弁護士「かなり踏み込んだ内容」

    内閣府が公開している資料「AIと著作権の関係等について」がTwitterで話題になっている。文化庁が制作した資料で、5月15日に開催した内閣府のAI戦略チームの会議で使用されたもので、AIと著作権に関する現行法での見解などをまとめている。6月3日頃からTwitter上で話題になっており、AIに詳しい弁護士も「かなり踏み込んだ内容」と見解を述べている。 同資料では、著作権の役割は「『思想又は感情を創作的に表現した』著作物を保護するもの」と指摘。データ(事実)やアイデア(作風や画風)は著作物に含まれないという。 この上で、AIと著作権の関係は「生成・利用段階」と「AI開発・学習段階」を分けて考えるべきと説明している。AIが生成した画像などを公開したり、そのイラスト集を販売したりする場合は、通常の著作権侵害と同様の法が適当される。AI画像と既存の著作物との類似性や依拠性(既存の著作物を基に創作し

    文化庁の「AIと著作権」の解釈が話題に AIに詳しい弁護士「かなり踏み込んだ内容」
    JULY
    JULY 2023/06/05
    そもそも生成 AI において、学習データから「類似性や依拠性」を取り除いて生成されるのか? という疑問がある。作風は保護対象外とは言え、例えばイラストやのイラストで学習した AI が、似た作風を生成しない?
  • ChatGPTなどLLMの弱点“ハルシネーション” 「GPTは要素技術だ。商用という意味では遠い」

    ChatGPTのビジネス利用はブームだが、これをビジネスで活用しようとした場合、さまざまな課題がある。AIを活用したチャットボット開発などで知られ、ChatGPTのようなLLMの活用も進めているPKSHA Technologyが、商用利用のポイントについて語った。 PKSHA Technologyでエンジニアリングマネジャーを務める中島真也氏(左)とPKSHA Workplaceでプロダクトマネージャー/プロダクトデザイナーを務める花塚匠氏 「GPTは要素技術だ。そのままでは商用という意味では遠い。検討すべき課題がある」。こう話すのはPKSHA Workplaceでプロダクトマネージャー/プロダクトデザイナーを務める花塚匠氏だ。 課題としては、精度、コスト、レスポンス速度、セキュリティなどが挙げられる。例えば、現在商用利用でほぼ唯一の選択肢となるOpenAIのGPT系APIは、上位のモデル

    ChatGPTなどLLMの弱点“ハルシネーション” 「GPTは要素技術だ。商用という意味では遠い」
    JULY
    JULY 2023/05/23
    同意。これをどう使うか、が、重要。