並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 150件

新着順 人気順

AIの検索結果1 - 40 件 / 150件

  • Hello GPT-4o

    GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat

      Hello GPT-4o
    • 中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!

      インターネット上である投稿が話題だ。それは特定の中国メーカーのスマートフォンでかつ、特定の場面で「消しゴムマジック」に準ずる機能を利用しようとすると「利用できない」というものだ。 その場面とは、北京にある天安門広場だ。北京の有名な観光地であるとともに、中国の歴史的な行事などで幾度も舞台になった場所だ。過去に天安門事件が起こった場所でもあることから、反政府的なデモを防ぐ目的で多くの警備兵が配置されていることでも知られる。 前述の反政府的なデモ防ぐ目的から、インターネット上でも、検閲が厳しい場所としても知られている。中国のネットユーザが天安門広場に飾られる毛沢東氏の肖像画を消した画像でも投稿してしまえば、そのアカウントはあっという間に凍結されてしまう。 今回フォロワーのなしみるく様よりこの2枚の写真を提供いただきました。 @Hayaponlog お疲れ様です🙏 Huawei機で天安門の写真で

        中国で売られるスマホには「消しゴムマジックで消せない場所」があるって本当?実際に試してみた - はやぽんログ!
      • デジタル庁2023年度事業 行政での生成AI利活用検証から見えた10の学び (1/3)|デジタル庁

        デジタル庁のAI担当の大杉直也です。この記事では、生成AIによる業務改善の一助になればと思い、実際の行政業務で生成AIの利活用を検討する際に得られた知見を共有します。 本記事は、「デジタル庁2023年度事業 行政での生成AI利活用検証の結果報告(以降、報告書とよびます)」で得られた知見を、よりわかりやすく具体的に示すために、「10の学び」の形式にまとめたものです。 その検証ではデジタル庁を中心とした行政職員を対象に、実際に複数種類のテキスト生成AIを取り扱える環境+ユースケースごとの独自開発を含むサポート体制を作り、(1)どの行政業務に対し、(2)どのようにテキスト生成AIを使えば、(3)どのくらい改善効果がありそうか、を調べました。また、報告書には含まれていなかった個別ヒアリング等による知見も反映させています。 文量が少し多くなってしまったため、全3回の構成で紹介いたします。第1回の本記

          デジタル庁2023年度事業 行政での生成AI利活用検証から見えた10の学び (1/3)|デジタル庁
        • GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」

          kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io kmizu @kmizu GPT-4oの画像認識力と理解力をもってすればいけるやろと思ってやってみたら実際いけた。 ペーパープロトタイピングから最初のHTML書き起こすのにかなり使えるのでは。 つーか指示そのものを画像の中に書いたの読み取ってくれるの何か世界の壁を超えて対話してる感があって凄い #GPT4o pic.twitter.com/3XHMFg3yye 2024-05-14 12:49:41

            GPT-4oの画像認識力と理解力ならいけるのではと思い手書きの仕様指示を読み込ませたら本当にコードを書き上げてくれた→「ついにコーダーが恐怖を感じる時が来たか」
          • AIラジオ『zenncast』の技術構成(プロンプトつき)

            先日、個人開発していたzenncastというWebサービスをリリースしました。 Zennでトレンドになっている記事を、毎日AIが10分のラジオにして届けてくれるというサービスです。 ありがたいことに公開後はたくさんの方に試してもらえ、技術的な質問も多数いただきました。 このZennではzenncastの技術構成や仕組みを紹介します(プロンプトつき)。 作ったもの まずはエピソードを一つ選んで1分くらい聴いてみてください! AIラジオの雰囲気が掴めると思います。 主な機能・特徴 毎朝10分のラジオを生成 Zennでトレンドになっている記事を要約して紹介 お便りを投稿すると、翌日のエピソードでAIパーソナリティが拾ってコメントしてくれる BGMをつけて爽やかな聴き心地 これらのステップは人の手を介さずすべて自動化されています。 Spotifyなどの各種プラットフォームへの配信はSpotify

              AIラジオ『zenncast』の技術構成(プロンプトつき)
            • Gitの仕組みと用語 / GitHub Term

              物理情報工学ソフトウェア開発演習

                Gitの仕組みと用語 / GitHub Term
              • 「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】

                米OpenAIは5月13日(米国時間)、生成AI「GPT」の新たなモデル「GPT-4o」を発表した。テキストはもちろん、音声や画像、映像での入力、音声での応答に対応し、アプリ版の「ChatGPT」ではユーザーと自然に対話できるようになった。開発者向けにAPIとして提供する他、同日からChatGPT内で利用できるように展開を始める。 GPT-4oは無料ユーザーでも利用可能になる。ChatGPTでは従来、無料ユーザーが使えるモデルは「GPT-3.5」までで、「GPT-4」を利用するには課金する必要があった。ただし、有料のChatGPT Plusユーザーは時間当たりのメッセージやり取り可能回数が無料ユーザーに比べて5倍に緩和される。企業向けのTeamやEnterpriseユーザーはさらに制限が緩和されるとしている。 同社は発表会のライブデモで、GPT-4oを搭載したiOS版ChatGPTと対話す

                  「GPT-4o」発表 頭一つ抜けた性能をChatGPT無料版にも展開 音声と視覚を備えて“自然な対話”可能に【追記済】
                • ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)

                  5月14日未明に発表された超絶高性能化したChatGPTの新バージョン「GPT-4o」は、無課金勢にも開放されると聞いて大喜びしたはいいけど、「なんか俺のChatGP、前のまんまなんだが……」というあなた。実はもうあなたも、すでにウワサのGPT-4oを使えるようになっています。 とはいえ、ちょっとばかり確認の仕方が分かりづらいので、簡単に解説しようと思います。 実はこんなとこにある無課金ユーザー向けのモデル選択 まず、いつものようにChatGPTのサイトにアクセスします。まだアカウントも持っていないよって方は、ここでは詳細は省きますので、どこかの情報を参考にしてちゃちゃっと作ってください。 ChatGPTのサイトにアクセスすると、下のような画面になるかと思います。

                    ChatGPT無料ユーザーが最新の「GPT-4o」を使う方法(ちょっとわかりづらいので解説)
                  • 〔Udemy初夏のビッグセール開催中〕エンジニア組織をまとめる技術─マネージャー歴12年のEMが語るプロジェクト・プロダクト・ピープルマネジメントに必要なスキル - はてなニュース

                    ソフトウェアエンジニアにとって、マネジメントの職に就くかどうかは大きな選択です。現在ではプレイヤーのままでスタッフエンジニアといった高い職位に進むキャリアもありますが、マネージャーとしてチームを率いてこそ達成できるビジネス上の成功もあるでしょう。 ひとくちにマネージャーといっても、マネジメントの対象によって要求されるスキルに幅があります。これまでUdemyの大きなセールで講座を紹介してきた当ニュースですが、今回はソフトウェア開発組織のマネジメントに必要となるスキルにフォーカスしました。 マネージャーという仕事と学びたいスキルを紹介してくれるのは、10年以上前からPM(プロジェクト・マネージャー)などに就いてチームを牽引し、現在はヘルステックベンチャーのカケハシでEM(エンジニアリング・マネージャー)を務める小田中育生(@dora_e_m)さんです。 また記事の後半では、マネジメントに関連し

                      〔Udemy初夏のビッグセール開催中〕エンジニア組織をまとめる技術─マネージャー歴12年のEMが語るプロジェクト・プロダクト・ピープルマネジメントに必要なスキル - はてなニュース
                    • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                      昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                        GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                      • 「韓国企業が育てたLINEが日本に強奪される」 資本関係見直しの問題、韓国野党に反日あおる動き:東京新聞 TOKYO Web

                        【ソウル=木下大資】通信アプリLINE(ライン)を運営するLINEヤフーに対し、総務省が韓国IT大手ネイバーとの資本関係見直しを求めたことに、韓国メディアが一斉に批判的な報道を展開している。自国企業の育てたサービスが日本に「強奪される」との受け止めが広がり、野党の一部では過去の植民地支配と重ねて日本への反感をあおる動きもある。 最大野党「共に民主党」の李在明(イジェミョン)代表は11日、自身の交流サイト(SNS)で松本剛明総務相が伊藤博文の子孫だと指摘する報道を引用し、「韓国のサイバー領土・LINEの侵奪」などと書き込んで尹錫悦(ユンソンニョル)政権の対応が消極的だと批判した。伊藤博文は初代韓国統監を務め、韓国では否定的なイメージが強い。祖国革新党の曺国(チョグク)代表は13日、LINE問題に抗議するとして島根県竹島(韓国名・独島=トクト)を訪問した。 この問題では昨年、LINE利用者らの

                          「韓国企業が育てたLINEが日本に強奪される」 資本関係見直しの問題、韓国野党に反日あおる動き:東京新聞 TOKYO Web
                        • Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita

                          GPT-4o凄すぎる!! 出たときから騒ぎまくっていましたが、GPT-4oの登場で興奮しっぱなしの私です。 先日こちらのQiitaの記事を拝読し、「Power Appsでやったらどうなるだろう🧐」という思いが抑えられず、作ってみたら超高速で画像解析アプリが作成できました! あらためて記事を出してくださったことに感謝いたします! まずは初弾!ということでGPT-4oを使って、 Power Appsで画像解析アプリを作成する方法 を書いていきます! まずは見た目(Power Apps)から! まずはPower Appsでサクっと画面を作ります! PowerPoint感覚で作れることが強みですからね! 最低限のもので構成しています。 画面 ├─ ScreenContainer - スクリーン全体 ├─ HeaderContainer │ └─ Header - ヘッダーコントロール ├─ Bo

                            Power Apps & GPT-4oを使って超高速で画像解析アプリを作る! - Qiita
                          • GPT-4o の概要|npaka

                            以下の記事が面白かったので、簡単にまとめました。 ・Hello GPT-4o 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間とほぼ同じです。英語のテキストおよびコードでは「GPT-4 Turbo」のパフォーマンスに匹敵し、英語以外の言語のテキストでは大幅に改善されており、APIでははるかに高速で50%安価です。「GPT-4o」は、既存のモデルと比較して、特に視覚と音声の理解に優れています。 2. モデルの機能「GPT-4o」以前は、音声モードを使用して、平均2.8秒 (GPT-3.5) および5

                              GPT-4o の概要|npaka
                            • Reader API

                              Our world-class embeddings for search, RAG, agent systems.

                                Reader API
                              • ジャック・ドーシーがBlueskyを辞めた理由をもうちょい詳しくエスパーする|KingYoSun

                                インタビュー記事はこちら https://www.piratewires.com/p/interview-with-jack-dorsey-mike-solana GIGAZINEはBlueskyのかなり初期から分散SNSを追っていて他のメディアより比較的コンテキストがわかっていると思いますが、今回は是非元になったインタビュー記事を読んでほしいです。SNSと言論の自由、検閲について興味があるなら特に 私とBlueskyそれでお前は誰やねんって話なので、ちょっと自己紹介します 多分bsky.appの日本人だと一番古いか、三番目くらいに古いユーザーで、多分世界初のBlueskyのサードパーティサーバー(PDS)のboobee.blueを運営しています。 その時の記事はこれ https://note.com/kingyosun/n/n45d3b1ff89bf 上の記事のときは「プロトコルはマジで

                                  ジャック・ドーシーがBlueskyを辞めた理由をもうちょい詳しくエスパーする|KingYoSun
                                • Googleオフィスに警察、社員50人超を解雇 抗議デモ対応が見せつけた“IT界の巨人”の変貌ぶりとは

                                  これに対し、今回のデモを組織した団体「No Tech For Apartheid」は「自分たちの労働がアパルトヘイトや大虐殺の原動力となることは望まない」と訴える。Googleに対してイスラエル政府との契約の中止を求めるのは、発端となったプロジェクト・ニンバスの契約を「ガザのパレスチナ人を虐殺するイスラエルへの支援」と見なしていることによるものだ。 社員の解雇について同団体は「言語道断の報復行為」「Googleが自社の社員よりも、虐殺行為をしているイスラエル政府および軍との12億ドルの契約の方を大切にしていることが、これではっきりした」と反発した。 また抗議デモは平和的に行われ、Google社内で器物を損壊したり、同僚を妨害したりもしていないと主張。社員の解雇はGoogleのいう「開かれた文化」の虚偽をさらけ出したと訴え、解雇は不当だったとし全米労働関係委員会(NLRB)に不服を申し立てて

                                    Googleオフィスに警察、社員50人超を解雇 抗議デモ対応が見せつけた“IT界の巨人”の変貌ぶりとは
                                  • OpenAIのAI危険対策チームトップが「限界に達し」退社 「安全確保が後回しになっている」

                                    米OpenAIで人間よりもはるかに賢いAI「Superintelligence」(超知能)の制御を目指して昨年結成されたSuperalignmentチームのトップ、ヤン・ライケ氏は5月17日(現地時間)、退社するとXで発表した。 「私がOpenAIに参加したのは、ここが超知能の研究を行うのに世界で最適だと思ったからだ。だが、OpenAIの幹部チームと中核的優先事項についてずっと同意できず、限界点に達した」という。 Superalignmentチームはライケ氏と、共同創業者でチーフサイエンティストのイリヤ・サツケバー氏が率いてきた。サツケバー氏は14日に退社を発表している。 ライケ氏は、「超知能の構築は本質的に危険な取り組み」であり、「OpenAIは人類全体に大きな責任を担っている」が、「安全性が輝かしい製品の開発より後回しになっている」と警鐘を鳴らす。 OpenAIは昨年2月、AGI(Ar

                                      OpenAIのAI危険対策チームトップが「限界に達し」退社 「安全確保が後回しになっている」
                                    • 絵文字は日本発祥らしい😱

                                      何気なく英語ニュースを聞いてたら"emojis"って単語が出てきてびっくりしてgeminiにきいたら確かに日本発祥らしい。すごいね。 The first emoji set was created by a Japanese phone carrier in 1999, and they've become a worldwide phenomenon since then. 最初の絵文字セットは 1999 年に日本の携帯通信会社によって作成され、それ以来世界的な現象になりました。

                                        絵文字は日本発祥らしい😱
                                      • 【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境

                                        はじめに WSL2(Windows Subsystem for Linux 2)は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。 この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。 構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。 今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU:NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化 デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。 「コントロール

                                          【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境
                                        • [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開

                                          [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開 Googleは同社の最新生成AIであるGeminiをベースとした新しいWeb IDE「Project IDX」をオープンベータとして公開しました。 Project IDXは、モバイルやデスクトップなどのマルチプラットフォームに対応したフルスタックのWebアプリケーションを、さまざまなフレームワークや生成的AIの支援などを活用して効率的に開発するための、Webブラウザから利用可能な統合開発環境です。 これまでその存在は発表されていましたが、招待されたユーザーのみが利用可能でした。 We want to make generative AI accessible to every developer on the planet. That’s why we’re making Gemini

                                            [速報]Google、Geminiベースの新WebIDE「Project IDX」をオープンベータで公開
                                          • AIの発明 特許を認めない判決「発明者は人に限られる」 | NHK

                                            AIの発明に特許を認められるかどうかが争われた裁判で、東京地方裁判所は「発明者は人に限られる」として特許を認めない判断を示しました。一方、今の法律はAIの発明を想定しておらず多くの問題が起きるとして、国会での議論を促しました。 アメリカに住む原告はAIが自律的に発明した装置について、発明者の名前を「ダバス、本発明を自律的に発明した人工知能」と書いて特許を出願しましたが、特許庁は3年前、「発明者は人間に限られる」として退ける決定をし、原告は決定の取り消しを求めて訴えを起こしました。 16日の判決で東京地方裁判所の中島基至裁判長は「知的財産基本法では、発明は人間の活動で生み出されるものだと定義されている。グローバルな観点でも、発明者に直ちにAIが含まれると解釈することに慎重な国が多い」と指摘し、原告の訴えを退けました。 一方、特許をめぐる法律はAIの発明を想定していないと指摘したうえで、「AI

                                              AIの発明 特許を認めない判決「発明者は人に限られる」 | NHK
                                            • M1MacでOllamaを試したら爆速で驚いた

                                              はじめに いつもNVIDIAが載っているWindowsで楽しくLLMを動かしたり生成AIライフを楽しんでいますが、今回はMacOSでOllamaを入れてLlama3を動かしてみました。 スペック: Apple M1 Pro(16 GB) 少し前だとCUDAのないMacでは推論は難しい感じだったと思いますが、今ではOllamaのおかげでMacでもLLMが動くと口コミを見かけるようになりました。 ずっと気になっていたのでついに私のM1 Macでも動くかどうかやってみました! 結論、爆速で推論できていたのでとても驚きました。OSS開発に感謝です! Ollamaとは OllamaとはローカルでLLMを動かすことができるアプリケーションです。 以下からダウンロードできます。 MacOSとLinuxで使うことができます。Windowsもプレビュー版があるみたいです。 #いざ推論 ダウロードができたらシ

                                                M1MacでOllamaを試したら爆速で驚いた
                                              • Chrome DevToolsにもGeminiを搭載へ。エラーの解決策などAIが支援

                                                Googleは、日本時間5月15日から開催中のイベント「Google I/O 2024」で、デスクトップ版のChromeが備える開発ツール「Chrome DevTools」に、同社の最新版の生成AIであるGeminiを組み込むと発表しました。 これによりDevToolsのコンソールで表示されるエラーメッセージなどをGeminiが解説し、エラーの解決などを支援してくれるようになります。 DevToolsのエラーをGeminiが解決 下記がGoogle I/Oのデベロッパー向け基……

                                                  Chrome DevToolsにもGeminiを搭載へ。エラーの解決策などAIが支援
                                                • GPT-4oを使って2Dの図面から3DのCADモデルを作る

                                                  はじめに 株式会社ファースト・オートメーションCTOの田中(しろくま)です! 先日、 OpenAIからGPT-4oがリリース されました。 いろいろGPT-4oに関して調べていると、スピードが速くなっていたり、音声も直接扱えてマルチモーダル化が進んでいたりするようなのですが、画像に関して GPT-4-turboに比べ、認識やOCRの精度が向上している ようです。 製造業という観点からすると、これは 設計図面などに活かせるようになるのでは? と思いました。 機械部品などの設計図面は以下のように、特定の方向から部品を2次元上に落とし込んだ形で書かれるのですが、部品本体を描いている図以外に、寸法や名称といった文字も含まれた画像になっています。 このような 図と文字の複合データにおいて、GPT-4oの進化は有効なのではないか と考えました。 ※画像元URL: http://cad.wp.xdoma

                                                    GPT-4oを使って2Dの図面から3DのCADモデルを作る
                                                  • 「AIずんだもん」3Dモデルが使用中止に 制作者が「不快な内容」と抗議

                                                    YouTubeチャンネル「AIずんだもん」を運営するきらっちさんがXで、東北ずん子・ずんだもんプロジェクトのキャラクター・ずんだもんの3Dモデルの使用を中止すると発表した。 3Dモデルの制作者から「不快な内容に利用されているため、利用をやめてほしい」と抗議を受けたという。併せて、きらっちさんは運営に不備があったとして謝罪した。 なお、5月13日に事情を説明するために行われた配信では、3Dモデルを無断で使用していたと発言している。 事情を説明するために行った配信 チャット欄のコメントに反応するAIずんだもんYouTubeチャンネル「AIずんだもん」では、チャット欄のコメントにAIVTuber・AIずんだもんが応答する配信を行っていた。 AITuberとは、視聴者のコメントに反応して応答を行うキャラクターコンテンツのこと。AI技術を用いることで、まるでVTuberのようなやり取りが疑似的に行わ

                                                      「AIずんだもん」3Dモデルが使用中止に 制作者が「不快な内容」と抗議
                                                    • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

                                                      1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

                                                        大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
                                                      • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                                        昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                                          OpenAIのGPT-4oを日本語OCRとして使ってみる
                                                        • Googleは対話型AI「Bard」のミスで時価総額1000億ドルが吹き飛ぶ、現実味を帯びる生成AI倒産 【生成AI事件簿】顧客からの問い合わせに誤回答、社内規則や契約書類で重大ミス、大切な場面で失敗して評判失墜など | JBpress (ジェイビープレス)

                                                          生成AIを活用する企業は増える一方だが、それとともに、AIの間違いによって損害を被る企業も増えている。 エア・カナダはチャットボットの誤回答で賠償金を支払うはめに。別の企業は生成AIが作成した解雇合意書に重要な項目が欠落していたため、高額な和解金を支払わなければならなくなった。 企業に求められるのは、生成AIは間違いを犯すという前提に基づいた準備や行動。AIが間違えているかどうか分からない領域では活用すべきではない。 (小林 啓倫:経営コンサルタント) チャットボットで損害を被ったエア・カナダ 企業内でのAI活用が加速している。社員や顧客と自然な言葉でやり取りできる生成AIが登場したことで、AIを応用できる業務が増え、具体的な成果も見えやすくなったためだ。 たとえば、カナダで1855年に設立され、現在では同国で最大の規模を誇るTD銀行(Toronto-Dominion Bank)は、コンタ

                                                            Googleは対話型AI「Bard」のミスで時価総額1000億ドルが吹き飛ぶ、現実味を帯びる生成AI倒産 【生成AI事件簿】顧客からの問い合わせに誤回答、社内規則や契約書類で重大ミス、大切な場面で失敗して評判失墜など | JBpress (ジェイビープレス)
                                                          • この「なんでわかるの?」系の質問は初めてやってみたのだけど、なかなか。こう答えられるのは「本当に賢い」証拠だと言ってもいいと思う。

                                                            kmizu @kmizu A Software Engineer in Osaka (& Kyoto). Ph.D. in Engineering. Interests: Parsers, Formal Languages, etc. ツイートは所属先の見解と関係ありません.思いついたことをつぶやきます. kmizu.github.io

                                                              この「なんでわかるの?」系の質問は初めてやってみたのだけど、なかなか。こう答えられるのは「本当に賢い」証拠だと言ってもいいと思う。
                                                            • 福井県小浜市による「ポケモンカードトレパク疑惑」が想像の100倍くらいアウトだった「なんでバレないと思ったんだ」

                                                              リンク 福井新聞ONLINE ポケモンに酷似、福井県小浜市など製作のカード配布停止 食のキャラ2種、レシラムとツタージャ似と指摘 | 社会,政治・行政,催し・文化 | 福井のニュース | 福井新聞ONLINE 福井県の小浜市・若狭町日本遺産活用推進協議会が企画し、4月から配布を始めたオリジナルのキャラクターカード2種類が、ゲームで人気のポケットモンスターのキャラクターに酷似し著作権を侵害する恐れがあるとして、配布を停止したことが分かった。事務局を務める小浜市は「酷似していると認めざるを得ない」としている。 同団体は御食国(みけつくに)の食文化に親しんでもらおうと、キャラクターカード製作を2022年度に企画。 89 users 29

                                                                福井県小浜市による「ポケモンカードトレパク疑惑」が想像の100倍くらいアウトだった「なんでバレないと思ったんだ」
                                                              • GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO

                                                                こんにちは、MLBお兄さんこと松村です。 昨年の MLB 全体ドラフト1位のポール・スキーンズ投手がメジャーデビューしました。予想通りの豪速球でした。 2024年4月29日についにテクニカルプレビューが開始となった GitHub Copilot Workspace ですが、ゴールデンウィーク中に私のアカウントでも利用可能となっていたため、試してみたことを書いていきます。 利用開始まで この記事を書いている時点では、 GitHub Copilot Workspace の利用には待機リスト (Waitlist) への登録が必要であり、その通過を待つ必要があります。 そのため GitHub Copilot Workspace を利用したい方は、こちらから登録を行いましょう。 githubnext.com ゼロからアプリを作ってみる 今回は練習として私がコードを書くこと無く、 C# の簡単なアプリ

                                                                  GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO
                                                                • NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体何なのか?

                                                                  NVIDIAが2024年5月15日に、経済産業省の助成や国内の主要クラウド企業との協力により、日本の生成AIインフラの構築を推進し、自国のデータを自国のAIで活用する「ソブリンAI」の基盤作りを強化していくこと発表しました。 NVIDIA to Help Elevate Japan’s Sovereign AI Efforts Through Generative AI Infrastructure Build-Out | NVIDIA Blog https://blogs.nvidia.com/blog/japan-sovereign-ai/ NVIDIA、生成AIインフラ構築をとおして日本のソブリンAIの取り組みを支援 | NVIDIAのプレスリリース https://prtimes.jp/main/html/rd/p/000000466.000012662.html NVIDIAは今

                                                                    NVIDIA主導で日本が「ソブリンAI」先進国に、AI立国に必須とNVIDIAが提唱するソブリンAIとは一体何なのか?
                                                                  • 出回っている「頂き女子マニュアル」をAIに要約してもらおうとしたら倫理的に問題があると断られた→頼み方を変えたらチョロかった

                                                                    NISHIO Hirokazu @nishio Doctor of Science & Master of Tech Mgmt | Research Director of Cybozu | Board Member of Mitou Foundation | Contributor of ⿻Plurality mem.nhiro.org

                                                                      出回っている「頂き女子マニュアル」をAIに要約してもらおうとしたら倫理的に問題があると断られた→頼み方を変えたらチョロかった
                                                                    • 怒る客の声、AIで穏やかに ソフトバンクがカスハラ対策 - 日本経済新聞

                                                                      ソフトバンクは15日、人工知能(AI)で客の通話音声を穏やかなトーンに変換する技術の事業化を目指すと発表した。顧客による迷惑行為「カスタマーハラスメント(カスハラ)」に対する取り組みの一環で、コールセンターの電話対応業務に利用する。2025年度中の事業化に向けて、東京大学と研究開発や検証を進める。ソフトバンクの新規事業提案制度「ソフトバンクイノベンチャー」から生まれた。電話口で怒鳴るなどの迷惑

                                                                        怒る客の声、AIで穏やかに ソフトバンクがカスハラ対策 - 日本経済新聞
                                                                      • 「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】

                                                                        主催の清風明育社は、コンピュータ専門学校「清風情報工科学院」を運営する学校法人。他ににじジャーニーの提供元や大阪府教育委員会などが協賛しているという。また、公式サイトには協力先として日本マイクロソフトの名前を記載している。当初は協賛にワコムも記載していたが、5月13日にネット上で批判の声が大きくなった後、同日中に記載がなくなった。 清風明育社は、コンテスト開催の背景について「(生成AIは)有料利用が前提とされることが多いため、若年層は手が出しにくい」「無料で利用できる高品質な生成AIアートのツールに触れることが、進路選択・職業選択において価値ある体験になる」と説明していた。 一方コンテストに対してはいくつかの批判も。まず「入賞作品の著作権は主催者に帰属する」点については「成果物を奪うつもりか」という批判が見られた。また、協賛社一覧にワコムの名前があったことから、同社に対し「クリエイター向け

                                                                          「入賞作品の著作権は主催者が取得」──生成AIアートコンテストが物議 ワコム協賛の記述も削除に【追記あり】
                                                                        • OpenAI、次世代AIモデル「GPT-4o」を発表

                                                                          日本時間2024年5月14日未明、OpenAIは新たなフラッグシップモデル「GPT-4o」を発表しました。このモデルは、音声、視覚、テキストのリアルタイム処理を可能とし、従来のAIモデルを大きく上回る性能を誇ります。OpenAIのCTOであるミラ・ムクティ氏は、「GPT-4oは、人間とマシンのインタラクションの未来を大きく変える一歩です。このモデルにより、コラボレーションがはるかに自然で簡単になります」と述べました。 「GPT-4o」の主な特徴を以下にまとめました。 他のモデルを凌駕する性能 GPT-4oは、OpenAIの以前のモデルであるGPT-4 Turboや、ライバル会社のClaude 3 Opusなどの大規模言語モデルと比較して、頭ひとつ抜けた性能向上を実現しました。サム・アルトマンCEOは、今年4月に "Chatbot Arena" でgpt2というコードネームでテストされていた

                                                                            OpenAI、次世代AIモデル「GPT-4o」を発表
                                                                          • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

                                                                            こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                                                                              ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
                                                                            • グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ

                                                                                グーグルのAI祭り「Google I/O 2024」基調講演を総まとめ
                                                                              • AI発明の新技術、特許と認めず 東京地裁「人間に限定」

                                                                                人工知能(AI)が発明した新技術が特許として認められるかどうかが争点となった訴訟があり、東京地裁は16日、知的財産基本法などに照らし「発明者は人間に限られる」として、米国籍の出願者の請求を棄却する判決を言い渡した。中島基至裁判長は一方で、現行法の制定時にAIの発達が想定されていなかったとし、国民的議論で新たな制度設計をすることが相当だと言及した。 判決によると、出願者は数年前に、発明者を「ダバス、本発明を自律的に発明した人工知能」と記載し、特定装置に関する特許を出願。特許庁は「発明者として記載できるのは人に限られる」として修正を命じたが応じなかったため、出願を却下した。 中島裁判長は「発明は人間の創造的活動により生み出されるものと定義される」と指摘。特許庁の判断は適法と結論付けた。 その上で、現行法の解釈では「AIがもたらす社会経済構造の変化を踏まえた的確な結論を導き得ない」と指摘。AIに

                                                                                  AI発明の新技術、特許と認めず 東京地裁「人間に限定」
                                                                                • Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も

                                                                                  基調講演に最初に登場したスンダー・ピチャイCEOは、同社の生成AI「Gemini」のこれまでの成長について語った。同氏によると、150万以上の開発者が活用しているという。 生成AI搭載検索エンジン「AI Overview」(旧SGE) 「AI Overview」は、昨年のGoogle I/Oで発表されたGoogle検索の生成AI機能「Search Generative Experience」(SGE)を改称し、改善したもの。 詳細を説明したリズ・リード氏は、「Googleがあなたのためにググってくれるようになる」と語った。 AI Overbiewは「Gemini時代のGoogle検索」であり、リアルタイム情報、ランキングと品質システム、新しいエージェント機能で改善されたという。 マルチステップリーゾニング(多段階推論)で、1つの質問で複数ステップの結果を提示する。 例として、ピラティスにつ

                                                                                    Google I/O 2024基調講演まとめ AI一色、GPT-4oのような機能も