並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 6 件 / 6件

新着順 人気順

画像認識の検索結果1 - 6 件 / 6件

  • GPT-4oをOCRとして使う - Re:ゼロから始めるML生活

    OpenAIからChatGPT-4oが発表されましたが、皆さんガンガンつかっていますでしょうか? さて、このChatGPT-4oですが、テキスト以外のデータも使用できるようになっているという特徴があります。 普通にテキストでのやり取りをしつつも画像データを扱えるということで、「実はこれいい感じのOCRとして使えるんじゃね?」って思っちゃったわけです。 ということで、今回はChatGPT-4oを使ってOCRを使うとどんなもんなのかやってみたいと思います。 やりたいこと やってみる とりあえずやってみる 請求書 名刺 参考文献 感想 やりたいこと 今回やりたいことはOCRです。早い話が画像ファイルを突っ込んでテキストを読み取りたいって感じです。 ただ、当たり前のようにOCRって言葉を使用していますがOCRって結構奥が深いです。 mediadrive.jp 単純に画像から文字を見つけて対応するテ

      GPT-4oをOCRとして使う - Re:ゼロから始めるML生活
    • OpenAI元社員リーク文書から読み解くAGIと人類の未来|遠藤太一郎

      はじめにOpenAIの元社員がリークした文書が話題になっています。「Situational Awareness: The Decade Ahead」と題されたこの文書は、AGI(汎用人工知能)や超知能の開発と、それがもたらす影響について詳細に分析している内容です。 この元社員はOpenAIのスーパーアラインメントチームに所属ということで、まさにこの文書の内容を専門として扱っていた方です。 AGIやその先の超知能への道筋、そして超知能時代に何が起こるのかとその対策に関して、ここまでまとまった文書をみたのは初めてでした。 そこで、この文書の内容を解説するスライドを作成してみました。元の文書は英語で165ページ程あるため、元々は私自身が素早く概要を掴むために、AI(Gemini 1.5 Pro)で要約したものがベースになっています。 AIの要約は間違う可能性があるので、全ての内容に引用元を記載し

        OpenAI元社員リーク文書から読み解くAGIと人類の未来|遠藤太一郎
      • AI時代に一人勝ち。NVIDIAの「CUDA」がIntelやAppleを蹴散らし業界の“実質的なスタンダード”になった背景を中島聡が徹底解説 - まぐまぐニュース!

        空前のAIブームの中にあって、その開発の現場で「一人勝ち」とも言うべき圧倒的なシェアを誇っているNvidia(エヌビディア)のGPU向け開発環境「CUDA」。IntelやAppleといったライバルたちを尻目に、いかにしてCUDAはトップに登り詰めたのでしょうか。今回のメルマガ『週刊 Life is beautiful』では世界的エンジニアとして知られる中島聡さんが、CUDA誕生の経緯から業界の「事実上の標準」となるまでを詳しく解説。さらにMicrosoftが5月20日に発表した「Copilot+PC」に関して、中島さんが注目したポイントを記しています。 ※本記事のタイトル・見出しはMAG2NEWS編集部によるものです/原題:NvidiaのCUDAが今の地位を築いた経緯 プロフィール:中島聡(なかじま・さとし) ブロガー/起業家/ソフトウェア・エンジニア、工学修士(早稲田大学)/MBA(ワシ

          AI時代に一人勝ち。NVIDIAの「CUDA」がIntelやAppleを蹴散らし業界の“実質的なスタンダード”になった背景を中島聡が徹底解説 - まぐまぐニュース!
        • ChatGPT-4o vs ChatGPT-4|特徴や各モデルの違いを解説 | 株式会社LIG(リグ)|DX支援・システム開発・Web制作

          こんにちは、Technology部のジョシュです。 先月13日にリリースされた「ChatGPT-4o」は、ChatGPT-4の後継モデルとして、前モデルからの性能の向上や、新たに追加された機能に世界中から注目が集まりました。 そこで今回は、「ChatGPT-4o」と前モデルの「ChatGPT-4」の違いを深掘りし、それぞれの機能や性能、そして応用の可能性を詳しく解説します。 「結局、どっちのモデルを使ったら良いの?」「ChatGPT-4oは何ができるようになったの?」など、 ChatGPTの最新情報をキャッチアップしたい方はぜひご覧ください。 ChatGPT-4oの概要 ChatGPT-4oは、OpenAIの最新の生成AIモデルで、より強化された自然言語処理(NLP)機能を備えています。GPT-3.5とGPT-4をベースに、テキスト、音声、画像をリアルタイムでシームレスに統合処理します。

            ChatGPT-4o vs ChatGPT-4|特徴や各モデルの違いを解説 | 株式会社LIG(リグ)|DX支援・システム開発・Web制作
          • Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み

            Amazonは生成AIと画像認識を使って、発送前の製品に破損したものや色・サイズが間違っているものがないかをチェックするシステム「Project P.I.」を発表しました。Project P.I.はすでにアメリカの一部フルフィルメントセンターで導入されているとのことです。 Amazon: AI spots product defects, reduces waste https://www.aboutamazon.com/news/innovation-at-amazon/amazon-ai-sustainability-carbon-footprint-product-defects How Project P.I. helps Amazon remove imperfect products - Amazon Science https://www.amazon.science/new

              Amazonの倉庫で出荷前に製品が破損・欠損しているかどうかを自動チェックするAI「Project P.I.」の仕組み
            • JR東海、25年度からワンマン運転拡大 AI画像認識を活用 - 日本経済新聞

              JR東海は6日、AI(人工知能)による安全確認装置を用いて、在来線のワンマン運転を拡大すると発表した。2025年度中に関西本線などの2区間で新型通勤電車「315系」の4両1編成に導入する。車両の側面に付けたカメラでホームの状況を撮影し、AIの画像認識技術で列車に接近する人物などを判別する。省人化を進めて業務効率を高める。まず導入するのは関西本線の名古屋―亀山駅間と武豊線の2区間。26年度以降は

                JR東海、25年度からワンマン運転拡大 AI画像認識を活用 - 日本経済新聞
              1