並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 22341件

新着順 人気順

機械学習の検索結果1 - 40 件 / 22341件

  • CHI2024を振り返って

    ヒューマンコンピュータインタラクション研究のトップカンファレンスであるACM CHI2024がハワイで開催された (5/11–5/16)。会議に出た感想を残しておく。 AIの席巻ある程度予想はしていたがAI、LLMと人間とのインタラクションをトピックにした発表が激増していた。CHIはパラレルセッションで、同時に20セッションぐらいが並行して発表が行われている。同時刻に開催される複数のセッションタイトルにAIやLLMが入っていて、もはやすべてを見るのが不可能な状態になっていた。 AIと銘打っていないセッションでも、要素技術として機械学習を使っているものは多いので、体感では半分以上の研究発表が何等かの意味でAIを使っている感じだった。少し前までは機械学習としってもSVMやCNN、LSTMぐらいでtransformersを使っていたら新しいね、ぐらいだったのだが、LLMが状況を変えていて「誰でも

      CHI2024を振り返って
    • M1MacでOllamaを試したら爆速で驚いた

      はじめに いつもNVIDIAが載っているWindowsで楽しくLLMを動かしたり生成AIライフを楽しんでいますが、今回はMacOSでOllamaを入れてLlama3を動かしてみました。 スペック: Apple M1 Pro(16 GB) 少し前だとCUDAのないMacでは推論は難しい感じだったと思いますが、今ではOllamaのおかげでMacでもLLMが動くと口コミを見かけるようになりました。 ずっと気になっていたのでついに私のM1 Macでも動くかどうかやってみました! 結論、爆速で推論できていたのでとても驚きました。OSS開発に感謝です! Ollamaとは OllamaとはローカルでLLMを動かすことができるアプリケーションです。 以下からダウンロードできます。 MacOSとLinuxで使うことができます。Windowsもプレビュー版があるみたいです。 #いざ推論 ダウロードができたらシ

        M1MacでOllamaを試したら爆速で驚いた
      • 【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境

        はじめに WSL2(Windows Subsystem for Linux 2)は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。 この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。 構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。 今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU:NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化 デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。 「コントロール

          【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境
        • Apple上級幹部2人が「ほとんどのMacユーザーはiPadも持っている」「AI PCとしてのiPad」などを語るインタビューが公開中

          IT系ニュースサイトのFast Companyが、Appleのワールドワイドマーケティング部門シニア・ヴァイスプレジデントであるグレッグ・ジョスウィアック氏と、ハードウェアエンジニアリング部門シニア・ヴァイスプレジデントであるジョン・ターナス氏へのインタビューを公開しました。両氏は2024年5月に登場したiPadシリーズに言及しています。 Apple still isn't done building its dream iPad - Fast Company https://www.fastcompany.com/91124983/ipad-greg-joswiak-john-ternus-interview This Joz quote is why macOS will likely never come to the iPad - 9to5Mac https://9to5mac.c

            Apple上級幹部2人が「ほとんどのMacユーザーはiPadも持っている」「AI PCとしてのiPad」などを語るインタビューが公開中
          • NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 | NTT東日本

            News Release東日本電信電話株式会社 2024年5月17日 NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 NTT東日本のデータサイエンティスト森田 大貴(もりた だいき)を含むチームが、世界的なAIのデータ分析コンペティションプラットフォーム「Kaggle(カグル)」※1で開催された「LLM Prompt Recovery」※2(以下、本コンペティション)において、全2,175チーム中12位に入賞し、金メダルを獲得しました。 これにより、森田社員は「Kaggle」コンペティションに参加している約20万人のユーザーの中で上位約1%に相当する「Kaggle Master」※3の称号を獲得しました。 1. 本コンペティションについて 「Kaggle」は、世界中のAIエンジ

              NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 | NTT東日本
            • 速度・出力量・コスト効率最強の、Gemini 1.5 Flash!

              はじめに おれの名前は樋口恭介。とにかく速いものが好きだ。そして今日は最近一番"速さ"を感じたものを紹介したい。そう、"Flash"のことです。 5月15日にGoogleの新しいモデル「Gemini 1.5 Flash」が発表され、ちょうどその日に名古屋イノベーターズガレージというところで生成AIのセミナーをすることになっていたので、その場で触ってみました。 そしたら……なんかプロンプト一発で1万字くらいが数分で出てきてしまい、あまりの衝撃で絶句してしまいました。LLMが出てきてから1年半くらい? ほぼ毎日触っていますが、こいつらはまだおれを驚かせてくれる……。 以下は急に446行・約1万字が出てきて放心状態のぼくの様子。 まあこういうのは動きを見てもらうのが一番でしょうから、ぜひ見てみてください。以下、あらためて触ってみた様子を動画におさめたものです。 Flashのデモ動画 いやこれマジ

                速度・出力量・コスト効率最強の、Gemini 1.5 Flash!
              • DNS トンネリング技術の悪用範囲がさらに拡大、C2 や VPN のほかユーザー追跡やネットワーク スキャンにも

                DNS トンネリング技術の悪用範囲がさらに拡大、C2 や VPN のほかユーザー追跡やネットワーク スキャンにも This post is also available in: English (英語) 概要 本稿は、DNS (ドメイン ネーム システム) トンネリングの野生 (in the wild) での新たな応用に関するケース スタディを紹介します。こうした技術の応用範囲は、単なるコマンド & コントロール (C2) や仮想プライベート ネットワーク (VPN) が目的の DNS トンネリングを超えて広がっています。 ときに悪質なアクターは DNS トンネリングを秘密の通信チャンネルとして使うことがあります。これなら従来型のネットワーク ファイアウォールを回避でき、従来の検出手法から C2 トラフィックや漏出データを秘匿できるからです。 ところが私たちは最近、従来の C2 や VPN

                  DNS トンネリング技術の悪用範囲がさらに拡大、C2 や VPN のほかユーザー追跡やネットワーク スキャンにも
                • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

                  こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                    ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
                  • LLM に表データを読み解かせたかったので、ちょっと試してみた | CyberAgent Developers Blog

                    AI事業本部 協業リテールメディア Div. の青見 (@nersonu) です。2023年11月に中途で入社したため、5月でようやく入社半年を迎えました。社内 Slack の times で有給休暇が付与されて喜んでいる(?)様子を御覧ください。 有給休暇に喜ぶ筆者 そんな社歴半年のペーペーですが、普段は機械学習エンジニアと強い気持ちで名乗ってお仕事をしています。特にうまい繋ぎも思いつかないので、記事の本題に入りましょう。 近年、 LLM に関する話題は尽きることはありません。研究領域やビジネス領域といった概念にとらわれず、わたしたちの生活のすぐそばで、今まさに違和感が少しずつ取り除かれながら社会に溶け込んでいっていると感じます。そんな LLM ですが、自然言語というデータの枠に収まらず、様々なタスクへの適用の試みが日夜行われています。そんな挑戦的な数多あるトピックの中から「表形式データ

                      LLM に表データを読み解かせたかったので、ちょっと試してみた | CyberAgent Developers Blog
                    • Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp

                      Apple⁠⁠、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も Appleは2024年5月15日、ハンディキャップのあるユーザがiPhoneやiPadなどを操作する際に助けとなる、2024年後半に登場予定の新しいアクセシビリティ機能を発表した。毎年5月の第3木曜日(今年は5月16日)に開催される、世界中でアクセシビリティについて話し合い、考え、学ぶことを目的とした一日「Global Accessibility Awareness Day(GAAD⁠)⁠」に合わせて発表されたもの。 Apple announces new accessibility features, including Eye Tracking -Apple アイ⁠・トラッキングがiPadとiPhoneで利用可能に 人工知能を活用したアイ・トラッキングにより、目だけでiPad

                        Apple、新しいアクセシビリティ機能を発表 ―視線による操作や音楽を“テクスチャ+振動”で体験する機能も | gihyo.jp
                      • iPhoneやiPadを「目で操作」可能に Apple、24年後半にアクセシビリティー機能を複数追加

                        米Appleは5月15日(現地時間)、2024年後半に登場する新しいアクセシビリティー機能を発表した。身体障害のあるユーザーがiPhone/iPadを目で操作できる「Eye Tracking」や、聴覚障害のあるユーザーに向けた新しい音楽体験「Music Haptics」、音声認識機能の強化や、乗り物酔いを軽減する「Vehicle Motion Cues」などを含む。 iPhone/iPadを目で操作できるEye Trackingは、iPhoneとiPadのフロントカメラを使用し、目の動きをトラッキング。アイコンやボタンなどの上にポインターを一定時間置くとアクションを実行する「Dwell Control」により、物理ボタン、スワイプ、その他のジェスチャーなどの操作が可能。iOS/iPadOSのアプリで利用でき、追加のハードウェアやアクセサリーは必要ないという。 Music Hapticsは耳

                          iPhoneやiPadを「目で操作」可能に Apple、24年後半にアクセシビリティー機能を複数追加
                        • Appleが追加アクセサリ不要なアイトラッキングや音楽を触覚で楽しめるMusic Haptics、音声ショートカットなどの新しいアクセシビリティ機能を発表

                          Appleは2024年5月15日、アイトラッキングやMusic Haptics、音声ショートカット、車両モーションキューなど2024年内に登場予定の新たなアクセシビリティ機能を発表しました。 Apple announces new accessibility features, including Eye Tracking - Apple https://www.apple.com/newsroom/2024/05/apple-announces-new-accessibility-features-including-eye-tracking/ ◆アイトラッキング 人工知能を活用したアイトラッキングにより、ユーザーは目だけでiPadやiPhoneを操作することが可能になります。アイトラッキングには前面カメラが使用されるため追加のハードウェアやアクセサリは不要で、数秒でセットアップと調整が

                            Appleが追加アクセサリ不要なアイトラッキングや音楽を触覚で楽しめるMusic Haptics、音声ショートカットなどの新しいアクセシビリティ機能を発表
                          • Amazon Kendra の Custom Document Enrichment と Amazon Bedrock で画像検索に対応する - Taste of Tech Topics

                            こんにちは、機械学習チーム YAMALEX の駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 皆さんは、「前のプレゼン資料に使った、犬の画像はどこいったかな?あの画像が欲しいので、探してくれないかな?」と無茶振りされたことはありませんか? そんな時でも、「舌を出して喜んでいる」と検索すれば画像がヒットし、こんな無茶振りにも応えることができるシステムを Amazon Kendra (以下、 Kendra )で構築しました。 舌を出して喜んでいる犬 ちょっと待って Kendra は機械学習を利用した検索サービスで、ウェブサイトや S3 に保存したドキュメントなどをもとに、適切な検索結果を返します。 しかし、 Kendra で検索できるのはテキストだけで、画像を S

                              Amazon Kendra の Custom Document Enrichment と Amazon Bedrock で画像検索に対応する - Taste of Tech Topics
                            • アップル、目で iPhoneやiPadを操作するアイトラッキングを追加。乗り物酔い防止や振動で感じる音楽などアクセシビリティ機能強化 | テクノエッジ TechnoEdge

                              ガジェット全般、サイエンス、宇宙、音楽、モータースポーツetc... 電気・ネットワーク技術者。実績媒体Engadget日本版, Autoblog日本版, Forbes JAPAN他 アップルは、毎年5月に行われれる世界各地でアクセシビリティを考える一日(Global Accessibility Awareness Day:GAAD)に合わせ、障害を持つ人たちに新たな体験を提供すべく、アップル製品への複数の新機能追加を発表しました。 今回発表された新機能のうち、iPhoneやiPadを対象とするものとしては、アイトラッキング(Eye Tracking)機能をはじめとして、カスタマイズ可能なVocal Shortcuts機能、Music Haptics機能、Vehicle Motion Cues機能などがあります。 アイトラッキングまず、一般ユーザーでも気になりそうなアイトラッキング機能は、

                                アップル、目で iPhoneやiPadを操作するアイトラッキングを追加。乗り物酔い防止や振動で感じる音楽などアクセシビリティ機能強化 | テクノエッジ TechnoEdge
                              • 「JetBrains」の各種IDE、AIコード補完機能をローカルで使用可能に

                                「JetBrains」の各種IDE、AIコード補完機能をローカルで使用可能に:クラウドベースのAI支援機能の懸念点をカバー クラウドベースのAIアシスタントを利用して著作権やデータプライバシーの問題を回避するというトレンドがますます広がっている。そうした中、「JetBrains」が「GitHub Copilot」に先んじてローカルでのAIコード支援機能を実装した。本記事ではそのメリットを解説する。 JetBrainsが開発する各種IDE(統合開発環境)の大半に、ローカルAI(人工知能)コードオプションが組み込まれた。これは、コードの全行を提案することを目的にトレーニングされた小さな言語モデルを、ローカルで動かすものだ。コードの正確性をチェックする組み込み機能が、同社IDEの有償サブスクリプションを利用するユーザーに提供されるようになる。 こうした機能は、2024年4月上旬にリリースされたバ

                                  「JetBrains」の各種IDE、AIコード補完機能をローカルで使用可能に
                                • チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?

                                  チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?:AI・機械学習の用語辞典 用語「チェビシェフ距離」について説明。2点間の距離を計測する方法の一つで、2つの点座標(n次元)で「次元ごとの距離(=各成分の差)の絶対値」のうち「最大値」を距離として採用する計算方法を意味する。 連載目次 用語解説 数学/統計学/機械学習におけるチェビシェフ距離(Chebyshev distance、Chessboard distance:チェス盤距離)とは、2点間の距離を計測する際に、n次元ベクトルで表現されるそれらの点座標の次元ごとに距離(=成分間の差)の絶対値を求めて、その中の最大値を距離とする方法である。 チェビシェフ距離は、n次元のチェス盤の上をキング(駒)が移動する手数(=ステップ数)によく例えられる(図1)。キングは斜めにも真っ直ぐにも動けるため、例えば左下にあるx地点から

                                    チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?
                                  • 高学歴、高収入、高スキルな人ほど「リストラ候補」になる…東大AI研究者が証言する「AIと仕事」の意外な関係 給料の低い「肉体労働」はAIの影響を受けにくい

                                    長らく議論が続く「AIによる労働への影響」 「特別なスキルを必要としない賃金が低い仕事であるほど、コンピュータ/AIによる自動化の影響を受ける可能性が高い」 これは、コンピュータ/AIが労働に与える影響を分析する研究で、長らく共有されてきた主張です。この分野の研究はいくつか例がありますが、ほぼすべてでこの結論に達していたと言っていいでしょう。 ディープラーニング登場直後の2013年に発表された、オックスフォード大学のカール・フレイとマイケル・オズボーンによる世界的に有名な論文「雇用の未来」でもこの主張がされています。 また、2019年に出版された、同じくカール・フレイによる書籍『テクノロジーの世界経済史』(邦訳版は2020年、日経BP刊)でも、数多くの研究を俯瞰ふかんしながら同様の主張にまとめられています。 では、生成AIが登場した2023年現在に広く共有されている主張はどうなっているので

                                      高学歴、高収入、高スキルな人ほど「リストラ候補」になる…東大AI研究者が証言する「AIと仕事」の意外な関係 給料の低い「肉体労働」はAIの影響を受けにくい
                                    • Apple、iPhone/iPad用アイトラッキングやミュージック・ハプティクスを含む、今年後半に登場する新しいアクセシビリティ機能を発表 | NEWS | Mac OTAKARA

                                      ※本サイトは、アフィリエイト広告および広告による収益を得て運営しています。購入により売上の一部が本サイトに還元されることがあります。 Appleが、身体障がいのあるユーザーがiPhoneやiPadを目で操作する方法であるアイトラッキングを含む、今年後半に登場する新しいアクセシビリティ機能を発表しています。 さらに、Music Hapticsは、耳の不自由なユーザがiPhoneのTaptic Engineを使って音楽を体験できる新しい方法を提供し、Vocal Shortcutsは、ユーザがカスタムサウンドを出すことでタスクを実行できるようにします。 これらの機能は、Appleのハードウェアとソフトウェアの力を組み合わせ、Appleシリコン、人工知能、機械学習を活用し、すべての人のための製品を設計するというAppleの数十年にわたる取り組みをさらに推し進めるものです。 Tim Cook CEO

                                        Apple、iPhone/iPad用アイトラッキングやミュージック・ハプティクスを含む、今年後半に登場する新しいアクセシビリティ機能を発表 | NEWS | Mac OTAKARA
                                      • Google ColabでTimesFMを動かして予測してみた - Qiita

                                        概要 最近の記事を見ると、Zero-Shotで時系列予測ができるTimesFMと呼ばれるものが公開されていました。 Githubのリポジトリはこちら: 時系列予測というとベイズなどを用いて泥臭いことをやったりしないとですが、こちらはtransformerのデコーダ部分のみを用いてGoogle TrendsやWikipedia Pageviewなどの膨大なデータ(100 billion time point)で学習を実施したものを公開されています。パラメータも200Mで、GPT-3やLLama-2などと比較すると軽量なモデルであり、チューニングすることなく高度な予測をすることが可能であると書かれています。 時系列予測と言われるとベイズなどが浮かんできますが、面倒臭いのでサクッと予測できるのは比較対象としても悪くない気もしています。今回は、国内企業物価指数] 総平均(前年比)の2000年から2

                                          Google ColabでTimesFMを動かして予測してみた - Qiita
                                        • GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ

                                          拙著『グラフニューラルネットワーク』が重版して第 3 刷となりました。皆さまありがとうございます! 拡散モデルと最適輸送でもやりましたが、漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、ICLR 2024(5/7 - 5/11 @ウィーン)で発表されたグラフニューラルネットワーク (GNN) 関連の研究動向を紹介します。 ICLR 2024 で発表された GNN 関連の論文は全部で 170 本です。凄まじい量ですね。ICLR 2024 では全て合わせて 2296 本の論文が採択されたので、7.4 パーセントが GNN 関連ということになります。この分量からも、GNN が活気ある研究対象であることが伺えます。 以下では、代表的なトピックについて

                                            GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ
                                          • “そこそこオープン”なAI「Llama 3」がビジネスに与える影響は? GPT-4を超える性能が手に入る世界に

                                            この連載について AIやデータ分析の分野では、毎日のように新しい技術やサービスが登場している。その中にはビジネスに役立つものも、根底からひっくり返すほどのものも存在する。本連載では、ITサービス企業・日本TCSの「AIラボ」で所長を務める三澤瑠花氏が、データ分析や生成AIの分野で注目されている最新論文や企業発表をビジネス視点から紹介する。 Metaがオープンソース生成AIモデル「Llama 3」を公開し、生成AIビジネスの世界に衝撃を与えています。同AIモデルは研究促進の目的で公開されており、OpenAIの「GPT-4」をしのぐ性能を持つモデルを、制限付きながら商用利用できるのが特徴です。 Llama 3のリリース後には世界中の開発者がこぞってLlama 3のファインチューニングに取り組み、独自モデルの拡張開発を始めています。日本語特化も含め、さまざまな業界特化型モデルが登場し、活用シーン

                                              “そこそこオープン”なAI「Llama 3」がビジネスに与える影響は? GPT-4を超える性能が手に入る世界に
                                            • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

                                              1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

                                                大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
                                              • 圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方

                                                からあげ AIの仕事をしているエンジニア。インターネットで20年以上情報発信を継続中。 「からあげ先生のとにかく楽しいAI自作教室」「面倒なことはChatGPTにやらせよう」を始めとした著書、商業誌への寄稿多数。個人としてモノづくりを楽しむメイカーとしても「Ogaki Mini Maker Faire」をはじめとした複数のメイカー系イベントに出展。好きな食べ物は、からあげ。 X(@karaage0703)・ブログ からあげです。エンジニアとして働きながら、ブログを書いたり、本を執筆したりしています。今回、読書術についての寄稿をさせていただくのですが、私に声がかかった理由は、ブログで公開した読書記録が大きな理由だったようです。 以下がKindleの購入ログをもとに、年ごとのKindle蔵書購入数を可視化したグラフです。 確かにグラフをみると、ここ2年は1年に約300冊となっています。ただ、こ

                                                  圧倒的な読書量を誇るからあげ氏が実践・読書との向き合い方
                                                • Integrate Amazon Aurora MySQL and Amazon Bedrock using SQL | Amazon Web Services

                                                  Amazon Web Services ブログ Integrate Amazon Aurora MySQL and Amazon Bedrock using SQL 本記事は、Integrate Amazon Aurora MySQL and Amazon Bedrock using SQLを翻訳したものです。翻訳はSr. Database Solutions Architectの杉山が担当しました。 組織は大量のデータをリレーショナルデータベースに保存しているため、エンドユーザーエクスペリエンスを向上させるために生成AIの基盤モデルを使ってこれらのデータセットを補強する明確な動機があります。この記事では、Amazon Aurora Machine Learningを使用して、Amazon Aurora MySQL互換エディションを生成AIモデルと統合する方法を探ります。Amazon Be

                                                    Integrate Amazon Aurora MySQL and Amazon Bedrock using SQL | Amazon Web Services
                                                  • GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる

                                                    今日も今日とてopenAIの新発表が機械学習界隈を賑わせていますね。 今回は、2024/05/14に発表されたGPT4oについてです。 返答速度があがったり画像認識精度があがったり音声会話の性能が良くなったりと色々話題が尽きません。 具体的にどのあたりが凄くなったのかは僕以外にもまとめている人が多そうなのでこの記事では触れません。 個人的に特に気になっているのが画像認識の精度向上部分で、今回は画像認識精度がどの程度あがったのか?というのを画像系機械学習の主要なタスクであるBBoxによる物体認識というタスクで簡単にチェックしてみようと思います。 BBoxとは BBoxはBoundingBoxの略で、画像内の特定のオブジェクトを囲むために使用される長方形のボックスの事を指します。 BoundingBoxの定義は以下の通り このBBox検出は画像系機械学習モデルの基本的なタスクであり、自動運転の

                                                      GPT4oを使って、訓練無しで物体検出(BBox)ができるか試してみる
                                                    • 未来の量子計算機は何をめざすべきか? ―実用的インパクトのある量子優位性に向けて―

                                                      プレスリリース 研究 2024 2024.05.14 未来の量子計算機は何をめざすべきか? ―実用的インパクトのある量子優位性に向けて― 発表のポイント ◆ 物性物理学の量子シミュレーションに必要とされる計算リソースに関する解析・試算を行い、量子計算機が古典計算機(スーパーコンピュータ)を凌駕する「量子優位性」の最小条件を、世界で初めて明らかにした。 ◆ 量子化学や暗号解読といった分野に比べ、物性物理学への応用は、計算時間・量子ビット数の観点で1桁以上も少ないリソースで量子優位性を達成可能であることを示した。 ◆ 本研究成果は、今後の量子計算機の研究開発に対して、中長期的な設計目標を示す役割を果たすものと期待される。また、本研究で用いられた解析手法・アルゴリズムは、材料科学・量子化学などの問題にも同様に応用可能であることから、理論的・基礎科学的なインパクトだけでなく、産業応用への知見も大き

                                                      • GoogleのAIに匹敵するオープンソースのAIモデル「Falcon 2」をUAEがリリース

                                                        アラブ首長国連邦の政府系研究機関であるテクノロジーイノベーション研究所(TII)が2024年5月13日に、MetaのLlama 3 8Bを上回り、GoogleのGemma 7Bと同等のパフォーマンスを持つオープンソースの大規模言語モデル(LLM)の「Falcon 2」を発表しました。 Falcon 2: UAE’s Technology Innovation Institute Releases New AI Model Series, Outperforming Meta’s New Llama 3 | Technology Innovation Institute https://www.tii.ae/news/falcon-2-uaes-technology-innovation-institute-releases-new-ai-model-series-outperforming

                                                          GoogleのAIに匹敵するオープンソースのAIモデル「Falcon 2」をUAEがリリース
                                                        • NTTがデジカメの画像で自動的に鋼材の腐食を検出・深さを推定する画像認識技術を確立 維持管理コストの縮減に - ロボスタ ロボスタ - ロボット情報WEBマガジン

                                                          NTTは、デジタルカメラを用いてインフラ設備を撮影した画像から自動的に鋼材の腐食を検出し、腐食の深さ(腐食による鋼材断面の欠損量)を推定する画像認識技術を確立。鋼製の管路設備を用いた検証の結果、誤差0.44mmの精度で鋼材断面の欠損量を推定できることを確認した。 今回確率した技術により、画像から自動的に設備の腐食箇所とその箇所における残存する鋼材の厚さを把握できるようになるため、設備の耐久性能や耐荷性能を高精度に評価することができ、適切な時期と方法で補修を実施できるようになるため、維持管理コストの縮減が可能となる。 背景 橋梁、鉄塔、ガードレール等といった鋼構造のインフラ設備が数多く設置されているが、インフラ設備の老朽化は大きな社会問題になっている。これら設備の老朽化を進行させる主な劣化要因は鋼材の腐食である。設備に発生した腐食は進行に伴い鋼材の断面を欠損させるため、設備の耐久性能や耐荷性

                                                            NTTがデジカメの画像で自動的に鋼材の腐食を検出・深さを推定する画像認識技術を確立 維持管理コストの縮減に - ロボスタ ロボスタ - ロボット情報WEBマガジン
                                                          • 6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学

                                                            東京大学 日本原子力研究開発機構 発表のポイント 6次元結晶の3次元空間の断面とみなせる「準結晶」の比熱が異常に大きくなる現象を、実験と機械学習シミュレーションで追求し、高次元での原子のゆらぎが原因であると突き止めた。 準結晶のシミュレーションには膨大な計算が必要で、これまでは簡単なモデルでしか行われてこなかったが、今回、高精度かつ長時間の機械学習シミュレーションを行い、実験と比較することが可能になった。 この結果は、複雑な物質において実験と比較可能な機械学習シミュレーション手法を確立できた事を意味しており、準結晶を用いた新たな熱電材料など様々な材料にこの手法を適用することで、材料開発が加速すると期待される。 高次元の揺らぎが3次元空間に影響を与える様子の概念図 Credit: UTokyo ITC/Shinichiro Kinoshita 概要 東京大学情報基盤センターの永井佑紀准教授、

                                                              6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学
                                                            • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                                              昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                                                OpenAIのGPT-4oを日本語OCRとして使ってみる
                                                              • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                                                                昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                                                                  GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                                                                • NTT、機械学習で画像から鋼材の腐食を推定

                                                                    NTT、機械学習で画像から鋼材の腐食を推定
                                                                  • M4搭載iPad Proと新型M2 iPad Air実機を、プロセッサだけに偏らず比較する(本田雅一) | テクノエッジ TechnoEdge

                                                                    ネット社会、スマホなどテック製品のトレンドを分析、コラムを執筆するネット/デジタルトレンド分析家。ネットやテックデバイスの普及を背景にした、現代のさまざまな社会問題やトレンドについて、テクノロジ、ビジネス、コンシューマなど多様な視点から森羅万象さまざまなジャンルを分析。 新しく発表されたiPad ProとiPad Airは、それぞれに主要な機能は似通っている。画面のサイズも同様であり、11インチと13インチのラインアップは全く同じだ。異なる点は、利用できるキーボードの種類、リフレッシュレート、ディスプレイの表示方式、 搭載するプロセッサのパフォーマンス、本体の薄さや重量などに集約できる。 一方で、従来機種でもそうだったのだが、ほとんどの用途にはiPad Airで充分だ。今回iPad Airに13インチモデルが加わったことにより、iPad Proとの差はさらに縮まった。言い換えるならば、大多

                                                                      M4搭載iPad Proと新型M2 iPad Air実機を、プロセッサだけに偏らず比較する(本田雅一) | テクノエッジ TechnoEdge
                                                                    • 2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁

                                                                      デジタル庁では、デジタル社会の実現に向けた重点計画(令和4年6月7日閣議決定)を踏まえ、AIの実態と動向を把握し、リスクと必要な対応策を特定したうえで、官民における適切な活用の検討を進めています。 昨今の生成 AIなどの技術革新により、さまざまな利点を得られるようになってきており、政府としても、このような技術の動向を見極めつつ、関係省庁における生成AIの業務利用について、第10回デジタル社会推進会議幹事会・書面開催など議論を重ねてきました。 これまでの議論の経緯も踏まえ、デジタル庁では、2023年12月より生成AIの適切な利活用に向けた技術検証を実施しました。2023年度の検証結果の全体的な内容と、検証で得られた具体的な生成AIへの入力文のサンプル、一部検証に用いたテストケースを公開します。 技術検証の目的今後の政府情報システムへの生成AI利活用に向けて以下のような具体的な知見を得ることを

                                                                        2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁
                                                                      • エンジニア向け海外の情報収集サイトまとめ - Qiita

                                                                        はじめに 本記事ではエンジニア向けの海外情報収集サイトをまとめました。”一次情報”をより”早く”取得するという意味で海外の情報収集を行うことは非常に意義のあることです。日本で働いている人でも、海外情報は積極的に取得しましょう。英語が読めない方も翻訳機やLLMに投げることで良い感じに翻訳してくれます。 本記事は、情報収集サイトを次の4種類に分類して紹介しています。参考にしてください。 学習系 ニュース系 ITサービス技術ブログ その他 それでは、早速紹介していきます!! 弊社Nucoでは、他にも様々なお役立ち記事を公開しています。よかったら、Organizationのページも覗いてみてください。 また、Nucoでは一緒に働く仲間も募集しています!興味をお持ちいただける方は、こちらまで。 学習系 FreeCodeCamp FreeCodeCamp.orgは、エンジニアやプログラミング初学者を対

                                                                          エンジニア向け海外の情報収集サイトまとめ - Qiita
                                                                        • GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO

                                                                          こんにちは、MLBお兄さんこと松村です。 昨年の MLB 全体ドラフト1位のポール・スキーンズ投手がメジャーデビューしました。予想通りの豪速球でした。 2024年4月29日についにテクニカルプレビューが開始となった GitHub Copilot Workspace ですが、ゴールデンウィーク中に私のアカウントでも利用可能となっていたため、試してみたことを書いていきます。 利用開始まで この記事を書いている時点では、 GitHub Copilot Workspace の利用には待機リスト (Waitlist) への登録が必要であり、その通過を待つ必要があります。 そのため GitHub Copilot Workspace を利用したい方は、こちらから登録を行いましょう。 githubnext.com ゼロからアプリを作ってみる 今回は練習として私がコードを書くこと無く、 C# の簡単なアプリ

                                                                            GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO
                                                                          • Causal Discovery Toolboxで簡単にデータの因果関係を解析してみよう - ENGINEERING BLOG ドコモ開発者ブログ

                                                                            TL;DR この記事では,Causal Discovery Toolbox(cdt)を用いて観測データから因果関係を簡単に解析する方法を紹介します.cdtは,Pythonで利用可能なツールで複数の因果分析モデルとアルゴリズムを提供しデータから因果関係を推定し視覚化することができます.特に,PCアルゴリズム,GES,LiNGAMなどの主要なアルゴリズムを使用した因果探索の手順とサンプルコードを提供し,それぞれの性能評価も行います. TL;DR はじめに 因果探索とは Causal Discovery Toolbox(cdt) 環境構築 利用できるアルゴリズム 1.PCアルゴリズム (PC) 2.CAM (Causal addtive model) 3.CGNN (Causal Generative Neural Networks) 4.GES (Greedy Equivalence Sear

                                                                              Causal Discovery Toolboxで簡単にデータの因果関係を解析してみよう - ENGINEERING BLOG ドコモ開発者ブログ
                                                                            • Anthropic Generate a promptとDifyの組み合わせがAI活用を加速する - Qiita

                                                                              近年、AIを業務に活用する企業が急増しています。特にチャットボットやワークフローの自動化には大きな注目が集まっていますが、高品質なAIアプリケーションを効率的に開発することは容易ではありません。そこで、Anthropic社の「Generate a prompt」機能とDify社のAIプラットフォームを組み合わせることで、より高度なAI活用が可能になります。 Anthropic Generate a promptでプロンプト作成を効率化 Anthropic ConsoleのGenerate a prompt機能は、AIモデルへの指示(プロンプト)を自動生成してくれます。ユーザーが目的とタスクの概要を入力すると、最適化されたプロンプトが出力されます。 このように、タスクに必要な情報を過不足なく盛り込んだプロンプトが自動で作成されます。これにより、ユーザーはプロンプト作成の手間を大幅に削減でき、

                                                                                Anthropic Generate a promptとDifyの組み合わせがAI活用を加速する - Qiita
                                                                              • データ解析・機械学習を始める際のサンプル数の目安(あくまで目安!)

                                                                                分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。 データ解析・機械学習でモデルを構築し始める際のサンプル数の目安について、もちろんモデルを構築する時には、可能な限り多くのサンプルを用いることが望ましいです。多くのサンプルを用いることで、サンプルの変化に強い (例えばサンプルが一つ追加されたり一つ削除されたりしても結果の変わりにくい) 頑健なモデルを構築できる可能性が高まります。頑健なモデルにより、より妥当な x の設計やモデルの解釈が可能になります。 ただし、サンプルを集め

                                                                                  データ解析・機械学習を始める際のサンプル数の目安(あくまで目安!)
                                                                                • 3D CADに搭載されはじめたAI機能と自動化

                                                                                  連載「テルえもんが見たデジタルモノづくり最前線」では、筆者が日々ウォッチしているニュースや見聞きした話題、企業リリース、実体験などを基に、コラム形式でデジタルモノづくりの魅力や可能性を発信していきます。連載第1回のテーマは「3D CADに搭載されはじめたAI機能と自動化」です。 皆さん、こんにちは! 小原照記(おばらてるき)と申します。普段は岩手県の「いわてデジタルエンジニア育成センター」という施設で3D CADを中核とした、デジタルエンジニアの育成と“企業の困りごと”を聞いて支援する仕事をしています。当センターではいろいろな3D CADをはじめとしたデジタルモノづくりに関する設備を保有しており、学生や企業の方たち向けに講習会を開催したり、3Dプリンタでの試作や3Dスキャナーを使用しての検査/リバースエンジニアリングなどの受託を行ったりしています。また、筆者個人のSNSやブログでは「テルえ

                                                                                    3D CADに搭載されはじめたAI機能と自動化