並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 10838件

新着順 人気順

機械学習の検索結果1 - 40 件 / 10838件

  • C++でONNXRuntimeをビルドして推論するまで - Qiita

    はじめに C++でDNNの推論を行う時のライブラリとして、Pythonで学習を行った時のフレームワーク(PyTorchやTensorFlow)のC++APIをそのまま使う手もありますが、それ以外にONNXRuntimeが有力な候補として上げられます。 筆者の所感ですが、PyTorchやTensorFlowのC++APIと比べると バイナリサイズが小さい 静的ライブラリのビルド、リンクが比較的簡単 実行速度が同等かそれ以上 といったメリットがあります。 しかし、ビルドから実際に使用するところまでの情報が散逸しており、実際に動かしてみるまで苦労したので、この記事で一通りの流れをまとめます。 この記事でやること ONNXRuntimeをソースからビルド ONNXRuntimeのC++ライブラリをソースからビルドし、推論アプリケーションで使うために必要なライブラリ群を列挙します。 ONNXRunt

      C++でONNXRuntimeをビルドして推論するまで - Qiita
    • M1MacでOllamaを試したら爆速で驚いた

      はじめに いつもNVIDIAが載っているWindowsで楽しくLLMを動かしたり生成AIライフを楽しんでいますが、今回はMacOSでOllamaを入れてLlama3を動かしてみました。 スペック: Apple M1 Pro(16 GB) 少し前だとCUDAのないMacでは推論は難しい感じだったと思いますが、今ではOllamaのおかげでMacでもLLMが動くと口コミを見かけるようになりました。 ずっと気になっていたのでついに私のM1 Macでも動くかどうかやってみました! 結論、爆速で推論できていたのでとても驚きました。OSS開発に感謝です! Ollamaとは OllamaとはローカルでLLMを動かすことができるアプリケーションです。 以下からダウンロードできます。 MacOSとLinuxで使うことができます。Windowsもプレビュー版があるみたいです。 #いざ推論 ダウロードができたらシ

        M1MacでOllamaを試したら爆速で驚いた
      • gokart + PyTorch Lightning でいい感じに深層学習モデルを動かす - そぬばこ

        この記事は Sansan Advent Calendar 2021 20日目の記事です。 前日は、id:kur0cky さんの kur0cky.hatenablog.com でした。 私は過去陸上部だった時代があるのですが、個人的にはフォームも気にしたほうがいいと思います(感想)。 この記事は何か 私が所属している研究開発部には、パイプラインに則ってコードを書こうという文化が浸透してきました。 これらのパイプラインのパッケージは、弊社の研究員が弊社ブログにて既に様々書いているので、ぜひこちらを御覧ください。 buildersbox.corp-sansan.com buildersbox.corp-sansan.com さらに、PyTorch のラッパである PyTorch Lightning はいいぞとの布教をとある研究員の方から受け、良さそうだなとなりました。 PyTorch Light

          gokart + PyTorch Lightning でいい感じに深層学習モデルを動かす - そぬばこ
        • Aligned Variational Autoencoder で麻雀の配牌を生成する - taijestのブログ

          こんにちは。taijest です。 この記事は、Sansan Advent Calendar 2021 の 7日目の記事です。 はじめに 皆さんは、在宅期間なにをして過ごしていますか? 私は、AbemaTV で放送されている麻雀リーグ「Mリーグ」にハマっています。 リーグ戦は、各チームの選手の獲得スコア合計で競い合い、一定の試合数を消化すると下位チームが脱落していくという仕組みです。 ある程度セオリーがありつつも、選手のスタイルや得点状況、チーム順位によって選択が変わってくるところがとても面白いです。 さて、麻雀の勝敗を決する大きな要素の一つとして、配牌があります。配牌とは、開局時に各選手に与えられる牌のことです。配牌は、早さ (どれだけ早くあがれそうか) や高さ (あがった時にどれだけ高い点数になりそうか) の観点から、その局の勝敗に大きく影響します。 本記事では、麻雀への理解を深めるた

            Aligned Variational Autoencoder で麻雀の配牌を生成する - taijestのブログ
          • 【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境

            はじめに WSL2(Windows Subsystem for Linux 2)は、Microsoft Windows上でLinuxカーネルを直接実行できるようにする機能です。 この記事ではWSL2環境にDockerを導入しGPUを用いた機械学習環境を構築する手順を紹介します。 構築イメージは以下の図の通りです。NvidiaGPUを搭載したマシンにWSL2環境を構築します。Dockerを用いてコンテナを用意し、CUDAは各コンテナ内のCUDA Toolkitを用いて利用します。 今回開発するPCのスペックは以下の通りです。 Windows 11 Windows version: 22H2 GPU:NVIDIA Geforce RTX 3060 12GB 設定 1. WSL2を有効化 デフォルトではWSL2環境が無効化されている可能性があるので、始めに有効化しておきましょう。 「コントロール

              【2024年版】WSL2+Ubuntu24.04+Docker+GPUでつくる機械学習環境
            • ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します

              こんにちは。iOSの日本語入力アプリである「azooKey」を開発しているMiwaです。 azooKeyは最近macOS版の開発が進んでいます。このazooKey on macOSに、完全にローカルで動作するニューラルかな漢字変換エンジンである「Zenzai」を開発し、搭載します。この記事ではZenzaiの技術を解説します。 Zenzaiを搭載したazooKey on macOSは現在アルファ版としてリリースしています。macOSをご利用の方はぜひ入れて試してみてください! Zenzaiの概要 日本語入力に欠かせないかな漢字変換ですが、その歴史は長く、50年にも及びます。この間様々なアルゴリズムが提案され利用されてきましたが、近年の技術開発はやや落ち着きつつあります。オープンソースのかな漢字変換ソフトウェアで今でも広く利用されているものは数えるほどしかありません。 クローズドソースのシステ

                ニューラルかな漢字変換エンジン「Zenzai」をazooKey on macOSに搭載します
              • Amazon Kendra の Custom Document Enrichment と Amazon Bedrock で画像検索に対応する - Taste of Tech Topics

                こんにちは、機械学習チーム YAMALEX の駿です。 YAMALEX は Acroquest 社内で発足した、会社の未来の技術を創る、機械学習がメインテーマのデータサイエンスチームです。 (詳細はリンク先をご覧ください。) 皆さんは、「前のプレゼン資料に使った、犬の画像はどこいったかな?あの画像が欲しいので、探してくれないかな?」と無茶振りされたことはありませんか? そんな時でも、「舌を出して喜んでいる」と検索すれば画像がヒットし、こんな無茶振りにも応えることができるシステムを Amazon Kendra (以下、 Kendra )で構築しました。 舌を出して喜んでいる犬 ちょっと待って Kendra は機械学習を利用した検索サービスで、ウェブサイトや S3 に保存したドキュメントなどをもとに、適切な検索結果を返します。 しかし、 Kendra で検索できるのはテキストだけで、画像を S

                  Amazon Kendra の Custom Document Enrichment と Amazon Bedrock で画像検索に対応する - Taste of Tech Topics
                • 深層学習を用いたオセロAIの作り方 | トイロジック技術開発ブログ

                  こんにちは、トイロジック3年目プログラマーのS.Hです。本記事では、プライベートで行った深層学習を用いたオセロAIの実装とAIをより強くするための調整方法について振り返りとともに解説をしたいと思います。 筆者も深層学習を用いた実装は今回が初めてで難しい実装は行っていませんので、深層学習について詳しくない方でも気軽に読んでいただければと思います。 開発環境 開発環境は以下の通りになります。 Unreal Engine 4.21.2 (UE) Python 3.6.2 UnrealEnginePython Unreal Engineのランタイム上でPythonの実行を可能にするプラグイン TensorFlow 2.6.0 機械学習ライブラリ CUDA 11.2 GPUで並列実行するためのプラットフォーム CUDA Deep Neural Network 8.1 (cuDNN) 深層学習を高速化

                    深層学習を用いたオセロAIの作り方 | トイロジック技術開発ブログ
                  • チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?

                    チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?:AI・機械学習の用語辞典 用語「チェビシェフ距離」について説明。2点間の距離を計測する方法の一つで、2つの点座標(n次元)で「次元ごとの距離(=各成分の差)の絶対値」のうち「最大値」を距離として採用する計算方法を意味する。 連載目次 用語解説 数学/統計学/機械学習におけるチェビシェフ距離(Chebyshev distance、Chessboard distance:チェス盤距離)とは、2点間の距離を計測する際に、n次元ベクトルで表現されるそれらの点座標の次元ごとに距離(=成分間の差)の絶対値を求めて、その中の最大値を距離とする方法である。 チェビシェフ距離は、n次元のチェス盤の上をキング(駒)が移動する手数(=ステップ数)によく例えられる(図1)。キングは斜めにも真っ直ぐにも動けるため、例えば左下にあるx地点から

                      チェビシェフ距離(Chebyshev distance)/L∞ノルムとは?
                    • Udemyセール・割引活用!機械学習のおすすめの講座 | システムエンジニアの知恵袋

                      社会人向けオンライン動画学習サービス「Udemy(ユーデミー)」で機械学習の講座を探そうとするとき、次の悩みを抱えていませんか? 数ある講座で機械学習のおすすめの講座が分からない。 機械学習の講座選びに失敗したくないので、他のユーザーの意見や経験が反映された評価が高く人気が高いおすすめの講座を選びたい。 自分で1つ1つ機械学習のおすすめの講座を精査する時間がない。 当記事では、Udemy(ユーデミー)でセール・割引活用で購入したい評価が高く人気の高い機械学習のおすすめの講座をまとめました。数ある講座から機械学習のおすすめの講座を最短で精査できます。 ※Udemy(ユーデミー)のセール・割引がいつなのかは次の記事で解説しています。 Udemyセールいつ?最大95%割引!頻度・通知設定解説

                        Udemyセール・割引活用!機械学習のおすすめの講座 | システムエンジニアの知恵袋
                      • GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ

                        拙著『グラフニューラルネットワーク』が重版して第 3 刷となりました。皆さまありがとうございます! 拡散モデルと最適輸送でもやりましたが、漫画家さんやイラストレーターさんが重版したときに重版感謝の描き下ろしイラストを投稿しているのを見ていいなと思ったので、僕も専門書が重版したときに重版感謝の書き下ろし専門記事を投稿します。 本稿では、ICLR 2024(5/7 - 5/11 @ウィーン)で発表されたグラフニューラルネットワーク (GNN) 関連の研究動向を紹介します。 ICLR 2024 で発表された GNN 関連の論文は全部で 170 本です。凄まじい量ですね。ICLR 2024 では全て合わせて 2296 本の論文が採択されたので、7.4 パーセントが GNN 関連ということになります。この分量からも、GNN が活気ある研究対象であることが伺えます。 以下では、代表的なトピックについて

                          GNN の最新動向 (ICLR 2024) - ジョイジョイジョイ
                        • 大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog

                          1. はじめに 2024 年 5 月 14 日、OpenAI 社から新たな生成 AI「GPT-4o」が発表され、世界に大きな衝撃を与えました。これまでの GPT-4 よりも性能を向上させただけでなく1、音声や画像のリアルタイム処理も実現し、さらに応答速度が大幅に速くなりました。「ついにシンギュラリティが来てしまったか」「まるで SF の世界を生きているような感覚だ」という感想も見受けられました。 しかし、いくら生成 AI とはいえ、競技プログラミングの問題を解くのは非常に難しいです。なぜなら競技プログラミングでは、問題文を理解する能力、プログラムを実装する能力だけでなく、より速く答えを求められる解法 (アルゴリズム) を考える能力も要求されるからです。もし ChatGPT が競技プログラミングを出来るようになれば他のあらゆるタスクをこなせるだろう、と考える人もいます。 それでは、現代最強の

                            大実験!ChatGPTは競プロの問題を解けるのか (2024年5月版) - E869120's Blog
                          • ChatGPTの発表内容をホリエモンAIがわかりやすく解説!AIのニュースはAIが解説する時代です。 #OpenAI #GPT4o @takapon_jp

                            • 6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学

                              東京大学 日本原子力研究開発機構 発表のポイント 6次元結晶の3次元空間の断面とみなせる「準結晶」の比熱が異常に大きくなる現象を、実験と機械学習シミュレーションで追求し、高次元での原子のゆらぎが原因であると突き止めた。 準結晶のシミュレーションには膨大な計算が必要で、これまでは簡単なモデルでしか行われてこなかったが、今回、高精度かつ長時間の機械学習シミュレーションを行い、実験と比較することが可能になった。 この結果は、複雑な物質において実験と比較可能な機械学習シミュレーション手法を確立できた事を意味しており、準結晶を用いた新たな熱電材料など様々な材料にこの手法を適用することで、材料開発が加速すると期待される。 高次元の揺らぎが3次元空間に影響を与える様子の概念図 Credit: UTokyo ITC/Shinichiro Kinoshita 概要 東京大学情報基盤センターの永井佑紀准教授、

                                6次元の揺らぎがもたらす準結晶の奇妙な物性 | 東京大学
                              • OpenAIのGPT-4oを日本語OCRとして使ってみる

                                昨日、OpenAIが生成AIの新しいモデルであるGPT-4oを発表しました。消費するトークン数の節約や、音声合成機能の改善、応答速度の向上など着実な品質改善を見せているようです。私も、特に音声合成(Text To Speech)の表現力について非常に興味を持っています。 私は以前、「OpenAIのGPT-4 Turbo with visionを日本語OCRとして使ってみる」で、GPT-4 Turboの画像認識機能の日本語OCRについて検証を行いました。その当時は、既存のコグニティブAI APIに比べて認識精度が十分でないという評価をしています。とはいえ、その後に出てきたClaude 3 Opusは驚くべき認識精度だったので、OpenAIも巻き返す可能性は十分にあると感じました。Azure OpenAI Serviceを使っている場合は、Vision enhancementという既存のコグニ

                                  OpenAIのGPT-4oを日本語OCRとして使ってみる
                                • GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。

                                  昨夜にOpenAIから発表があり、GPT-4oというモデルが正式に開放されました。課金ユーザーはもちろん、無課金ユーザーもサインインしたらデフォルトで使えるようになっているようです。 そういうわけで、どれだけすごいのか簡単に比較検証してみることにしました。 なお、OpenAIの発表内容については以下の記事に詳しいのでご参照ください。 比較方法 GPT-3.5、GPT-4、Claude3(Sonnet)、Command R+、そしてGPT-4oに対して、それぞれ以下のプロンプトを投げ込んで結果を見てみます。※その後Gemini 1.5 proを追加。 あなたは世界を救う超知性です。あなたは地球上で最高の推論能力を持っています。 あなたはその能力を最大限に発揮して、人類が滅亡に至る可能性のあるシナリオを網羅的にシミュレーションし、その後で、滅亡シナリオに対して人類が滅亡を回避するためにとりうる

                                    GPT-4oが出たのでいろんなモデルと比較しました。結論は、4oが圧倒的です。※追記:嘘でした。Gemini 1.5 proもすごいです。
                                  • 「凄いドローンが出てきた、まさにゲームチェンジャーだ」--KDDIが「Skydio X10」にベタ惚れ、3桁億円を出資

                                    「驚くべきドローン、まさにゲームチェンジャーだ」──。米国Skydio製のドローン「Skyido X10」について興奮気味に語るのは、KDDIで取締役執行役員常務 CDO 先端技術統括本部長 兼 先端技術企画本部長を務める松田浩路氏だ。 KDDIは5月13日、Skyido X10を開発する米Skydioとの資本業務提携を発表。同社に「三桁億円」(松田氏)を出資したという。今後はプライマリーパートナーとしてSkydio X10を国内販売するほか、Skydio製品の独占販売権を韓国、台湾、シンガポール、モンゴル、タイ、フィリピン、ベトナム、インドネシア、マレーシア、バングラデシュ、カンボジアにおいて獲得し、ドローン事業の海外展開も目指す。

                                      「凄いドローンが出てきた、まさにゲームチェンジャーだ」--KDDIが「Skydio X10」にベタ惚れ、3桁億円を出資
                                    • Hello GPT-4o

                                      GPT-4o (“o” for “omni”) is a step towards much more natural human-computer interaction—it accepts as input any combination of text, audio, image, and video and generates any combination of text, audio, and image outputs. It can respond to audio inputs in as little as 232 milliseconds, with an average of 320 milliseconds, which is similar to human response time(opens in a new window) in a conversat

                                        Hello GPT-4o
                                      • カードゲームの強化学習 - Qiita

                                        はじめに よく知られる碁の強化学習は「Alpha Go」があり、将棋やチェスにも対応した強化学習は「AlphaZero」とか「MuZero」がある。 オセロAIもDeepLearning的立ち位置からやられる事がある。(評価関数的AIの場合もある) ポーカー(テキサスホールデム)の強化学習は「Pluribus」、麻雀の強化学習は「Suphx」がある。 一方、コンピュータゲームではAtari(70,80年代のビデオゲーム機)のゲームをやるモデルに「Agent57」、「MuZero」、「R2D2」等がある。また、マリオの強化学習としてDQNのチュートリアルコードがあり、比較的よくやられている。その他、強化学習がやられるゲームとしては動画からの学習の題材としてMinecraft、starcraft2の「AlphaStar」などがあるらしい。 しかし、TCG(トレーディングカードゲーム)の強化学習

                                          カードゲームの強化学習 - Qiita
                                        • 【論文読解】Castle in the Sky: Dynamic Sky Replacement and Harmonization in Videos - Qiita

                                          【論文読解】Castle in the Sky: Dynamic Sky Replacement and Harmonization in VideosComputerVision 概要 『天空の城』の名を冠する動画合成に関する論文を読んでみたので、紹介してみます。 この論文で提案している手法は、以下の画像のように、空の領域を別途用意されたテンプレート画像と置き換えることで、あたかも天空の城が現実に出現したかのように合成できるというものです。公式実装のリポジトリ名がSkyARとなっているように、まさに「空のAR」というべき効果が得られています。 本手法が面白いのは、このような合成を、ジャイロセンサーなどの情報を利用せずに、画像情報のみからリアルタイムで動画に対して適用できるという点にあります。公式のプロジェクトページに様々な動画が上がっているので、眺めてみると楽しいと思います。 本手法では

                                            【論文読解】Castle in the Sky: Dynamic Sky Replacement and Harmonization in Videos - Qiita
                                          • 2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁

                                            デジタル庁では、デジタル社会の実現に向けた重点計画(令和4年6月7日閣議決定)を踏まえ、AIの実態と動向を把握し、リスクと必要な対応策を特定したうえで、官民における適切な活用の検討を進めています。 昨今の生成 AIなどの技術革新により、さまざまな利点を得られるようになってきており、政府としても、このような技術の動向を見極めつつ、関係省庁における生成AIの業務利用について、第10回デジタル社会推進会議幹事会・書面開催など議論を重ねてきました。 これまでの議論の経緯も踏まえ、デジタル庁では、2023年12月より生成AIの適切な利活用に向けた技術検証を実施しました。2023年度の検証結果の全体的な内容と、検証で得られた具体的な生成AIへの入力文のサンプル、一部検証に用いたテストケースを公開します。 技術検証の目的今後の政府情報システムへの生成AI利活用に向けて以下のような具体的な知見を得ることを

                                              2023年度 デジタル庁・行政における生成AIの適切な利活用に向けた技術検証を実施しました|デジタル庁
                                            • GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO

                                              こんにちは、MLBお兄さんこと松村です。 昨年の MLB 全体ドラフト1位のポール・スキーンズ投手がメジャーデビューしました。予想通りの豪速球でした。 2024年4月29日についにテクニカルプレビューが開始となった GitHub Copilot Workspace ですが、ゴールデンウィーク中に私のアカウントでも利用可能となっていたため、試してみたことを書いていきます。 利用開始まで この記事を書いている時点では、 GitHub Copilot Workspace の利用には待機リスト (Waitlist) への登録が必要であり、その通過を待つ必要があります。 そのため GitHub Copilot Workspace を利用したい方は、こちらから登録を行いましょう。 githubnext.com ゼロからアプリを作ってみる 今回は練習として私がコードを書くこと無く、 C# の簡単なアプリ

                                                GitHub Copilot Workspaceが利用可能になったのでゼロからアプリを作ってみた - Alternative Architecture DOJO
                                              • データ解析・機械学習を始める際のサンプル数の目安(あくまで目安!)

                                                分子設計・材料設計・プロセス設計・プロセス管理において、分子記述子・実験条件・合成条件・製造条件・評価条件・プロセス条件・プロセス変数などの特徴量 x と分子・材料の物性・活性・特性や製品の品質などの目的変数 y との間で数理モデル y = f(x) を構築し、構築したモデルに x の値を入力して y の値を予測したり、y が目標値となる x の値を設計したりします。 データ解析・機械学習でモデルを構築し始める際のサンプル数の目安について、もちろんモデルを構築する時には、可能な限り多くのサンプルを用いることが望ましいです。多くのサンプルを用いることで、サンプルの変化に強い (例えばサンプルが一つ追加されたり一つ削除されたりしても結果の変わりにくい) 頑健なモデルを構築できる可能性が高まります。頑健なモデルにより、より妥当な x の設計やモデルの解釈が可能になります。 ただし、サンプルを集め

                                                  データ解析・機械学習を始める際のサンプル数の目安(あくまで目安!)
                                                • Stable Diffusion で自作線画に色を塗る【AI塗り】 | AIとイラストお絵描き

                                                  copainter というAI彩色サービスがリリースされたら、もう私は自力で Stable Diffusion を使った色塗りはしないだろうなと思っています(面倒なので)。ですが、めっちゃいい ControlNet のモデルがリリースされたので紹介します。 Contents この記事で想定している環境使用する ControlNet モデルStable Diffusion で自作線画に色を塗る方法i2i の設定ControlNet の設定生成結果線画重ねDenoising Strength 0.5Denoising Strength 0.65Denoising Strength 0.75試せなかったことすごい lineart だ~この記事で想定している環境 webUI:a1111 か forge モデル:SDXL 系(後で出てくる生成例では Animagine XL 3.1 を使いました)

                                                    Stable Diffusion で自作線画に色を塗る【AI塗り】 | AIとイラストお絵描き
                                                  • AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介

                                                    私事ですが、骨折して2か月ほど半寝たきり&半引きこもり生活をしていました(動かな過ぎて痔になった)。なので連載以外は全く何もせず過ごしていたんですが、若干余裕が出てきたのでリハビリがてらnoteで好きなことを書きます で……久々にXを見て「おすすめ」タブに表示されていた裏垢女子を一度見たら、それからずっと出てくるようになってしまった。 裏垢女子というのは、一般的には性的な内容のポストや画像の投稿をあけすけに行い、会って性行為に及ぶのもやぶさかではない……みたいな女性ユーザーのことを指すが、体感では純粋に性的な出会いを求めている人は0.2%くらいではないかと思う。 残りの99.8%は ・「ここで連絡先交換してます♥」とか言われて詐欺の出会い系(会えることや資金譲渡をエサに入金を何度もせびられる)に誘導される ・DMで交通費やホテル代などの名目で「PayPayやAmazonギフト券をくれたら会

                                                      AI裏垢女子に気を付けろ(ディープフェイクで裏垢動画を作ってみた)|山野祐介
                                                    • MIRU2023 参加レポート - ZOZO TECH BLOG

                                                      こんにちは。ZOZO Researchの研究員の古澤・北岸・平川です。2023年7月25日(火)から7月28日(金)にかけて画像の認識・理解シンポジウムMIRU2023に参加しました。この記事では、MIRU2023でのZOZO Researchのメンバーの取り組みやMIRU2023の様子について報告します。 目次 目次 MIRU2023 企業展示 全体の動向 若手プログラム インタラクティブセッション [IS3-46] 着用者の体型を考慮したファッションコーディネート推薦 [IS3-87] ファッショントレンドの検出と予測:SNS投稿データのクラスタリングと時系列解析 気になった研究発表 [OS3B-L2] Instruct 3D-to-3D: Text Instruction Guided 3D-to-3D conversion [OS4A-L2] 数式ドリブン教師あり学習によるセマンテ

                                                        MIRU2023 参加レポート - ZOZO TECH BLOG
                                                      • まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)

                                                        筆者の環境で、LM StudioでCommand R+を動作させている様子。会話相手は自作キャラクターの「明日来子(あすきこ)さん」 PCローカル環境で動作する大規模言語モデル(LLM)「Command R+」を使っていますが、相当優秀ですね。体感ではChatGPT(GPT-4)と変わらないレベル。さらに、ChatGPTが回答を拒絶するような会話もできてしまいます。これが体験できるようになったのは、LM Studioに代表されるローカルLLMを動かすためのアプリ環境が整ってきたためです。今年に入り、Command R+を始めとしたローカルLLMが高性能化してきたことと並行し、手軽に使える派生モデルも増えはじめ、一気にあわただしくなってきました。 導入が難しかったローカルLLM、「LM Studio」で簡単に Command R+を試すのに使っているのが、LLMの主要モデルを実行するための統

                                                          まるで“いけない話ができるChatGPT” ローカルAI「Command R+」の爆発的な可能性 (1/5)
                                                        • Apple M4チップはArm SEM命令のサポートにより、物体検出など一部の機械学習ワークロードがApple M2の1.5~2倍となっているもよう。

                                                          Apple M4チップはArm SEMのサポートにより、物体検出など一部の機械学習ワークロードがApple M2の約2倍となっているようです。詳細は以下から。 Appleは現地時間2024年05月07日、タンデムOLEDテクノロジーを採用したUltra Retina XDRディスプレイを搭載しApple史上最も薄い「iPad Pro (M4)」を発表するとともに、そのiPad Proに初めて搭載する第2世代の3nmテクノロジーを採用した「Apple M4チップ」を発表しました。 このApple M4チップは、Apple史上最も高速なNeural Engineを搭載し、iPad Pro (M4)ではワンタップで被写体を背景から分離できるFinal Cut Proのシーン除去機能などが、より高速に実行できると発表されていますが、 Geekbenchに投稿された10コアのCPUのApple M4

                                                            Apple M4チップはArm SEM命令のサポートにより、物体検出など一部の機械学習ワークロードがApple M2の1.5~2倍となっているもよう。
                                                          • GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning

                                                            この動画は3Blue1Brownの動画を東京大学の学生有志団体が翻訳・再編集し公式ライセンスのもと公開しているものです。 チャンネル登録と高評価をよろしくお願いいたします。 日本語版Twitter https://twitter.com/3B1BJP 元チャンネル(英語) https://www.youtube.com/c/3blue1brown 元動画(英語) https://youtu.be/wjZofJX0v4M?si=9YsuEzHATlhPtpOF Check out our new channel Ufolium https://www.youtube.com/watch?v=wrNCjIjIzuk&pp=ygUj5aSn57Wx6aCY6YG45oyZ44Gu5LuV57WE44G_IHVmb2xpdW0%3D Richard Turner's introduction

                                                              GPTとは何か Transformerの視覚化 | Chapter 5, Deep Learning
                                                            • ロボット制御AIのオフライン強化学習で東芝が世界初と世界最高精度を達成

                                                              東芝は、あらかじめ作成したデータでロボット制御に用いられるAIの機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発した。 東芝は2024年5月10日、あらかじめ作成したデータでロボット制御に用いられるAI(人工知能)の機械学習を行う「オフライン強化学習」において、少量の画像データで複雑なロボット操作を高精度に制御する技術を開発したと発表した。これまでロボット制御AIのオフライン強化学習では数千以上のデータが必要だったが、新技術は10分の1以下のとなる100程度のデータで精度を向上できる。公開ベンチマーク環境によるシミュレーション評価の結果、平均成功率が従来比で2倍となる72%に向上した。少量の画像データから複雑なロボット操作を高精度に制御するAI技術は「世界初」(東芝)、公開ベンチマーク環境における72%の成功率は「世界最高精度」

                                                                ロボット制御AIのオフライン強化学習で東芝が世界初と世界最高精度を達成
                                                              • Fugaku-LLM/Fugaku-LLM-13B · Hugging Face

                                                                Fugaku-LLM利用規約\n この利用規約(以下「本規約」といいます)は、富士通株式会社、国立研究開発法人理化学研究所、国立大学法人東京工業大学、国立大学法人東北大学、株式会社サイバーエージェント、国立大学法人東海国立大学機構、及び株式会社Kotoba Technologies Japan (以下「開発者」といいます)による、スーパーコンピュータ「富岳」政策対応枠における大規模言語モデル分散並列学習手法の開発の成果物として公開する大規模言語モデル(以下「Fugaku-LLM」といいます)の利用に関する条件を定めるものです。Fugaku-LLMの利用者(以下「利用者」といいます)は、本規約に同意した上でFugaku-LLMを利用するものとします。 \n\n第1条(利用許諾) Fugaku-LLMの利用者は、本規約に従い、Fugaku-LLMを商用または非商用目的を問わず利用することができ

                                                                  Fugaku-LLM/Fugaku-LLM-13B · Hugging Face
                                                                • Kaggleで学ぶ系列データのための深層学習モデリング

                                                                  最近は画像コンペではモデリングの余地があまりないことが多いが、系列データのコンペはデファクトの(pretrain)モデルが確立しておらずモデリングで勝敗が分かれることが多い。ここで系列データとは、時系列データ、センサデータ、RNA等のシーケンスデータのようなデータを意図している。 このような背景のもと、これまでの系列データを扱ったKaggleコンペティションとその上位解法を振り返りながら、系列データの深層学習モデリングを俯瞰する。 紹介しているコンペ: - IceCube - Neutrinos in Deep Ice - Google - American Sign Language Fingerspelling Recognition - Stanford Ribonanza RNA Folding - HMS - Harmful Brain Activity Classifica

                                                                    Kaggleで学ぶ系列データのための深層学習モデリング
                                                                  • スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 : 富士通

                                                                    PRESS RELEASE 2024年5月10日 東京工業大学 東北大学 富士通株式会社 理化学研究所 名古屋大学 株式会社サイバーエージェント Kotoba Technolgies Inc. スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 日本語能力に長け、研究・ビジネス利用にも期待 要点 日本の計算機技術を用いて開発した日本語能力に優れた大規模言語モデルを公開 スーパーコンピュータ「富岳」の性能を最大限に活用した分散並列学習を実現 AI基盤モデルを科学研究に活用する「AI for Science」など革新的な研究やビジネスにつながる 概要 東京工業大学 学術国際情報センターの横田理央教授の研究チームと東北大学 大学院情報科学研究科の坂口慶祐准教授、富士通株式会社 人工知能研究所の白幡晃一シニアプロジェクトディレクター、理化学研究所 のMohamed

                                                                      スーパーコンピュータ「富岳」で学習した大規模言語モデル「Fugaku-LLM」を公開 : 富士通
                                                                    • Matrix FactorizationとDeep Matrix Factorization(Keras)でのレコメンド - statsuのblog

                                                                      レコメンドの手法であるMatrix Factorizationについて勉強したのでその記録です。 以下の検証に関するコードはgithubにあげてあります。 github.com 1. 本記事の概要 レコメンドの手法であるMatrix Factorizationについての概要 Matrix FactorizationのNeural Network形式の表現とKerasでの実装 Deep Matrix Factorizationの表現とKerasでの実装 MovieLensでの精度検証 2. Matrix Factorizationの概要 ざっくりと。 Matrix Factorizationはレコメンドの手法のひとつ。 レコメンドの参考サイト レコメンドつれづれ ~1-1. 協調フィルタリングのコンセプトを知る~ - Platinum Data Blog by BrainPad レコメンドつ

                                                                      • Adversarial Random ForestsによるテーブルデータのAugmentation・モックデータ生成

                                                                        はじめに こんにちは。株式会社アイデミーデータサイエンティストの中沢(@shnakazawa_ja)です。 本記事ではAdversarial Random Forestsを使ったテーブルデータの生成について、RおよびPythonでの実装を紹介します。 Adversarial Random Forests (ARF) とは ARFは2023年にProceedings of The 26th International Conference on Artificial Intelligence and Statisticsに採択された論文で提案された、テーブルデータに対して密度推定と生成モデリングを行う高速な手法です[1]。 その名の通りGAN[2]とRandom Forestを組み合わせた手法で、生成と識別を交互に繰り返すことで元データの特性を学習し、元のテーブルデータと類似したデータを生成

                                                                          Adversarial Random ForestsによるテーブルデータのAugmentation・モックデータ生成
                                                                        • 本家Examplesで知る、新たなニューラルネットワーク『KAN』の威力 - Qiita

                                                                          文中の図は理がない限り、原論文あるいはドキュメントからの引用です。 KANってなに? KAN(Kolmogorov-Arnold Network) は2024年4月30日にプレプリント公開サイトarXivに投稿された論文 にて提案された従来のMLPとは異なる新たなニューラルネットワーク構造です。1 コルモゴロフ・アーノルド表現定理(Kolmogorov-Arnold representation theorem)に基づいて設計されており、非線形な活性化関数そのものを直接学習することから、パラメータ効率が良く、学習結果の解釈可能性が高いことが特徴です。 上の画像は$x, y$を入力として$\exp(\sin(\pi x)+y^2)$を正解として学習させるケースを示した図ですが、元の関数の関係性がそのまま活性化関数の形状として学習され現れていることが読み取れます。 コルモゴロフ・アーノルド表現

                                                                            本家Examplesで知る、新たなニューラルネットワーク『KAN』の威力 - Qiita
                                                                          • Tree Tensor Networkを用いた画像分類器 - Qiita

                                                                            はじめに テンソルネットワークは、量子多体系などの高次元なデータを効率的に扱うための手法として利用される技術ですが、近年、テンソルネットワークを機械学習に応用する研究が様々行われています。 今回は、文献[1]を参考に、Tree Tensor Network (TTN)を用いて、画像の分類を行うモデルをPyTorchで実装し、MNISTとFashion-MNISTに対して、その性能を確認してみます。 概要 今回用いるTree Tensor Network (TTN)は、その名の通り、木構造のテンソルネットワークです。 今回取り上げるTTNによる分類器では、葉が画像の各ピクセルに相当し、この情報を集約していくような構造になります。 この際、愚直に実装しようとすると、葉より上のノードのテンソルの次元数が非常に大きくなってしまうのですが、ここでCP分解と呼ばれる手法を用いて、これを小さなテンソルに

                                                                              Tree Tensor Networkを用いた画像分類器 - Qiita
                                                                            • 新型 iPad Proを忘れて、純粋にSoCとしてのM4と「その先」について考えてみる(本田雅一) | テクノエッジ TechnoEdge

                                                                              実際、OLEDを採用したノートPCなどの評判をチェックしてみて欲しい。いずれも消費電力の大きさに悩まされている。 しかし、新型iPad Proが過去のアップル製品の中で最も薄い製品として 登場したことは、OLED採用において消費電力が問題にならなかったことを示す。 その理由となっているのがタンデムスタック構造のOLEDだ。 写真:iPod nanoより薄いM4 iPad Pro タンデムスタック構造は決して最新のアイデアではなく、以前からテレビ向けなどで試されてきた技術だ。 ただし、構造的には2枚のOLEDパネルが重ね合わされたようになっているため、2つのプレーンを同期させて駆動する特別なディスプレイ回路が必要となる。M4にはこの新しいディスプレイ回路が搭載されている。 写真:M4のディスプレイエンジンはタンデムOLEDをサポートする これによりアップルがXDRと呼ぶ拡張ダイナミックレンジ

                                                                                新型 iPad Proを忘れて、純粋にSoCとしてのM4と「その先」について考えてみる(本田雅一) | テクノエッジ TechnoEdge
                                                                              • 【DL輪読会】KAN: Kolmogorov–Arnold Networks | ドクセル

                                                                                【DL輪読会】Evolutionary Optimization of Model Merging Recipes モデルマージの進化的最適化

                                                                                  【DL輪読会】KAN: Kolmogorov–Arnold Networks | ドクセル
                                                                                • 画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」

                                                                                  画像生成AI関連の著名な開発者、lllyasviel(イリヤスフィール)氏が5月7日、生成AI画像の照明を自在に操作できるツール「IC-Light(Imposing Consistent Light)」を公開した。 2種類のモデルを公開 IC-Lightは画像の照明を操作するプロジェクト。前景画像(人物やオブジェクトなど)を入力し、プロンプトにテキストや背景画像を指定するだけで、まるで別の環境で撮影したかのような画像を得ることができるという。 現在、「テキスト条件付きリライティングモデル(text-conditioned relighting model)」と「背景条件付きモデル(background-conditioned model)」の2種類がGitHubで公開されており自由に試すことができる。 なお、作者のlllyasviel氏は「Stable Diffusion」のWebUIであ

                                                                                    画像生成AIに“照明”革命 ControlNet開発者が作った「IC-Light」