並び順

ブックマーク数

期間指定

  • から
  • まで

321 - 360 件 / 1838件

新着順 人気順

ディープラーニングの検索結果321 - 360 件 / 1838件

  • VRで注目、新技術「NeRF」の衝撃 様々な視点の画像を美しく合成

    複数の視点の画像から、新たな視点の画像を合成して作り出す「Novel View Synthesis」というタスクがある。VRやスポーツの自由視点映像などには不可欠な技術だ。この領域で驚異的な性能を発揮したのが「NeRF」(ナーフ)。果たしてどんなアルゴリズムで、美しい合成画像を作り出せるのか。世界中の研究者や技術者に衝撃を与えたその技術を、論文からひもといていく。 まずは下の3枚の画像を見ていただきたい(図1)。左の2枚の写真を基に、一番右の画像のような新たな視点の画像を生成する技術を、今回は紹介していく。コンピュータービジョン分野やコンピューターグラフィックス分野の主要な研究課題の1つであり、応用先にはVR(仮想現実)やスポーツの自由視点映像など、様々な分野が挙げられる。 これは「Novel View Synthesis」という、複数の視点の画像を手がかりに新たな視点の画像を合成する技術

      VRで注目、新技術「NeRF」の衝撃 様々な視点の画像を美しく合成
    • ニューラルネットワークの中身を分割してAIの動作を分析・制御する試みが成功、ニューロン単位ではなく「特徴」単位にまとめるのがポイント

      GoogleやAmazonが投資するAIスタートアップのAnthropicの研究チームが、ニューラルネットワークがどのように言語や画像を扱っているのかを解き明かす研究において、個々のニューロンを「特徴」と呼ばれる単位にまとめることでニューラルネットワークの中身を解釈しやすくなるという研究結果を発表しました。 Anthropic \ Decomposing Language Models Into Understandable Components https://www.anthropic.com/index/decomposing-language-models-into-understandable-components 大規模言語モデルは多数のニューロンが接続されたニューラルネットワークで、ルールに基づいてプログラミングされるのではなく、多数のデータを元にトレーニングを行うことでタス

        ニューラルネットワークの中身を分割してAIの動作を分析・制御する試みが成功、ニューロン単位ではなく「特徴」単位にまとめるのがポイント
      • アボカドとアボガド、深層学習で識別 プロ並み精度誇る

        人工知能(AI)を使って果物のアボカドとアボガドを識別するシステムを、千葉電波大学の鰐梨教授らが開発した。専門家並みの精度で見分けることができるという。研究結果は英科学誌「フェノメノン」5月特大号に掲載された。 研究チームではアボカドとアボガドの写真をそれぞれ200万枚ずつ用意し、ディープラーニング(深層学習)という手法を用いて、AIにそれぞれの画像からアボカドとアボガドの特徴を見つけ出させた。学習後、判別前の果物を見せたところ、99.7%の確率でアボカドとアボガドをほぼ正しく区別した。 アボカドは脂肪分を多く含むことから「森のバター」と呼ばれる一方、アボガドは「森のマーガリン」と呼ばれ、アボカドの代用品として使われることが多い。プロであれば手触りや色の違いから容易に判別できるが、よく似た見た目をしているため、これまで一般の人には識別が難しかった。今後スマートフォン向けアプリなどへの応用を

          アボカドとアボガド、深層学習で識別 プロ並み精度誇る
        • 大澤昇平🇺🇳 on Twitter: "具合悪そうだから介抱したのに急に「レイプされた」とかファビョり出して社会的地位を落としにかかってくるのトラップ過ぎるし、男にとって敵でしかないわ。"

          具合悪そうだから介抱したのに急に「レイプされた」とかファビョり出して社会的地位を落としにかかってくるのトラップ過ぎるし、男にとって敵でしかないわ。

            大澤昇平🇺🇳 on Twitter: "具合悪そうだから介抱したのに急に「レイプされた」とかファビョり出して社会的地位を落としにかかってくるのトラップ過ぎるし、男にとって敵でしかないわ。"
          • ファンタジー世界が舞台のゲームでAIが「目的があるかのように」話したり行動したりできるようにする研究

            RPGなどのゲームをプレイしている最中に、村人のようなノンプレイヤーキャラクターが同じことしか言わなかったり、同じ行動ばかり続けていることにがっかりしたことがあるゲーマーは多いはず。ジョージア工科大学と、Facebook AI Research(FAIR)が協力して行った最近の研究で、「目標を持って会話したり行動したりするファンタジーゲームのAI」が発表されました。 How to Motivate Your Dragon: Teaching Goal-Driven Agents to Speak and Act in Fantasy Worlds (PDFファイル)https://arxiv.org/pdf/2010.00685.pdf Teaching AI agents to communicate and act in fantasy worlds https://techxplor

              ファンタジー世界が舞台のゲームでAIが「目的があるかのように」話したり行動したりできるようにする研究
            • 機械学習と自動微分 (2023)

              「最適化法」第15回(ゲストトーク), 2023年1月20日, 同志社大学.

                機械学習と自動微分 (2023)
              • 自然言語処理でBERTまでの流れを簡単に紹介 - moriyamaのエンジニアリング備忘録

                はじめまして@vimmodeです。普段はMNTSQというリーガルテックの会社で自然言語処理をしています。今回はBERTとBERTまでの流れを簡単に紹介します。 自然言語処理で今やデファクトスタンダードとなりつつであるBERT。登場当時はモデルの複雑さに伴う計算環境や計算リソースの確保が難しく気軽に動かせなかったが、ColabやKaggleカーネル環境が整備されたきたおかげで誰でも気軽に使えるようになりました。 また、haggingface社が公開したBERTと関連モデルのラッパーライブラリであるtransformersによりわずか10行程度でBERTモデルを記述できます。 一方、自然言語処理を始めて間もない段階でいきなりBERTを突きつけられても理解の壁が高いと思いますので、今回は数式やコードを使わずにBERTに至るまでの流れを簡単に紹介したいと思います。 ※これらはあくまで私の理解であり

                  自然言語処理でBERTまでの流れを簡単に紹介 - moriyamaのエンジニアリング備忘録
                • 伊藤詩織氏に「断固抗戦する」「左翼の言論弾圧は益々加速」 提訴された大澤昇平氏、ツイッターで気炎

                  ジャーナリストの伊藤詩織氏は2020年8月20日、ツイッターで誹謗中傷を受けたとして、元東大特任准教授で株式会社Daisy代表取締役の大澤昇平氏に110万円の損害賠償を求めて東京地裁に提訴した。各メディアが報じた。 提訴を受け、大澤氏は「先方の主張は理不尽すぎるので全力で勝負します」と争う構えを示している。 杉田水脈氏も法廷闘争へ 各報道によれば、伊藤氏が20年6月、誹謗中傷する内容のイラストをツイートされたなどとして、漫画家のはすみとしこ氏ら3人を提訴した一件をめぐり、大澤氏が「伊藤詩織の何がダメダメかって、刑事裁判でレイプが認められなかったにもかかわらず、その後の民事裁判の結果をレイプを関連付けている点」などとツイート。「伊藤詩織って偽名じゃねーか」と事実無根の内容も書き込んでいた。 大澤氏は提訴を受け、8月20日にツイッターで「突然俺を訴えると言い出した。正直全く意味が分からない」と

                    伊藤詩織氏に「断固抗戦する」「左翼の言論弾圧は益々加速」 提訴された大澤昇平氏、ツイッターで気炎
                  • AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃

                    AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃 2020.10.08 Updated by Ryo Shimizu on October 8, 2020, 11:13 am JST 「最近のAIがすごい」と言われてからもう6年ほどが経過した。 なかでも人目を引いたのは、なんといっても2016年のAlphaGoだろう。最難関ゲームの一つと言われる囲碁において、人間のトップ棋士に対しAIが圧勝したのである。 これは「深層強化学習」というAIだが、実際のところ、「深層強化学習」を実用的に利用した例はまだ少ない。 多くのAIベンチャーやAIベンダーが扱う「AI」技術は、古典的な統計解析か、時折ニューラルネットを使っているくらいで、「深層学習」ではあっても「深層強化学習」とは完全に別物である。ラジオもコンピュータも同じ電気で動くものだが別物であるのと同じだ。 深層強化学

                      AIの想像力が人間を超えるとき。深層強化学習のブレイクスルー、D3RLの衝撃
                    • Interpretable Machine Learning

                      Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約 機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。 しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。 本書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。 解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。 その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo

                      • [輪講資料] LoRA: Low-Rank Adaptation of
 Large Language Models

                        パラメータを固定した事前学習済みモデルに対して、ごく少数のパラメータからなる低ランク行列を導入・学習することで、モデル全体のfine-tuningと同等の性能を発揮できる手法であるLoRAと、その論文について解説した資料です。 深層学習を用いた自然言語処理の歴史的な変遷と周辺技術から、LoRAが必要とされるに至った背景まで丁寧に解説します。

                          [輪講資料] LoRA: Low-Rank Adaptation of
 Large Language Models
                        • 低解像度ビデオもすぐに高解像度に変換できる超解像アルゴリズムTecoGANがすごい

                          3つの要点 ✔️ 低解像から高解像へ変換 ✔️ 時間的に一貫したフレームを生成するために双方向損失関数を採用 ✔️ 超解像度へ変換するTecoGANを提案 Learning Temporal Coherence via Self-Supervision for GAN-based Video Generation Temporally Coherent GANs for Video Super-Resolution (TecoGAN) written by Mengyu Chu, You Xie, Jonas Mayer, Laura Leal-Taixé, Nils Thuerey (Submitted on 23 Nov 2018 (v1), last revised 21 May 2020 (this version, v4)) Comments: Published by arXi

                            低解像度ビデオもすぐに高解像度に変換できる超解像アルゴリズムTecoGANがすごい
                          • 実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?

                            こんにちは。Turing株式会社の機械学習チームでインターンをしている九州大学修士1年の岩政(@colum2131)です。 Turingは完全自動運転EVの開発をするスタートアップです。 自動運転技術において、カメラやセンサ情報は正確な制御をする上で不可欠な要素である一方、自然言語やマルチモーダルな処理が必要となる状況もしばしば存在します。特に完全自動運転車においては、音声認識によってドライバーの音声命令を認識し、リアルタイムで適切な制御を行うことや、複雑な交通状況の背景にあるコンテクストを理解させるといった要求が出てきます。そのために、「基盤モデル」と呼ばれるような、自然言語処理を含む大規模モデルの学習が必要になってくると、私たちは考えています。 そこで本記事では、言語モデルの発展の流れとTuringが目指す基盤モデルの開発について紹介します! 1. 言語モデルとは? 近年の言語処理モデ

                              実践!大規模言語モデル / 1000億パラメータ越えモデルを動かすには?
                            • 顔画像生成のためのデータセットを作る - すぎゃーんメモ

                              動機 TensorFlowの登場をきっかけに 機械学習によるアイドル顔識別 という取り組みをしていて、3年以上かけてコツコツとアイドルの自撮りを収集してラベルをつけてデータセットを作ってきたけど、 アイドルヲタクはもう辞めてしまって 現場にも全然行かなくなり、卒業・脱退の情報を追いながらラベルを更新していく作業を続ける情熱はすっかり薄れてしまった。 もうアイドル顔識別プロジェクトは終了にしよう、と思った。 しかし折角今まで集めたデータを捨ててしまうのは勿体無い。せめて最後に何か活用できないものか。 と考えて、「画像生成」に再び取り組んでみることにした。 過去に試したことはあったけど、それほど上手くはいっていない。 TensorFlowによるDCGANでアイドルの顔画像生成 TensorFlowによるDCGANでアイドルの顔画像生成 その後の実験など この記事を書いたのが2016年。 この後

                                顔画像生成のためのデータセットを作る - すぎゃーんメモ
                              • DALL·E 2

                                DALL·E 2 is an AI system that can create realistic images and art from a description in natural language.

                                  DALL·E 2
                                • 最新Raspberry Pi OS(Bullseye)のAI画像認識環境構築方法

                                  ラズパイでAI画像認識環境構築 ひさしぶりにラズパイでディープラーニングしようと思ったら、色々変わっていたのでメモ。 追記:ラズパイ5に関しては以下記事参照ください。 前提 ハードウェアやソフトウェアの前提は以下です。 Raspberry Pi 4 Raspberry Pi OS(64-bit) with Desktop 2023-02-21(Bullseye) USBカメラ OSは64bitを使用します。32bitだとライブラリのバージョンが変わってくるのでこの記事のままだとインストールできませんので注意してください。 SDカードの書き込みやハードウェアのセッティングに関しては、以下記事参照ください。 また、上記記事では、カメラとしてRaspberry Pi カメラモジュールを使っていますが、Raspberry Pi OSがBullseyeになってから、使用するライブラリが変わった(Pi

                                    最新Raspberry Pi OS(Bullseye)のAI画像認識環境構築方法
                                  • AIのべりすと

                                    Write Stories, with the Largest Public Japanese AI ever! AIで小説を書こう! AI Novelist is the largest public Japanese storywriting AI, trained from scratch by more than 2TB corpus. You may start from one of the example prompts or start with your own text! Tips: You may want to enter at the least 5-6 lines worth of a seed text to make sure the AI understands the context/genre.

                                      AIのべりすと
                                    • ChatGPTを支えた高品質AI作成手法「RLHF」の中身はこんな感じ、面倒なデータ入力・整理はオープンソースでセルフホスト可能なプラットフォーム「Argilla」が便利

                                      RLHFとは「人間の評価による強化学習」のことで、大規模言語モデルをChatGPTなどの実用レベルに至る品質にまで高めた実績のある手法です。RLHFでは教師データを作成したり、大規模言語モデルの回答を評価したりする際に人間がデータを入力する必要があり、特に複数人で作業する場合にデータの管理が大変になってしまうものですが、そうしたRLHF用データの入力や管理を行ってくれるプラットフォームが「Argilla」です。 Bringing LLM Fine-Tuning and RLHF to Everyone https://argilla.io/blog/argilla-for-llms/ 大規模言語モデルを作成する時の手順を示したのが下の図です。まず大量のテキストを用いて事前学習を行います。こうして作成されたモデルが事前学習済みモデルで、GPTやPaLM、LLaMAなどのモデルがこのカテゴリに

                                        ChatGPTを支えた高品質AI作成手法「RLHF」の中身はこんな感じ、面倒なデータ入力・整理はオープンソースでセルフホスト可能なプラットフォーム「Argilla」が便利
                                      • 【終了しました】 『ゼロから作る Deep Learning ❸』公開レビューのお知らせ|斎藤 康毅(さいとう こうき)

                                        こんにちは、斎藤 康毅(さいとう こうき)といいます。ここ1年間はずっと本を書いていました。『ゼロから作る Deep Learning ❸ — フレームワーク編』という本です。最近ようやく、原稿を書き終わろうとしています。 この本は「ディープラーニングのフレームワークを作ろう」という本です(野心的にも、オリジナルの「フレームワーク」をゼロから作ります)。世界中を見回しても、ほとんど類書がないような本になっていると思います。これから先、できるかぎり良い本になるよう、最後の最後までブラッシュアップしていく予定です。 さて、今回も前作同様に「公開レビュー」を行います。興味のある方は、オンラインで原稿を読めるページを用意していますので、チェックしてみてください(無料です!)。問題に感じた箇所や改善すべきと思った点など、コメントいただけますと幸いです。どんなに小さな指摘や疑問でも構いませんので、気軽

                                          【終了しました】 『ゼロから作る Deep Learning ❸』公開レビューのお知らせ|斎藤 康毅(さいとう こうき)
                                        • 自民 平井卓也 前デジタル相 小選挙区で議席確保できず | NHKニュース

                                          自民党の平井卓也 前デジタル大臣は、小選挙区の香川1区では議席を確保できませんでした。平井氏は、比例代表の四国ブロックに重複立候補しており、比例代表の結果を待つことになります。 平井氏は、63歳。平成12年の衆議院選挙で初当選し、菅内閣ではデジタル改革担当大臣を務め、デジタル庁の創設に尽力しました。 平井氏は、8回目の当選を目指して、デジタル改革の推進などを訴えましたが、小選挙区の香川1区では、立憲民主党の前議員の小川淳也氏に及びませんでした。 平井氏は、比例代表の四国ブロックに重複立候補しており、比例代表の結果を待つことになります。

                                            自民 平井卓也 前デジタル相 小選挙区で議席確保できず | NHKニュース
                                          • ブラウザなどのツール操作を簡単に自動化できるAI「ACT-1」が登場

                                            AIスタートアップのAdeptが、デジタルツールを使用するように訓練された大規模なTransformerモデル「ACT-1」を発表しました。ACT-1はブラウザで何が起こっているかを監視し、クリック・入力・スクロールなどの特定アクションを実行できるChrome拡張機能に接続されており、操作を自動化できます。 ACT-1: Transformer for Actions https://www.adept.ai/act ACT-1は、ユーザーの高度な要求を受け止め、それを実行することができます。ユーザーはテキストボックスにコマンドを入力するだけで、あとはACT-1が実行します。 ACT-1への指示は、ブラウザ上に表示されるポップアップに英語で入力して行います。例えば「ヒューストンで4人家族が住む家を探してほしい、予算は60万ドル(約8400万円)」と入力します。 すると、物件の検索サイトでヒ

                                              ブラウザなどのツール操作を簡単に自動化できるAI「ACT-1」が登場
                                            • 「一般人おじさんでも初音ミクになって踊れる可能性と未来がある」の動画が凄い技術なんだけど男に戻る瞬間がサブリミナル

                                              バーチャル美少女おじさん珍味 @hanageshinnkenn 美少女になりたいおじさん。ダンスとアニメが好きです。noteには二次元美少女になる方法やAIについて書いてます。 最後のゴーヤ祭 / 思春期テロリスト https://t.co/egEMyRn6Yc

                                                「一般人おじさんでも初音ミクになって踊れる可能性と未来がある」の動画が凄い技術なんだけど男に戻る瞬間がサブリミナル
                                              • Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】 - Qiita

                                                Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】RaspberryPiTensorflowLitexnnpack 1. はじめに 今から半年前の2020年6月、ラズパイ4上でTensorFlow Liteを使った様々なAI認識アプリを動かしてみて、その動作速度をまとめました。 当時のTensorFlowはバージョン2.2でしたが、現在は 2.4(rc4) へと進んでいます。進化が極めて速いDeepLearningの世界において、この半年間でTensorFlow Liteはどう変化したでしょうか。もし「手持ちのアプリは何も変えてないのに、TensorFlow Liteを新しくするだけでめっちゃ速く動くようになったぜ」というのだと嬉しいですよね。 本記事では、前回計測に用いたアプリを再び最新版のTensorFlow Lite環

                                                  Raspberry Pi4 単体で TensorFlow Lite はどれくらいの速度で動く?【2020年12月版】 - Qiita
                                                • DockerでのディープラーニングGPU学習環境構築方法 - Qiita

                                                  DockerでGPU学習環境構築 背景 ディープラーニングでローカルPCのGPUを使った学習環境を構築した経験のある人は、一度はNVIDIAのドライバやCUDA周りでハマった経験があるのではないでしょうか?そんなバッドノウハウ(怪文章?)をまとめたQiita記事(TensorFlowでGPU学習させるためにCUDA周りではまったときの対処法)に、なんとNVIDIAの中の人(@ksasaki さん)から「Dockerを使えば…人類は幸せになれる(超意訳)」とのコメントをいただきました! 喜び勇んで、NVIDIAのドライバをアップデートしたところ、そこには文鎮と化した起動しないLinuxマシンが…からあげのNVIDIAとの戦いは始まったばかりだ!(戦ってません) DockerでGPU学習環境構築するメリット うまく構築できればという前提で、以下のようなメリットがあります。 様々なフレームワーク

                                                    DockerでのディープラーニングGPU学習環境構築方法 - Qiita
                                                  • 混ざった楽器の音を演奏者の動きで分離 米MITなど研究

                                                    Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米マサチューセッツ工科大学(MIT)とMIT-IBM Watson AI Labの研究チームが開発した「Music Gesture for Visual Sound Separation」は、楽器を演奏する複数人の動きを深層学習で分析し、個々の楽器の音を分離する手法だ。ピアノ、フルート、トランペットなどの楽器を複数人で同時演奏した場合に、その映像から演奏者それぞれのメロディーを抜き出す。 映像解析ネットワークと視覚音声分離ネットワークの2つからなる「自己教師あり学習」を採用。映像解析ネットワークでは、人体のキーポイント18点、手のキーポイント21点を抽出。次に身体の動きと前後関係を統合し、

                                                      混ざった楽器の音を演奏者の動きで分離 米MITなど研究
                                                    • 機械学習で画像の高画質化を試みる(備忘録)- Python3 - Qiita

                                                      OpenCVはpix2pixの実行とは直接関係しないのですが、後述の学習データの作成で使用します。今の所最新バージョンで問題なさそうですが、もし実行できないのであれば同じようにバージョンを指定してインストールを行ってください。 3.学習データの作成 pix2pixには予め学習用データセットが用意されていますが、今回の目的は画像の高画質化なので、それに適した学習データを自作することにします。 前述したとおり、pix2pixは以下のような2枚の対になった画像を繋げて1枚にしたものを学習データとして用います。(256px × 256pxを2枚繋げた512px × 256pxの画像) この画像を作成するためには 1. 大きな画像を256px × 256pxに切り分ける 2. 切り分けたそれぞれの画像にぼかしを入れる 3. 切り分けた画像とぼかしを入れた画像を結合する の3つの処理を行う必要がありま

                                                        機械学習で画像の高画質化を試みる(備忘録)- Python3 - Qiita
                                                      • 【まとめ】ディープラーニングを使った異常検知 - Qiita

                                                        ディープラーニングを使った異常検知が進歩していますが、最新情報を追うのが大変です。 ここでは、最新情報をまとめておきます(随時更新)。 本稿では、以下の内容を記します。 ディープラーニングを使った異常検知について、簡単に歴史をまとめます。 最新の手法(2019年当時)について、ベンチマークを行います。 歴史 完全に独断と偏見で作った歴史です。 全ての論文は読めていないので、ご了承ください。 【~2017年】オートエンコーダによる異常検知 オートエンコーダによる異常検知 2、3年前はオートエンコーダによる異常検知が主流でした。オートエンコーダでは、元画像と再構築画像との差をとって、その和が大きいとき異常と認識させています。Qiitaの記事でも、オートエンコーダによる異常検知はたくさんありますので、気になる人は探してみてください。 Variational AutoEocoder(VAE)による

                                                          【まとめ】ディープラーニングを使った異常検知 - Qiita
                                                        • Markdown を拡張する MDX はドキュメント作成の新たな可能性?

                                                          この記事は、技術書典 11 で頒布中の「Vivliostyle で本を作ろう vol. 5」から抜粋した記事です。ご興味ありましたら、Vivliostyle を使って組版された本誌もぜひお買い求めください! また、この記事以外の内容もすべて Vivliostyle 公式サイトで無料公開中です。 技術書やドキュメントを執筆する際、あなたはどのような形式で文章を書きますか? 最近ではもっぱら Markdown で書かれることが多いですが、この Markdown を拡張するポテンシャルを持つお気に入りの OSS プロジェクト「MDX」を紹介します。 MDX = Markdown + JSX MDX の名前の由来は Markdown + JSX なので、MDX を理解するためにはまず JSX について知る必要があります。 JSX とは JavaScript の拡張構文の一つで、元々 React の

                                                            Markdown を拡張する MDX はドキュメント作成の新たな可能性?
                                                          • https://withktsy.com/archives/2745

                                                              https://withktsy.com/archives/2745
                                                            • 自然言語処理の王様「BERT」の論文を徹底解説 - Qiita

                                                              オミータです。ツイッターで人工知能のことや他媒体で書いている記事など を紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください! 2018年10月に登場して、自然言語処理でもとうとう人間を超える精度を叩き出した ことで大きな話題となったBERT。それ以降、XLNetやALBERT、DistillBERTなどBERTをベースにしたモデルが次々と登場してはSoTAを更新し続けています。その結果、GLUEベンチマークでは人間の能力が12位(2020年5月4日時点)に位置しています。BERTは登場してまだ1年半程度であるにもかかわらず、被引用数は2020年5月4日現在で4809 にも及びます。驚異的です。この記事ではそんなBERTの論文を徹底的に解説していきたいと思います。BERTの理解にはTransformer[Vaswani, A.

                                                                自然言語処理の王様「BERT」の論文を徹底解説 - Qiita
                                                              • DreamFusion: Text-to-3D using 2D Diffusion

                                                                Abstract Recent breakthroughs in text-to-image synthesis have been driven by diffusion models trained on billions of image-text pairs. Adapting this approach to 3D synthesis would require large-scale datasets of labeled 3D assets and efficient architectures for denoising 3D data, neither of which currently exist. In this work, we circumvent these limitations by using a pretrained 2D text-to-image

                                                                  DreamFusion: Text-to-3D using 2D Diffusion
                                                                • 最強の囲碁AIに圧勝する人物が登場、AIの弱点を突いて人類が勝利したと話題に

                                                                  人工知能(AI)の進化に伴って、チェスや将棋といった知能ゲームにおいてAIがプロプレイヤーに勝利するケースが増えていましたが、2016年1月にGoogleの「AlphaGo」が囲碁のプロ棋士に勝利したことを皮切りに、2カ月後には世界最強の棋士にも勝利したり、「私ならAlphaGoにも勝てる」と宣言したプロ棋士にも接戦の末勝利したり、2017年には自力で戦術を覚えて強くなれる新バージョンの「AlphaGo Zero」が発表されたりと、囲碁の世界でもAIが圧倒的な勝者として君臨していました。そのような中で、アマチュアの囲碁プレイヤーがコンピュータの直接的なサポート無しで最強レベルの囲碁AIに15戦14勝と大勝し、「AIに対する人類の勝利」と話題になっています。 Adversarial Policies in Go - Game Viewer https://goattack.far.ai/ad

                                                                    最強の囲碁AIに圧勝する人物が登場、AIの弱点を突いて人類が勝利したと話題に
                                                                  • 機械学習概論~ディープラーニングGAN、本格的に学べる全20時間の大学講義が無償公開

                                                                    機械学習概論~ディープラーニングGAN、本格的に学べる全20時間の大学講義が無償公開:AI・機械学習の独学リソース 機械学習概論、単回帰、重回帰から、k-means、主成分分析、ニュートラルネットワーク、CNN/RNN/GANまで、全20回の講義概要と目次を紹介。本稿独自に考察した、難易度や前提知識、お勧めの学習方法、注意点についても示す。

                                                                      機械学習概論~ディープラーニングGAN、本格的に学べる全20時間の大学講義が無償公開
                                                                    • 【エッジAI】MITがまた何かすごいのを作ったようです。有名AI学会のNeurIPSで発表した内容を解説(コード・動画あり) | AIDB

                                                                      ホーム 実装 【エッジAI】MITがまた何かすごいのを作ったようです。有名AI学会のNeurIPSで発表した内容を解説(コード・動画あり) 【エッジAI】MITがまた何かすごいのを作ったようです。有名AI学会のNeurIPSで発表した内容を解説(コード・動画あり) 2020/12/18 実装 AIDB Research

                                                                        【エッジAI】MITがまた何かすごいのを作ったようです。有名AI学会のNeurIPSで発表した内容を解説(コード・動画あり) | AIDB
                                                                      • PyTorchチュートリアル(日本語訳版)

                                                                        [1] 本サイトでは、「PyTorch 公式チュートリアル(英語版 version 1.8.0)」を日本語に翻訳してお届けします。 [2] 公式チュートリアルは、①解説ページ、②解説ページと同じ内容のGoogle Colaboratoryファイル、の2つから構成されています。 両者は基本的には同じ内容です。本サイトでは 「Google Colaboratoryファイル」で、チュートリアルの日本語訳を用意しております(未完成分は順次公開いたします)。 [3] 本サイトのチュートリアルの閲覧および実行は、Google Colaboratory環境を前提とします。 (本サイトのライセンスはこちらとなります) [4] 本サイトに掲載している、日本語チュートリアルをまとめて配置したGitHubはこちらとなります。 [0] 目次(table of contents) 日本語解説へ [1] テンソル(T

                                                                          PyTorchチュートリアル(日本語訳版)
                                                                        • LLM Visualization

                                                                          A 3D animated visualization of an LLM with a walkthrough.

                                                                          • 脳みそが固くなったおじさんSEが機械学習を勉強してみた - Qiita

                                                                            【はじめに】 本記事は 「機械学習をどう学んだか by 日経 xTECH ビジネスAI② Advent Calendar 2019」 の19日目になります。 おじさんSEの私がどうやって機械学習を勉強したかを記します。 きっかけは当時抱えていた分類課題において、「機械学習が使えるんじゃね?」というところから始まりました。 闇雲にやっていたので正直記憶は曖昧です。 経歴 プログラム歴は30年近くあります。 小学生の時に覚えたMS BASICから始まり、Z80アセンブラ、MC68000アセンブラ、FORTRAN、C(UNIX)、C++(Mac)、VB、Java(Android)、VB.NET、C#と触ってきました。 いろいろな言語に触れてきましたが、どれも極めるほどガッツリやっていたわけではありません。 機械学習に関しては20年以上前、いわゆる第二次AIブームの終わり頃に卒論のテーマでニューラ

                                                                              脳みそが固くなったおじさんSEが機械学習を勉強してみた - Qiita
                                                                            • 機械学習による株価予測 いろはの”い” - Qiita

                                                                              はじめに ちょうど3年ほど前に機械学習による株価予測のTipsをブログにて公開したことがある。 機械学習による株価予測には押さえておくべきノウハウが多数あり(要するにドメイン知識が必要であり)、データサイエンティストが単に予測対象を株価に置き換えても簡単に良い結果を得ることは難しい。フィナンシャルデータは過分散で統計的エラーが発生しやすく、バックテストや検証の結果は殆どの場合で信用するに値しない。その上、取引における市場の仕組みや制度を正しく検証に反映できていない場合、実運用において大きくパフォーマンスが劣化してしまう。考慮すべき事象は、上場情報(新規、廃止、監理指定等)、取引規制や貸借情報(売買停止、空売り規制、信用取引規制等)に加え、売買のレイテンシー、板の厚みやキューの考え方など多岐に渡る。 このため殆どの検証は机上の空論で終わる可能性が高い。検証に関する記事は多数存在するが、実弾投

                                                                                機械学習による株価予測 いろはの”い” - Qiita
                                                                              • 強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)

                                                                                東京大学 松尾研究室が主催する深層強化学習サマースクールの講義で今井が使用した資料の公開版です. 強化学習の基礎的な概念や理論から最新の深層強化学習アルゴリズムまで解説しています.巻末には強化学習を勉強するにあたって有用な他資料への案内も載せました. 主に以下のような強化学習の概念やアルゴリズムの紹介をしています. ・マルコフ決定過程 ・ベルマン方程式 ・モデルフリー強化学習 ・モデルベース強化学習 ・TD学習 ・Q学習 ・SARSA ・適格度トレース ・関数近似 ・方策勾配法 ・方策勾配定理 ・DPG ・DDPG ・TRPO ・PPO ・SAC ・Actor-Critic ・DQN(Deep Q-Network) ・経験再生 ・Double DQN ・Prioritized Experience Replay ・Dueling Network ・Categorical DQN ・Nois

                                                                                  強化学習の基礎と深層強化学習(東京大学 松尾研究室 深層強化学習サマースクール講義資料)
                                                                                • 日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策

                                                                                  2019年11月20、21日の2日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2019」が開催されました。1日目は「Engineering」をテーマに、LINEの技術の深堀りを、2日目は「Production」をテーマに、Web開発技術やUI/UX、プロジェクトマネジメントなど、より実践的な内容についてたくさんのプレゼンテーションが行われました。「NAVER ClovaのOCR(光学的文字認識) 」に登壇したのはNAVER OCR Team AI ResearcherのHwalsuk Lee氏。深層学習を用いたOCR技術の仕組みについて語りました。講演資料はこちら LINEのOCR技術の仕組み Hwalsuk Lee氏:みなさま、こんにちは。Hwalsuk Leeと申します。NAVER Clova OCR Teamから参りました。今

                                                                                    日本語OCRはなぜ難しい? NAVERのエンジニアが語る、テキスト検出における課題と解決策