並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 1818件

新着順 人気順

ディープラーニングの検索結果481 - 520 件 / 1818件

  • GitHub - google-deepmind/ithaca: Restoring and attributing ancient texts using deep neural networks

    Yannis Assael1,*, Thea Sommerschield2,3,*, Brendan Shillingford1, Mahyar Bordbar1, John Pavlopoulos4, Marita Chatzipanagiotou4, Ion Androutsopoulos4, Jonathan Prag3, Nando de Freitas1 1 DeepMind, United Kingdom 2 Ca’ Foscari University of Venice, Italy 3 University of Oxford, United Kingdom 4 Athens University of Economics and Business, Greece * Authors contributed equally to this work Ancient His

      GitHub - google-deepmind/ithaca: Restoring and attributing ancient texts using deep neural networks
    • 真面目なプログラマのためのディープラーニング入門

      はじめに: 本講座は「機械学習ってなんか面倒くさそう」と感じている プログラマのためのものである。本講座では 「そもそも機械が『学習する』とはどういうことか?」 「なぜニューラルネットワークで学習できるのか?」といった 根本的な疑問に答えることから始める。 そのうえで「ニューラルネットワークでどのようなことが学習できるのか?」 という疑問に対する具体例として、物体認識や奥行き認識などの問題を扱う。 最終的には、機械学習のブラックボックス性を解消し、所詮は ニューラルネットワークもただのソフトウェアであり、 固有の長所と短所をもっていることを学ぶことが目的である。 なお、この講座では機械学習のソフトウェア的な原理を中心に説明しており、 理論的・数学的な基礎はそれほど厳密には説明しない。 使用環境は Python + PyTorch を使っているが、一度原理を理解してしまえば 環境や使用言語が

        真面目なプログラマのためのディープラーニング入門
      • 【保存版】さまざまなAI画像処理の手法を学べるレシピ50選(2022年8月版) - Qiita

        はじめに ※本記事は2022年8月16日に20個のレシピを追加し50選へと更新いたしました。 AxrossRecipeを運営している松田です。 AxrossRecipe は、エンジニアの"アカデミックな教育"と"現場の業務"のスキルギャップに着目し、「学んだが活用できない人を減らしたい」という想いで、ソフトバンク社内起業制度にて立ち上げたサービスです。 現役エンジニアによるノウハウが"レシピ"として教材化されており、動くものを作りながらAI開発やデータ分析の流れを追体験できます。 AxrossRecipe: https://axross-recipe.com Twitter: https://twitter.com/AxrossRecipe_SB 画像処理とは 画像処理は、「動画像のデータに対して、コンピュータが何かしらの処理を施すこと」の総称で、「画像認識」や「物体検出」、「画像合成・加

          【保存版】さまざまなAI画像処理の手法を学べるレシピ50選(2022年8月版) - Qiita
        • 機械学習エンジニアに爆速でなるための教材集 - Qiita

          0. はじめに 昨今のAI、DXブームの影響で、機械学習、深層学習(ディープラーニング, Deep Learning) への注目は増すばかりですが、初学者の方にとって機械学習を学ぶハードルは依然高い状態かと思います。 機械学習、特にディープラーニングを習得するには学ぶべきことが多く、また分野によっては難易度が高いということもあり、学んでいる途中で挫折してしまうという人も多いという印象があります。 そこで本記事では、これから機械学習を学びたい方が自学自習する際の助けになるようにと、有用な自習コンテンツをまとめました。 本記事では、機械学習エンジニアとして実務に参画できるレベルを目指して、コンテンツを収集しました。よって機械学習の理論やライブラリに加え、社会実装する上で付随して必要となるソフトウェアエンジニアリングのスキルも含めています。 コンテンツについては、適宜追記していく予定です。 対象

            機械学習エンジニアに爆速でなるための教材集 - Qiita
          • Grad-CAMだけじゃない画像認識におけるCAM手法を徹底解説 - ABEJA Tech Blog

            長期インターン生の木村です。 今回、以前から興味を持っていた画像認識モデルにおける説明可能なAIのクラス活性化マッピング手法を調査してみました。 説明可能なAIとは 近年、深層学習ベースの画像認識モデルは製造業、医療、自動運転など至る場面で社会実装が進められていますが、ディープなラーニングを行っているだけに推論の判断根拠を人間が解釈できない問題があります。医療、自動運転のような命に関わる領域では安全性や公平性を担保できないために安心して導入できません。 このような問題を解決するのが「説明可能なAI(XAI)」です。 「説明可能なAI(XAI)」は、AIの推論結果を人間が解釈可能な形で出力する技術を指します。例えば、犬と猫が映っている画像を画像分類するAIが犬と推論した場合、モデルがどこを判断根拠としているかをヒートマップで可視化します。このヒートマップは、「顕著性マップ」と呼ばれます。 画

              Grad-CAMだけじゃない画像認識におけるCAM手法を徹底解説 - ABEJA Tech Blog
            • インターンシップでマルチA100 GPUサーバをぶん回してみた - NTT Communications Engineers' Blog

              はじめに 2月14日から25日までの2週間、NTTコミュニケーションズのインターンシップに参加させていただいた八木です。普段は大学院で画像処理の高速化に関する研究をしています。インターンシップでは技術コースのうち「AI/MLシステムとの統合を志向した、メディアAI技術の研究開発」ポストに応募しました。全日リモートでの参加で、joinしたチームのマルチA100 GPUサーバなどを用いて画像認識モデルを学習し、NTT Com で独自に構築しているデータセットでその性能評価をしました。この記事では、その体験談を記載します。 インターンシップまでの経緯 就活イベントで NTT Com の紹介を聞いたのですが、そこで色々と説明してくださった社員の方からメディアAI技術開発チームを紹介してもらい、後日今回のメンターさんらと懇談していただきました。その際、チームの紹介を受け興味を持ち、このインターンシッ

                インターンシップでマルチA100 GPUサーバをぶん回してみた - NTT Communications Engineers' Blog
              • Deep Learning on Graphs

                This book covers comprehensive contents in developing deep learning techniques for graph structured data with a specific focus on Graph Neural Networks (GNNs). The foundation of the GNN models are introduced in detail including the two main building operations: graph filtering and pooling operations. We then discuss the robustness and scalability of the GNNs, which are extremely important for util

                • 楔形文字とディープラーニング(2)

                  ​ ユニグラムの表よりも随分コンパクトになりましたね。𒂊も𒉡もそれぞれ5種類の翻字表現があったわけですが、𒂊𒉡という並びではコーパス全体でもe-nu e-nu- e nu-の3つの組み合わせでしか使われていなかったことがわかります。 またe-nuのようにここで単語が区切られる場合とe-nu-のようにあとに文字が続く場合はだいたい同じ頻度ですが、nu-maとnu ma-ではだいぶ開きがあることもわかりました。この3文字をつなげた𒂊𒉡𒈠で考えると、e-nu ma-よりもe-nu-maと読むほうが確率が高そうだと予想できます。 それぞれのバイグラムのつながりを図示したものがこちらです。 こうしてみると、先頭から最後までつながるルートはずいぶん限られていることがわかります。正解のルートをオレンジの線で図示してみました。 ただ、つながりだけを考えるとe-nu ma-an-me-ešとい

                  • Pythonで実装するニューラルネットワークを完成させよう

                    連載目次 本稿は、ニューラルネットワーク(以下、ニューラルネット)の仕組みや挙動を、数学理論からではなくPythonコードから学ぶことを目標とした連載(基礎編)の最後となる第3回です。 前々回の第1回では、「ニューラルネットの訓練(学習)処理を実現するために必要なこと」として、 ステップ(1)順伝播: forward_prop()関数として実装(前々回) ステップ(2)逆伝播: back_prop()関数として実装(前回) ステップ(3)パラメーター(重みとバイアス)の更新: update_params()関数として実装(今回)。これによりモデルが最適化される という3大ステップを示しました。前回の第2回で、このうちの「ステップ(2)逆伝播」までの実装が完了しています。 今回はその続きとして、「ステップ(3)パラメーターの更新と、モデルの最適化」までを実装して、ニューラルネットの実装を完了

                      Pythonで実装するニューラルネットワークを完成させよう
                    • 楔形文字とディープラーニング(1)

                      「自然言語処理を用いたアッカド語楔形文字の読解」という論文を見つけました。著者はイスラエルはアリエル大学のシャイ・ゴルディンさんを筆頭に7名。この人数の多さに工学部みを感じるわけですが(偏見)、実際にはコンピュータサイエンスのひとが一人いるだけで残りは人文系なんでしょうか? 掲載誌はオープンアクセスジャーナルです。ありがたーい。 Gordin S, Gutherz G, Elazary A, Romach A, Jiménez E, Berant J, et al. (2020) Reading Akkadian cuneiform using natural language processing. PLoS ONE 15(10): e0240511. https://doi.org/10.1371/journal.pone.0240511 (opens new window) ゴルディ

                      • 東工大、「隠れニューラルネットワーク」を利用した省電力AIチップを開発

                        東京工業大学(東工大)は2月24日、エッジ端末でのAI応用の発展に向けて今後さらに重要となる、ディープラーニング技術の「深層ニューラルネットワーク」(DNN)モデルの高効率な推論を実現する「隠れニューラルネットワーク」(HNN)理論を利用した低消費電力型の新規アクセラレータLSIの試作チップを開発したことを発表した。 同成果は、東工大 科学技術創成研究院の廣瀬一俊大学院生、同・劉載勲准教授、同・本村真人教授らの研究チームによるもの。詳細は、集積回路に関する国際会議「ISSCC 2022(国際固体素子回路会議)」にて発表された。 AI技術の一種であるディープラーニングで用いられる情報処理モデルであるDNNは、「重み」といった計算パラメータを外部メモリから読み込む際に多大な電力を消費してしまうため、精度を求めてネットワークが複雑化・巨大化していくに伴って計算量が増化、結果として消費電力が増加す

                          東工大、「隠れニューラルネットワーク」を利用した省電力AIチップを開発
                        • 私たちが見ている世界は脳が「過去15秒間」を平均化した映像だった - ナゾロジー

                          私たちの目は常に膨大な量の視覚情報にさらされています。 脳にとって、これは容易な状況ではありません。 何百万もの色や形、光の加減や視点の変化により、視覚の世界は絶えず移り変わっているのですから。(走りながら撮ったカメラの映像を見てください) にもかかわらず、私たちはブレやノイズのない安定した世界を見ることができます。 これは何世紀にもわたって研究者たちを悩ませてきた視覚科学の問題でした。 そしてこのほど、カリフォルニア大学バークレー校 (University of California, Berkeley・米)の研究で、視覚の安定性を説明する新たなメカニズムが発見されました。 それによると、私たちの脳は、過去15秒間に見たものを統合・平滑化して、整った一つの印象にまとめ上げているとのこと。 一体どういうことでしょうか。 研究の詳細は、2022年1月12日付で科学雑誌『Science Adv

                            私たちが見ている世界は脳が「過去15秒間」を平均化した映像だった - ナゾロジー
                          • GitHub - unifyai/ivy: The Unified AI Framework

                            Ivy is an open-source machine learning framework that enables you to: 🔄 Convert code into any framework: Use and build on top of any model, library, or device by converting any code from one framework to another using ivy.transpile. ⚒️ Write framework-agnostic code: Write your code once in ivy and then choose the most appropriate ML framework as the backend to leverage all the benefits and tools.

                              GitHub - unifyai/ivy: The Unified AI Framework
                            • DeepETA: How Uber Predicts Arrival Times Using Deep Learning

                              You’re seeing information for Japan . To see local features and services for another location, select a different city. Show more At Uber, magical customer experiences depend on accurate arrival time predictions (ETAs). We use ETAs to calculate fares, estimate pickup times, match riders to drivers, plan deliveries, and more. Traditional routing engines compute ETAs by dividing up the road network

                                DeepETA: How Uber Predicts Arrival Times Using Deep Learning
                              • 音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション

                                日進月歩というより、秒進分歩で進化している感じのある音声合成、歌声合成の世界ですが、また新たな革命ともいえるAI音声合成ソフトが誕生しました。これまでDTMステーションでも何度も取り上げてきた歌声合成ソフト、Synthesizer Vを開発するDreamtonics株式会社と株式会社AHSと共同開発する形で、もはや人間の喋り声にしか聴こえない音声合成ソフト、VOICEPEAKを発表し、3月11日から発売を開始するのです。Synthesizer Vと同様、Windows、Mac、Linuxでも動くマルチプラットフォームソフトで価格はダウンロード版で23,800円(税込み)となっています。 このソフト「VOICEPEAK 商用可能 6ナレーターセット」という製品名になっていますが、実際には女性3人+男性3人+女の子1人=7人の声を切り替えることが可能なAI音声合成ソフトで、テキストを入力すれば

                                  音声合成業界に激震! もはや人間の喋り声、入力文字読み上げソフトVOICEPEAKはビジネス用途でも自由に利用可能|DTMステーション
                                • 図とコードで必ず分かるニューラルネットワークの逆伝播

                                  連載目次 本稿は、ニューラルネットワーク(以下、ニューラルネット)の仕組みや挙動を、数学理論からではなくPythonコードから学ぶことを目標とした連載(基礎編)の第2回です。「難しい高校以降の数学は苦手だけど、コードを読んでロジックを理解するのは得意!」という方にはピッタリの記事です。 前回の第1回では、本連載の目的や特徴を示した後で、「ニューラルネットの訓練(学習)処理を実現するために必要なこと」として、 ステップ(1)順伝播: forward_prop()関数として実装(前回) ステップ(2)逆伝播: back_prop()関数として実装(今回) ステップ(3)パラメーター(重みとバイアス)の更新: update_params()関数として実装(次回)。これによりモデルが最適化される という3大ステップを示しました。前回はこのうちの「ステップ(1)順伝播」まで実装が完了しています。今回

                                    図とコードで必ず分かるニューラルネットワークの逆伝播
                                  • 1000台超のPS4で強化学習。ソニーのAI「Sophy」は何がすごいのか…グランツーリスモの未来

                                    グランツーリスモでeスポーツトップドライバーと、AIドライバーである「Sophy」が対戦する様子。 オンライン会見を筆者キャプチャー ソニーが開発した「AI」が、プロのeスポーツ・レーサーに勝利した。 その名は「Grand Turismo Sophy(ソフィー、以下Sophy)」。 2020年にソニーが設立したAIの基礎研究機関である「ソニーAI」と「グランツーリスモ」シリーズを開発するポリフォニー・デジタル、ソニー・インタラクティブエンタテインメント(SIE)との共同開発だ。3月4日より発売される最新作「グランツーリスモ7」にも、アップデートでの追加搭載が決まっている。 囲碁や将棋でAIが人間に勝つ時代、ゲームでAIが人間に勝つのは当たり前……。 そう思う人がいるかもしれない。 だが、ソニーAI・COO(最高執行責任者)のミカエル・ シュプランガー氏はSophyの成果が「人工知能における

                                      1000台超のPS4で強化学習。ソニーのAI「Sophy」は何がすごいのか…グランツーリスモの未来
                                    • ymicky on Twitter: "Transformerを理解するのにこの動画がかなりわかりやすかった。 3Dアニメーションで説明してくれる https://t.co/VUnkCFMDVB https://t.co/4f3zOxsDbv"

                                      Transformerを理解するのにこの動画がかなりわかりやすかった。 3Dアニメーションで説明してくれる https://t.co/VUnkCFMDVB https://t.co/4f3zOxsDbv

                                        ymicky on Twitter: "Transformerを理解するのにこの動画がかなりわかりやすかった。 3Dアニメーションで説明してくれる https://t.co/VUnkCFMDVB https://t.co/4f3zOxsDbv"
                                      • cedro on Twitter: "有名な動画の顔を入れ替えるディープフェイク技術FaceSwapは2つのビデオを使った長時間の学習プロセスが必要です。 SberSwapはこの学習プロセス無しで、ビデオと1枚の画像だけで顔を入れ替える技術です。 これは色々な顔をAn… https://t.co/Nw2po3Jo3V"

                                        有名な動画の顔を入れ替えるディープフェイク技術FaceSwapは2つのビデオを使った長時間の学習プロセスが必要です。 SberSwapはこの学習プロセス無しで、ビデオと1枚の画像だけで顔を入れ替える技術です。 これは色々な顔をAn… https://t.co/Nw2po3Jo3V

                                          cedro on Twitter: "有名な動画の顔を入れ替えるディープフェイク技術FaceSwapは2つのビデオを使った長時間の学習プロセスが必要です。 SberSwapはこの学習プロセス無しで、ビデオと1枚の画像だけで顔を入れ替える技術です。 これは色々な顔をAn… https://t.co/Nw2po3Jo3V"
                                        • ニューラルネットワーク入門

                                          Pythonコードで理解するニューラルネットワーク入門 ニューラルネットワークの仕組みや挙動を、数学理論からではなく、Pythonコードから理解しよう。フルスクラッチでニューラルネットワーク(DNN:Deep Neural Network)を実装していく。 第1回 Pythonでニューラルネットワークを書いてみよう(2022/02/09) 本連載(基礎編)の目的 ・本連載(基礎編)の特徴 ニューラルネットワークの図 訓練(学習)処理全体の実装 モデルの定義と、仮の訓練データ ステップ1. 順伝播の実装 ・1つのノードにおける順伝播の処理 ・重み付き線形和 ・活性化関数:シグモイド関数 ・活性化関数:恒等関数 ・順伝播の処理全体の実装 ・順伝播による予測の実行例 ・今後のステップの準備:関数への仮引数の追加 第2回 図とコードで必ず分かるニューラルネットワークの逆伝播(2022/02/16)

                                            ニューラルネットワーク入門
                                          • Pythonでニューラルネットワークを書いてみよう

                                            連載目次 本連載(基礎編)の目的 スクラッチ(=他者が書いたソースコードを見たりライブラリーを使ったりせずに、何もないゼロの状態からコードを記述すること)でディープラーニングやニューラルネットワーク(DNN:Deep Neural Network、以下では「ニューラルネット」と表記)を実装して学ぶ系の書籍や動画講座、記事はたくさんあると思います。それらで学んだ際に、「誤差逆伝播」(バックプロパゲーション)のところで挫折して、そこはスルーしている人は少なくないのではないでしょうか。個々の数式や計算自体を理解していても、何となく全体像がつかめずに、 と自信を持って言えない人も多いのではないかと思います。 本連載(基礎編)はそういった人に向けた記事になります。この記事はニューラルネットの仕組みを、数学理論からではなくPythonコードから学ぶことを狙っています。「難しい高校以降の数学は苦手だけど

                                              Pythonでニューラルネットワークを書いてみよう
                                            • GitHub - suhara/cis6930-fall2021: Course materials for Fall 2021 "CIS6930 Topics in Computing for Data Science" at New College of Florida

                                              This course covers a line of Deep Learning techniques that have been applied to a variety of computer science problems, especially in Computer Vision and Natural Language Processing. The course will start from Deep Learning fundamentals such as basic model architecture and optimization techniques before moving onto more sophisticated techniques. This course covers commonly used techniques for Comp

                                                GitHub - suhara/cis6930-fall2021: Course materials for Fall 2021 "CIS6930 Topics in Computing for Data Science" at New College of Florida
                                              • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "機械学習用データセットを検索できるサイト Dataset Search https://t.co/6DZpLvGrh1 ・Googleが運営 ・キーワードを入力すると一覧表示 ・データセットのリンク、ファイル形式、更新日、デー… https://t.co/gtP3JZUKJQ"

                                                機械学習用データセットを検索できるサイト Dataset Search https://t.co/6DZpLvGrh1 ・Googleが運営 ・キーワードを入力すると一覧表示 ・データセットのリンク、ファイル形式、更新日、デー… https://t.co/gtP3JZUKJQ

                                                  QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "機械学習用データセットを検索できるサイト Dataset Search https://t.co/6DZpLvGrh1 ・Googleが運営 ・キーワードを入力すると一覧表示 ・データセットのリンク、ファイル形式、更新日、デー… https://t.co/gtP3JZUKJQ"
                                                • AlphaCode

                                                  AlphaCode Attention Visualization Hover over tokens in the solution to see which tokens the model attended to when generating the solution. Click a token to select it; clicking in empty space will deselect. Solutions were selected randomly, keeping at most one correct (passes all test cases in our dataset) and one incorrect sample per problem and language. Note that since our dataset only has a li

                                                  • TechCrunch

                                                    Welcome, folks, to Week in Review (WiR), TechCrunch’s weekly news recap. The weather’s getting hotter — but not quite as hot as the generative AI space, which saw a slew of new model

                                                      TechCrunch
                                                    • 自動プログラミングAIの「AlphaCode」をDeepMindが発表、競技プログラミングレベルのコード生成が可能

                                                      DeepMindが競技プログラミングレベルのプログラミングが可能な人工知能(AI)の「AlphaCode」を発表しました。AlphaCodeのほかにも自動でプログラミングが可能なAIは存在しますが、AlphaCodeは414億ものパラメーターを保持した特に精度の高いAIに仕上がっているとのことです。 Competitive programming with AlphaCode | DeepMind https://deepmind.com/blog/article/Competitive-programming-with-AlphaCode Competition-Level Code Generation with AlphaCode (PDF)https://storage.googleapis.com/deepmind-media/AlphaCode/competition_leve

                                                        自動プログラミングAIの「AlphaCode」をDeepMindが発表、競技プログラミングレベルのコード生成が可能
                                                      • Competitive programming with AlphaCode

                                                        Research Competitive programming with AlphaCode Published 8 December 2022 Authors The AlphaCode team Note: This blog was first published on 2 Feb 2022. Following the paper’s publication in Science on 8 Dec 2022, we’ve made minor updates to the text to reflect this. Solving novel problems and setting a new milestone in competitive programming Creating solutions to unforeseen problems is second natu

                                                          Competitive programming with AlphaCode
                                                        • コスプレしたアインシュタイン?強力な生成モデルGLIDE

                                                          3つの要点 ✔️ 言語指示から多様かつ高解像度な画像が生成できるGLIDEを提案 ✔️ 言語指示に忠実した生成画像がDALL-Eを超える ✔️ 気軽に使えるミニモデルを公開 GLIDE: Towards Photorealistic Image Generation and Editing with Text-Guided Diffusion Models written by Alex Nichol, Prafulla Dhariwal, Aditya Ramesh, Pranav Shyam, Pamela Mishkin, Bob McGrew, Ilya Sutskever, Mark Chen (Submitted on 20 Dec 2021 (v1), last revised 22 Dec 2021 (this version, v2)) Comments: Publish

                                                            コスプレしたアインシュタイン?強力な生成モデルGLIDE
                                                          • Googleストリートビューからリアルなバーチャル3Dシーンを自動作成 Googleとトロント大が開発

                                                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 米Google Researchとカナダ・トロント大学の研究チームが開発した「Urban Radiance Fields」は、Googleストリートビューなどのスキャンプラットフォームで取得できる情報を基に、複数の視点の画像から合成して作り出す新たな視点画像と3D再構成を自動作成する手法だ。 特定シーンの異なる角度から撮影した複数枚の画像を組み合わせる手法と違い、今回は常に動いているカメラから撮影する、スキャンプラットフォームの取得データ画像を入力に使う。そのため、常に変わるカメラ位置や太陽の位置、画像間の露出の変化、ほとんどの画像に映り込む空の画像の処理、同じ構造物でもカメラごとに色が異

                                                              Googleストリートビューからリアルなバーチャル3Dシーンを自動作成 Googleとトロント大が開発
                                                            • AIを作るAIを作る

                                                              人工知能(AI)はデータのパターンを識別して学習するため、とにかく十分なデータと処理能力が必要です。AI開発現場における処理能力の要請は年々増大しており、AIの開発者は数百万から数十億のパラメータを注意深く調整しなければいけません。これを達成するために設計された「ハイパーネットワーク」について、インドの作家兼ジャーナリストのアニル・アナンサスワーミー氏が解説しています。 Researchers Build AI That Builds AI https://www.quantamagazine.org/researchers-build-ai-that-builds-ai-20220125/ 人工知能の構築には「最適化」と呼ばれるプロセスで限りなく理想に近い値を見つけていくことが肝要ですが、ここに到達するためにネットワークをトレーニングすることは簡単ではありません。そんな難解なプロセスにつ

                                                                AIを作るAIを作る
                                                              • Metaが言語・画像・音声など複数分野に適応できる自己学習型AI「data2vec」を発表

                                                                Facebookを運営するMetaがあらゆる分野に適応できる自己学習型AI「Data2vec」を開発したと発表しました。 Data2vec: The first high-performance self-supervised algorithm that works for speech, vision, and text https://ai.facebook.com/blog/the-first-high-performance-self-supervised-algorithm-that-works-for-speech-vision-and-text Introducing the First Self-Supervised Algorithm for Speech, Vision and Text | Meta https://about.fb.com/news/2022/01

                                                                  Metaが言語・画像・音声など複数分野に適応できる自己学習型AI「data2vec」を発表
                                                                • 深層強化学習AI時代の”人間”の仕事

                                                                  深層強化学習AI時代の"人間"の仕事 2022.01.21 Updated by Ryo Shimizu on January 21, 2022, 07:18 am JST 2022年は、AIはあまりニュースの話題にのぼらないだろうと思う。 なぜならば、もはやAIを用いることは当たり前になってきているからだ。 バズワードとしてのAIは2021年で終わった感がある。 一方で、AIの仕事は、うまくいけばいくほど地下に潜る性質がある。 すなわち、競争相手にどうやっているかを探られないように巧妙に隠す必要があるからだ。 次にニュースになるものがあるとすれば、AIがコンシューマ製品に搭載された時だが、たとえば「スマホにAI」は既に入っているのでニュース性がない。「ゲーム機にAI」が入っているのは当たり前であり、「テレビにAI」ももはや新鮮味がない。 アカデミズムの世界では、少し前までは、「ディープラ

                                                                    深層強化学習AI時代の”人間”の仕事
                                                                  • Deep Learning for Recommender Systems: A Netflix Case Study | AI Magazine

                                                                    Deep Learning for Recommender Systems: A Netflix Case Study Authors Harald Steck Netflix Linas Baltrunas Netflix Ehtsham Elahi Netflix Dawen Liang Netflix Yves Raimond Netflix Justin Basilico Netflix DOI: https://doi.org/10.1609/aimag.v42i3.18140 Abstract Deep learning has profoundly impacted many areas of machine learning. However, it took a while for its impact to be felt in the field of recomme

                                                                    • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "GANの概要がわかりやすくまとまっているスライド https://t.co/FeOgJVgUci ・GAN研究の主要な流れ ・大分類:GAN vs pix2pix, GAN vs cGAN ・主要論文9本の要旨 ・GANの代表的… https://t.co/YV0NcBnBWF"

                                                                      GANの概要がわかりやすくまとまっているスライド https://t.co/FeOgJVgUci ・GAN研究の主要な流れ ・大分類:GAN vs pix2pix, GAN vs cGAN ・主要論文9本の要旨 ・GANの代表的… https://t.co/YV0NcBnBWF

                                                                        QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "GANの概要がわかりやすくまとまっているスライド https://t.co/FeOgJVgUci ・GAN研究の主要な流れ ・大分類:GAN vs pix2pix, GAN vs cGAN ・主要論文9本の要旨 ・GANの代表的… https://t.co/YV0NcBnBWF"
                                                                      • 介護求人広告サービスのマッチングにディープラーニングを導入した話 - エス・エム・エス エンジニア テックブログ

                                                                        はじめに 医療・介護・ヘルスケア・シニアライフの4つの領域で高齢社会の情報インフラを構築している株式会社エス・エム・エスのAnalytics&Innovation推進部( 以下、A&I推進部)でデータ分析基盤開発を担当している長谷川です。 A&I推進部はエス・エム・エス社内のデータを横断的に収集し、データの分析や加工から、データに基づく施策までを行う部門で、現在は介護事業者向け経営支援サービスである「カイポケ」や、介護職向け求人情報サービスである「カイゴジョブ」のデータ分析やレコメンドシステムの開発を行っています。 今回はその中で「カイゴジョブ」における介護求人の課題をディープラーニングによる分類モデルで改善した取り組みについて紹介します。 介護業界の課題 具体的な説明に入る前に、簡単に介護求人の課題感を説明します。 ご存じの通り、昨今の日本は少子高齢化が進み、介護にまつわる課題が毎日のよ

                                                                          介護求人広告サービスのマッチングにディープラーニングを導入した話 - エス・エム・エス エンジニア テックブログ
                                                                        • 「将スタ -将棋ソフトスタジオ-」の公開 - 「十六式いろは」のあれこれ

                                                                          ★2022年4月18日までに将スタシリーズをダウンロードして ファイルを展開している方へ! お手数ですが、以下のページを読んで対応をお願い致します。 ↓ https://16-168.hatenablog.jp/entry/2022/04/18/223512 ※公開日 2022-01-17 ※更新日 2022-04-18 あなたスタイル機能等を追加しました。7-zip問題対応済み。 →更新内容 ディープラーニング将棋AI制作ソフト 「将スタ -将棋ソフトスタジオ-」 将スタのイメージ画像 目的別おすすめ将スタ 自分っぽい将棋ソフト(クローンAI?)を作りたい→【onlyあなたスタイル】 試したい、ファイルサイズが小さめがいい→【lite版】:このページ 将スタのフル機能を使いたい→【将スタ(無印)】:このページ 将スタの前のバージョンを使っている→【差分版】:このページ ↓ 使い方動画 ↓

                                                                            「将スタ -将棋ソフトスタジオ-」の公開 - 「十六式いろは」のあれこれ
                                                                          • GitHub - martinsbruveris/tensorflow-image-models: TensorFlow port of PyTorch Image Models (timm) - image models with pretrained weights.

                                                                            TensorFlow Image Models (tfimm) is a collection of image models with pretrained weights, obtained by porting architectures from timm to TensorFlow. The hope is that the number of available architectures will grow over time. For now, it contains vision transformers (ViT, DeiT, CaiT, PVT and Swin Transformers), MLP-Mixer models (MLP-Mixer, ResMLP, gMLP, PoolFormer and ConvMixer), various ResNet flav

                                                                              GitHub - martinsbruveris/tensorflow-image-models: TensorFlow port of PyTorch Image Models (timm) - image models with pretrained weights.
                                                                            • Google Research: Themes from 2021 and Beyond

                                                                              Philosophy We strive to create an environment conducive to many different types of research across many different time scales and levels of risk. Learn more about our Philosophy Learn more

                                                                                Google Research: Themes from 2021 and Beyond
                                                                              • 2021年の深層学習ハイライト(応用事例編) - Qiita

                                                                                はじめに この記事は前回の研究論文編の続編です.今回は,2021年のおもしろかった深層学習応用事例を紹介します. * 本記事は,私のブログにて英語で書いた記事を翻訳し,適宜加筆修正したものです.元記事の方も拡散いただけると励みになります. 事例4選 紹介するのはこちらの4事例です! AlphaFold2 GitHub Copilot Airfriend Google Meetの背景効果 AlphaFold2 タンパク質の機能はその構造に依存するため,タンパク質の構造は生物の内部で何が起きているのかを理解するための鍵の一つです.しかし,タンパク質の構造を実験によって解析するには膨大な時間と費用がかかります.また,アミノ酸配列から構造を正確に予測することは不可能でした(タンパク質の折りたたみ問題)——AlphaFold(2)[1]が登場するまでは. 私は構造生物学に詳しくないので,AlphaF

                                                                                  2021年の深層学習ハイライト(応用事例編) - Qiita
                                                                                • 2021年の深層学習ハイライト(研究論文編) - Qiita

                                                                                  はじめに 2019年,2020年に引き続き,1年を振り返って最もおもしろかった深層学習の論文を選んで紹介したいと思います.最近,目を通す論文の数が減ってしまったので,今回は取り上げるのを8本とし,別記事として「応用事例編」を書くことにします. * 本記事は,私のブログにて英語で書いた記事を翻訳し,適宜加筆修正したものです.元記事の方も拡散いただけると励みになります. ** 記事中の画像は,ことわりのない限り対象論文からの引用です. 論文8選(公開順) 普段から,読んだ論文を簡単にまとめてツイートしているので,それを使って公開日順に振り返っていきます.対象はおおまかに「2021年に公開された論文」と「2021年に学会・雑誌で発表されたもの」とします.他におもしろい論文があれば,コメントで教えていただけると嬉しいです1. 紹介するのはこちらの8本です! Exploring Simple Sia

                                                                                    2021年の深層学習ハイライト(研究論文編) - Qiita