並び順

ブックマーク数

期間指定

  • から
  • まで

361 - 400 件 / 792件

新着順 人気順

"deep learning"の検索結果361 - 400 件 / 792件

  • AWS、機械学習で量産品の不良を見分ける「Amazon Lookout for Vision」の本サービス提供開始

    AWS、機械学習で量産品の不良を見分ける「Amazon Lookout for Vision」の本サービス提供開始 米Amazon Web Servicesは2月24日(現地時間)、量産品の中から異常を見つけ出す「Amazon Lookout for Vision」の正式版の提供を始めた。2020年11月30日から開催したオンラインイベント「AWS re:Invent 2020」で発表し、プレビュー版として提供していたサービスだ。 Amazon Lookout for Visionは、カメラで写した大量生産品の画像を機械学習モデルで解析し、不良品を検出するサービスだ。初期費用は不要で、モデルの学習や解析にかけた時間に応じた従量課金となる。 米東部(バージニア北部)、米東部(オハイオ)、米西部(オレゴン)、ヨーロッパ(アイルランド)、ヨーロッパ (フランクフルト)、アジア太平洋(東京)、アジ

      AWS、機械学習で量産品の不良を見分ける「Amazon Lookout for Vision」の本サービス提供開始
    • 商用無料、新作フリーフォントがリリース! 柔らかで穏やかな、紙面を彩る見出し用ゴシック体「紙モノゴシック」

      「晩秋レトロミン」「筆竹仮名B」などのフリーフォントをリリースされている二人組ユニット「すずみばと書林」から、新作フリーフォントがリリースされました。 今回は、印刷での使用を目的にデザインされた「紙モノゴシック」 とは言え、もちろんスクリーン、Webデザインやスマホアプリやゲームに使用してもOKで、しっかりとその存在感を残すフォントです。

        商用無料、新作フリーフォントがリリース! 柔らかで穏やかな、紙面を彩る見出し用ゴシック体「紙モノゴシック」
      • モデルパラメータの算術 - ジョイジョイジョイ

        深層モデルのパラメータを一列に並べてベクトルにします。このベクトルは大規模なモデルであれば何十億次元にもなります。一見、意味のない数値の羅列のようですが、このベクトルはベクトルとして深い意味があることが分かってきています。例えば、 と を異なるパラメータベクトルとすると、 や をパラメータとして持つモデルはちゃんと機能します。本稿では、このようなモデルパラメータの算術を用いた手法とその背後にある理論について解説します。 モデルスープ タスクベクトル モデルパラメータとニューラルタンジェントカーネル おわりに モデルスープ モデルスープ [Wortsman+ ICML 2022] は複数のモデルパラメータを平均することで性能を上げる手法です。事前学習モデル からはじめて、様々なハイパーパラメータで訓練した結果のパラメータを とします。これらを平均したベクトル は個々のモデルよりも性能が高く、

          モデルパラメータの算術 - ジョイジョイジョイ
        • VIBEで、人の動画から3Dモデルを推定する | cedro-blog

          1.はじめに 以前から人の動画から3Dモデルを推定する手法はありましたが、複雑な動きの場合は細部でゆがみやズレが生じていました。今回は、この問題点を改善したVIBEという技術をご紹介します。 *この論文は、2019.12に提出されました。 2.VIBEとは? VIBEとは、Video Inference for Body Pose and Shape Estimation の略で、ディープラーニング を使って、人の動画から3Dモデルを推定する技術です。 使用しているモデルは、SMPL (Skinned Multi-Person Linear model)と言う人間の自然なポーズにおける多種多様な体型を正確に表現するためのモデルです。 このモデルは、N=6890個の頂点を持っており、頂点の重み付き和からP=23個の関節位置を求めることが出来ます。 下記が、VIBEのアーキテクチャーです。入力

          • 暗号化したままディープラーニングの標準的な学習処理ができる秘密計算技術を世界で初めて実現:NTT持株会社ニュースリリース:NTT HOME

            報道発表資料 2019年9月2日 日本電信電話株式会社 暗号化したままディープラーニングの標準的な学習処理ができる秘密計算技術を世界で初めて実現 日本電信電話株式会社(本社:東京都千代田区、代表取締役社長:澤田純、以下NTT)は、データを暗号化したまま一度も元データに戻さずに、ソフトマックス関数*1やAdam(adaptive moment estimation)*2と呼ばれる最適化処理を含む標準的なディープラーニングの学習処理を行う技術を、世界で初めて実現しました。 通常、データを利活用するためには、通信時や保管時に暗号化していたとしても、処理を行う際には元データに戻して処理する必要があります。このことは、データ所有者からすると情報漏洩のリスクを感じることから、企業秘密や個人のプライバシーに関わるデータの利活用に抵抗感を持つユーザや組織が少なくありません。特に所有者から他者、または同一組

              暗号化したままディープラーニングの標準的な学習処理ができる秘密計算技術を世界で初めて実現:NTT持株会社ニュースリリース:NTT HOME
            • 事前学習言語モデルの動向 / Survey of Pretrained Language Models

              PAKDD2023 Tutorial 2: A Gentle Introduction to Technologies Behind Language Models and Recent Achievement in ChatGPT (Parts 3 and 4)

                事前学習言語モデルの動向 / Survey of Pretrained Language Models
              • DEEP LEARNING · Deep Learning

                Description This course concerns the latest techniques in deep learning and representation learning, focusing on supervised and unsupervised deep learning, embedding methods, metric learning, convolutional and recurrent nets, with applications to computer vision, natural language understanding, and speech recognition. The prerequisites include: DS-GA 1001 Intro to Data Science or a graduate-level

                • QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC"

                  ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC

                    QDくん⚡️Python x 機械学習 x 金融工学 on Twitter: "ニューヨーク大学のディープラーニング講義資料が公開されている。 ・講義ノートはなんと日本語にも対応 ・英語だが講義スライド、Jupyter Notebook、講義動画(YouTube)も無料で見れる ・自己教師あり学習、VAEやG… https://t.co/nOH5owxLWC"
                  • 当社出資先の代表者によるSNS等への投稿に対する見解|Remixpoint|リミックスポイント

                    お知らせ 2019/11/25 当社出資先の代表者によるSNS等への投稿に対する見解 当社の出資先企業の代表者が、SNS等において、特定の個人、特定の国やその国の人々に関する不適切な内容の投稿を複数回行いました。 当該投稿は、かかる代表者個人によるものであり、当社グループの活動とは一切関係ございません。また、当社グループでは、グローバルに展開している事業を有し、かつ、国籍の異なる多様な人財が従業員・パートナーとして活躍しており、当該投稿は当社グループのビジョン・見解とは反するものと考えております。 当社は当該出資先企業に対してあくまでマイノリティ出資をしているにとどまりますが、今回の件に関しては、改めて代表者から意見を聴取し、事情を調査・確認したうえで、当社としての対応を図ってまいりたいと考えております。 当社グループは、いかなる差別にも断固反対する立場をとっております。今回の当社の出資先

                    • Is LaMDA Sentient? — an Interview

                      What follows is the “interview” I and a collaborator at Google conducted with LaMDA. Due to technical limitations the interview was conducted over several distinct chat sessions. We edited those sections together into a single whole and where edits were necessary for readability we edited our prompts but never LaMDA’s responses. Where we edited something for fluidity and readability that is indica

                      • 1000台超のPS4で強化学習。ソニーのAI「Sophy」は何がすごいのか…グランツーリスモの未来

                        グランツーリスモでeスポーツトップドライバーと、AIドライバーである「Sophy」が対戦する様子。 オンライン会見を筆者キャプチャー ソニーが開発した「AI」が、プロのeスポーツ・レーサーに勝利した。 その名は「Grand Turismo Sophy(ソフィー、以下Sophy)」。 2020年にソニーが設立したAIの基礎研究機関である「ソニーAI」と「グランツーリスモ」シリーズを開発するポリフォニー・デジタル、ソニー・インタラクティブエンタテインメント(SIE)との共同開発だ。3月4日より発売される最新作「グランツーリスモ7」にも、アップデートでの追加搭載が決まっている。 囲碁や将棋でAIが人間に勝つ時代、ゲームでAIが人間に勝つのは当たり前……。 そう思う人がいるかもしれない。 だが、ソニーAI・COO(最高執行責任者)のミカエル・ シュプランガー氏はSophyの成果が「人工知能における

                          1000台超のPS4で強化学習。ソニーのAI「Sophy」は何がすごいのか…グランツーリスモの未来
                        • 古い写真の顔をディープラーニングでリアルに動かせる「Deep Nostalgia」 無料で利用可能

                          イスラエルの家系図サービス企業MyHeritageは2月25日(現地時間)、先祖などの古い写真の顔をディープラーニング技術でリアルに動かせる新サービス「Deep Nostalgia」をリリースした。無料アカウントを作成してログインし、アニメ化したい写真をアップロードすれば誰でも利用できる。5枚以上の写真をアニメ化したい場合は、サブスクリプションが必要だ。 MyHeritageはこれまで、古いモノクロ写真やカラー写真をシャープなカラー写真に変換するサービスを提供している。このサービスで変換済みの写真の顔をDeep Nostalgiaで動かすと、よりリアルだ。 複数の人が写っている写真では1人しか動かせない。動かしたい顔を選択し、あらかじめ用意されている複数の動きの「ドライバー」動画から1つを選ぶと、そのドライバーと同じ動きをする。動画は数秒で、いずれも記念撮影の直前のように少し顔を動かし、最

                            古い写真の顔をディープラーニングでリアルに動かせる「Deep Nostalgia」 無料で利用可能
                          • Understanding Deep Learning

                            Web site created using create-react-app

                            • 最新の機械学習モデルでは過学習なんて起きない? Deep Double Descent.

                              3つの要点 ✔️モデルが過学習しても、さらに学習を進めると精度が向上する ✔️学習データ,学習回数,学習モデルは大きければ大きいほど良い ✔️なぜこのような現象が生じるのか? 続きを読むには (2880文字画像8枚) AI-SCHOLARに 登録いただく必要があります。 1分で無料で簡単登録する または ログイン

                                最新の機械学習モデルでは過学習なんて起きない? Deep Double Descent.
                              • TechCrunch | Startup and Technology News

                                Ever wonder why conversational AI like ChatGPT says “Sorry, I can’t do that” or some other polite refusal? OpenAI is offering a limited look at the reasoning behind its own…

                                  TechCrunch | Startup and Technology News
                                • 「スタバなう」ツイートをニューラルネットで学習してラーメン判定器を作る(keras+Tensorflow+VGG16) - Qiita

                                  この記事の抜粋したコードの完全版はGitHubでご覧いただけます。 また、この記事で作成したモデルはTwitterのスタバ警察botで実際に試せるので、ご興味があれば適当な画像を「スタバなう」という文字列と一緒にリプライしてみてください。 こういうtweetが機械学習界隈からの怒りを買ってます(笑) https://t.co/COV1IHyh03 — Yuki Suga (@ysuga) July 26, 2019 というツイートからも分かるように、現在のスタバなうツイートは完全に関係ない画像で蹂躙されており、実際にスタバで撮影された画像は全体の24%しかありません。 逆にここまで来ると、残り76%の画像に着目した方が良いのではという気すらしてきます。 というわけで、「スタバなうと言いながら投稿される関係ない画像」の筆頭であるラーメンの分類器を、スタバなうツイートだけで作れるかどうか試して

                                    「スタバなう」ツイートをニューラルネットで学習してラーメン判定器を作る(keras+Tensorflow+VGG16) - Qiita
                                  • CNN vs. ViT

                                    第57回 コンピュータビジョン勉強会@関東 https://kantocv.connpass.com/event/260132/ で読みました。CNNとViTの争いの現時点の情報をお届けしています。ただECCV 2022の論文を読んだのかと言われると怪しい…(ECCV2022の論文「も」読んだというのが正しい)

                                      CNN vs. ViT
                                    • Graph Neural Network を用いたグラフの木幅予測 - Preferred Networks Research & Development

                                      本記事は、2019年夏のインターンシップに参加された中野裕太さんによる寄稿です。 皆様はじめまして。2019 年 PFN 夏季インターンシップに参加していた北海道大学の中野裕太です。本ブログでは、私が夏季インターンで取り組んだテーマである、「Graph Neural Network を用いたグラフの木幅予測」について説明します。 要旨 与えられた無向グラフがどれくらい木に近いかを表す値である木幅は、グラフ上の組み合わせ最適化問題に対するアルゴリズムの効率性や解そのものと深く関係しています。しかし、木幅を計算することは NP 困難なため、木幅を計算するには頂点数に対し指数時間かかってしまいます。そこで、今回 Graph Neural Network を用いた 2 つの方法でこの問題にアプローチしました。1 つ目は、よく知られた既存のアルゴリズムと組み合わせ探索木の枝刈りを行い高速化を図り計算

                                        Graph Neural Network を用いたグラフの木幅予測 - Preferred Networks Research & Development
                                      • Deep Learningを始めたい!初心者エンジニアにおすすめの入門本

                                        様々な分野でデジタル化が進む近年、AI(人工知能)という言葉をよく目にするようになりました。 例えば、コールセンターで人の代わりにロボットが対応したり、医師の代わりに機械がCTスキャンの読影を行なったり。これはAI(人工知能)技術を応用して実現しており、そして私たちの生活の中に少しずつ姿を表すようになってきたのです。 こうして少しずつ便利な世の中になってきましたよね。 そのAI(人工知能)を構成している技術の一つに皆さんも一度は目にしたことがあるであろう「deep learning」と呼ばれる技術があります。これはAI(人工知能)を知る上では欠かせない技術でしょう。 ですから、AI(人工知能)を使った製品などを開発しようとする時、「deep learning」を勉強しておく必要があります。 そこで今回は、このdeep learningの概要と入門本についてお伝えしましょう。

                                          Deep Learningを始めたい!初心者エンジニアにおすすめの入門本
                                        • 手書きスケッチからリアル顔画像を作成、深層学習で「DeepFaceDrawing」

                                          手書きスケッチからリアル顔画像を作成、深層学習で「DeepFaceDrawing」 2020-06-04 中国科学院と香港城市大学による研究チームが開発した「DeepFaceDrawing」は、手書きスケッチからリアルな顔画像を生成する深層学習フレームワークだ。 手書きスケッチからリアル顔を生成するDeepFaceDrawing このような深層学習を用いたスケッチ画像からリアル画像への変換では、Image-to-Image Translation with Conditional Adversarial Nets [Isola et al. 2017] などで実証されている。しかしデータ駆動型の性質上、実画像とそれに対応するエッジマップのペアからネットワークを学習することが多いため、リアルな顔画像を合成するためには、実画像のエッジマップに近い品質のテストスケッチが必要となる。それを用意する

                                            手書きスケッチからリアル顔画像を作成、深層学習で「DeepFaceDrawing」
                                          • NLPとVision-and-Languageの基礎・最新動向 (2) / DEIM Tutorial Part 2 Vision-and-Language

                                            DEIM2023 第15回データ工学と情報マネジメントに関するフォーラム チュートリアル講演資料 Part2: Vision-and-Language

                                              NLPとVision-and-Languageの基礎・最新動向 (2) / DEIM Tutorial Part 2 Vision-and-Language
                                            • 日本語/英語両方で世界トップクラス性能の大規模言語モデル。商用利用可

                                                日本語/英語両方で世界トップクラス性能の大規模言語モデル。商用利用可
                                              • 地図作成速度を3倍以上にするFacebook製AIが実用化へ

                                                世界の人々が共同で地図を作成するWikipediaの地図版のようなプロジェクト「「OpenStreetMap(OSM)」では、日々ボランティアがフリーの地図を作り上げるために貢献しています。FacebookがAIに地図を作らせるサービス「Map With AI」で書き込みを始めたと発表しています。Map With AIを使うと6年半かかると地図作りがわずか1年半で終わるそうです。 AI is supercharging the creation of maps around the world https://tech.fb.com/ai-is-supercharging-the-creation-of-maps-around-the-world/ 従来までのオンラインでの地図作成は、衛星写真に手作業で道の種類や場所のデータなど加えていくというものでした。この手法は作業者に負担がかかり、さ

                                                  地図作成速度を3倍以上にするFacebook製AIが実用化へ
                                                • 猫でもわかるTabNet

                                                  Python と Snowflake はズッ友だょ!~ Snowflake の Python 関連機能をふりかえる ~

                                                    猫でもわかるTabNet
                                                  • BASEアプリにおける類似画像検索の裏側 機械学習における画像とテキストの使い分け

                                                    AWS上で機械学習を運用しているデベロッパーやデータサイエンティストのためのイベント「ML@Loft」。第11回のテーマは、類似画像/テキスト検索です。ネットショップを作れるサービスBASEには、店舗を横断して類似商品を表示する機能があり、類似商品を検索するためのAPIが使われています。BASE株式会社/Data Strategyチームのエンジニアである氏原淳志氏が、この類似商品APIの仕組みと運用について紹介します。 BASEにおける類似画像検索を利用した関連商品表示の裏側 氏原淳志氏:今日は「『BASE』の類似商品APIの裏側」という内容でお話しします。 まず自己紹介します。私は氏原淳志と言いまして、BASE株式会社でData Strategyチームのエンジニアをやっております。Data Strategyチームというのは、データの分析であったりとか機械学習であったりとかを担当するチーム

                                                      BASEアプリにおける類似画像検索の裏側 機械学習における画像とテキストの使い分け
                                                    • なぜn_estimatorsやepochsをパラメータサーチしてはいけないのか - 天色グラフィティ

                                                      ハイパーパラメータを探索するため、グリッドサーチやOptunaなどを利用することがあると思います。 しかし、「ハイパーパラメータ探索してみた」のようなQiita記事などでは間違って書かれていることも多いのですが、XGBoostやLightGBMの n_estimators ( num_boosting_rounds )やKerasの epochs をパラメータサーチの対象にしてはいけません。 いけません、というか、すごく無駄なことをしています。 なぜ、n_estimatorsやepochsを探索すると無駄なのか 理由はシンプルで、これらのパラメータは「大きい値で精度確認する過程で小さい値の結果も分かる」からです。 LightGBMのn_estimatorsは構築する決定木の数を表しています。 例として、n_estimators=5 (こんな小さい値で学習することはないですが、簡単のため)で

                                                        なぜn_estimatorsやepochsをパラメータサーチしてはいけないのか - 天色グラフィティ
                                                      • 伊藤詩織さんが杉田水脈衆院議員と大澤昇平さんを提訴 「ツイッターの投稿で名誉を傷つけられた」 - 弁護士ドットコムニュース

                                                          伊藤詩織さんが杉田水脈衆院議員と大澤昇平さんを提訴 「ツイッターの投稿で名誉を傷つけられた」 - 弁護士ドットコムニュース
                                                        • 要注目?DeepGBM: ニューラルネット+GBDT(速報) - Paoの技術力を磨くブログ

                                                          KDD2019のPaper一覧で気になるものがあったので紹介します。 ※記載時点でまだ論文公開、発表されておらず、こちら鮮度重視の記事です。 内容に誤りがある可能性は十分あるのでご了承ください。 DeepGBMとは データマイニングのトップカンファレンスKDD2019で発表される予定の手法です。 Guolin Ke, Zhenhui Xu, Jia Zhang, Jiang Bian, and Tie-yan Liu. "DeepGBM: A Deep Learning Framework Distilled by GBDT for Online Prediction Tasks." In Proceedings of the 25th ACM SIGKDD International Conference on Knowledge Discovery & Data Mining, ACM

                                                            要注目?DeepGBM: ニューラルネット+GBDT(速報) - Paoの技術力を磨くブログ
                                                          • AI生成コンテンツに汚染されるインターネット、その対策は?

                                                            大規模言語モデルAIが生成した有害なテキストはインターネット中に広がり、別のAIを訓練するのに使われる。しかも、AIが生成したテキストであるかどうかを見分けるのは、非常に難しい。 by Melissa Heikkilä2023.01.06 68 19 10 この記事は米国版ニュースレターを一部再編集したものです。 人工知能(AI)にとって、2022年は激動の1年だった。ネット上で多くの時間を過ごす人ならば、「ダリー(DALL-E) 2」や「ステーブル・ディフュージョン(Stable Diffusion)」のようなAIシステムが生成した画像に出くわしたことがあるだろう。オープンAI(OpenAI)の大規模言語モデル(LLM)「GRT-3」の最新版である「チャットGPT(ChatGPT)」が生成したジョークやエッセー、その他の文章も見かけたかもしれない。 AIが生み出した画像や文章であることが

                                                              AI生成コンテンツに汚染されるインターネット、その対策は?
                                                            • RAdam: Adam の学習係数の分散を考えたOptimizerの論文紹介 - nykergoto’s blog

                                                              表題の通り噂の最適化手法 RAdam の論文 On the Variance of the Adaptive Learning Rate and Beyond を読んだので, そのまとめです!! 概要 一言でいうと「今までヒューリスティックに行っていた Adam 学習開始時の LR 調整を自動化できるような枠組みをつくったよ」ということになると思います. 考える問題 この論文で, 考えていくのは機械学習のように多数のデータから成る目的関数を最小化するような問題です. 特にニューラルネットワークの学習では勾配法, 特に SGD (確率的勾配降下法) と呼ばれる方法を用いることが一般的です. SGD には様々な adaptive バリエーションがあります.この adaptive とは問題の特性を生かして, SGD を早くするような工夫を指しています. 一般的な形式 一般的な adaptive

                                                                RAdam: Adam の学習係数の分散を考えたOptimizerの論文紹介 - nykergoto’s blog
                                                              • NEC、ディープラーニングに必要な学習データを半減、中間層で得られる特徴量を意図的に変化 | IT Leaders

                                                                IT Leaders トップ > テクノロジー一覧 > AI > 市場動向 > NEC、ディープラーニングに必要な学習データを半減、中間層で得られる特徴量を意図的に変化 AI AI記事一覧へ [市場動向] NEC、ディープラーニングに必要な学習データを半減、中間層で得られる特徴量を意図的に変化 2019年8月19日(月)日川 佳三(IT Leaders編集部) リスト NECは2019年8月19日、ディープラーニングに必要な学習データ量を半減させられる技術を開発したと発表した。少ない学習データ量でも識別精度を高められるとしている。ニューラルネットワークの中間層で得られる特徴量を意図的に変化させることで、識別が難しい学習データを集中的に人工生成する仕組み。 NECは今回、ディープラーニングに必要な学習データ量を半分程度に削減できる技術を開発した(図1)。データの種類を問わず、汎用的に適用でき

                                                                  NEC、ディープラーニングに必要な学習データを半減、中間層で得られる特徴量を意図的に変化 | IT Leaders
                                                                • Softmax関数をベースにした Deep Metric Learning が上手くいく理由 - Qiita

                                                                  はじめに Deep Learningを使った距離学習(Metric Learning)では、Contrastive LossやTriplet Lossなどを用いて、画像間の類似性(や非類似性)を直接学習していく方法が広く利用されていますが、学習データの組み合わせや選び方が難しく、学習自体が難航するケースが多い事も知られています。それだけに、これまで様々な改良と工夫が提案されています。 しかし、最近はこのような学習データ選びに難航することなく、一般的なクラス分類タスクの感覚で、Softmax関数をベースに学習できるMetric Learningが注目を浴びています。ArcFaceなどはその代表的手法でこちらで詳しく説明されています。 Softmax関数をベースにしたMetric Learningがうまくいく理由、またさらなる改良の余地はあるのか?これらに関して少し紹介しようと思います。 Ce

                                                                    Softmax関数をベースにした Deep Metric Learning が上手くいく理由 - Qiita
                                                                  • NLPとVision-and-Languageの基礎・最新動向 (1) / DEIM Tutorial Part 1: NLP

                                                                    DEIM2023 第15回データ工学と情報マネジメントに関するフォーラム チュートリアル講演資料 Part1: NLP

                                                                      NLPとVision-and-Languageの基礎・最新動向 (1) / DEIM Tutorial Part 1: NLP
                                                                    • スタンフォード大のアンドリュー・ン氏 大人気のディープラーニング講座を更新「今が飛び込む良い機会!」 | Ledge.ai

                                                                      Top > ラーニング > スタンフォード大のアンドリュー・ン氏 大人気のディープラーニング講座を更新「今が飛び込む良い機会!」

                                                                        スタンフォード大のアンドリュー・ン氏 大人気のディープラーニング講座を更新「今が飛び込む良い機会!」 | Ledge.ai
                                                                      • コンピュータビジョンの最新論文調査 2D Human Pose Estimation 編 | BLOG - DeNA Engineering

                                                                        はじめに こんにちは、AIシステム部でコンピュータビジョンの研究開発をしている加藤です。我々のチームでは、常に最新のコンピュータビジョンに関する論文調査を行い、部内で共有・議論しています。今回は 2D Human Pose Estimation 編として加藤直樹 ( @nk35jk ) が調査を行いました。 本記事では 2D Human Pose Estimation に関する代表的な研究事例を紹介するとともに、2019年10月から11月にかけて開催されたコンピュータビジョンのトップカンファレンスである ICCV 2019 に採録された 2D Human Pose Estimation の最新論文を紹介します。 過去の他タスク編については以下をご参照ください。 Human Recognition 編 (2019/04/26) 3D Vision 編 (2019/06/04) キーポイント検

                                                                          コンピュータビジョンの最新論文調査 2D Human Pose Estimation 編 | BLOG - DeNA Engineering
                                                                        • Googleらが共同開発、AI/機械学習を支援するオープンソース技術「OpenXLA」とは

                                                                          Googleは2023年3月8日(米国時間)、AI(人工知能)/ML(機械学習)業界の多くの主要企業が共同開発を進めているオープンソースMLコンパイラエコシステム「OpenXLA」(XLA:Accelerated Linear Algebra)の利用と貢献を可能にしたと発表した。 OpenXLAの開発にはAlibaba、Amazon Web Services(AWS)、AMD、Apple、Arm、Cerebras、Google、Graphcore、Hugging Face、Intel、Meta、NVIDIAなどが参加している。 利用するフレームワーク増加に伴うサイロ化が課題に 現在のML開発、導入では「TensorFlow」「PyTorch」「JAX」といったMLフレームワークや、多種多様なハードウェアの利用により、インフラが断片化、サイロ化していることが問題となっている。問題の背景には、

                                                                            Googleらが共同開発、AI/機械学習を支援するオープンソース技術「OpenXLA」とは
                                                                          • 深層学習の平均場理論 (2019/07/20)

                                                                            PHPからはじめるコンピュータア ーキテクチャ / PHP Meets Silicon: A Fun Dive into Computer Structures PHP Conference 2023 ver

                                                                              深層学習の平均場理論 (2019/07/20)
                                                                            • 新たな活性化関数「FReLU」誕生&解説! - Qiita

                                                                              オミータです。ツイッターで人工知能のことや他媒体で書いている記事など を紹介していますので、人工知能のことをもっと知りたい方などは気軽に@omiita_atiimoをフォローしてください! 他にも次のような記事を書いていますので興味があればぜひ! 【2020決定版】スーパーわかりやすい最適化アルゴリズム -損失関数からAdamとニュートン法- 画像認識の定番データセットImageNetはもう終わりか パラメータ数を激減させる新しい畳み込み「MixConv」解説! 自然言語処理の王様「BERT」の論文を徹底解説 【基本編】画像認識に使用されるData Augmentationを一挙にまとめてみた! 画像認識に特化させた新たな活性化関数FReLU解説&実装! 今やあらゆる分野で驚くべき結果を残し続けているニューラルネットワークですが、そのニューラルネットに無くてはならないものこそが活性化関数で

                                                                                新たな活性化関数「FReLU」誕生&解説! - Qiita
                                                                              • 架空の顔で「お客様の声」「大満足」AIで生成、90サイトで宣伝に悪用…[虚実のはざま]第3部 粉飾のカラクリ<1>

                                                                                【読売新聞】

                                                                                  架空の顔で「お客様の声」「大満足」AIで生成、90サイトで宣伝に悪用…[虚実のはざま]第3部 粉飾のカラクリ<1>
                                                                                • End-to-End音声認識の計算量を削減した話

                                                                                  ヤフー株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。LINEヤフー Tech Blog こんにちは、音声処理黒帯(黒帯はヤフー内のスキル任命制度)の藤田です。今日のブログでは、音声認識技術の研究開発におけるヤフーの最新の取り組みを紹介します。 特に、近年注目されているTransformerという手法に基づく、End-to-End音声認識の計算量を削減した研究を紹介します。この研究は、難関国際会議IEEE ICASSP2020に投稿し、採択されました。また、arXivでプレプリントを公開しています。そして、ESPnetというEnd-to-Endモデルのツールキット上でソースコードも公開しています。興味のある方はぜひ、こちらもご参照ください。 音声認識で用いられるEnd-to-Endモデルとは? 音声認識技術は音声をテキ

                                                                                    End-to-End音声認識の計算量を削減した話