並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 560件

新着順 人気順

deeplearningの検索結果481 - 520 件 / 560件

  • 画像認識と深層学習

    日本ロボット学会 ロボット工学セミナー 第126回 ロボットのための画像処理技術 講演資料 https://www.rsj.or.jp/event/seminar/news/2020/s126.html 2012年の画像認識コンペティションILSVRCにおけるAlexNetの登場以降,画像認識においては深層学習,その中でも特に畳み込みニューラルネットワーク (CNN) を用いることがデファクトスタンダードとなった.CNNはクラス分類をはじめとして,物体検出やセグメンテーションなど様々なタスクを解くためのベースネットワークとして広く利用されてきている.本講演では,CNNの発展を振り返るとともに,エッジデバイスで動作させる際に重要となる高速化等,関連する深層学習技術の解説を行う. 1. クラス分類向けモデルについて 1.1. ILSVRCで振り返る進化の歴史 1.2. その他重要なモデル 1

      画像認識と深層学習
    • 日本ディープラーニング協会、「ディープラーニング開発標準契約書」を公開 | Ledge.ai

      日本ディープラーニング協会(JDLA)は「ディープラーニング開発標準契約書」を策定し、9月6日に公開した。 JDLAは、ディープラーニングを中心とする技術による日本の産業競争力の向上を目指す協会。理事長は東京大学大学院工学系研究科教授の松尾豊氏が務める。 スタートアップと大企業間での契約締結を円滑化するディープラーニング技術は、さまざまなビジネスでの活用、社会実装に向けた開発・検討が進みつつある。技術開発を担うスタートアップと業務の委託者である大企業との間で多くの議論が交わされている。 一方で、契約においては、当事者間の契約実務に関する経験・スキル、ディープラーニングに関する認識・理解のギャップがあり、契約の締結がなかなか進まないという課題がある。 JDLAの産業活用促進委員会では、これらの課題を踏まえ、スタートアップと大企業間での契約締結を円滑化しさらなるディープラーニング技術の産業活用

        日本ディープラーニング協会、「ディープラーニング開発標準契約書」を公開 | Ledge.ai
      • NovelAI - The AI Storyteller

        Driven by AI, painlessly construct unique stories, thrilling tales, seductive romances, or just fool around. Anything goes! What even is NovelAI?NovelAI is a monthly subscription service for AI-assisted authorship, storytelling, virtual companionship, or simply a LLM powered sandbox for your imagination. Our Artificial Intelligence algorithms create human-like writing based on your own, enabling a

          NovelAI - The AI Storyteller
        • 初めてのロバスト統計学① - Qiita

          なんとなくロバスト統計の話がしたくなったので、、、 データに外れ値が混入することによって、分析結果の信頼性が損なわれてしまうことは少なくありません。 例えば、成人男性の身長の平均が知りたくて、成人男性5人分の身長を測定して記録したとします。 しかし、入力の際に間違えて1人分の身長の0が多くなってしまい、次のようなデータが得られたとします。単位は $cm$ です。

            初めてのロバスト統計学① - Qiita
          • 嘘だろ?深層学習が3Dゲームを再現|shi3z|note

            深層学習の世界では時折・・・と言っても、一ヶ月に一回くらいだが・・・信じられないようなことが起きる。 以前、ゲーム画面を見ただけでパックマンやらマリオやらを再現するAIが出現したと聞いたとき、「嘘だろ」と思ったのだが、まあ言うてパックマン。なんとなくできるのかもしれない。 しかしこの手のものはあまりにも直感に反するので自分の手で確かめないと本当かどうかわからない。 そんな時のために僕の仕事机には7台のGPUマシンがあるわけだが、たまたまRTXが遊んでいたので実行してみたら、「嘘だろ」としか言いようがない結果を目の当たりにすることになった。 GTAVこと「グランセフトオートV」は、自動車泥棒になって架空の街を走り回るゲームだ。 こいつをひたすらAIに学習させると、GTAVをAIが再現するという、全く直感に反することが行われるらしい。3Dゲームというのは、それを作った経験のある人なら誰でも、恐

              嘘だろ?深層学習が3Dゲームを再現|shi3z|note
            • 高校時代、数学ができないことで馬鹿にされてきた僕は機械学習エンジニアになった - Qiita

              はじめに 現在、機械学習エンジニアとしてお仕事をしています。 一応、会社での立ち位置は機械学習エンジニアですが、SESなので、 やることは現場によってまちまちです。今は分析をしつつ推薦ロジックをつくっています。 まだ、この職について半年、実際に業務に携わって3か月くらいの新米のぺーぺーですが、 この半年を振り返りつつ、これからしたいこと、やってきた勉強などを書いていきたいと思います。 そして、私のような経歴の方で、機械学習に挑戦したい方の参考になればと思います。 綺麗事は、書くつもりはなく、ありのままの現実を書きますので、参考にしていただければ幸いです。 これは完全なポエムとなっています。ご了承を。 あと、僕のことを知ってる身内へ。 恥ずかしいので、あまり広めないでね。 私について 私は、地方私立Fラン大学出身です。 数学とプログラミングとは無縁の生活をしていました。 勉学と無縁だったと言

                高校時代、数学ができないことで馬鹿にされてきた僕は機械学習エンジニアになった - Qiita
              • Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog

                こんにちは! 画像システムグループで機械学習エンジニアをやっている小島です。 この記事では、今ホットな「Zero-shot Learning」と「Vision & Language」に関する最新情報を、CLIPという研究を起点として網羅的にサーベイをしていきます。このために論文1000本に目を通し、70本程度を記事にしました。 Zero-shotやVision & Languageは、Stable Diffusionに代表される画像生成AIとも密接に関連している技術です。この記事を通して、Vision & Languageの奥深い世界を体感できるでしょう。 注意事項 この記事は非常に長いため、全部読むのに1時間以上かかる可能性があるので、休憩を取りながら、または必要な部分だけ読んでください。各セクションを個別に読んでも問題ありません。 また、文章中の画像は、特別な記載がない限り、引用元の論

                  Zero-shot Learning網羅的サーベイ:CLIPが切り開いたVision & Languageの新しい世界 - エクサウィザーズ Engineer Blog
                • 音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと

                  「Unreal Engine (UE) Advent Calendar 2022 その3」23日目の記事です。 はじめに OpenAIの音声認識AI「Whisper」がすごいらしい。これをUnreal Engineでリアルタイムに動かせるようにしたら応用範囲が広がっておもしろいんじゃないかと思いました。 (「異議あり!」って実際に声に出させたいよね) (NLPアドベンチャーを音声入力で、みたいな夢も広がる) しかし、いざやってみたらいろいろな課題にぶつかりました。この記事は、それらをどう解決したかの記録です。 目次 目標設定:C++とONNX Runtimeで実装する Whisperの処理の全体感 課題と対応 課題1:マイク入力と前処理をC++で実装する 課題2:Whisperの機械学習モデルをONNXにエクスポートする 課題3:ONNXモデルをtransformer&FP16向けに最適化

                    音声認識AIのWhisperをUnreal Engineでリアルタイムに動かすためにやったこと
                  • GoogleのDeepMindが囲碁のルールを自ら学習することでAlphaZeroを凌駕する強化学習手法「Muzero」を提案。

                    3つの要点 ✔️その1 DeepMindからAlphaZeroの進化版「MuZero」が登場 ✔️その2 モデルベース強化学習によりルールを与えなくてもAlphaZeroに勝利 ✔️その3 囲碁・チェス・将棋に加えてAtariでも同一モデルで最高性能を達成 続きを読むには (3155文字画像6枚) AI-SCHOLARに 登録いただく必要があります。 1分で無料で簡単登録する または ログイン

                      GoogleのDeepMindが囲碁のルールを自ら学習することでAlphaZeroを凌駕する強化学習手法「Muzero」を提案。
                    • 【異常検知】異常原因を特定する - Qiita

                      異常検知は、正常データだけで学習できる製造業で人気のある手法です。 そして、異常検知で異常を検出したとして、「異常原因を特定したい」という 要望もよく聞かれます。 そこで、本稿では、複数のセンサが付いた異常検知システムにおいて、 異常が発生した場合に、どのセンサが異常値を示しているのかを特定する 方法を検討します。 ※コード全体はこちらに置きました。 ※こちらはPythonデータ分析勉強会#17の発表資料です。 きっかけ 以前に、こんな内容をツイートしたところ、皆さん興味をお持ちのようでした。 昨日、JFEスチールの製造ラインで異常検知する話しを聞いた。 ・数十個にわたるセンサで常時監視 ・異常検知の制約は、異常のみならず異常原因も特定する ・センサは相関が強いものだけを取り出し、主成分分析だけで異常検知 ・これによりコストと納期を大幅に削減 ー続くー — shinmura0 @ 3/14

                        【異常検知】異常原因を特定する - Qiita
                      • 機械学習・アルゴリズム関連まとめ - Qiita

                        損失関数・不均衡 不均衡データにおけるsampling ランク学習のListNetをChainerで実装してみた 不均衡データへの決定打となるか!?「Affinity loss」の論文を読む、実装する 不均衡データを損失関数で攻略してみる 解説編:オーバーサンプリング手法解説 (SMOTE, ADASYN, Borderline-SMOTE, Safe-level SMOTE) LightGBMでランキング学習 半教師あり学習のこれまでとこれから Struggling with data imbalance? Semi-supervised & Self-supervised learning help! 深層学習 転移学習:機械学習の次のフロンティアへの招待 ディープラーニングの判断根拠を理解する手法 DNC (Differentiable Neural Computers) の概要 +

                          機械学習・アルゴリズム関連まとめ - Qiita
                        • G検定 本番困りそうな所まとめ - Qiita

                          はじめに G検定の内容をざっと確認できるページを作ったので公開しておきます。 1. 基礎知識関係 1.1. 人名まとめ ・ 機械学習の基礎関係 名前 内容

                            G検定 本番困りそうな所まとめ - Qiita
                          • ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発

                            Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 京都大学の研究チームが開発した「Non-Local Musical Statistics as Guides for Audio-to-Score Piano Transcription」は、Web上のピアノ演奏動画の音声データから楽譜を作成する、深層学習(ディープラーニング)を用いた自動変換システムだ。 システムは、3段階で構成される。1段階目は、入力された動画の音の信号に対してMIDIシーケンスを深層学習ネットワークで推定(Multipitch detection)する。ピッチ解析用とベロシティ推定用のネットワークを別々で学習し、その出力を組み合わせてMIDIシーケンスを合成する。2段

                              ピアノの演奏動画から楽譜を自動作成 ディープラーニングで 京大が技術開発
                            • 画像化したテキストから直接翻訳する全く新しいニューラル機械翻訳モデルが登場【論文速報】

                                画像化したテキストから直接翻訳する全く新しいニューラル機械翻訳モデルが登場【論文速報】
                              • 画像生成AI「Stable Diffusion」をGoogle ColaboratoryでWebアプリ的に簡単に動かすノートブックを作りました - karaage. [からあげ]

                                Stable Diffusionの衝撃 つい先週「Midjourney」というAIによる画像生成AIを紹介しましたが、Stable Diffusionという超新星が登場いたしました。 何が凄いかというと、オープンにモデルが公開されているので、誰でもこのモデルを改変したり、モデルを使用したアプリが作れるのです。詳しくは、以下の深津さんのnote記事を参照ください。 さすらいAIプログラマーのshi3zさんは、既に日本語で誰でも無料で手軽に使えるWebアプリを公開されています。 サーバー代めちゃくちゃかかっているけど、自腹でやり続けるそうです。凄すぎです。上記記事のshi3zさんのYouTube動画から、shi3zさんの熱狂が伝わってきます。 Stable DiffusionをWebアプリ的に手軽に使えるツールを作成しました。 思えば、私もディープラーニングおじさんも、AIにハマった大きなきっ

                                  画像生成AI「Stable Diffusion」をGoogle ColaboratoryでWebアプリ的に簡単に動かすノートブックを作りました - karaage. [からあげ]
                                • Building A Virtual Machine inside ChatGPT

                                  Unless you have been living under a rock, you have heard of this new ChatGPT assistant made by OpenAI. You might be aware of its capabilities for solving IQ tests, tackling leetcode problems or to helping people write LateX. It is an amazing resource for people to retrieve all kinds of information and solve tedious tasks, like copy-writing! Today, Frederic Besse told me that he managed to do somet

                                    Building A Virtual Machine inside ChatGPT
                                  • グラフデータ分析 入門編

                                    グラフ分析ナイト (エンジニア向け) https://dllab.connpass.com/event/159148/ グラフ畳み込みネットワークなど、グラフ上の機械学習/深層学習技術の概要についてご説明します。Read less

                                      グラフデータ分析 入門編
                                    • 深層学習入門 ~基礎編~ - Qiita

                                      対象者 深層学習について勉強始めたいな〜って考えている人向け。 いきなりライブラリを利用して何か作るのも手ですが、やっぱりちゃんと理解するには「車輪の再発明」しないといけませんね〜 本記事は深層学習の基礎理論メインですが、できるだけ数式を少なくして図メインでざっくり説明します。 実装などは次回以降順番にやっていこうと思います。 次回の記事はこちらです。 目次 深層学習とは ニューロンモデル レイヤーモデルとニューラルネットワークモデル 活性化関数 シグモイド関数(sigmoid) tanh関数 ReLU関数 ソフトマックス関数(softmax) 計算グラフ 足し算の計算グラフ 掛け算の計算グラフ 割り算の計算グラフ 指数関数の計算グラフ 底がネイピア数の指数関数の計算グラフ 対数関数の計算グラフ 底がネイピア数の対数関数の計算グラフ sigmoid関数の計算グラフ sigmoid関数の順伝

                                        深層学習入門 ~基礎編~ - Qiita
                                      • 機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita

                                        scikit-learnライブラリを用いて、機械学習の実装とアルゴリズムをバランス良く学んでいただく書籍を執筆しました。 AIエンジニアを目指す人のための機械学習入門 実装しながらアルゴリズムの流れを学ぶ(電通国際情報サービス 清水琢也、小川雄太郎 、技術評論社) https://www.amazon.co.jp/dp/4297112094/ 既に発売開始しています。 機械学習の ・各種アルゴリズムの実装 ・それぞれのアルゴリズムの動作の仕組み これらを学んでみたい方に向けて執筆いたしました。 ご活用いただければ幸いです。 昨年書いた書籍 つくりながら学ぶ! PyTorchによる発展ディープラーニング(小川雄太郎、マイナビ出版) の、機械学習版のような位置付けです。 本記事では、 ・本書を書いたモチベーション ・本書の概要 ・本書の目次 を紹介いたします。 本書を書いたモチベーション 本書

                                          機械学習の実装とアルゴリズムをバランス良く学べる書籍を執筆しました - Qiita
                                        • LangChain の新記法「LangChain Expression Language (LCEL)」入門

                                          LangChain Advent Calendar 2023 の 2 日目の記事です。 LangChain Expression Language (LCEL) とは LangChain Expression Language (LCEL) は、LangChain でのコードの新しい記述方法です。 公式ドキュメント: https://python.langchain.com/docs/expression_language/ LCEL ではプロンプトや LLM を | で繋げて書き、処理の連鎖 (Chain) を実装します。 2023 年 10 月後半頃から、LangChain では LCEL を使う実装が標準的となっています。 この記事では LCEL の基本的な使い方を紹介していきます。

                                            LangChain の新記法「LangChain Expression Language (LCEL)」入門
                                          • AI For Everyone (すべての人のためのAIリテラシー講座)

                                            AIはエンジニアだけのものではなく、今や社会⼈の基本リテラシーと⾔えます。本 コースは、AIの基礎を学びたい⽅、今の組織をAIを使いこなせる組織へと変⾰させ たい⽅、そんなすべての⽅々に、理系⽂系問わず、肩書きや職種問わず、受講いた だけるコースです。 本コースでは、次のことを学習していただきます: - ニューラルネットワーク、機械学習、ディープラーニング、データサイエンス など、⼀般的なAIに関する専⾨⽤語とその意味 - 実際にAIができること、できないこと - 組織の課題解決のためにAIを適⽤できる可能性とその⽅法 - 機械学習およびデータサイエンスプロジェクトの進め⽅ - AIエンジニアチームと連携して社内でAI戦略を構築する⽅法 - AIを取り巻く倫理的および社会的議論の概要 本コースはDeepLearning.AIが提供している通常の「AI for Everyone」(オリジナル

                                              AI For Everyone (すべての人のためのAIリテラシー講座)
                                            • NEC、従来技術の半分の学習データ量でも高精度に識別可能なディープラーニング技術を開発

                                              NECは、従来の半分程度の学習データ量でも高い識別精度を維持できるディープラーニング技術を新たに開発しました。 識別精度の向上には、識別が難しい学習データをより多く学習することが有効ですが、学習に適した質の良いデータを十分に確保することが重要です。本技術は、ニューラルネットワーク(注1)の中間層で得られる特徴量を意図的に変化させることで、識別が難しい学習データを集中的に人工生成します。これにより、少ない学習データ量でも識別精度を大きく向上させ、ディープラーニングを適用したシステムの開発期間短縮に貢献します。 具体的には、ディープラーニング技術の適用に必要な学習データ量を半分程度に削減します。また本技術は、データの種類を問わず汎用的に適用可能であることから、専門家による調整が不要になります。これにより従来、学習データ収集時間やコストの高さが阻害要因となっていた製品の外観検査やインフラ保全など

                                                NEC、従来技術の半分の学習データ量でも高精度に識別可能なディープラーニング技術を開発
                                              • M1 Mac、「TensorFlow」の新Mac版でのトレーニングが従来の7倍速

                                                米Appleは11月18日(現地時間)、Macに最適化した「TensorFlow 2.4」のmacOS向けフォークのプレリリース版をGitHubで公開したと発表した。 TensorFlowは米Googleが2015年にオープンソース(Apache License 2.0)で公開した機械学習プラットフォーム。ツール、ライブラリ、コミュニティリソースを備え、Linux、Windows、macOS、Android、iOSをサポートする。 これまでのMac版TensorFlowは、MacでのトレーニングでCPUのみを使っていたが、新バージョンは「ML Compute」を活用することで、CPUだけでなく、GPUも最大限に活用する。これはIntel Macだけでなく、M1搭載の最新モデルでも可能だ。 例えば、M1搭載の13インチMacBook Proでのトレーニングは、ベンチマークで従来の最大7倍高速

                                                  M1 Mac、「TensorFlow」の新Mac版でのトレーニングが従来の7倍速
                                                • 【ディープラーニング】機械学習初心者が競艇1位予想を作れるのか試してみた。 - Qiita

                                                  はじめに ディープラーニングの勉強を始めて1ヶ月。 基礎的なものは理解できた気がしてきたので、何かできないかと考えてみました。 そしてふと、この競艇の順位予想が思いつきました。 順位予想ができるという確信はありませんでしたが、ボートレースのデータのオープンソースが公開されていることがわかり、これはやってみるしかないと思いました。 参考にしたデータ元と特徴量 ↓データ元のサイトは下記リンクから飛ぶことができます。↓ BOTE RACE OFFICIAL タウンロード・他 選手のデータから勝率まで細かく載っているので学習させるにはちょうどいい情報量だと思います。 今回学習させるデータの種類は以下の通りです。 艇番 年齢 体重 級別 全国勝率 全国2率 当地勝率 当地2率 モーターナンバー モーター勝率 ボートナンバー ボート勝率 とりあえずこの情報量で学習させていきます。 選手番号を使うことも

                                                    【ディープラーニング】機械学習初心者が競艇1位予想を作れるのか試してみた。 - Qiita
                                                  • 自然言語処理とVision-and-Language / A Tutorial on NLP & Vision-and-Language

                                                    2022年度人工知能学会全国大会(第36回) チュートリアル講演資料

                                                      自然言語処理とVision-and-Language / A Tutorial on NLP & Vision-and-Language
                                                    • 無人コンビニ「AmazonGo」を実現している技術について、どの日本語記事よりも詳しく調べてみる - Qiita

                                                      記事の概要 巷で話題になっている無人店舗「Amazon Go」。「コンビニの店員いらなくなるんちゃう?」と話題になっているので、技術者の端くれとして、それを可能にしている技術について知るべく、日本語でいろいろ調べてみたのですが、参考になる記事が全く出てきませんでした。 なので、Re:MARSというAmazonのカンファレンスイベントの記事や、その他英語・日本語、さまざまな技術系記事を参考に、解説記事を書いてみました。(引用記事は一番下を参照) 技術系の話ですが、細かいことは端に置いて、大枠だけ理解できるように書いたので、ぜひ最後まで読んでみてください。 ※重要 記事内の情報は、Amazon Goの内外の方が発信してくださった情報をもとに僕が推測したものです。誤りがある可能性が十分にありますので、ご承知おきください。 また、著作権には最大限注意して執筆しましたが、もし万が一修正が必要な点があ

                                                        無人コンビニ「AmazonGo」を実現している技術について、どの日本語記事よりも詳しく調べてみる - Qiita
                                                      • neue cc - Claudia - Anthropic ClaudeのC# SDKと現代的なC#によるウェブAPIクライアントの作り方

                                                        Claudia - Anthropic ClaudeのC# SDKと現代的なC#によるウェブAPIクライアントの作り方 2024-03-18 AI関連、競合は現れども、性能的にやはりOpenAI一強なのかなぁというところに現れたAnthropic Claude 3は、確かに明らかに性能がいい、GPT-4を凌駕している……!というわけで大いに気に入った(ついでに最近のOpenAIのムーブが気に入らない)ので、C#で使い倒していきたい!そこで、まずはSDKがないので非公式SDKを作りました。こないだまでプレビュー版を流していたのですが、今回v1.0.0として出します。ライブラリ名は、Claudeだから、Claudiaです!.NET全般で使えるのと、Unity(Runtime/Editor双方)でも動作確認をしているので、アイディア次第で色々活用できると思います。 GitHub - Cyshar

                                                        • DeepLearningについて、最近作ったもの、書いたもの、勉強したこと

                                                          こんにちは!逆瀬川 ( @gyakuse ) です。 今日は最近作ったもの、書いたもの、勉強したことを備忘録的にまとめていきたいと思います。 なぜ書くのか、なぜ学ぶのか DeepLearningの普及以降、Attention Is All You Need以降、Hugging Faceでの民主化以降、そしてStable DiffusionやChatGPTの登場以降、どんどんAGIへの距離が短くなってきています。未来は想定より大きく変わりそうです。どったんばったん大騒ぎのときはみんなが分かっておくべきことは効率的に共有すべきで、そのために書いています。書くためには論文等を読む必要があります。そしてそのためには基礎からしっかり学ぶことが大事です。次の一歩をみんなで歩んでいくために、学び、書いています。 間違ったことを言うかもしれませんが、それでも誰かのためになれば嬉しいです。あと、個人的にはこ

                                                            DeepLearningについて、最近作ったもの、書いたもの、勉強したこと
                                                          • nerman: AllenNLP と Optuna で作る固有表現抽出システム - クックパッド開発者ブログ

                                                            事業開発部の @himkt です.好きなニューラルネットは BiLSTM-CRF です. 普段はクックパッドアプリのつくれぽ検索機能の開発チームで自然言語処理をしています. 本稿では,レシピテキストからの料理用語抽出システム nerman について紹介します. nerman の由来は ner (固有表現抽出 = Named Entity Recognition) + man (する太郎) です. クックパッドに投稿されたレシピから料理に関する用語を自動抽出するシステムであり,AllenNLP と Optuna を組み合わせて作られています. (コードについてすべてを説明するのは難しいため,実際のコードを簡略化している箇所があります) 料理用語の自動抽出 料理レシピには様々な料理用語が出現します. 食材や調理器具はもちろん,調理動作や食材の分量なども料理用語とみなせます. 「切る」という調理

                                                              nerman: AllenNLP と Optuna で作る固有表現抽出システム - クックパッド開発者ブログ
                                                            • 誰でもノーコードで画像判別の機械学習モデルを作成できる「Lobe」【イニシャルB】

                                                                誰でもノーコードで画像判別の機械学習モデルを作成できる「Lobe」【イニシャルB】
                                                              • AIで1枚の人物写真から高精細3Dモデル作成 Facebookなど開発

                                                                Innovative Tech: このコーナーでは、テクノロジーの最新研究を紹介するWebメディア「Seamless」を主宰する山下裕毅氏が執筆。新規性の高い科学論文を山下氏がピックアップし、解説する。 南カリフォルニア大学、Facebook Reality Labs、Facebook AI Researchによる研究チームが開発した「PIFuHD」は、1枚の人物写真から衣服を着た人体3次元モデルを高解像に再構築する深層学習フレームワークだ。指や顔の特徴、衣服のひだといった細かい情報や、見えていない箇所まで3Dで再現する。 人物の3Dモデルを忠実に作成する場合、従来は「Light Stage」と呼ばれる、全方位に多数のカメラやセンサーを配置した球形ドーム型キャプチャーシステムが用いられてきた。しかし、Light Stageは高価なため一般的に導入は難しい。そこで1枚の画像から深層学習を用い

                                                                  AIで1枚の人物写真から高精細3Dモデル作成 Facebookなど開発
                                                                • 「スマート」ガラスを用いた画像認識技術――電源も電子回路も不要 - fabcross for エンジニア

                                                                  「スマート」ガラスを通過する光線が、後方面(右端)で光エネルギー集中スポット・パターンを生成し、ディープラーニングにより手書き数字の識別が可能になる。 IMAGE COURTESY ZONGFU YU ウィスコンシン大学の研究チームが、電源や電子回路、センサーなどを必要としない「スマート」なガラスを用いた画像認識技術を考案した。サブ波長サイズの気泡や異相が多数配置されたガラス材料において、画像から発射された光が反射や回折、吸収を繰り返した後、ガラス後方面で一定の光エネルギー集中スポットを生じることを利用し、ディープラーニングを通じて画像認識を実現するというもので、研究成果は、2019年7月8日発行の『Photonics Research』誌8月号に掲載されている。 顔認識をはじめとして、人工知能ニューラルネットワークによる画像認識は、様々な分野で開発されている。画像認識におけるひとつの問題

                                                                  • 無償入手可能な音声コーパス/音声データベースの一覧 - Qiita

                                                                    無償かつ入手しやすい音声データセットをメモしています。 ライセンス・利用規約は「商用利用可能」「研究用途のみ」ともに紹介します。 コーパスを探すときに有用なサイト コーパス配布元サイト 音声資源コンソーシアム : 日本語コーパスが豊富、無償または有償で利用可能 緩いライセンスのコーパスでなくても良いときはここ 自発的発話の日本語音声コーパスはだいたいここにある 入手は要申請 所属や責任者を記入する必要があるため、研究者や企業でないと厳しい? (この記事では音声資源コンソーシアムのコーパスは未掲載) Shinnosuke Takamichi: コーパス一覧 : 日本語中心。高道先生が携わっている音声コーパス 大量の日本語音声コーパスが配布されている 音声合成のコーパスをつくろう (Slideshare) : 2021年6月時点の音声コーパス事情 あなたにどうしても伝えたい30の音声コーパス

                                                                      無償入手可能な音声コーパス/音声データベースの一覧 - Qiita
                                                                    • Transformerによる時系列データ予測のご紹介 - Platinum Data Blog by BrainPad

                                                                      本記事は、当社オウンドメディア「Doors」に移転しました。 約5秒後に自動的にリダイレクトします。 発展を続ける「自然言語処理」技術。その中でも幅広く使用される深層学習モデルTransformerは、自然言語処理以外の音楽生成や物体検出などの領域でも適用できます。本ブログでは、 Transformerを時系列データに適用する方法をご紹介します。 こんにちは、AIソリューションサービス部の井出と申します。 この記事では、特に自然言語処理分野で幅広く使用される深層学習モデルTransformerを時系列データへ適用する方法に関してご紹介します。 以前の記事では、Transformerの構造や特徴などについて、自然言語処理分野の機械翻訳を例としてご紹介しております。はじめに、こちらの記事をご一読していただくことで、より本記事でご紹介する内容に対する理解が深まるかと思います。 Transform

                                                                        Transformerによる時系列データ予測のご紹介 - Platinum Data Blog by BrainPad
                                                                      • 音ゲーの“譜面”作りをAIで高速化 KLabが「スクスタ」で活用、所要時間を半分に

                                                                        音ゲーの“譜面”作りをAIで高速化 KLabが「スクスタ」で活用、所要時間を半分に:CEDEC 2021(1/2 ページ) ゲームセンターの筐体としてだけでなく、スマートフォンゲームの一つとしても人気を集めるリズムゲーム。他のゲームと違うのは、ガチャだけでなく新しい曲やその“譜面”も、新規コンテンツとして開発する必要がある点だ。特に譜面、曲に合わせてタッチする位置などを示した時系列データは、1曲1曲に合わせて新規に作ることになる。この手間を、AIを活用して効率化している企業がある。 「低い難易度の譜面作りにAIを活用することで、1曲当たり40時間ほどかかっていた作業時間を約50%削減できた」──スマホ向けリズムゲーム「ラブライブ!スクールアイドルフェスティバル ALL STARS」(スクスタ)を開発するKLabの高田敦史さん(開発推進部機械学習グループ)は、自社開発した「譜面制作支援ツール

                                                                          音ゲーの“譜面”作りをAIで高速化 KLabが「スクスタ」で活用、所要時間を半分に
                                                                        • RaspberryPi 3 Model B+でIoT監視カメラをつくる(その7 カメラのAI化) | そう備忘録

                                                                          追加インストール機械学習の為にGoogeのTensorFlow関連のモジュールを追加インストールした。 Edge TPUランタイムのインストール以下のコマンドでラズパイにEdge TPU(Tensor Processing Unit)ランタイム(スタンダード版)のインストールを行った。 尚、本来はCoral USB Acceleratorの様なEdge TPUユニットをラズパイに接続して機械学習を行うのが理想なのだろうが今のIoT監視カメラにCoral USB Acceleratorを追加すると外箱を作り直さないといけないのと、そこそこの値段がするので(1.5万円ぐらい)ラズパイ単体でTensor Flow Liteを動かすことにしている。 この為、最後の行のlibedgetpu1-stdのインストールは今回のプログラムをラズパイ単体で動かすだけであれば不要なのだが、今後Coral USB

                                                                            RaspberryPi 3 Model B+でIoT監視カメラをつくる(その7 カメラのAI化) | そう備忘録
                                                                          • 第1回 初めてのニューラルネットワーク実装、まずは準備をしよう ― 仕組み理解×初実装(前編)

                                                                            第1回 初めてのニューラルネットワーク実装、まずは準備をしよう ― 仕組み理解×初実装(前編):TensorFlow 2+Keras(tf.keras)入門 機械学習の勉強はここから始めてみよう。ディープラーニングの基盤技術であるニューラルネットワーク(NN)を、知識ゼロの状態から概略を押さえつつ実装してみよう。まずはワークフローを概観して、データ回りの処理から始める。

                                                                              第1回 初めてのニューラルネットワーク実装、まずは準備をしよう ― 仕組み理解×初実装(前編)
                                                                            • 自然言語からSQLを自動生成するDeep Learning技術 - Qiita

                                                                              本記事は Towards Complex Text-to-SQL in Cross-Domain Database with Intermediate Representation(論文, リポジトリ)のサーベイ記事です。 日鉄ソリューションズ(NSSOL)様での研究開発インターンの一環として執筆しました。 今回紹介するのは、ざっくり言えば、自然言語で記述された質問からSQLクエリを生成するタスク(Text-to-SQL)において、文脈自由な中間表現を導入して性能を上げた研究で、提案モデルはIRNetと呼ばれています。 この研究ではSpider (論文, サイト) というデータセットを用いています。Spiderは従来のText-to-SQLデータセットよりも複雑な事例を多く含んでいます。 Spiderの公式サイトで挙げられている難易度が中くらい(Meidum)の例がこちらです: 複数テーブ

                                                                                自然言語からSQLを自動生成するDeep Learning技術 - Qiita
                                                                              • Kaggle と出会ってから Master になるまで、そしてこれから。 - 俵言

                                                                                はじめに 以下の Tweet で言っている"長い旅路"の詳細です。完全にポエムかつ長文*1、しかも自己陶酔を多分に含んだ自分語りです。 暇かつ心に余裕があって何でも寛大に許せそうな場合にお読みください。 奇跡の solo gold を獲得し、遂に Kaggle Master になりました! Kaggle と出会ってから4年半、一念発起して分析コンペに本気で取り組み始めてから1年半、長い旅路でした。 今までチームを組んだり議論したりして下さった皆さん、本当にありがとうございました!これからもよろしくお願い致します! pic.twitter.com/IzWin2rioa— 俵 (@tawatawara) 2020年3月18日 話をしよう。あれは2年... いや5年くらい前の話だったか... といった感じの、むかーしむかしからの話*2。Kaggle と出会ってからの人生(の一部)の紹介みたいなも

                                                                                  Kaggle と出会ってから Master になるまで、そしてこれから。 - 俵言
                                                                                • 【後藤弘茂のWeekly海外ニュース】 人間の脳から産まれたディープラーニングのプルーニング

                                                                                    【後藤弘茂のWeekly海外ニュース】 人間の脳から産まれたディープラーニングのプルーニング