Kerasで複数の情報を入力して、途中で結合する方法を紹介します。 この方法は、例えば以下のように画像とテキストを使って予測モデルを作る場合などに有効です。リンク先参考。 ImageDataGeneratorを使いつつ統合する方法は、記事「KerasのImageDataGeneratorを使いつつ複数Input統合モデル」を参照ください。 処理概要 以前、記事「【Keras入門(1)】単純なディープラーニングモデル定義」で紹介した以下の図の配列dataを2つに分解して統合するモデルにしてみます。 処理プログラム プログラム全体はGitHubを参照ください。 ※なぜか直接GitHubで見られずに、nbviewerなら参照できました。nbviewerにhttps://github.com/YoheiFukuhara/keras-for-beginner/blob/master/Keras09_
この記事の抜粋したコードの完全版はGitHubでご覧いただけます。 また、この記事で作成したモデルはTwitterのスタバ警察botで実際に試せるので、ご興味があれば適当な画像を「スタバなう」という文字列と一緒にリプライしてみてください。 こういうtweetが機械学習界隈からの怒りを買ってます(笑) https://t.co/COV1IHyh03 — Yuki Suga (@ysuga) July 26, 2019 というツイートからも分かるように、現在のスタバなうツイートは完全に関係ない画像で蹂躙されており、実際にスタバで撮影された画像は全体の24%しかありません。 逆にここまで来ると、残り76%の画像に着目した方が良いのではという気すらしてきます。 というわけで、「スタバなうと言いながら投稿される関係ない画像」の筆頭であるラーメンの分類器を、スタバなうツイートだけで作れるかどうか試して
チップメーカーのエヌビディアは、GPUチップ上で動作する言語理解の人工知能(AI)プログラムの開発を支援するソフトウェアを発表した。機械学習モデルの訓練および訓練済みモデルの実行をスピードアップできるだけでなく、より大きな言語モデルを訓練することが可能となるという。 by Will Knight2019.08.19 83 41 17 2 人工知能(AI)はこの10年間で目覚ましい進歩を遂げたが、言語理解についてはまだお粗末としか言いようがない。試しにちょっとアレクサと機知に富んだ冗談を言い合ってみれば分かる。 数多くのAIアルゴリズムを実行しているコンピューターチップの製造メーカーであるエヌビディアは、この状況はもうすぐ変わると考えている。爆発寸前である言語理解の分野で利益を得ようと狙っているのだ。 エヌビディアは8月13日、同社製ハードウェア上でより洗練された方法で言語を扱うAIプログラ
Metric Learning について Metric Learning は、データの教師情報を基にデータ間の距離や類似度などの Metric を学習する手法です。日本語で手軽に読める記事だと、*1, *2 などが詳しいです。 このたび、phalanx さんの tweet *3で、 Metric Learning の基礎的なアルゴリズムのいくつかが scikit-learn-contrib *4に搭載されていると知りました。 本記事では、scikit-learn-contrib の metric-learn パッケージを用いて、簡単にMetric Learning を試します。 インストール README や PyPI *5 に記載のある通り、次の通りにインストールします。 pip install metric-learn 利用するデータセット 今回は、sklearn に含まれている lo
人工知能(AI)はいつか人間の感情を私たちよりもうまく伝えられるようになるかもしれない。コロラド大学とデューク大学の研究者によって開発されたニューラルネットワークモデル「EmoNet」は、画像を11種類の感情カテゴリーに正確に分類することに成功した。 この研究に関わった研究者の1人であるPhilip Kragel氏によると、ニューラルネットワークは、一連のフィルターを学習することによって、入力信号を興味深い出力にマッピングすることを学習するコンピューターモデルだという。例えば、バナナを検出するように訓練されたネットワークは、形や色など、バナナに固有の特徴を学習する。 EmoNetの開発に使われたデータベースには、不安や関心、悲しみ、驚きなど、27種類の感情カテゴリーを表す2185本の動画が含まれていた。このモデルは「切望」「性的欲求」「恐怖」に関連する画像を信頼性の高い間隔で区別できたが、
ディープラーニングも使える確率的プログラミングツール「Gen」を開発、MIT:AIモデルやアルゴリズム作成の民主化に貢献 マサチューセッツ工科大学(MIT)の研究チームが開発した確率的プログラミングツール「Gen」を使えば、初心者でも簡単にAIに触れることができ、専門家は高度なAIプログラミングが可能になる。ディープラーニングよりも適用範囲の広いことが特徴だ。 【訂正:2019年7月4日10時50分 記事タイトルの一部に誤解を招く表現があり訂正しました。 訂正前:ディープラーニングを超える汎用AIツール→訂正後:ディープラーニングも使える確率的プログラミングツール】 マサチューセッツ工科大学(MIT)の研究チームは、2019年6月下旬に米アリゾナ州フェニックス市で開催されたカンファレンス「Programming Language Design and Implementation」で、新し
印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます マサチューセッツ工科大学(MIT)は米国時間6月26日、確率的プログラミングシステム「Gen」を開発したと発表した。Genにより、初心者でもコンピュータービジョンやロボティクス、統計に関する処理を容易に手がけられるようになるという。 Genは、「Julia」に組み込まれるかたちで実装されている。なお、JuliaはMITの研究者らによって2012年に公開された動的プログラミング言語であり、世界的に高い人気を集めている。 Genの開発者らは「カスタム化した複数のモデリング言語をJuliaに組み込む」ことで、ユーザーが「数式と格闘したり、高効率なコードを手作業で記述したりせずとも」人工知能(AI)のモデルやアルゴリズムを開発できる新たなAIプ
メタップスワンは7月1日、インスタグラマーの投稿画像や自分が撮影した写真をもとに、AIがさまざまなECサイトから類似商品を提案し、購入できるアプリ「miel(ミエル)」(iOS/Android)のベータ版を公開した。 mielでは、⼈気インスタグラマーのInstagram投稿画像のうち、ファッション関連の投稿画像のみタイムラインで閲覧できる。ユーザーが投稿画像の中にある気になるアイテムをタップすると、mielに参加している様々なファッションECサイトの約100万点(2019年6⽉時点)のアイテムの中から、似ているアイテムをAIが提案してくれる。気に入ったアイテムがあれば、そのままECサイトで購⼊できるという。 また、スマートフォンに保存されているファッションスナップの画像から、似ているアイテムを提案してもらうことも可能。これにより、「ファッション誌のモデルが着ている服が気になる」「このアイ
.app 1 .dev 1 #11WeeksOfAndroid 13 #11WeeksOfAndroid Android TV 1 #Android11 3 #DevFest16 1 #DevFest17 1 #DevFest18 1 #DevFest19 1 #DevFest20 1 #DevFest21 1 #DevFest22 1 #hack4jp 3 11 weeks of Android 2 A MESSAGE FROM OUR CEO 1 A/B Testing 1 A4A 4 Accelerator 6 Accessibility 1 accuracy 1 Actions on Google 16 Activation Atlas 1 address validation API 1 Addy Osmani 1 ADK 2 AdMob 32 Ads 71 Ads API 11
Introduction The deployment of machine learning models is the process for making your models available in production environments, where they can provide predictions to other software systems. It is only once models are deployed to production that they start adding value, making deployment a crucial step. However, there is complexity in the deployment of machine learning models. This post aims to
先ごろ公開された調査研究報告によると、人工知能(AI)モデルはわずか半日で偽の国連演説文の書き方を覚えてしまうという。 このオープンソースの言語モデルは、Wikipediaのテキストと国連総会で行われた7000件を超える演説の台本を使って訓練されたもので、政治指導者らと同じ論調の演説を簡単に模倣できたと、国連研究員のJoseph Bullock氏とMiguel Luengo-Oroz氏は述べている。 同研究員らによると、このモデルにいくつかの単語をインプットするだけで、理路整然とした「質の高い」テキストを生成できたという。たとえば、モデルに「The Secretary-General strongly condemns the deadly terrorist attacks that took place in Mogadishu」(国連事務総長は、モガディシュで死者を出したテロリスト攻
現在、様々な画像認識技術において”GAN”が利用されるようになり、その応用範囲はめざましいものがあります。新しく発表された「Sphere GAN」では幾何の理論を基に構成することで次元数を引き上げ、計算精度の向上を実現しています。 参考論文 : Sphere Generative Adversarial Network Based on Geometric Moment Matching 従来のGANモデルの弱点 従来のGANモデルの主なアイデアは、偽物のデータと本物のデータ間の分布散らばりを最小化するものでした。GANはこれまで様々なモデルに利用されてきましたが、処理できない複雑な問題も存在します。例えば、連続的に画像データを生成し学習しようとすると、計算が爆発してしまう場合があります。 従来のGANが処理できない問題を解決するため、これまでIPMs(integral probabili
「Gensim」による機械学習を使った自然言語分析の基本――「NLTK」「潜在的ディリクレ配分法(LDA)」「Word2vec」とは:Pythonで始める機械学習入門(9)(1/2 ページ) 最近流行の機械学習/Deep Learningを試してみたいという人のために、Pythonを使った機械学習について主要なライブラリ/ツールの使い方を中心に解説する連載。今回は機械学習を使った自然言語分析のライブラリ「Gensim」について解説します。 プログラミング言語「Python」は機械学習の分野で広く使われており、最近の機械学習/Deep Learningの流行により使う人が増えているかと思います。一方で、「機械学習に興味を持ったので自分でも試してみたいけど、どこから手を付けていいのか」という話もよく聞きます。本連載「Pythonで始める機械学習入門」では、そのような人をターゲットに、Pytho
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く