今日参加してきた Deep Learning Acceleration勉強会 - connpass が非常に面白かった. 一度聞いただけでは全然理解できなかったので、後から読み返すように公開された資料や論文などをメモをまとめた。 私自身は仕事で一度tensorflowでCNN触ってみたくらいで、超初心者なので、 おかしな書き方をしているところがあるかもしれませんヾ(´゚Д゚;) [2017/09/04 11:00 追記] 間違いの修正/情報追記 目次 モデルアーキテクチャ観点からのDeep Neural Network高速化 by Yusuke Uchida(@yu4u)さん 資料 よくある高速化の方法 Factorization conv(5 x 5) => conv(3 x 3) - conv(3 x 3) conv(3 x 3) -> conv(1 x 3) - conv (3 x
単語と遊ぶ① 分布図を書いてみる 分布図を書くメソッドを以下のように定義しました。 通常、単語のベクトル表現は100次元とか300次元とかでモデルに学習させます。 それを次元圧縮して2次元に落とし込んだ後に可視化を行っています。 from sklearn.decomposition import PCA import matplotlib.pyplot as plt def draw_word_scatter(word, topn=30): """ 入力されたwordに似ている単語の分布図を描くためのメソッド """ # 似ている単語を求めるためにはGensim word2vecの以下の機能を利用 # model.most_similar(word, topn=topn) words = [x[0] for x in sorted(model.most_similar(word, topn
日本語の自然言語処理で分散表現を使おうと思った場合、まず頭に浮かぶのはword2vecだと思います。 特に分散表現自体の精度とかには興味がなく、それを使った対話システムを作りたいだけだったりするのであれば、 データクレンジングや学習には結構時間もかかるので、学習済みの公開モデルを使わせていただくのが手っ取り早そうです。 (単語ベクトルの準備に手間取り、モチベーション低下に繋がる悪い例:対話システムを作りたい!【準備編1】) 調べてみると、よく出来ていそうな公開モデルを2つ見つけたので、その利用方法と気になるベクトル次元数と単語数を調べてみました。 なお、どちらもWikipedia日本語版を学習元にしているようです。 word2vecを使うには、以下のバージョンのgensimを利用します。 $ pip freeze | grep gensim gensim==1.0.0 白ヤギコーポレーショ
「pixivコミック・ノベル」チームのエンジニアの pawa です。 pixivコミックはWebやアプリで漫画を試し読みできるサービスです。私が一番好きな pixivコミック作品は「温泉卓球☆コンパニオンズ!」です。 2017年7月4日、pixivコミック(Web版)の作品ページにタグ機能が追加されました。 これらのタグは、作品説明文から自動的に抽出されたもので、コンピュータに計算させた「作品のキーワードとして妥当な順番」に並んでいます。 今回は、このタグ機能が生まれるまでの物語をご紹介します。 問題提起 pixivコミックに携わる者として、以前から、次の2点を問題だと感じていました。 特定のジャンル(たとえばスポーツ)の漫画を探すのが難しい 「あわせて読みたい」作品がなぜ「あわせて読みたい」のか分かりにくい 私は、社会人になってから、大好きなスポーツが共通する人とスポーツをすることの果て
機械学習の中でも、応用範囲の広さから注目を浴びている「ディープラーニング」。この技術に魅せられ、エバンジェリストになろうと決意した男が日本ヒューレット・パッカードにいる。PC歴37年の“自作オタク”が、なぜディープラーニングにハマったのか。 人間の脳神経の仕組みをコンピュータ上に再現することで、人間の考え方に近い認識や判断をさせる「ディープラーニング」。この技術は、自動運転車や囲碁、将棋、自動翻訳など、日々の生活に関わる分野でも活用されていることから、耳にする機会が多くなっている。 しかし、世の中を変え得る技術として期待が高まる一方で、エンタープライズ分野への実用化は、まだあまり進んでいないのが現状だ。実証実験レベルで止まっている企業も多く、事例はまだまだ少ない。試してみたいが、何ができるのかよく分からない――そんな企業も多いだろう。 そんな中、ディープラーニングの可能性に魅せられ、エバン
開発環境を【その1】で確認したわけですが、動作確認に用いたサンプルが何をしているのか朧気にしかわかりません。 ということで、まずは基本を【記事1】で学習します。 【記事1】 TensorFlowのキーコンセプト: Opノード、セッション、変数 - Qiita データフローグラフのプログラミングは初めてです。MatlabのSimulinkもそのうちやりたい…。 ふむふむ【記事1】では基本がとてもわかり易く書いてありますね。 ただ、まだデータフローグラフを見たことがないので実感がありません。 そういえばtensorboardとかいうデータフローを確認するツールがあったような気がします。ただ、ツールから調べても脇道にどんどん進んでいってしまうので、まずはイメージしやすい例でtensorflowに慣れていきたいと思います。 まずはテンプレートのMNISTを使って遊びます。 ちなみにMNISTはMi
今回のネタは TensorFlow を使っていると、いつも目にしていた警告について。 それは、次のようなもの。 W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.1 instructions, but these are available on your machine and could speed up CPU computations. W tensorflow/core/platform/cpu_feature_guard.cc:45] The TensorFlow library wasn't compiled to use SSE4.2 instructions, but these are available on yo
おはようございますこんにちは、こんばんは、初めましての人は初めまして、GMOペパボの情報システムグループでエンジニアをしている西畑です。 今回は私が作成したbotについての話をしたいと思います。どのようなbotかというと、ペパボ内での制度や日々の困り事があった時にどの部署に問い合わせるのがよいのかを推薦してくれるbotです。 ここでの困り事とは、技術的に分からない事やお客様への対応方法がわからないというような業務のスキルに関するものではなく、例えば使っているPCが壊れた、経費精算の仕方がわからないといった業務上必要になる雑務的なものを処理する上での困りごとを指します。 社会人の方であれば、経費精算や備品のトラブルで何処かに対応を依頼するという経験をしているのではないでしょうか。学生でも似たようなケースはありそうですね。 そういった、いわゆる組織内の取り決めやフローについて疑問を抱いていたと
deeplearn.js is an open-source library that brings performant machine learning building blocks to the web, allowing you to train neural networks in a browser or run pre-trained models in inference mode. We provide an API that closely mirrors the TensorFlow eager API. deeplearn.js was originally developed by the Google Brain PAIR team to build powerful interactive machine learning tools for the bro
Googleから発表された機械学習のためのJavaScriptライブラリのdeeplearn.jsを眺めてみたので、纏めておきます。 オフィシャルを舐めて、どういうものか、これからどんな感じになっていくか(いってほしいか)をダラっとタレます。 注意 眺めたのはv0.1.0なので、内容が今後大幅に変更になる可能性があります(というかある)。 触った環境 MacBook Pro (Retina, 15-inch, Mid 2015) - プロセッサ: 2.5GHz Intel Core i7 - メモリ: 16GB 1600 MHz DDR3 - グラフィックス: AMD Radeon R9 M370X 2048 MB Chrome 60.0.3112.101 (Official Build) (64ビット) deeplearn.js v0.1.0 Exampleを眺める 何ができるかを眺める
コーディング不要で、ディープラーニングのプログラムを生成できるソフトウェア「Neural Network Console」を、ソニーが無償提供。 ソニーは8月17日、コーディングの知識がなくても、ディープラーニング(深層学習)のプログラムを生成できるソフトウェア「Neural Network Console」の無償提供を始めた。自社の製品・サービス開発にも利用しているツールを多くの開発者や研究者に使ってもらうことで「ディープラーニング技術の発展につなげる」という。 同社は今年6月、ディープラーニングのプログラムを生成する際に使うコアライブラリー(基盤ソフトウェア)「Neural Network Libraries」(以下、Libraries)をオープンソース化した。人間の脳を模倣した「ニューラルネットワーク」の設計、製品・サービスへの搭載を効率化する演算モジュール群だが、利用には高度なプロ
SONY『深層学習モデルの開発ハードル無くそう』 TensorFlow、Keras、Theano、Caffeなど。これまでディープラーニング向けライブラリといえば、海外勢が圧倒的…という状況でした。 が、そんな状況が いきなりひっくり返る かもしれません。 なんとあの SONY がGUI&プログラミングいらずなAI開発ツールをリリース。突如無料で開放してくれたんです。 関連記事:ディープラーニングとは|AI・人工知能・歴史・仕組み・学習手法・活用事例 関連記事:ニューラルネットワークとは|AI・人工知能・仕組み・歴史・学習手法・活用事例 その名も『Neural Network Console』 ざっと紹介するとつまり “簡単にディープラーニングを行えるGUIツール” ということなんですが、なにより『ヤバイ』のが下記の特長点。 Windows対応!! というわけで伝えるべき点が多すぎるリリー
概要 現在の日付を$T$とすると、$T+1$から$T+30$までにおける日次価格の単純移動平均をDeepLearningを使って予測し、 ロングポジションを持った(もしくはショート)時の価格より、予測した移動平均を上(下)回れば利益確定するようなシミュレーション売買を行いました。また、30日保持したら強制的に手仕舞いするようにします。 エントリーは日時毎に残高があれば全力で行うようにします。 ※オレンジのラインが30日後の30日単純移動平均になります。緑がx軸の日付時点における為替価格です。 使用したDLフレームワーク chainer ver1.3~1.5 ちょうどver1.5で互換性が大幅に変更になって、対応するのが大変でした。 2017/8現在はver2.0.2になっているみたいですね。 使用データ みずほヒストリカルデータ https://www.mizuhobank.co.jp/r
MIT、機械学習を用いてストリーミングビデオのバッファリングを減らす映像配信システム「Pensieve」を開発。既存より最高30%減少でユーザー体感品質もUP。次はVR配信をテスト 2017-08-15 マサチューセッツ工科大学(MIT)の「CSAIL(Computer Science and Artificial Intelligence Laboratory)」は、機械学習を用いて既存のシステムよりも再バッファリングの少ないストリーミング体験を提供することができる映像配信システム「Pensieve」を開発、論文にて発表しました。 Neural Adaptive Video Streaming with Pensieve(PDF) YouTubeなどは、視聴者の通信環境に応じて自動的にコンテンツの品質を変更する「ABR(アダプティブビットレート)」アルゴリズムを採用しており、ユーザーが感
Googleは「Gmail」に、専用機械学習モデルに基づくフィッシング検出など、複数のセキュリティ機能を追加した。 Gmailで受信されるメッセージの50~70%がスパムメールだが、Googleは機械学習を採用することによって、スパムやフィッシングのメッセージを99.9%を超える精度で検出できるという。 同社の最新機械学習モデルは、一部のメッセージ(平均でメッセージ全体の0.05%未満)をさらなるフィッシング分析のために遅延させることによって、この処理を改善する。 Googleによると、同社の新しい検出モデルによってURLクリック時の新しい警告も生成され、疑わしいリンクをクリックした場合に警告メッセージがユーザーに表示されるという。新しいパターンが検出されるにつれてモデルが適応していき、時間の経過とともに改良されていくという。 またGoogleは、保護すべきデータを誤って社外の人物に送信し
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く