サクサク読めて、アプリ限定の機能も多数!
トップへ戻る
猫
medium.com/@chezou
ターゲットとしている記事は、上記の記事から抜粋すると 「自分が専門とする分野の解説を、関連する他分野の技術者や若者に向けて残しておきたい」「公開したい技術文書があるけれど、論文のようにフォーマルな内容ではないから、個人ブログで公開するしかないかな」「技術書を書きたい。でも、いきなり本を一冊書くのは大変だ」という感じです。「仕事ではじめる機械学習」のときも思いましたが、プロに編集していただくと、自分の思考や考えが理解されやすい形に整理されるというメリットがとても大きいので、知ってもらいたいネタがある人は是非応募して欲しいと思っています。 でも、「いきなり雑誌の寄稿とか…」と思う方の助けになればと思い、自分がしたことなどをまとめていこうと思います。 1. 寄稿する決意を固める2018年11月頃に keiichiro shikanoさんから、「こういうような雑誌を立ち上げたいんだけど、BERTの
こんにちは、日本語のテキスト処理してますか。 最近はBERTやらTFhubで使えるのEmbeddingのモデルが一段と増えてきて、楽しいですね。BERTで用いられるWordPieceや、MeCabの作者としても有名な工藤さんの新作、SentencePieceといった新しいTokenizerが出てくる一方で、TFhubで用意されているNNLMのtokenizerは公開されていないので結局MeCabで頑張らないといけない(少なくとも当初Tokenizerなんて要らないよという返事をされた)など、2018年の今でもMeCabの重要性は変わらず続いています。 そこで、今回はWindowsでも形態素解析をしたいという人にどうしたらいいんだっけという話の2018年12月版をしたいと思います。 tl;dr64bit版のMeCabインストーラーが欲しい場合はikegami-yukinoさんのこちらの非公式
RISELabのStack上の図のオレンジと緑の部分が彼らが作っているフレームワークになるのですが、その中でも以下のものについての紹介がありました。 RAY, RLlib, Tune: Pythonの分散処理フレームワークRAYと、それを使った強化学習ライブラリRLlib、パラメータチューニング用のライブラリTuneFlor: MLのモデル作成のための実験をtrackingするためのライブラリClipper: MLモデルのServing用のAPIサーバを立てたり管理するためのライブラリPyWren: AWS Lambdaを使った並列処理のためのライブラリOpaque: Apache Sparkを使った暗号化したDataFrameを処理するライブラリWAVE: Decentralised authorization for IoTtl;drという名の感想機械学習エンジニアリングは複雑で、モデ
気づけば入社して2ヶ月ほど経ってしまいましたが、Treasure Dataに入ったと思ったらArmに入社していました。 Machine Learning teamの3人目のエンジニアとして、HivemallやTD上での機械学習周りの開発と、お客様へのコンサルティング等々をやっていきます。振り返ってみるとML的に強い人と同じチームで仕事するのは初めてな気もするので、楽しいです。 入社2日目には話すことが決まっていたPlazma tech talkのスライドはこちらです。TD上でのML何ができるんだっけという話の整理と、今開発中のpy> operator on TDを使うと何がML的に嬉しいんだっけという話を書いています。個人的にはIoTを考えた時のエッジでの予測みたいな話も見据えたcapabilityの広がりが大きいところかなと思っています。
現在の自分の肩書である「セールスエンジニア」という仕事がどのようなものか知らない方も多く、毎回説明するのが大変なのでブログ記事にしました。セールスエンジニアという仕事はなかなか馴染みがありませんが、20代後半から30代のITエンジニアの… ただ、Clouderaのセールスエンジニアのロールは継続的に使っていただくために割となんでもするという感じで裁量も大きく、Field Data Scientistという風に名乗らせていただいて、Spark周りのBig Dataの話とデータ活用の話、それから機械学習の話を幅広くさせていただきました。 おかげさまで、国内外での発表も色々とさせていただきましたが、USのエンジニアブログにも5本ほど執筆させてもらい、Strata Data Conference Singapore 2017での発表や、自社の全エンジニアが集まる社内テックサミットでの発表などかなり
タイトル通り日本ソフトウェア科学会の研究会、機械学習工学研究会キックオフシンポジウムに登壇しました。@bonotake さんから声をかけられた時はカジュアルに受けたのですが、蓋を開けてみれば大御所の方々ばかりで恐縮しながらの発表でした。 僕の発表内容としては、書籍「仕事ではじめる機械学習」の話からデプロイパターンの話と、機械学習特有の難しさはどこから来るのかという話をしました。
長い間、Pythonでパッケージを作った場合、構造化されたドキュメントを使う場合は、reStructuredText (reST)でドキュメントを書く必要がありました。 ところが、aodag さんに教えてもらったのですが2018年2月にアクセプトされたPEP 566のおかげで、PyPIのドキュメントがtxtかreSTでなければいけないという制約が外れました。そこで、昨日新しくなったばかりのPyPIでMarkdownがレンダーできる方法を試してみました。 (必要に応じて)ライブラリをupgradeするMarkdownが扱えるようになったのは、setuptoolsのv38.6.0からです。古いバージョンだとMarkdownがレンダーされないので、合わせてpipとwheelをupgradeしておきました。 $ python -m pip install --upgrade pip $ pip i
さて、「ワンオペ育児」という単語を聞いたことはあるかと思います。読んで字のごとく、一人で子育てをすることです。牛丼チェーンのワンオペで深夜対応すると言うところから転じてできた言葉だと思いますが、僕自身仕事がら海外出張1週間とか結構あるので、出張中「ワンオペ育児辛い」という疲弊したメッセージが妻から届くこともしばしばありました。 まぁ、そうは言っても仕事だし仕方ないよねと思いながら申し訳ない気持ちでいっぱいだったのですが、幸か不幸か妻が利き手を手術し数ヶ月使えないという展開になりました。そう、僕のもとにもワンオペ育児がやってきたのです。 我が家は、小学校低学年1人と幼稚園児が1人という4人家族です。実家はお互い現在居住地から遠く、ヘルプはあてにできない状況。今でこそ包丁は握れないけど、力のいらないことならできるようになってきたので、かなり分担できていますが、術後当初は二人いる子供の面倒を見な
どういう本なの?まえがきのスクリーンショットを貼りましたが、この本は多くの機械学習の本とは異なり、機械学習の実務で使えるようになるために知りたい、機械学習を含めたシステムのアーキテクチャや機械学習プロジェクトの進め方、効果検証をどうするのかということをまとめました。 めざすところのイメージ既に多く刊行されているTensorFlowやChainerでディープラーニングをしてみようというものでもなければ、機械学習の理論をわかりやすく解説するといった類のものでもありません。ゼロから作るDeep LearningやCourseraのMachine Learningで学んだけど、実際の仕事に活かすにはどうしたら良いだろう?という疑問に答えているつもりです。また、大学の講義などで機械学習は学んだけど、実際仕事で機械学習のプロジェクトを進めるときはどうすればいいんだろう?という人にも得るものがあると思い
2年ぶりにPyConJPに参加しました。2日間参加してきたので、メモがてら書いていきます。 興味深かった話 pandasとdaskのコミッターのshinhrksさんの基調講演。pandasに対してどうコントリビュートしているかという話を中心に、OSS活動をしていこうと思わせる(1日目とは打って変わって)良い基調講演でした。 特に印象的だったのが、pandasの中ではAirspeed Velocityを使ってCIでベンチマークを取りコミット間の処理速度が低下していないかを検出しているという点です。Pythonのパッケージなので、他の言語では難しいかもしれないということです。ともすると速度のデグレは気づきにくいことも多いですが、OSSでそこまできっちり見ているのは素晴らしいと思いました。
機械学習ブームなどにより、 Python を触り始める Rubyist が増えてきたと思います。その際に問題になりやすいのが環境構築です。Rubyだと rbenv がデファクトスタンダードになっているのに、なぜか Python に… 私の立ち位置もともとは、数年前まで 年に一回Python3でNLTKやらscikit-learnやら機械学習や自然言語処理の環境を作ろうと試みては失敗してPython使うものかと思っていた人でした。それが、Anacondaで環境導入すると、面倒なことは何も考えずに済むということを知り、CookpadではAnacondaを前提に環境構築を勧めていました。 今は、ymotongpooに「郷に入っては郷に従え」と言われたため、pip+virtualenv/venvで全てをこなしていますが、これで困ったことは特にありません。macOS, Windows, Linuxそ
英語版はこちら。 TensorFlowの登場以降、OSSベースの機械学習の盛り上がりは加速しています。Kerasの作者のFrançois Cholletさんの言葉が、この状況を非常に端的に表しています。これだけでも十分だとは思いますが、この記事では、なぜオープンソースの機械学習が強いのか、最近のどういった流れがあるのかを整理したいと思います。 tl;dr機械学習やDeep Learningのフレームワークが充実してきた論文が査読前に公開され、他社も簡単にアルゴリズムの検証ができるようになった多くのプレーヤーの参戦により、アカデミアでの機械学習の研究がレッドオーシャン化した他社にないアルゴリズムで一発勝負、実装は秘密、というアプローチが厳しい牧歌的な時代5年前10年前の世界では、先端の機械学習に取り組んでいるのは大学などの研究室、大企業の研究所や一部の先進的な企業がほとんどでした。特に、ラベ
Amazonでエリン・メイヤー, 田岡恵, 樋口武志の{ProductTitle}。アマゾンならポイント還元本が多数。一度購入いただいた電子書籍は、KindleおよびFire端末、スマートフォンやタブレットなど、様々な端末でもお楽しみい… よく「日本は」「海外は」という議論が巻き起こることがあるが、これはそもそもナンセンスだなとぼんやりと思っていたことを明確にしてくれた。それは、文化は国によって相対的なのだ、ということである。 無論、こう書くと「自分は日本人の中でも特殊だ」とかいう国の中での分散はもちろんあるのだが、それが当たり前と生まれ育ってきたものは何が特殊なのかは相対化しないと認識できない。本書の中では、「デンマークの赤ちゃんは氷点下でも外で昼寝をさせる」ということに対して、デンマーク人は特に違和感なく話しているという例が出ている。 これは、ただ国ごとにステレオタイプを列挙していると
Ubuntu 17.04 on 4k monitor基本的に、X1 Carbonに最初から入っているWindows 10がBitlockerが有効化されていてセキュアなので、以下を参照しながらデュアルブートにしました。(とはいってもうっかりUbuntu側をセキュアにし忘れた)
joker1007さんも煽っていることもあり、MacBook Pro Retina(2015) 15インチが重すぎてしんどいので、Thinkpad X1 Carbon(2017)を買いました。2.04kgから1.13kgへと大幅軽量化しました。外での打ち合わせや出張も結構増えてきて、Macは電源も含めると辛い重さになるので思いきって買いました。背中と腰が死にそうなので軽さは正義です。(msfmさん色々ご相談に乗っていただきありがとうございました!) 選定のポイントは 1.3kg以下英語キーボードメモリ16GB15万円くらいまでという条件で選んだのですが、最後まで残ったのはDell XPS13とX1 Carbonだけでした。最初は値段の安さと軽さに惹かれてZenbook 3をメインに機能と値段の比較表を書いていたんですが、途中で店頭でキーボード触ってみて、日本語キーボードだとホームポジション
人工知能学会(以下JSAI)で発表された論文が、Pixivのデータを「晒した」ということで盛り上がっています。詳細は、以下のtogetterを見ていただければと思いますが、ざっくり言うとPixivで公開されていた女性向けランキングトップ10の二次創作小説(R-18)に対して「有害表現」を分類するという目的で、作者名とURLを論文に書いて炎上したということになります。 なお、以下のまとめの片方はコンテンツ提供側に、片方が学術的な立場に偏ったものになっています。今回、これに対して一つの解決策になるかもしれないと思い、自分の考えを書きます。
Amazonでリンダ・リウカス, 鳥井 雪のルビィのぼうけん こんにちは! プログラミング。アマゾンならポイント還元本が多数。リンダ・リウカス, 鳥井 雪作品ほか、お急ぎ便対象商品は当日お届けも可能。またルビィのぼうけん こんにちは!… ルビィのぼうけんはパパが隠した宝石を見つけるために様々な謎を解いていくという、フィンランドのリンダさんが描いた絵本だ。本の後半には、練習問題があり、パズルのような謎で、子供としては楽しく算数のようなパズルを解いていく感覚で取り組んでいる。 例えば、人参、青リンゴ、ピーマン、オレンジなどを、緑グループと果物グループのベン図にそれぞれ配置する、なんて問題は幼稚園の頃には難しかったが、小学生になった今ではさらっと理解できるようになり、子供自身の成長を感じる。 ルビィのぼうけんの訳者のとりいさんはpodcastでも笹田さんと共にインタビューさせていただいたのだけれ
このポストは、最近もやもやっと思っていることを吐き出したポエムである。厳格なファクトチェックを経たものと期待しないで欲しい。 tl;drサイバー攻撃としてプロパガンダをばらまくことを行うハッカーグループがいる彼らはfake newsサイトをいくつも作って選挙等に介入している不正アクセスして得た結果を、自分たちに有利な情報をフィルターしてWikileaksに流し、ニュースの情報源をコントロールしている本文ここ最近、日本でも”fake news”という単語を聞くようになってきた。僕が聞いたのは、rebuild.fmでその単語が出てきたときだったが、何故出演者がFacebookも引き合いに出して、怒りを感じているのかがわからなかったので少し調べてみた。もちろん、足りない視点などあるとは思うので、見つけたらこっそり教えて欲しい。 日本語でフェイクニュースや偽ニュースと言うと、虚構新聞のことか、とか
このページを最初にブックマークしてみませんか?
『Aki Ariga – Medium』の新着エントリーを見る
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く