shunk031のブックマーク (182)

  • 言語処理学会第25回年次大会(NLP2019)に一般発表とスポンサーで参加しました - Gunosyデータ分析ブログ

    こんにちは、研究開発チームの関です。 でんぱ組.incの推しである相沢梨紗さんと、妄キャリの推しだった桜野羽咲さんのコラボユニットが格的に活動を開始しました。 生きてるといいことありますね。ステージ上の目のやり場に困っています。 今回3/12 ~ 3/15に名古屋大学で開催された言語処理学会第25回年次大会に一般発表とスポンサーとして参加しました。 言語処理学会年次大会へのスポンサーは今年で4年目になりますが、一般発表は初めてになります。 (昨年は論文賞をいただき、招待講演をさせていただいておりました。) data.gunosy.io 一般発表 一般発表では、Gunosyで研究開発チームでインターンをしている北田 (shunk031) が「広告クリエイティブ自動生成にむけたマルチタスク学習とConditional AttentionによるCVR予測」という題目で発表を行いました。予稿はこ

    言語処理学会第25回年次大会(NLP2019)に一般発表とスポンサーで参加しました - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/04/05
    広告クリエイティブの評価に関する研究で一般発表してきましたー!
  • メルカリの写真検索を支えるバックエンド | メルカリエンジニアリング

    メルカリのAI EngineeringでTech Leadを務めている中河です。今回は3/18に正式リリースされた「写真検索機能」を支えるバックエンド・インフラをシステム側からの視点でご紹介します。 写真検索とは 所謂、画像検索機能で商品名を知らなくても画像から商品を検索できる機能の事です。詳しくは下記の公式リリースをご覧ください。 about.mercari.com 基的な写真検索の仕組みは、Deep Neural Networks (DNN)を使用して商品画像から特徴ベクトルを取得し、取得した特徴ベクトルをApproximate Nearest Neighbor Index(ANN Index)に追加して画像indexを構築。 検索時には同じく商品画像からDNNを介して特徴量ベクトルを取得し、ANN Indexから検索します。 アーキテクチャの概要 Figure1 上記がアーキテクチ

    メルカリの写真検索を支えるバックエンド | メルカリエンジニアリング
    shunk031
    shunk031 2019/03/25
  • Grad-CAMを使ったNLPモデルの判断根拠の可視化 - やむやむもやむなし

    機械学習モデルの解釈性は業務で使う上ではなぜそのような予測を行ったかの判断根拠の可視化として、また学習させたモデルをデバックする際にどんな入力に反応して誤予測を引き起こしてしまったか分析する上で非常に重要な要素です。 画像分野ではGrad-CAMと呼ばれる勾配を使った予測根拠の可視化手法が提案されており、今回はその手法を使ってNLP向けのCNNモデルの判断根拠を可視化していきます。 実験で使用したノートブックはGithub上で公開しています。 github.com 機械学習モデルの解釈性 機械学習モデルに対する解釈性は近年では特に重要なトピックです。例えば 業務の自動化を機械学習で行う場合に説明責任が生じる DNNのデバッグをして性能改善を行いたい といったときに機械学習モデルの解釈性は必要になります。 機械学習モデルの解釈性についてはステアラボ人工知能セミナーでの原聡先生の資料がとても分

    Grad-CAMを使ったNLPモデルの判断根拠の可視化 - やむやむもやむなし
    shunk031
    shunk031 2019/03/19
    NLPのモデルにCVからの手法であるGradCAMを使った判断根拠の可視化の話。ここらへんはちょうど去年の言語処理学会で発表した話で僕もやったことあるのですが、それっぽいところが活性化していたので割と妥当なのかも
  • 結婚しました。|鈴木天音

    日、2019年3月9日に豊島区役所に婚姻届を出して入籍しました。 相手は3つ下のサークルの後輩です。僕はもう修了するだけですが、学生結婚と言っていいでしょう。研究室やサークルの友人には話していましたが、高校同期にはほとんど話していなかったですね。驚く顔を想像して少しにやりとしてしまいます。 結婚に至った経緯交際を始めたのは僕が大学4年生の12月でした。2年3ヶ月ほどの交際です。博士課程への進学を希望しているため、どのタイミングで結婚しても学生結婚になります。であれば早く結婚して2人での生活を始めたほうが良いと判断しました。結婚前に同棲したいという話を両親に伝えたところ、それだけ大切な相手が出来たなら結婚するべきだという意見を貰ったことで格的に結婚に向けて動き始めました。 スケジュールとしては、昨年8月に結婚することを決め、9月に互いの両親への挨拶、12月に両家顔合わせを行いました。

    結婚しました。|鈴木天音
    shunk031
    shunk031 2019/03/10
    おめでとうございます🎉🎉
  • 大学院を修了(?)・株式会社レトリバを退職し,クックパッド株式会社に就職します|himkt

    TL; DR修士(シュレディンガー)の @himkt です. 当に修了できるのかよくわかっていませんが, 予定としては今年の3月に筑波大学の大学院 (図書館情報メディア研究科)を修了し, 春からクックパッド株式会社でリサーチエンジニアをします. 就活エントリしゅーかつエントリというやつを記念に書きます. もっと綺麗事だけではなくぶっちゃけた話を聞きたいぞ,みたいな人は直接会った時に聞いてください... 😏 就職活動にあたっては大変お世話になったレトリバ,勢いがめっちゃあって面白いことしてそうだったメルカリから内定をいただきました (当にありがとうございました),どうしようかな, としばらく考え,結果的にクックパッドに行こうと決めました. (ちなみに,緑色の会社とかSNSの会社とか外資コンサル企業を受けて落ちた話, メーカーと,ウェブ系および研究系の企業の選考を受けたけど途中で辞退した

    大学院を修了(?)・株式会社レトリバを退職し,クックパッド株式会社に就職します|himkt
    shunk031
    shunk031 2019/03/10
    おめでとうございます🎉
  • Pythonのパッケージ周りのベストプラクティスを理解する - エムスリーテックブログ

    砲撃する自走砲(PzH2000自走榴弾砲)。自走砲は戦車によく似ていますが、戦車ではありません。*編とは関係ありません。 こんにちは、エムスリー基盤開発チーム小です。 Pythonのパッケージ管理周りでは、 「setup.pyでrequirements.txtを読み込むのが普通なんですよね?」 「pipenv があれば venv はオワコンなんですね?」 「pyenvは要らないんですよね!?」 「Python歴史が古い分、Rubyなどに比べてカオス」 みたいな混乱をよく目にします。 実際、複数のツールがあって(一見)複雑です。また「なぜこうした状況にあるのか」がドキュメント化されているわけでもありません。 なので、私なりに整理してみることにしました。 ※「追伸」を追加しました。この記事では汎用プログラミング言語としてPythonを使うケース(Webアプリとか、CLIツールとか、ライブ

    Pythonのパッケージ周りのベストプラクティスを理解する - エムスリーテックブログ
    shunk031
    shunk031 2019/03/03
    pipenvようやくなぜ必要なのかわかった goのdepとかrubyのgemに比べてrequirements.txtって貧弱だなっておもってたけど、それをpipenvが担ってくれるわけですね
  • NLP前処理ツール「chariot」とPyTorchで日本語テキスト分類 - やむやむもやむなし

    chakki-worksが発表した自然言語処理の前処理ツール「chariot」をさっそく動かしてみました。 公式サンプルは英語でのコードだったので、せっかくなので日語のデータを使ってPyTorchの日語分類モデルの学習を行ってみました。 chariotのgithubはこちら github.com 実験で使用したコードはGithubにもあげています。 github.com chariotとは chariotは自然言語処理の前処理のパイプラインを構築するためのツールです。 前処理を実行するPreprocessorに前処理をstackしていくことで、パイプラインを構築していきます。 公式の紹介記事では以下をポイントにあげています。 chariotでは、以下3点をできるようにしました。 - 前処理を宣言的に定義できる - 前処理が簡単に保存できる(パラメーターごと) - モデルの学習にたどり着

    NLP前処理ツール「chariot」とPyTorchで日本語テキスト分類 - やむやむもやむなし
    shunk031
    shunk031 2019/03/03
    めっちゃ便利なやつ!早速使ってみたいです
  • Web IntelligenceとIEEE Bigdataで発表してきました - Gunosyデータ分析ブログ

    こんにちは、研究開発チームの関です。 夢眠ねむ卒業公演素晴らしかったですね。WWDBestで膝から崩れ落ちました。近年におけるアイドルのあり方として一つの完成形をみた気がします。夢眠ねむさんとでんぱ組さんの今後のご活躍を引き続き応援しています。 今回のブログでは2018年12月3日〜6日に行われたWeb Intelligence(WI) 2018と2018年12月10日のIEEE Bigdata 2018のWorkshopに参加&発表してきましたのでその報告をさせていただきます。 当社として、そして個人としてもはじめての国際会議参加&発表でした。とても良い経験になりました。 Web Intelligence 2018 Web Intelligence(WI)はウェブに関する国際会議の一つです。 セマンティックウェブとかソーシャルメディアとか推薦システムとか、応用よりで学際的な研究に焦点が当

    Web IntelligenceとIEEE Bigdataで発表してきました - Gunosyデータ分析ブログ
    shunk031
    shunk031 2019/01/15
    短期間に2本国際学会発表してて強い…
  • 第6回:ゼロから始めるデータ分析人材の育て方

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 昨今、多くの企業が抱えている問題の一つとして、データ分析人材、特にデータ分析を専門とする技術者(データサイエンティスト、人工知能AI〉開発者、コンサルタントなど)の不足があります。その一因には、人材の育成が追い付いていない現状が挙げられます。 今回は、200人を超えるデータ専門家の人材育成に関わった経験を持つ筆者(=佐野遼太郎)が自らの成長体験を踏まえつつ、その取り組み方や伸びる人材の特徴を解説します。ちなみに、ここで育成の対象となるのは、これから初めて機械学習モデルを作る人とします。 知識ゼロからの機械学習の学び方 まずは、筆者自身の体験をもとにデータ分析技術者の卵がどのように機械学習に取り組むべきかを書きます。 ・理論(中身)の理

    第6回:ゼロから始めるデータ分析人材の育て方
    shunk031
    shunk031 2019/01/03
  • 誰も気付いていないTikTokの本当のイノベーションを語る - toricago

    TikTokは良い動画が一瞬でバズりやすい。それは例え、あなたの最初に投稿した動画だったとしても。これはYouTubeと対極的である。YouTubeでは無名の人がどんなに面白い動画を投稿しても、そもそも誰にも見てもらえない。YouTubeで毎日毎日面白い動画を投稿し、たまたま見てくれた人が読者登録してくれたりして、数ヶ月、半年と努力を継続しなければならない。 一言で表せば、YouTubeは「信用経済」「評価経済」時代のプラットフォームなのである。 たくさんの登録者数を持つYouTuberが強い。少ない登録者数しか持たないYouTuberは弱い。弱いYouTuberは、たくさん登録者数をゲットするまで、修行する。そういう世界だ。 一旦インフルエンサー級まで自分の信用や評価を蓄積することができれば、後は自由自在に動きやすい。他のYouTuberともコラボしやすいし、企業案件もどんどん舞い込んで

    誰も気付いていないTikTokの本当のイノベーションを語る - toricago
    shunk031
    shunk031 2019/01/03
    TikTokのサービス上の特性を使って上手くコールドスタート問題を回避してるって話良かった
  • Factorization Machineの実装と数値検証 - エムスリーテックブログ

    はじめに あけましておめでとうございます。エンジニアGの西場です(@m_nishiba)。AI機械学習チームで自然言語処理や推薦システムの開発を行っています。 Gunosyのデータ分析ブログのDeepなFactorization Machinesの最新動向 (2018)を読んでFactorization Machineに興味を持ち調査しました。 Factorization Machine Factorization Machine(FM)はSVMとFactorization methodを組み合わせたような手法です。 詳しくは下記の論文を読んでください。 Factorization Machine FMを用いることで、スパースなユーザー属性情報等の交差項の重みを効率的に計算することができます。 つまり、下記のような回帰モデルを考えたときに [tex: y(x)=w_0 + \sum{i=

    Factorization Machineの実装と数値検証 - エムスリーテックブログ
    shunk031
    shunk031 2019/01/03
  • MeCab-python3でsurfaceがうまく取れない - tetsuのlog

    どうもはじめまして!!! テツです!!!!!!!!!!!!!!!!!! 自己紹介はまた今度やります 研究で自然言語処理をやろうと思い、mecabで形態素解析やるぞ!!と意気込んでいたところ躓いてしまいました。 今回はそれの解決方法について書きたいと思います。 環境 MacOS Mojave python3 mecab-python3 とりあえず解析してみた とりあえず、解析 なんかsurfaceの値がおかしい、、、 普通にparseでやるとうまくできる! あとコマンドのmecabでもうまくできます! 解決法 5回くらい現実逃避しつつ、ググりまくりました! 結果は、最新バージョンのバグでした!! github.com とりあえず先輩と同じバージョン(mecab-python3 0.7)にしてみたところ、 できました!!! これで僕も自然言語処理できるようになりました。よかった 以上、初投稿で

    MeCab-python3でsurfaceがうまく取れない - tetsuのlog
    shunk031
    shunk031 2018/12/28
    研究室の後輩が記事を書いてた〜 mecab-python3の最新版入れるとsurfaceがいい感じに取れない話の解決策みたい
  • CMU教授直伝の論文の書き方 - でかいチーズをベーグルする

    CMUに留学している時にFaloutsos教授に教わった論文の書き方をまとめる。この書き方に従うことで論文の採択率がかなり上がった。今となっては自分的に当たり前のことだし、できる研究者の皆様は自然と守っていることも多いと思うけど良い論文を書きたいと思っている学生とかに参考にしてもらえたらと思う。ただし、Faloutsos教授に教えてもらったことを一旦自分で噛み砕いてからまとめたものなので自分の主観とかが混じってしまっているかもしれない。 主語が大きくならないように予め断っておくけど、この書き方はもちろんすべての論文に対して当てはまるわけじゃなくて以下の前提条件がある。 国際会議論文である データマイニング関連分野の論文である 論文誌とか卒論とかもっと長めの論文を書くときは当てはまらない項目もあるし、データマイニング関連分野以外の論文を書いたことが無いのでそれ以外の分野の論文に当てはまるかも

    CMU教授直伝の論文の書き方 - でかいチーズをベーグルする
    shunk031
    shunk031 2018/12/27
  • 都内に引っ越す際の物件選びの話 - 未来永劫

    はじめに 東京に引っ越すのは初めてなので,東京のクソ不動産と戦うために役立った情報などを記事で掲載する. 自分自身は,完全紹介性の不動産業をしている方とやりとりを行なった為,特段苦しい出来事は発生しなかったが調べて役に立った情報もあるのでまとめて開示する. メモなので走り書きですが,これから都内に引越しを検討している方の役に立てば. はじめに 不動産に聞いた「分かりやすいクソ不動産」の見分け方 不動産に聞いた「ベストな物件選びシーズン」 自分の要求物件について 希望賃料 希望する物件の条件 MUST OPTION(あると良い) 物件探しのスケジュール 物件探し 内見 持ちもの 現地に行く前に確認する事 現地で確認する事 契約にあたっての交渉 交渉で値切れるもの 交渉するタイミング 仲介手数料に関して その他雑感 参考文献 不動産に聞いた「分かりやすいクソ不動産」の見分け方 不動産の店舗前

    都内に引っ越す際の物件選びの話 - 未来永劫
    shunk031
    shunk031 2018/12/27
  • DeepなFactorization Machinesの最新動向 (2018) - Gunosyデータ分析ブログ

    はじめに こんにちは。研究開発チームの関です。 最近毎週日曜日の恋するワンピースの更新を楽しみに生きています。好きなツッコミは「この船の航海士は誰?」です。 あと虹のコンキスタドールのベストアルバム「THE BEST OF RAINBOW」は皆さん買いましたか? 健康にいいので毎日聞きましょう。 この記事はGunosy Advent Calendar 2018の22日目の記事です。 昨日はcou_zさんの「【年末年始に読みたい】Gunosyエンジニアが2018年に購入した書籍まとめ」でした。 皆さんFactorization Machinesは好きですよね。 予測モデル構築においてはXGBoostと並んでとりあえずやっておくべき手法として知られています。 今回のエントリではKDD2018で発表されたxDeepFMを読み解きながら、 DeepなFactorization Machineの現状

    DeepなFactorization Machinesの最新動向 (2018) - Gunosyデータ分析ブログ
    shunk031
    shunk031 2018/12/22
    深層学習xFMは各々のいいとこ取りなので良さみが深いです
  • 2018年のxonshrc - Stimulator

    - はじめに - この記事はXonsh Advent Calendar 2018 - Qiita最終日の記事です。 私のxonshrc、業務用のコマンドとか含めると大体1500行くらいあるんでgithubで公開するんじゃなくて一部ずつ切り取ってここで紹介しようかなと思いました。 なんか作る時の参考になれば幸いです。 - はじめに - - 基的な設定 - 環境変数 aliases xontrib - ライブラリ周り - import, xontrib_load時の自動install importの遅延ロード - 認証周り - 1passwordを利用したpassword, one-time-passwordの取得 sshの自動化 ssh-hostの管理 gitアカウントの管理 - 移動、操作 - 履歴の取得 dirの保存 keybindings - other - google-trans

    2018年のxonshrc - Stimulator
    shunk031
    shunk031 2018/12/21
    ssh周りでxonshの力借りるのめっちゃ便利そう。設定してみる
  • 博士課程に進むときに考えたこと | blog.makky.io

    これは klis Advent Calendar 2018 18日目の記事です。 筑波大学 知識情報・図書館学類を卒業して、今は筑波大学 図書館情報メディア研究科のM2で、来年度は同じ大学院の博士後期課程に進学することになっています。 自分は大学院を卒業するときに、就職するか進学するかでだいぶ悩んで、最終的に進学することを選びました。 はっきり言って博士号取れるかなんて現時点では分からないし、みんな進学するべきみたいなことを豪語することは出来ません。自分も数年後に「大学院はクソだ」と言って退学して、全く別のことをしている可能性も大いにあります。 だけど、数年後の、研究がダメでエモくなっている自分にとって、博士課程に進もうと思ったきっかけが何かのモチベーションに繋がるかもしれません。なので、あくまで数年後の自分に伝える感じで、進学しようと決めるまでに考えたことを書いてみようと思います。 読ん

    博士課程に進むときに考えたこと | blog.makky.io
    shunk031
    shunk031 2018/12/21
  • 就職する時に考えたこと - 未来永劫

    はじめに blog.makky.io nzw0301.github.io 知人によるハートフルな記事を読んで自分も何か書こうと思う。 多分、ssとかhimktとかも書くでしょう(雑なフリ)。 と言われたのであんまりネタが無いけど書く. 既に以下の記事で自分の就活情報は開示しているので,もうちょっと私事を多めに書く. note.mu 就職しかする気が無かったのか? そんな事はない. 高専からの大学編入をしている身なので,当然博士課程進学は考えていた. 事実,B1の段階で研究もどきを経験して,B2で査読なしではあるが学会発表も経験していたので,一般の大学生よりはアドがあったと思う. B3では企業で研究っぽい事をやらせてもらえていたし,B4の査読なしはベストプレゼン賞(笑)みたいなの取ったしM1の国際会議は落ちたが最近別の奴が通ったので発表でフィリピンに行っていた. 後述する「進学しない理由」を

    就職する時に考えたこと - 未来永劫
    shunk031
    shunk031 2018/12/21
  • Goで多層キャッシュを実装するときに役立つtips - Gunosy Tech Blog

    こんにちは、メディア事業部所属の石塚(@ij_spitz)です。こちらはGunosy Advent Calendar 2018、4日目の記事です。なお、昨日の記事は@timakinさんのGoで多層キャッシュ実装と@aibouさんのInfrastructure as Codeの心構えでした。 何を書くか全然決めてなかったのですが、昨日@timakinさんがGoでの多層キャッシュの実装ポイントについて書いていたことに加えて、僕も最近業務で多層キャッシュについて取り組んでいたので、Goで多層キャッシュを実装するときに役立つtipsについて書きたいと思います。 ちなみに僕は多層キャッシュのことを多段キャッシュと呼んでいましたが、曖昧さを解消するために記事では多層キャッシュで統一します。 なぜ多層キャッシュを使うのか 多層キャッシュ自体については昨日のブログで既に説明されているので詳細は控えます

    Goで多層キャッシュを実装するときに役立つtips - Gunosy Tech Blog
    shunk031
    shunk031 2018/12/04
    じゅんじゅんさんいつのまにかgoエンジニアになってた
  • 6年勤めたNTTを退職しました - Software Transactional Memo

    最終退社時の自分の机 2012年に修士卒からの新卒でNTT研究所に入り、6年間お世話になりました。 研究所では同期や先輩や後輩や上司に恵まれ、存分に書籍や論文を読んで勉強して力を蓄えたり、対外的な発表の場にも恵まれ外ではできないような体験をすることができました。 ありがとうございました。 入社当時に作られたtogetterを見返すと togetter.com togetter.com まるで昨日のように感じられる。 NTT社内で僕が何をやっていたかについては言える物は軒並みアウトプットされているのでわざわざここでは触れない。 NTT研究所について NTT研究所を客観的に見た時にどうかを書いていく とにかく人に恵まれている。採用の倍率が高いのもあって潤沢な学生エントリーからよりすぐりのエリートが謎の力でポテンシャルを見極められて採用されている。同期を見てひと目ですごい奴も居れば、一見してわか

    6年勤めたNTTを退職しました - Software Transactional Memo
    shunk031
    shunk031 2018/11/26
    評価はエモさではなく💰で、それはそうみたいになった