shunk031のブックマーク (182)

  • サムネイル画像に対するテキスト認識の性能比較について (Pytesseract / Google Cloud Vision API / Amazon Rekognition) - Gunosyデータ分析ブログ

    こんにちは。データ分析部アルバイトの北田 (@shunk031) です。好きなべ物は畳み込みニューラルネットワークです。 はじめに Gunosyでは広告を出稿する際に使用するサムネイル画像や広告画像において、テキストが占める割合の多い画像を把握したいといったニーズがあります。 Facebookの広告ポリシー*1では、広告内のテキストが過剰であるときに配信数が減ってしまったり、まったく配信されなくなる場合があるようです。 通常、画像から文字を読み取るOCR技術を利用することで前述のニーズを満たすことができそうです。 OCRを利用するにはPythonから使えるpytesseractや、Google Cloud Vision APIAmazon RekognitionといったクラウドベースのAPIを用いる方法があります。 これらpytesseract、Google Cloud Vision

    サムネイル画像に対するテキスト認識の性能比較について (Pytesseract / Google Cloud Vision API / Amazon Rekognition) - Gunosyデータ分析ブログ
    shunk031
    shunk031 2018/05/09
    :eyes:
  • 結婚式をした - Adventure

    - はじめに - 今日2018年5月6日、結婚式を挙げた。 どんな事やったか簡単に書いた上で、思った事をつらつら書く。 - はじめに - - 当日まで - きっかけから決定まで 費用と準備 準備で思ったこと - 結婚式当日 - 式中の話 会な話 結婚式を終えての感想とか - おわりに - - 当日まで - 最初に当日までどんな感じで進んだか適度に書く。 きっかけから決定まで きっかけはシンプルに「が気になると言ったから」だ。 この時は「気になる」であって、「実際何個か式場を見て予算も聞いて惹かれなかったり、キツそうってなったら諦めよう」くらいの会話をして、まず結婚式場を探す作業を一緒にやった。インターネットも見たし、TwitterのフォロワーからAmazon経由で贈られてきた無駄ゼクシィも少し役に立った。 「ガラス張りだと雨が降るとダルいね」「友達が多い訳でもないし家族婚良いかもね」み

    結婚式をした - Adventure
    shunk031
    shunk031 2018/05/06
    おめでとうございます :tada:
  • ゼロから作るDeep Learning学習備忘録(1〜4章) - OKKAH NET

    ゼロから作るDeep Learningの学習備忘録です。 ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装 作者: 斎藤康毅出版社/メーカー: オライリージャパン発売日: 2016/09/24メディア: 単行(ソフトカバー)この商品を含むブログ (18件) を見る github.com 目的 ・最低限の外部ライブラリだけ利用し、Pythonを使って、ゼロからディープラーニングによるプログラムを実装する。 ・簡単な機械学習の問題からスタートし、最終的には画像を高精度に認識するシステムを実装する。 1章 Python入門 ・Python: 汎用のプログラミング言語。コードがシンプルで扱いやすい。 ・Anaconda: データ分析などに必要なライブラリを一括してインストールできる。 ・NumPy: 数値計算のためのライブラリ。 ・Matplotlib:

    ゼロから作るDeep Learning学習備忘録(1〜4章) - OKKAH NET
    shunk031
    shunk031 2018/04/29
    後輩くんがざくっとまとめているみたい。よい
  • PyTorch で開発中の JIT 機能 - iwiwi 備忘録

    概要 https://github.com/pytorch/pytorch/tree/v0.4.0/torch/csrc/jit PyTorch は NN 定義をコンパイルし Python のユーザーコードを通らずモデルを実行できる機能を開発中。実は開発は普通にオープンに GitHub で行われているし master にじゃんじゃん入っているので試せる。以下の 2 種類の両方が実装されつつある。 実際に実行して作成された計算グラフを IR に変換する torch.jit.compile Python のコードを制御構文も含めて直接 IR に変換する torch.jit.script 以下は PyTorch 0.4.0 で実行。 In [1]: import torch In [2]: torch.__version__ Out[2]: '0.4.0' torch.jit.compile ま

    PyTorch で開発中の JIT 機能 - iwiwi 備忘録
    shunk031
    shunk031 2018/04/26
  • Notionが便利すぎてぜひオススメしたい話 - カシミヤのニット

    こんにちは.最近は,入社して社会になってます. Notion*1 自分の考えをまとめたり,チームでの共有事項をまとめたりするためのツールはたくさんあります. Google DocsやGithub Wiki,TrelloやDropbox Paper,どれも素晴らしいツールですが,色々導入しすぎて「今回の案件にはどれが最適なのか...」ってなる時ありませんか? それを解決してくれるのがNotionです. Notionとは All-in-one workspace を謳った上記ツールの機能を網羅してくれるツールです. www.notion.so 概要 Notionは,web,Desktop,iOSなど各プラットフォームにも対応しており,電車での移動中などでも簡単に編集・確認ができます. コードを含めたドキュメントはもちろん,kanbanや表,カレンダーを作成することができます. これらの要素は,

    Notionが便利すぎてぜひオススメしたい話 - カシミヤのニット
    shunk031
    shunk031 2018/04/22
    便利そう
  • 深層学習のモデル圧縮・高速化に関する論文80本ノック - そうだね

    こんにちは.無事に3年生に進級できてホッとしています. 昨年度から深層学習のモデル改変による高速化手法について調べていました.そんなわけで稿では深層学習モデルのパラメータ容量の削減や高速化を目的とした手法に関する論文を80紹介します. 一部, ハイパーパラメータ探索(Neural Architecture Search等)の論文を「高速なモデルの探索に使えないかな〜」というきもちで含めました. また, 蒸留に関する論文は必ずしも高速化を狙ったものだけではなく, 蒸留そのものの派生論文についても含めています. 全ての論文について詳解ではなく雑な概要のみ記載しています. サーベイする際のガイドにでも使っていただければ幸いです. サクッと読んだだけの論文も多々ありますので間違い等ございましたらご指摘ください. では参りましょう. 高速なモデルアーキテクチャ より良い速度と精度のトレードオフを

    深層学習のモデル圧縮・高速化に関する論文80本ノック - そうだね
    shunk031
    shunk031 2018/04/06
    おぉぉ!すごい量だ
  • 第2回 Cpaw AI competitionに参加しました - odan’s diary

    Cpaw AI competitionが何かとか、Cpawとは?みたいは話は下のリンクを見て下さい connpass.com 雑に説明すると競プロ(ハーフマラソン系)+機械学習コンペです。当日はさくらインターネットさんからCPU 12Core,メモリ96GBのマシンが貸し出されており、その上で競技に取り組みました。問題は合計4問用意されており、正解率の合計で総合順位が決定する形式でした。 ただし4問のうち1問はとても難しいらしく正解率を8倍した値が合計する時に使われる仕様でした(300+800=1100点満点)。 環境構築 クリーンインストールされたUbuntuが与えられただけだったので、まず自力で環境構築をする必要がありました。 zshをインストールしてGitHub - odanado/dotfilesをcloneすることで手軽に開発環境を作りました。 Pythonを実行する環境にはDo

    第2回 Cpaw AI competitionに参加しました - odan’s diary
    shunk031
    shunk031 2018/04/03
    参加していただき、ありがとうございました!
  • 非エンジニアが最速でSQLをマスターする方法 - Gunosy Tech Blog

    こんにちは、データ分析部の石塚です。 Gunosyではエンジニア以外の職種でもSQLを叩いて自らデータを集計・分析するという習慣と全社員が各サービスのログ*1に触ることができる環境があります。 例えば、ユーザー獲得を担っているプロモーションチームはエンジニアが0名のチームなのですが、実際にSQLを叩いています。 それによって、自分たちの獲得したユーザーはどのような行動をしているのかを確認したり、分析することができています。 これはGunosyのみの事例ではなく、AWSのRedshiftやAthena、GCPのBigQueryが台頭してきたおかげで、どの会社も低コストにログをSQLで集計・分析できる基盤が整ってきています。 個人的にはアプリやウェブの業界で働くマーケターにはSQLは必須の知識と言える時代になってきたと感じています。 そこで今回は特別プログラミングなどの経験が無い人でも、SQL

    非エンジニアが最速でSQLをマスターする方法 - Gunosy Tech Blog
    shunk031
    shunk031 2018/02/06
    `非エンジニアが最速でSQLをマスターする方法はエンジニアを合コンに連れて行くことだ`
  • Google を退職しました。そして Graffity という拡張現実の世界へ。 - Masaki Ohno Log

    2018 年 1 月をもって Google法人を退職しました。 人生初めての退職エントリ。最初にお断りとして、自分がみた Google は全世界に拠点を持つ同社の中でも日法人且つ、広告製品から見た一部にしかすぎません。そのごく一部から一社員として見えた Google という世界と感じてきた想いについて書き残したいと思います。 2016 年 4 月 Google に新卒入社し、1 年 9 ヵ月間、主に広告製品を担当させていただきました。その他 Google が持つ膨大な広告データ解析や日での新チーム立ち上げ、iOS アプリの日ローンチなど様々なプロジェクトに関わらせていただきました。 インターネットの歴史Google に多大なインパクトを残した素晴らしい広告製品、そしてプロジェクトを優秀な諸先輩、同期後輩に囲まれながら、一社員として携わることが出来たこと、当に貴重な機会を頂

    Google を退職しました。そして Graffity という拡張現実の世界へ。 - Masaki Ohno Log
    shunk031
    shunk031 2018/02/01
  • シェルスクリプトの代わりにPythonを使う - オープンソースこねこね

    これまで、開発や運用時に使う、ちょっとしたコマンドラインツール、自動化スクリプトは、主にBashのシェルスクリプトで実装していたのですが、最近このような用途にはPythonを使うようにしています。 Bashスクリプトへの不満 スクリプトの実装方針 ポータビリティ重視のための縛りPythonプログラミング Tips __future__モジュールでバージョン2、3両方に対応させる バージョン2、3で異なるモジュールを、同じ名前で読み込む バージョン2、3を判別する関数を用意する よく使うスニペット 文字に色をつける 赤い文字でエラーメッセージを出力して終了する 外部コマンド実行する テキストをファイルに出力する ファイルに実行権限をつける スクリプトの同時、多重起動防止する コマンドライン・オプションの解析 HTTPリクエスト まとめ Bashスクリプトへの不満 Bashのスクリプト実装にお

    シェルスクリプトの代わりにPythonを使う - オープンソースこねこね
    shunk031
    shunk031 2018/01/27
  • 現地就職してからの1年とその前後 - はまさき

    ここ何年か、ベイエリアで遭遇することがちょこちょこある堤さんがサンフランシスコで就職して1年が経ちました - Over&Out その後というのを書いていたのを見た。偶然にも同じような時期にサンフランシスコにある会社に就職していたので、堤さんとお会いした時にたまに示し合わせるのが面白い。プロモートおめでとうございます。何でこの前言ってくれなかったの! 1年前の就職活動 ここに辿り着いた後は「どうにかなるもんやな」というのと「いやはや全然出来ないな」というのを、毎日とか毎週とかの周期で繰り返しているけれど、仕事が決まるまでの間はもっとしんどかった。 がちょうど最近Tradecraftというこの辺のスタートアップ野郎を生み出すトレーニングプログラムに応募して、電話面接、オンサイト面接を経ているのを目の前にすると、忘れかけていた当時の感覚が思い出されてくる。 すぐ甘えるので環境を強制する レジュ

    現地就職してからの1年とその前後 - はまさき
    shunk031
    shunk031 2018/01/11
  • 業務メール書き方チートシート - tkm2261's blog

    お久しぶりです。 今日は技術的な話題では無いですが、社外・社内にメールを出す時のテンプレ的なものを紹介したいと思います。 初めに言いますが、クッッソどうでも良い話題です。面接のスーツに何を着るかぐらいどうでも良い話です。 ただ、学生だと志望会社にメールを出すときに変に文面悩んだり、エンジニアだと社外にメール出す経験があまり無くて変に文面悩んだりとか、ここで悩むのは更に無駄なので、 ニートという身軽な身分のうちに、日の会社で大体OKっぽいメールの書き方を適当に紹介します。 アホらしいですがメールの行間から仕事慣れてない感がでるとマイナス印象になったりもするので、それっぽいメールの書き方は知っておいて良いかもしれません。 自分もコンサルの新卒の時にいきなりクライアントにメールするのは怖かった記憶があるので、自分が学生の時に知りたかった内容的なのを書いておきます 業務メール書き方チートシート

    業務メール書き方チートシート - tkm2261's blog
    shunk031
    shunk031 2018/01/09
  • メルカリのBold Internship2017 に参加した - 未来永劫

    https://www.mercari.com/jp/recruit/boldinternship_2017/ 夏のSummer Internshipに引き続きアメリカ or イギリスのどこかにランダムで飛ばされるインターンに参加した. 前置き 発端はバイト中にメルカリの社員さんから「今年もBold Internshipやるよ」と話を振ってもらったこと. 英語が出来ない(B3でTOEIC300点台のGoBoldさ)*1 & 海外渡航経験ゼロなので一瞬渋い気持ちになったが「Go Boldにやっていき💪」と返事をしてしまったので,大胆に応募課題を書いて提出した.*2 概要 第1回目のインターンが大きく話題になったので知らない人は少ないかと思うが,このインターンの特徴は 海外渡航費(調べたら年末年始の時期は片道で20万円前後) 現地宿泊費(Airbnbで自分で宿を取る.10万前後) が全て会社

    メルカリのBold Internship2017 に参加した - 未来永劫
    shunk031
    shunk031 2018/01/08
    とてもよさそう
  • Google Home と mornin' を使って声でカーテンを開閉する

    この記事は WACUL Advent Calendar 2017 の 12 日目の記事です。 11 日目の記事は @kyoh86 さんの 「Go の俺的 scaffold はこれだ!2017 年版」 でした。 tl;drGoogle Home から IFTTT をキックして Pushbullet で送ったプッシュ通知をトリガーに Tasker で mornin’ の Android アプリを操作する Motivation我が家では以前から Nature Remo を利用してエアコンをアプリ経由で屋外から操作したりしていましたが、10 月に Google Home が発売されたことで声でエアコンやテレビを操作できる様になりました。Google Home と Nature Remo の連携は 公式のドキュメント に記載されている通り簡単に行うことができます。 また、テレビやエアコンだけでなく

    Google Home と mornin' を使って声でカーテンを開閉する
    shunk031
    shunk031 2018/01/06
    Google homeとmorninどうにかして連携したかったけど、Taskerを使えば良いのか!
  • 【論文紹介】Interpretable Predictions of Tree-based Ensembles via Actionable Feature Tweaking【KDD 2017】 - 横須賀の某Prisonで働く研究者?のブログ

    どうも,接点QB です. KDD 2017の論文を漁っていたら,「Interpretable Predictions」というタイトルに目を惹かれて表題の論文を読んだので紹介したいと思います. 機械学習(教師あり)の手法は「予測・分類」を目的としていて,「説明性」に関してはあまり重視されない印象があります. しかし,実際の問題を解決しようとする際には説明性を求められるケースが多いと思います. たとえば,「この人は商品Aを購入しないグループに属する事はわかりました.じゃあ,どうすればこの人に商品Aを買わせることができますか?」といったケースがあります. 今回紹介する論文で提案されている手法は,上記のような例でも対応することが出来ます. 論文の概要 問題設定と前提条件は, 2値分類 使用するのは決定木ベースのアンサンブル分類器 です.そして,論文の目的は negativeに分類された$\rene

    shunk031
    shunk031 2018/01/04
  • ICML'17における強化学習 - sotetsuk's tech blog

    この記事は2017年に書きかけのままだったブログ記事の供養です。 今2018年年始なので、NIPS参加報告も目立つ中、4ヶ月遅れくらいですが書きかけだったICML2017の参加録をひとまず投稿しておきます。 ホットトピック モデルベース深層強化学習 ソフト最適 階層性(オプション) (報酬情報なしでの)系統立った探索 一貫学習 (end-to-end learning) 学習時と異なる環境への汎化(transfer/zero-shot) 実用的な探索(安全・公平) ヒトによる教示 方策オフ型学習でのバイアス・バリアンス 個人的に面白かった発表・トピック5選 チュートリアル ソフト最適 カテゴリカルDQN ベータ方策 PVFによるオプションの発見 総括 [PR] 速習 強化学習 8月上旬にシドニーで行われたICML2017に参加してきました 私自身は自然言語生成のワークショップで発表をしてき

    ICML'17における強化学習 - sotetsuk's tech blog
    shunk031
    shunk031 2018/01/04
  • 新年なのでRustでComet IIエミュレータを書いた - ブログの名前なんて適当で良いのでは

    shunk031
    shunk031 2018/01/01
    ちひろ先生の謎技術
  • 2017年振り返り - skozawa's blog

    2017年を振り返る。 2017年目標 - skozawa's blog 手を動かす、行動する VPSを移行したかったので、ansible触ってみたり、pythonで少しアプリ作ってみたりした。apacheからnginxになってある程度モダンにできたのでよかった。 あとは転職がらみで、いくつかの会社に話を聞かせてもらいに行ったりできたのはよかった。 自己投資 そんなにできなかった気がするけど、東京に引っ越すタイミングで色々買い替えたので、まあいいかな 次の5年 ビジネス、プロダクトへの貢献に対して、自分ができる/したいことを考えて、動けた1年だったかなと思う。 今年はなんといっても転職が一番大きな出来事だった。年始あたりから考えつつ、いくつか話を聞かせてもらいにいったりもして、最終的に今の会社にさせてもらった。転職後でまだまだインプットが多い状態だけど、今のところ、自分なりには良い選択だっ

    2017年振り返り - skozawa's blog
    shunk031
    shunk031 2017/12/31
  • ビットコインのフォークとアクティベート方法のまとめ - Gunosy Blockchain Blog

    はじめに こんにちは。開発部の @yamarkz です。 昨今ビットコインのスケーリング問題がさらに顕在化してきていますね。 最近では主要取引所での手数料改定も行われました。 ビットコイン・ネットワークの混雑に伴い、日時間 12 月 24 日(日)午前 4:00 より、ビットコイン送付手数料を下記のとおり改定いたします。 ■ビットコイン送付手数料 改定前:0.0004 BTC 改定後:0.0015 BTC ※bitWireを除く— bitFlyer(ビットフライヤー) (@bitFlyer) 2017年12月23日 スケーリング問題を解決するための手段は日々IRCで議論され、現在も改善へ向けた開発が進められています。 直近では2017/8にアクティベートされた「segwit」や、2017/11に中止となった「segwit2x」などが解決手段として注目を浴びました。 今回はこれらの解決手

    ビットコインのフォークとアクティベート方法のまとめ - Gunosy Blockchain Blog
    shunk031
    shunk031 2017/12/28
  • 学生エンジニアは時給1000円のベンチャーでバイトをするのをやめろ - 未来永劫

    この記事はklis Advent Calendar 2017の24日目の記事です. adventar.org 私はklis13(3編)で,slis17の @ss_shopetan です. アドベントカレンダーエモい日記書こうと思うのですが何読みたいですか?— shopetan (@ss_shopetan) 2017年12月7日 投票により表題の話が最も需要があるらしい. 私自身,再来年には就職をしている予定なので,自分のバイト経験を交えながら昨今の学生エンジニア事情を考えてみる. 一番言いたいこと 低賃金で働くのはやめよう. 給与が低水準なのは私たちにとっても不幸だし,これを良しとし続けるならば今後業界水準も上がらないので長期的に考えても不幸になる. また,現在安い金額で働かなくても,知識と実力をつければ将来的に大きな額で働くことができる.*1 特に地方の人間は搾取されがち. つくば市も例

    学生エンジニアは時給1000円のベンチャーでバイトをするのをやめろ - 未来永劫
    shunk031
    shunk031 2017/12/24