タグ

ブックマーク / tjo.hatenablog.com (8)

  • 2024年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス&定番の書籍リスト - 渋谷駅前で働くデータサイエンティストのブログ

    毎年四の五の言いながら書いている推薦書籍リスト記事ですが、何だかんだで今年も書くことにしました。なお昨年度版の記事を上にリンクしておきましたので、以前のバージョンを読まれたい方はそちらをお読みください。 今回のバージョンでは、趣向をちょっと変えて「定番」と「注目分野」というように分けました。何故こうしたかというと、平たく言って 「初級&中級向け」推薦書籍リストは定番化していて毎年あまり変更点がない 逆に直近のホットトピックスに関するテキストは毎年入れ替わりが激し過ぎて網羅しづらい という課題があり、特に2点目についてはあまりにもデータサイエンス関連書籍の新規刊行が多過ぎる&僕自身がその流れについていけておらず完全に浦島太郎状態ですので、万人向けに等しくウケるようなリストを作るのは今回をもって完全に諦めたというのが実態です。 その上で、前回まで踏襲されていた定番書籍リストはバルクで提示すると

    2024年版:独断と偏見で選ぶ、データ分析職の方々にお薦めしたいホットトピックス&定番の書籍リスト - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2024/02/24
  • 「仮説ドリブン」という名の甘い罠 - 渋谷駅前で働くデータサイエンティストのブログ

    今回の記事では、ちょっと感覚的でふわっとした話をしようと思います。それは「『仮説ドリブン』という考え方には往々にして落とし穴があるのではないか?」という問題提起です。 そもそも、「仮説ドリブン」(仮説駆動型:hypothesis-driven)というアプローチは実験科学分野出身の我が身にとっては、個人的には馴染み深いものです。まだ僕がポスドクだった頃、国際会議に際して日人研究者同士で集まる会が毎回あったのですが、その席上でお話を聞く機会があった当時のトップ研究者の先生から「この世の森羅万象は網羅しようとするにはあまりにも広大過ぎる、故に森羅万象を区切って『仮説で白黒つけられる範囲』に絞り、これを検証するということを繰り返して前に進むべき」ということを聞かされ、感銘を受けたのを覚えています。 実際、仮説ドリブンの考え方は非常に有用なものであり、今現在僕自身が主戦場とする広告・マーケティング

    「仮説ドリブン」という名の甘い罠 - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2023/12/21
    データは嘘つかないけど詐欺師はデータを使うのトリックに騙されそう
  • データ分析部門にビジネス上のレゾンデートルを与えるということ - 渋谷駅前で働くデータサイエンティストのブログ

    3月にばんくしさんとイベントでご一緒したり個人的に話をする機会*1があったんですが、その際に何度も話題にされていたのが「エンジニア部門やAI部門にビジネス上のレゾンデートル(存在意義)をどう与えるか」というテーマでした。これについては実際にご人もnoteの記事としてまとめられています。 このnote記事ははてブ数を見るまでもなく各所で多くの議論を呼んだようで、観測範囲ではかなり広汎に分かれた論調が散見されています。そのいずれもそれぞれの界隈*2における実態を反映しているように見受けられ、一口にエンジニア業界・AI業界といってもやはり多様なのだなという感想を持ちました。 ということで既にある程度論点が出尽くしてきた感もありますが、今回のブログ記事ではデータ分析部門の話題に特化した上で、そこに僕の見聞談並びに見解を幾許か付け加えてみようかと思います。ちなみにあまり楽しい話題ではない旨、予め警

    データ分析部門にビジネス上のレゾンデートルを与えるということ - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2023/03/15
    前職は会社から見ればR&D要素の強い名目で採用されたけど、コロナ禍でキャッシュが尽きる可能性あったので、レイオフされた。それに似たような話はデータ組織におこりうる。
  • データサイエンティストは何を勉強すべきか:「教養」と「必須」と「差別化」と - 渋谷駅前で働くデータサイエンティストのブログ

    (Image by Wokandapix from Pixabay) 個人的な観測範囲での話ですが、データサイエンティストという職業は「21世紀で最もセクシーな職業」として刹那的な注目を集めた第一次ブーム、人工知能ブームに煽られて火がついた第二次ブーム、そして「未経験から3ヶ月で人生逆転」ムーブメントと折からのDXブームに煽られる形で沸き起こった第三次ブームを経て、何だかんだで社会に定着してきた感があります。 で、このブログを始めた頃からの連綿と続くテーマになっていますが、いつの時代も話題になるのが「データサイエンティスト(になるに)は何を勉強すべきか」ということ。7年前から恒例にしてきた「スキル要件」記事では、基的には「どれも必要な知識(学識)」であるという前提で分野・領域・項目を挙げてきました。少なくとも、最初の3回ぐらいはそういう認識でスキル要件記事を書いていた気がします。 ところ

    データサイエンティストは何を勉強すべきか:「教養」と「必須」と「差別化」と - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2022/07/30
    データエンジニア版、MLエンジニア版もはよ
  • AutoML Tablesと他の機械学習モデルとのパフォーマンス比較をしてみた(追記あり) - 渋谷駅前で働くデータサイエンティストのブログ

    以前よりGoogleではCloud AutoMLという"Learning to learn"フレームワークによる「人手完全不要の全自動機械学習モデリング&API作成」サービスを展開してきていましたが、それらは画像認識や商品推薦はたまた自然言語処理がメインで、最もオーソドックスな構造化データに対する多変量モデリングは提供されていませんでした。 が、今年のCloud Nextにおいてついに多変量モデリング版であるAutoML Tablesのベータ版が公開されたということで、既に色々な方が「試してみた」系の記事を書かれているようです。 https://medium.com/@matsuda.minori/google-cloud-next-sf-19%E3%81%A7%E7%99%BA%E8%A1%A8%E3%81%95%E3%82%8C%E3%81%9Fauto-ml-tables%E3%82

    AutoML Tablesと他の機械学習モデルとのパフォーマンス比較をしてみた(追記あり) - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2019/05/23
    某チャレンジに使ってみよう
  • 「ビッグデータ」「データサイエンティスト」後のデータ分析業界はどうなっていくのか - 渋谷駅前で働くデータサイエンティストのブログ

    先日の合同企業説明会でご来場いただいた就活生の皆さんにこの話題をだいぶ話したので、続きの意も込めてちょっと書いてみようと思います。実はその時お話した内容について、後日データ分析者同士の飲み会を開いた時に色々議論になったもので(笑)、そのフィードバックも兼ねるかなぁという。 そうそう、この記事でも引き合いに出しますが「アルゴリズム実装系」「アドホック分析系」というデータサイエンティストの分類については、以下のslideshareをお読みあれ。 最新業界事情から見るデータサイエンティストの「実像」 from Takashi J Ozaki そして予めお断りしておきますが、今回の記事も基的には僕の個人的なデータ分析業界での経験と見聞に基づいて独断を並べているだけで、言ってみればただのポジショントークです。何かしら客観的な数値的根拠とかそういうものがあるわけではないので、悪しからず。。。 バズワ

    「ビッグデータ」「データサイエンティスト」後のデータ分析業界はどうなっていくのか - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2014/02/01
    そりゃそうだけどやるのは難しそうだ。 “「実態」を伴うデータ分析体制を維持し続ける企業や組織が、競争で優位に立っていくようになる”
  • 「日本型データサイエンティストの登場を契機に活用が進展」記事について二言三言 - 渋谷駅前で働くデータサイエンティストのブログ

    先日、Twitter上&FB上にこんな記事が出回っていたので読んでみました。 日型データサイエンティスト、CDO、CAO:日型データサイエンティストの登場を契機に活用が進展、野村総合研究所が予想 - ITmedia マーケティング データ分析をビジネスに活用するためには、高度なデータ分析の専門家である「データサイエンティスト」の存在が不可欠だとNRIでは認識している。しかし同社の調査によると、現時点では、日企業で社内にデータサイエンティストがいる企業は8%程度と、ごく一部。今後、現場力とコンサルタント的スキルを持つ「日型データサイエンティスト」登場し活躍することで、データ分析がビジネス展開に大きく貢献する成功事例が、徐々に現れてくると予測する。 また、米国で設置が進むCDO(チーフ・データ・オフィサー:最高データ責任者)やCAO(チーフ・アナリティクス・オフィサー:最高分析責任者)

    「日本型データサイエンティストの登場を契機に活用が進展」記事について二言三言 - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2013/12/12
    ありそうな話「一部の「勝ち組」以外の多数派企業はデータ分析を外注するようになり、全体としてデータ分析コンサルへの傾斜が強くなる」
  • データサイエンティストは精鋭の6000人しか要らないかもしれない - 渋谷駅前で働くデータサイエンティストのブログ

    ちょっと前の話ですが、Vapnikマン氏*1(@sla)の超絶素晴らしいインタビュー記事が出てました。 データサイエンティストが要らなくなる日が来るかもしれない しかも、あの「ネガティブにデータサイエンティストな日記」のid:dscaさんが、Vapnikマン氏のインタビュー記事に触発されて データサイエンティストが要らない日はもう来ている という素晴らしい記事を書かれていて、これはもう釣られるしかないでしょーといった風情です。そんなわけで全力で釣られたついでに煽り記事書いてみました。いつも通りロクな内容ではないので、念のため(笑)。 そもそも25万人もデータサイエンティストって必要なのか? 日経が「今後データサイエンティストは25万人不足する」とか吹かしてくれたおかげで、今やすっかり「25万人」説が広まってしまったわけですが。 結論から言うと、日国内ではそんなに要りません。僕の超絶大ざっ

    データサイエンティストは精鋭の6000人しか要らないかもしれない - 渋谷駅前で働くデータサイエンティストのブログ
    legoboku
    legoboku 2013/08/10
    データ分析業務が自動化もしくは途上国へアウトソーシングされることで、業務を請け負うデータサイエンティストの需要も減る?との意見。でも、顧客の一番近くで素早くPDCAを回す人は必要とされるのでは?
  • 1