並び順

ブックマーク数

期間指定

  • から
  • まで

201 - 240 件 / 496件

新着順 人気順

サイエンティストの検索結果201 - 240 件 / 496件

  • 「ChatGPTは5年後に使われなくなる」ーメタのチーフサイエンティストが批判 AIバブルには陰り(36Kr Japan) - Yahoo!ニュース

    AIの第一人者で米メタ(Meta)のチーフサイエンティストでもあるヤン・ルカン氏が人工知能の脅威をテーマとした公開討論会に登壇し、「5年後には誰もChatGPTを使っていないだろう」と再びChatGPTを痛烈に批判した。 この大胆な予想はたちまち大きな注目を集めた。 ルカン氏がChatGPTを非難するのは今回が初めてではない。まず技術面で特に革新的なところがないという理由でChatGPTに懐疑的な立場を取っている。他の企業も同様の技術を持っており、ChatGPTを開発したOpenAIが特に先進的というわけではなく、単に技術を上手く組み合わせたに過ぎないというのがその考えだ。 あまりに大きな反響があったためかルカン氏は後日、自身の発言を釈明している。OpenAIを批判しているのではないこと、ChatGPTは信じられないほど革新的なもので他社サービスを凌駕しているという世間やメディアの捉え方を

      「ChatGPTは5年後に使われなくなる」ーメタのチーフサイエンティストが批判 AIバブルには陰り(36Kr Japan) - Yahoo!ニュース
    • 「仕事にデータサイエンスが役立つ」は本当なのか、具体的な活用術を実際のデータサイエンティストに聞いてみた

      データサイエンスやIoTなどに関わる「先端IT人材」は、経済産業省の(PDF)調査では「2030年に45万人が不足する」と言われていますが、「そもそもデータサイエンスって何?」「普通に仕事するだけなら必要ないのでは?」という疑問を抱く人も多いはず。ちょうど5周年キャンペーンを実施しているオンライン学習プラットフォーム「Udemy(ユーデミー)」に「データサイエンスの資格のための講座」が開設されたとのことなので、技術者や経営者でない人にもデータサイエンスは必要なのか、具体的にどう役立つのかを、まさにその資格の開発に携わった堅田洋資さんと石田祥英さんにイチからいろいろ話を聞いてみました。 オンラインコース - いろんなことを、あなたのペースで | Udemy https://www.udemy.com/ 目次 ◆1:そもそも「データサイエンス」って何? ◆2:「データサイエンス」でビジネスはど

        「仕事にデータサイエンスが役立つ」は本当なのか、具体的な活用術を実際のデータサイエンティストに聞いてみた
      • LLM活用時代に“価値あるデータサイエンティスト”になるには 「食べログChatGPTプラグイン」開発で見えてきた、これから求められるスキル

        大規模言語モデル(LLM)を、実際にプロダクトや実務に役立つかたちで利用している各社が見た使いどころや、実践の上での工夫について学び合うためのイベント第二弾。今回のテーマは「大規模言語モデルがつくる新しい顧客体験」。ここで登壇したのは、株式会社カカクコムの森菜都未氏。食べログにおける大規模言語モデル活用の未来と、データサイエンティストの向き合い方について発表しました。 食べログの先端領域推進を担当する森菜都未氏 森菜都未氏(以下、森):よろしくお願いします。「食べログChatGPTプラグイン導入で見えてきた未来:データサイエンティストの向き合い方」について、株式会社カカクコムから森菜都未が発表いたします。 まず、自己紹介です。森菜都未と申します。株式会社カカクコムの食べログシステム本部技術部データサイエンスチームに所属しています。 学生時代は自然言語処理研究室で研究を行っており、その後、ソ

          LLM活用時代に“価値あるデータサイエンティスト”になるには 「食べログChatGPTプラグイン」開発で見えてきた、これから求められるスキル
        • データサイエンティストの素養は「獣神サンダー・ライガー選手」に学べ

          本記事では詳細まで言及しませんが、データサイエンティストには統計、数学、プログラミング以外にもクラウドやSQLなど幅広い技術と知識が求められます。データサイエンティストは従来と異なる職業のため、同じIT業界でもキャリアプランが存在しません。将来にわたって活躍できるデータサイエンティスト像としては、ビジネスシーンを含めて幅広い問題を解決できる人材が考えられます。 そんな理想のデータサイエンティストになるためには、どうすればいいでしょうか? 学習面では、文系・理系と区別せずに「文理融合」し、既存の枠に収まらない知識が必要です。産業界でも、業種や職種を越えた「共創」や「コラボレーション」といった横断的な連携が求められています。 例えば、素材開発において昆虫の構造や仕組みを参考にする事例がありますが、両者の組み合わせが役立つと考えた人はどれだけいるでしょう。データサイエンスは、テクノロジーマニアの

            データサイエンティストの素養は「獣神サンダー・ライガー選手」に学べ
          • 新卒データサイエンティストたちの活躍。働きやすさと成長を実現する組織体制

            LINE株式会社は、2023年10月1日にLINEヤフー株式会社になりました。LINEヤフー株式会社の新しいブログはこちらです。 LINEヤフー Tech Blog LINEの開発組織の部門やプロジェクトについて、その役割や体制、技術スタック、今後の課題やロードマップなどを具体的に紹介していく「Team & Project」シリーズ。今回はData Science室に新卒で入社した若手エンジニアたちをご紹介します。22卒入社の安藤正和と栗本真太郎、21卒入社の松田祐汰と武田拓弥の4名に、LINEに入社した経緯や担当する業務、今後の目標などを聞きました。 Data Science室で働くメンバーの自己紹介 ――みなさんの所属チームの概要やご自身の役割を簡単に教えてください。 安藤:22卒入社の安藤正和です。私はFinancial Data Scienceチームという、LINE Pay関連のデ

              新卒データサイエンティストたちの活躍。働きやすさと成長を実現する組織体制
            • Kaggle Grandmasterに聞く「トップデータサイエンティストの過去・現在・未来」 ― データサイエンティスト協会 6th シンポジウム

              Kaggle Grandmasterに聞く「トップデータサイエンティストの過去・現在・未来」 ― データサイエンティスト協会 6th シンポジウム:Kaggleイベントレポート 世界でたった162人しかいないKaggle Grandmastersのうち、貴重な日本人の2人をお招きして開かれたパネルディスカッションでの質疑応答を、余すことなく書き起こした。Grandmasterになるまでの経緯から、データサイエンティストとしての働き方までが分かる。

                Kaggle Grandmasterに聞く「トップデータサイエンティストの過去・現在・未来」 ― データサイエンティスト協会 6th シンポジウム
              • 大量のユーザーデータを横断的に使うために LINEのデータサイエンティストが気をつけているいくつかのこと

                2020年11月25〜27日の3日間、LINE株式会社が主催するエンジニア向け技術カンファレンス「LINE DEVELOPER DAY 2020」がオンラインで開催されました。そこで LINEのフェローであり、Data Science and Engineeringセンターに所属する並川淳氏が、「LINEではどのようにサービス横断でのデータ活用を実現しているのか」というテーマで、LINEにおけるデータの扱い方について共有しました。 LINEにおけるデータ活用の取り組み 並川淳氏(以下、並川):本日は「LINEではどのようにサービス横断でのデータ活用を実現しているのか」というタイトルで、並川が発表いたします。私は、LINEではふだん機械学習に関わる開発全般を担当しています。ですが、今日は機械学習に限らず、LINEにおけるデータ活用の取り組みについて幅広く紹介させてもらえればと思っています。よ

                  大量のユーザーデータを横断的に使うために LINEのデータサイエンティストが気をつけているいくつかのこと
                • 分析結果が有意にならなくて困っている人々のためのハウツー本を書きました - 渋谷駅前で働くデータサイエンティストのブログ

                  近年様々な議論もあるようですが、依然として「統計的仮説検定」を初めとする統計分析においては「p < 0.05」なるp値が得られるような「有意差」もしくは「有意性」が重視される業界は世間には数多く、有意な分析結果が得られなくて困っている人々は少なくないようです。 そこで、そんな人々のためになるようなハウツー本的な書籍をこの度上梓しました。題して『今日からはじめる達人p値ハッキング』ということで、p-hacking及びそれ以外の様々な「有意な分析結果を得るためのテクニック」をまとめてあります。以下に目次を挙げておきます。 目次 第1章:何故貴方の分析にはp < 0.05が必要なのか 第2章:全てのサンプルを使うことをやめよう 第3章:サンプルをもっと増やしてみよう 第4章:p < 0.05が得られるような仮説を設定してみよう 第5章:検定手法を使い分けてみよう 第6章:p < 0.05が大変な

                    分析結果が有意にならなくて困っている人々のためのハウツー本を書きました - 渋谷駅前で働くデータサイエンティストのブログ
                  • 未経験から“AI人材”に データサイエンティストが伝える「機械学習を学ぶ意味」

                    AIや機械学習と聞くと、人間と同等の知能を持ったロボットや、ものすごいスピードで処理をするシステムのようなものを思い浮かべる方もいらっしゃるかもしれません。 しかし、実際の生活や業務で活躍するAIは、もっと理解しやすい、身近なものです。 例えば、お掃除ロボットや、スマートスピーカー、SNSで人をタグ付けする機能など、皆さんの生活の中ですでに活用されています。これらのAI・機械学習を使うと、コストを下げられる、パーソナライズできる、つながりを生み出すことができるなどのメリットがあります。 例えば、SNSで誰かをタグづけしようとする際に、自分で検索をして、選択してという作業をするのは手間がかかりますが、AIが自動で提案してくれることにより自分でタグ付けするという手間、つまりコストを下げられます。 また、ECサイトでよく見かける「あなたにおすすめ」などのレコメンドは、個人の嗜好(しこう)をデータ

                      未経験から“AI人材”に データサイエンティストが伝える「機械学習を学ぶ意味」
                    • 農家さん、ご心配なく。種苗法の一部を改正する法律案についての解説 - アグリサイエンティストが行く

                      最近、ニュースやSNSなどで種苗法の改正が取りざたされています。生産農家の権利が著しく制限され、大きな不利益を被るのではないかという論調がちょくちょく見られます。 フリー素材ぱくたそ(www.pakutaso.com) 結論から言うと、今までとほとんど変わることはありません。その理由は順を追って説明していきましょう。 まずはそもそも、種苗法とはどのような目的で作られ、どのように運用されている法律なのでしょうか。ごく簡単に言うと、新品種を育成した人や団体がその育成者権を占有できる権利を認め、保護することが目的です。多額の費用や労力をかけて作り上げた新品種については、育成者がその利益を十分に受けることは当たり前のことですね。この辺りは、特許や実用新案などの考え方とよく似ています。 しかし、時代の変遷とともに従来の種苗法では育成者権の保護が難しくなる事例が出始めました。登録品種の権利侵害について

                        農家さん、ご心配なく。種苗法の一部を改正する法律案についての解説 - アグリサイエンティストが行く
                      • Scalabilityを追求するということ - 渋谷駅前で働くデータサイエンティストのブログ

                        (Image by Pixabay) 今年も恒例の年末振り返り記事の季節になりました(笑)。なおここ数年の年末振り返り記事はこちらから。 去年まではどちらかと言うと「stats/ML分野の進歩が早過ぎてついていけない」という愚痴半分諦め半分みたいな話をしていたわけですが、ついていけなくなった結果技術的な知識という面では周回遅れになりつつあるという段になって、僕個人の中では別の課題意識が今年になって出てきたのでした。ということで、今回の記事では今年の注目トピックを振り返りながら、その課題意識についてちょっとポエムを書いてみようと思います。 自動化の潮流 チームを作るということ そしてscalabilityへ 自動化の潮流 AutoML Tablesの登場が、個人的には今年の最も大きな出来事でした。このブログでAutoML Tablesのパフォーマンスを色々試してみたのがきっかけとなって、つい

                          Scalabilityを追求するということ - 渋谷駅前で働くデータサイエンティストのブログ
                        • 民間のデータサイエンティストが見た「驚きの内幕」、厚労省のコロナ分析(Forbes JAPAN) - Yahoo!ニュース

                          新型コロナウイルスの感染拡大を受けて4月7日に発令された緊急事態宣言が5月25日、約1カ月半ぶりに全域で解除された。発令の際に呼びかけられたのが「接触の8割減」。今回の解除基準には含まれていないが、自粛による人々の行動の変化と新規感染者の減少の関係性を把握し、第2波に備えるためにも、接触の分析は重要だ。 8割の根拠は、厚生労働省クラスター対策班のメンバーで北海道大学の西浦博教授の計算に基づくもの。通信業者の位置情報などを活用して、一人当たりの接触頻度を調べることで、感染拡大の状況を推定できるという。「新規感染者数」は感染してから陽性の診断を受けるまでおよそ2週間の時間差があるが、「接触」はリアルタイムに監視することができる数少ない指標でもある。 この接触の評価に4月から関わっているのが民間のデータ分析会社ALBERT(アルベルト)の社員の有志だ。チームを率いるのは32歳のデータサイエンティ

                            民間のデータサイエンティストが見た「驚きの内幕」、厚労省のコロナ分析(Forbes JAPAN) - Yahoo!ニュース
                          • データサイエンティストに必要な3つのスキルセットとは?くわしく解説

                            会社のDX推進に欠かせないデータサイエンティストですが、具体的にどのようなスキルを備えている必要があるのでしょうか。今回は一般社団法人データサイエンティスト協会が公開している「データサイエンティストスキルチェックリストver5」の内容に則り、データサイエンティストに求められる3つのスキルセットを解説します。 データサイエンティストに必要な3つのスキルセットとは? データサイエンティストには、大きく分けて「データサイエンス力」「データエンジニアリング力」「ビジネス力」の3種類のスキルが求められます。 データサイエンス力 データサイエンス力は、企業のビジネス課題に関連するデータを情報科学理論に基づいて分析し、課題解決につなげる能力です。企業が効率的にデータを活用できるかどうかはデータサイエンティストの解析能力に大きく左右されるため、データサイエンティストにとって要のスキルと言えます。 データエ

                              データサイエンティストに必要な3つのスキルセットとは?くわしく解説
                            • 「機械に代替されないデータサイエンティスト」に必要な能力とは?

                              「機械に代替されないデータサイエンティスト」に必要な能力とは?:これからのAIの話をしよう(コンサル編)(1/3 ページ) 「機械学習や統計学を駆使するデータサイエンスビジネスの世界は、どうやら人月商売(※)ではうまくいかなそうだ」という考えが浸透したのが平成の終わり。しかし、AI・データ活用に正解はなく、令和になったいまでも各社手探りの状況が続いています。 企業は、どうすればデータサイエンティストの能力を最大限に発揮させ、ビジネスを拡大できるのでしょうか。組織を運営するマネジメント層と、現場で働くデータサイエンティストが真剣に考えている課題です。 データ分析組織を立ち上げた企業や、データサイエンティスト自身が意識すべきことについて、コンサルティング事業を手掛けるイーストフィールズ創業者の東野智晴さんに聞きました。東野さんは2009年ごろからデータ分析業務をしており、さまざまな案件を担当す

                                「機械に代替されないデータサイエンティスト」に必要な能力とは?
                              • データサイエンティストの飛び道具としてのStreamlit - プロトタイピングをいい感じにする技術 - JX通信社エンジニアブログ

                                (ちょっと遅れましたが)新年あけましておめでとうございます🪁 JX通信社シニア・エンジニアで, データサイエンスからプロダクト開発までなんでもやるマンの@shinyorke(しんよーく)と申します. Stay Homeな最近は大河ドラマを観るのにハマってます&推しの作品は「太平記」です*1. データ分析やデータサイエンティスト的な仕事をしていると, 「いい感じのアウトプットがでた!やったぜ!!なおプレゼン🤔」 みたいなシチュエーションが割とあると思います. さあプレゼンだ!となったときにやることと言えば, ドキュメントとしてまとめる. 社内Wikiやブログ, ちょっとしたスライドなど. 分析・実験で使ったモノをそのまま見せる. より具体的に言うとJupyterのnotebookそのもの. 社内のいろいろな方に伝わるよう, ちょっとしたデモ(Webアプリ)を作る. だいたいこの3つのどれ

                                  データサイエンティストの飛び道具としてのStreamlit - プロトタイピングをいい感じにする技術 - JX通信社エンジニアブログ
                                • ChatGPTに書かせた基礎統計学の教科書を公開しました - 渋谷駅前で働くデータサイエンティストのブログ

                                  ChatGPT以下各種LLM chatbotが創り出すコンテンツが何かと話題を呼ぶ昨今ですが、僕もその世間の潮流に沿って試してみたことがあります。それが「統計学の教科書の自動執筆」です。 ということで、実際にChatGPTを使って基礎統計学の教科書を書いてみました(カバーはStable Diffusionに描かせてみました)。プロンプトは何を入力したか記録を取っていなくて忘れてしまったお見せできませんが、ひとまず要約統計量・相関・回帰についての解説までを執筆させてみたので、是非そのクオリティをご評価いただければと思います。なお、統計学のテキストにありがちな「統計学者たちのエピソード」的コラムもありますので、どうぞご笑覧ください。 (これはエイプリルフールネタです)

                                    ChatGPTに書かせた基礎統計学の教科書を公開しました - 渋谷駅前で働くデータサイエンティストのブログ
                                  • Undersampling + baggingで不均衡データに対処した際の予測確率のバイアスを補正して、その結果を可視化してみる - 渋谷駅前で働くデータサイエンティストのブログ

                                    この記事は以下の検証記事の続きです。 先日、Twitterでこんなお話を見かけました。 分類問題で不均衡データを扱う際、ダウンサンプリングして学習すると予測確率にバイアスが生じるので、calibrationしようという話を書きましたhttps://t.co/qujK29crNY— 岸本ばなな (@unpuy_tw) July 22, 2019 その記事がこちらです。 そう言えば、上記の検証記事の中でもコメントしたのですが「undersampling + baggingで不均衡データを補正するとfalse positiveは物凄く多くなる」んですよね。これは僕も結構気になっていて、もう少し巧みに正例の領域にだけ限局して決定境界を引けないものか?と思っていました。この方法を使えばそれが実現できるのかどうか、実際に試してみようと思います。 なお、前回の記事同様面倒なのでRでランダムフォレストのみ

                                      Undersampling + baggingで不均衡データに対処した際の予測確率のバイアスを補正して、その結果を可視化してみる - 渋谷駅前で働くデータサイエンティストのブログ
                                    • 時系列モデリングのおさらい:季節調整とトレンド抽出 - 渋谷駅前で働くデータサイエンティストのブログ

                                      COVID-19が世界中に感染拡大し、日本含め多くの国で外出や集会の制限(自粛)措置が取られて久しい昨今ですが、これに伴って多くのところでCOVID-19に関連したオープンデータが公開されるようになっており、データ分析を生業とする人間が実データを扱う良い機会ともなっているように見受けられます。 ということで、今回の記事では東京都が公開している日次のCOVID-19感染者(PCR検査陽性者)報告数のデータを題材として、時系列モデリングのおさらいをしてみようと思います。なお、この記事における時系列モデリング結果は今後のCOVID-19の感染拡大状況について何かしらの解釈や予測をするためのものでは全くありません*1ので、悪しからずご了承ください。 また、この記事で公開しているコードは以前書いたクソコードをそのまま転用しているので、端的に言ってただのクソコードです。皆さん自身がお試しになる際は是非

                                        時系列モデリングのおさらい:季節調整とトレンド抽出 - 渋谷駅前で働くデータサイエンティストのブログ
                                      • 引く手あまたのデータサイエンティスト 学生は及び腰? - 日本経済新聞

                                        膨大なデータから機械学習や統計学などの知識を駆使し、新しいビジネスの糸口や課題解決への道筋を引き出す「データサイエンティスト」。デジタルシフトの時代において、IT(情報技術)企業だけでなくメーカーや小売りなどあらゆる産業で引っ張りだこの人材で、「21世紀で最もセクシーな職業」とも称される。これだけ期待が高まるデータサイエンティストだが、実は就活生は二の足を踏むという調査結果が出ている。そのミスマ

                                          引く手あまたのデータサイエンティスト 学生は及び腰? - 日本経済新聞
                                        • 年間30回の社内外発信をやったデータサイエンティストの情報収集から発信までの流れを共有します! - Qiita

                                          株式会社ブレインパッドでデータサイエンティストをしている金(a.k.a ジュンヒョン)です。 この記事はBrainPad Advent Calender 2023 25日目の記事です。 はじめに みなさん、メリークリスマス!…ん? し、、、しまった、、、12月26日?! (DALL·Eに生成してもらった「12月25日クリスマスにずっと寝て、12月26日に起きたサンタさん」の画像①です) すみません、ルドルフが起こしてくれなくてずっと寝てしまった金です。1日遅れのアドベントカレンダーになりますが、どうか楽しく読んでいただけると幸いです🙇‍♂ (DALL·Eに生成してもらった「12月25日クリスマスにずっと寝て、12月26日に起きたサンタさん」の画像②です) 今年を振り返って 個人的に今年は社内外的に情報発信を頑張り始めた元年となります。 まず、社内発信で言いますと、ブレインパッドでは年間3

                                            年間30回の社内外発信をやったデータサイエンティストの情報収集から発信までの流れを共有します! - Qiita
                                          • 成果に直結するデータ分析とは?現役データサイエンティストが解説

                                            『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

                                              成果に直結するデータ分析とは?現役データサイエンティストが解説
                                            • RにTorchとLightGBMがやってきた - 渋谷駅前で働くデータサイエンティストのブログ

                                              これまで、RとPythonは両方使える人が少なくないながらも開発陣やコミュニティの思想が違うせいもあってか、「Rは統計学向け」「Pythonは機械学習向け」的な住み分けが年々進み、特に機械学習関連の重要なフレームワーク・ライブラリ類はPython向けのみがリリースされることが多く、R向けにはリリースされないということが常態化している印象がありました。 そんな中、この9月にPythonの機械学習OSSを代表する2つのライブラリが相次いでR版パッケージを発表したので、個人的にはなかなか驚きました。中には「この2つがRに来たからにはもうPythonは触らない」と豪語する過激派の方もいらっしゃるようですが(笑)、それはさておき個人的な備忘録としてこの2つのR版パッケージを試してみた記録を記事として残しておこうと思います。 なお、以下のモデリングはほぼ何もチューニングを行っておりません。あくまでも「

                                                RにTorchとLightGBMがやってきた - 渋谷駅前で働くデータサイエンティストのブログ
                                              • データサイエンス実務の典型的なワークフローを考える - 渋谷駅前で働くデータサイエンティストのブログ

                                                (Image by Gerd Altmann from Pixabay) 元々Quora英語版で回答を書いた話題なのですが、「データサイエンティストの典型的なワークフロー」というのは当たり前の話題のようでいて意外と難しいトピックです。それこそ例えば巷の営業やエンジニアの人々に向かって「あなたの『職種』の典型的なワークフロー」について教えて欲しいとリクエストしても「それは個々の現場・会社ごとに千差万別だろう」と言われてしまうのが関の山だと思われます。 ただ、おそらくこの質問がQuora英語版でされていた理由として「まだデータサイエンティストという職種がそれほど世間に広まっていないので、そもそもどのような仕事の流れをたどるかのイメージ自体が未経験者には思いつかない」ということがあるのではないかと個人的には見ています。ここが明確になっていないせいで、新たにデータサイエンティストの仕事に就きたいと

                                                  データサイエンス実務の典型的なワークフローを考える - 渋谷駅前で働くデータサイエンティストのブログ
                                                • 『計量経済学』(末石本)はエコノメトリクスのエッセンスを「オールインクルーシブ」で簡潔にまとめた必読の一冊 - 渋谷駅前で働くデータサイエンティストのブログ

                                                  計量経済学 ミクロデータ分析へのいざない 作者:末石 直也日本評論社Amazon データ分析業界の友人から「読んでみたら物凄く良かった」と勧められて買ったのが、こちらの一冊。同名の書籍は沢山あるので、ここでは著者の末石先生のお名前を取って「末石本」と呼ばせていただきますが、これが本当に物凄く良くて感嘆させられるばかりでした。 ということで、門外漢が書いて良いものかどうか迷うところですが簡単に書評をまとめてみました。特に操作変数法を中心とする因果推論・自然実験まわりの確かな知識を得たい人にはお薦めだということを最初に書き添えておきます。なお、いつもながらですが僕の理解があやふやなため書評の中には怪しい箇所もあるかと思いますので、お気付きの方はコメント欄なりでご指摘くださると幸いです。 本書の内容 第1章 線形回帰とOLS 第2章 操作変数法 第3章 プログラム評価 第4章 行列表記と漸近理論

                                                    『計量経済学』(末石本)はエコノメトリクスのエッセンスを「オールインクルーシブ」で簡潔にまとめた必読の一冊 - 渋谷駅前で働くデータサイエンティストのブログ
                                                  • AIで皆さんの好みにぴったり合う絶品インドカレーを作る方法をまとめて本にしました - 渋谷駅前で働くデータサイエンティストのブログ

                                                    最近思い出したように趣味の自作インド料理の話題を各所で披露することが多いのですが、完全に趣味が高じた結果としてAIというか機械学習とインド料理を掛け合わせたら面白いことが出来るのではないか?と思い、ついにこの度本まで出すことになりました(笑)。題して『AIでインドカレーを自作しよう』という本です。 必要なものは、本書と、インド料理に必要な食材やスパイス以下各種調味料と、厚手の鍋と、こちらのGitHub repoから入手できるKerasをバックエンドとするpre-trained modelだけ。このモデルは日本に限らずシンガポール・インド・US・UKのカレー好きの人たち多数から集めたデータをもとに構築したものです。これを同じrepoに置いてあるnotebookに従ってインポートしてKerasベースNNを組み、初期値として皆さんの居住国・年齢・身長・体重などのdemograpihic info

                                                      AIで皆さんの好みにぴったり合う絶品インドカレーを作る方法をまとめて本にしました - 渋谷駅前で働くデータサイエンティストのブログ
                                                    • マーケティングと機械学習は相性抜群、データサイエンティストが業務ごとに解説

                                                      マーケティングは、他部署との折衝や規制が少ないので機械学習の導入が行いやすく、また比較的たやすく効果測定でき、さらにインパクトがわかりやすいので始めるのに適した分野です。 特にECやCRMと言ったデジタルマーケティングでは、元からかなりのデータが蓄積されているケースが多いです。業種に関わらず機械学習が活用されており、事例の多いテーマでもあります。 機械学習によりマーケティング業務が効率化し、パフォーマンス改善につながります。また、単に精度を向上させるだけでなく、これまで特定の人の感覚に頼っていた業務の属人化を防げます。 たとえば人事異動でまったく新しい人間が担当になっても、フォーマット化されたデータを使えば以前と変わらない高精度なターゲティングモデルを運用することが可能です。ではさっそく具体的な活用事例を見ていきます。 B2Bマーケティングでの機械学習活用 B2Bマーケティングは、受注確度

                                                        マーケティングと機械学習は相性抜群、データサイエンティストが業務ごとに解説
                                                      • いま、もっとも渇望されている「データ・サイエンティスト」その役割とは? | Mugendai(無限大)

                                                        「情報化社会」という概念が広く使われ始めたのは、1990年代半ばのことだと言われています。 それから約30年――コンピューターやスマートフォン等が普及し、インターネットを中心としたネットワーク・インフラが整備されたことを受けて、情報は質・量の両面で大きな変化を遂げました。 加えて、近年のIoT(Internet of Things)やビッグデータ処理、AI(人工知能)といった新たな技術の進化により、社会における情報の位置付けは大きく見直されつつあります。 「情報化社会」という概念が広く使われ始めたのは、1990年代半ばのことだと言われています。 それから約30年――コンピューターやスマートフォン等が普及し、インターネットを中心としたネットワーク・インフラが整備されたことを受けて、情報は質・量の両面で大きな変化を遂げました。 加えて、近年のIoT(Internet of Things)やビッ

                                                          いま、もっとも渇望されている「データ・サイエンティスト」その役割とは? | Mugendai(無限大)
                                                        • RでK-meansの最適なクラスタ数をAIC / BICに基づいて求める - 渋谷駅前で働くデータサイエンティストのブログ

                                                          これはただの備忘録です。既知の話題ばかりが並べられているので、特に新鮮味のない内容である点予めご容赦ください。 クラスタリング手法として広く知られるK-meansは、その簡便さから非常に広汎に使われていますが、一方で「クラスタ数を恣意的に決め打ちせざるを得ない」という難点があり、「最適なクラスタ数をどうやって決めるか」という課題が長年に渡ってあります。この課題の解決策についてちょっと調べてみたので、以下にまとめてみました。 K-meansにおける「最適なクラスタ数の決め方」として、こちらの記事では伝統的な手法ということで エルボー法 シルエット分析 X-means(K-meansに情報量規準を適用して再帰的に最適クラスタ数を決める) の3種類が紹介されています。これらは僕も以前から聞いたことがあるもので、実際K-meansの実装の中には最初からエルボー法などを含んでいるものもあったりします

                                                            RでK-meansの最適なクラスタ数をAIC / BICに基づいて求める - 渋谷駅前で働くデータサイエンティストのブログ
                                                          • Lightweight MMM:NumPyroで実装されたベイジアンMMMフレームワーク - 渋谷駅前で働くデータサイエンティストのブログ

                                                            以前「Ads carryover & shape effects付きのMedia Mix Modeling」という記事で取り上げたベイジアンMMMのtechnical report (Jin et al., 2017)ですが、当時RStanで実装されていたものが4年の時を経て時代の趨勢に沿う形でPythonベースのOSSとしてリリースされています。 それがLightweight MMM (LMMM)です。ベイジアンモデリング部分はNumPyroによるMCMCサンプラーで実装されており、さらにはモダンなMMMフレームワークにおいて標準的とされる予算配分の最適化ルーチンも実装されています。全体的な使い勝手としては、まだ開発途上の部分もあるので時々痒いところに手が届かない感があるものの、概ねRStanで実装したものと似たような感じに仕上がっているという印象です。 ということで、LMMMがどんな感

                                                              Lightweight MMM:NumPyroで実装されたベイジアンMMMフレームワーク - 渋谷駅前で働くデータサイエンティストのブログ
                                                            • NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 | NTT東日本

                                                              News Release東日本電信電話株式会社 2024年5月17日 NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 NTT東日本のデータサイエンティスト森田 大貴(もりた だいき)を含むチームが、世界的なAIのデータ分析コンペティションプラットフォーム「Kaggle(カグル)」※1で開催された「LLM Prompt Recovery」※2(以下、本コンペティション)において、全2,175チーム中12位に入賞し、金メダルを獲得しました。 これにより、森田社員は「Kaggle」コンペティションに参加している約20万人のユーザーの中で上位約1%に相当する「Kaggle Master」※3の称号を獲得しました。 1. 本コンペティションについて 「Kaggle」は、世界中のAIエンジ

                                                                NTT東日本のデータサイエンティストがKaggleコンペティション「LLM Prompt Recovery」で金メダルを獲得し、Kaggle Masterへ昇格 | NTT東日本
                                                              • データサイエンティストは預言者だった? AI時代の社会の回し方

                                                                近代民主主義の起源となった思想家の難しい概念は、実はビッグデータのことだった──? 哲学者の東浩紀さんと「AIの遺電子」作者の山田胡瓜さんの対談で出てきた「一般意志2.0」と「訂正可能性」というキーワード。AIが否応なしに普及していく中での社会制度を考えるべく、東さんの哲学について山田さんが聞いていく。 前編:AI社会はクレーム対応社会? 東浩紀と山田胡瓜が語る、AIが見せるユートピアとディストピア 中編:なぜ僕らは画像生成AIよりも人のイラストに惹かれるのか 改めて問われる「自分は何がしたかったのか」問題 後編(この記事):データサイエンティストは預言者だった? AI時代の社会の回し方 (聞き手・執筆:井上輝一) データサイエンティストは預言者か ルソー「一般意志」の現代的解釈 山田 良くも悪くも、AIは実質的に世の中に入ってきちゃうじゃないですか。それに対する議論の上では人文的な知見が

                                                                  データサイエンティストは預言者だった? AI時代の社会の回し方
                                                                • TensorFlow Probabilityを試してみる(1): 定番のEight SchoolsのモデリングをRStanと比較する - 渋谷駅前で働くデータサイエンティストのブログ

                                                                  先日の記事でも書いたように、どうもここ最近RStan周りの環境が色々厳しくなっている気がしていて、仮にRStanが今後環境面での不具合やミスマッチなどで使えなくなったらベイジアンモデリングやれなくなって困るかも。。。という危惧を最近抱きつつあります。 そこで代替手段として思いつくのが、JAGS, PyMC, PyStan, そしてTensorFlow Probability (TFP)。TFPを挙げたのは完全に身贔屓なんですが(笑)、Pythonで回せるものとして近年注目を集めているフレームワークとしては筆頭に近いのではないかと思います。ということで、贔屓の引き倒しみたいになりそうですが今回含めてちょっと連続してTFPでRStanと同じことをやってみる、というただそれだけの備忘録的な記事をだらだらと書いていこうと思います。 いつもながらですが、僕はコーディングに関してはド素人ですので間違っ

                                                                    TensorFlow Probabilityを試してみる(1): 定番のEight SchoolsのモデリングをRStanと比較する - 渋谷駅前で働くデータサイエンティストのブログ
                                                                  • 30歳目前となったので、データサイエンティストとしての半生を振り返る - Qiita

                                                                    ※1 上記に関しては、まだ給与テーブルや評価制度が整備されていなかったり、当時の市場状況を反映している給与、報酬なので、あくまで村上個人の相対的なステップアップに対する基準値であり、特定の会社の給与水準の参考に使用するのはお控えください。 ※2 自分の年収情報を機密情報として指定された場合に効力あるのでしょうか?詳しい人がいれば教えて頂きたいです。(同時に受かった会社から提示された年収は後で提示しておきます。) これを公開することで何が言いたいかというと、 「新卒4ヶ月で退職してしまって、茨の道でしかなかった。でも、へこたれずにちゃんとやれば挽回できる。」 ということを伝えたいんです。 最初の分析受託会社が結構有名な所なので、今はそこのOBという錯覚資産をフル活用して使わせて貰ってますが、その実態は実はアルバイトでした。詳しいことは後ほど書きますが、どんな仕事をしていてもアルバイトはアルバ

                                                                      30歳目前となったので、データサイエンティストとしての半生を振り返る - Qiita
                                                                    • 蔓延防止等重点措置(まん防)の効果検証を「あえて」DID+TSclustによる時系列クラスタリング+CausalImpactでやってみた - 渋谷駅前で働くデータサイエンティストのブログ

                                                                      少し前の話ですが、現在COVID-19の感染が拡大している地域で実施される「蔓延防止等重点措置(まん防)」に効果があったかどうかについて、計量経済学的な観点に基づいた政策評価レポートが公開されて話題になっていました。 追記 本日午前中に元のレポート自体が更新されていたようで*1、今回の記事はその更新を反映していない点悪しからずご了承ください。 で、結論はともかくその手法とアプローチについては色々と議論が起きているようです。例えば、上記のブログ記事では実際に東京都のデータで追試をしてみて、もう少し異なるやり方があるのではないかと指摘しています。 この辺は僕にとっても同様で、普段から同様のデータ分析を広告・マーケティング分野で手掛けている身としては「自分ならこうしたい」と思われるポイントが幾つかあり、折角データソースや背景となる行政措置の詳細などがレポート中で明記されているのだから、いっそ自分

                                                                        蔓延防止等重点措置(まん防)の効果検証を「あえて」DID+TSclustによる時系列クラスタリング+CausalImpactでやってみた - 渋谷駅前で働くデータサイエンティストのブログ
                                                                      • 日本HPが提唱するエッジAIの有用性「データサイエンティストが妥協せず最高精度のモデルを作れる」 | Ledge.ai

                                                                        サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                                                          日本HPが提唱するエッジAIの有用性「データサイエンティストが妥協せず最高精度のモデルを作れる」 | Ledge.ai
                                                                        • 企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム

                                                                          企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム:Kaggleイベントレポート 最近注目を集めている“Kaggler採用枠”やKaggler社内ランク制度の実態はどのようなもので、それによってどのようなメリットがあるのか。実際にKaggler制度を運用する企業の代表者やその制度の下で働くKagglerたちの意見を聞いてみよう。

                                                                            企業の“Kaggler枠”って実際どうなの? ― データサイエンティスト協会 7th シンポジウム
                                                                          • 新卒データサイエンティストとして入社したLINEを退職し、GANYMEDEに入社しました|gya9

                                                                            Absolute JUPITER 改め ZETA DIVISION VALORANT部門アナリストのgya9(ぎゃく)です。今回はVALORANTの話題から少し逸れて、自分のキャリアについてのお話になります。 表題の通り、LINE株式会社を退職し、本日2021年7月8日よりZETA DIVISION(旧 JUPITER)を運営するGANYMEDE株式会社に入社しました。 今後は、Esports事業のデータ分析職とVALORANTチームのアナリストを兼任することになります。引き続き応援よろしくお願いします! 以下、もう少しだけ詳細な経緯を話します。身の上話になってしまいますが、興味のある方やキャリアについて考えている方の参考になれば幸いです。 前職について 就活時には、①自分の強みを活かせる ②興味のある分野になるべく近い の2点を満たすような仕事がしたいと考えており、学生当時のスキルセット

                                                                              新卒データサイエンティストとして入社したLINEを退職し、GANYMEDEに入社しました|gya9
                                                                            • Google、データサイエンティストや機械学習エンジニア向けのMLOpsサービスを発表

                                                                              CodeZine編集部では、現場で活躍するデベロッパーをスターにするためのカンファレンス「Developers Summit」や、エンジニアの生きざまをブーストするためのイベント「Developers Boost」など、さまざまなカンファレンスを企画・運営しています。

                                                                                Google、データサイエンティストや機械学習エンジニア向けのMLOpsサービスを発表
                                                                              • 21. データサイエンティスト新卒課題図書6冊を紹介します! | 白金鉱業.FM

                                                                                弊社では「新卒1年目は毎日業務時間1hを使って課題図書を読んで勉強する(1年間)」という勉強会制度があります。 例年2年目になった先輩が自身の経験を元に図書の入れ替えを行い、次年度の課題図書を指定&メンターに就任する仕組みです。 2019年の1年間の勉強会を終え、2020年度版の課題図書の選定が終わったので、担当した2年目社員メンバーから今年の課題図書を紹介してもらいました! 白金鉱業.FMのハッシュタグ #白金鉱業fm にてコメントなど歓迎です! Show notes 統計学のための数学入門30講 統計学入門 統計モデルと推測 (データサイエンス入門シリーズ) はじめてのパターン認識 実証のための計量時系列分析 最適化手法入門(データサイエンス入門シリーズ)

                                                                                  21. データサイエンティスト新卒課題図書6冊を紹介します! | 白金鉱業.FM
                                                                                • データサイエンティストって「4種類」あんねん - Qiita

                                                                                  データサイエンティストってなんだ? 僕は現在とあるコーヒーチェーン企業でデータサイエンティストとして働いている。 なんやかんやで社会に出てから約5年ほどが経った。 ただ、正直なところ僕自身が最近まで データサイエンティストがどのような職業なのかよくわかっていなかった。 「働いてるのに何を言っているんだ?」と思われるかもしれないが、落ち着いて聞いてほしい。 おそらくその理由はデータサイエンティストという職業に対するイメージが人によってバラバラであり、自分のやっていることが世間一般で言うところの「データサイエンティスト」なのかよくわかっていなかったからだと思う。 そんな中、最近『データ分析失敗事例集』という本で「データサイエンティストには4つの分類がある」という話を読んでしっくりきたので自分の経験も合わせてまとめたい。 4つの分類 まずは書籍に載っていた4つのパターンをざっくりまとめてみよう。

                                                                                    データサイエンティストって「4種類」あんねん - Qiita