並び順

ブックマーク数

期間指定

  • から
  • まで

241 - 280 件 / 619件

新着順 人気順

dataScienceの検索結果241 - 280 件 / 619件

  • 「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS - once upon a time,

    2016/07/25に「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました。 connpass.com 今回はClouderaに入って初めてのコミュニティイベントということでしたが、なんと400人を超える応募をいただいてとてもありがたい限りです。 会場をご提供いただいたDMM.comラボ様、発表いただいたサイバーエージェントの内藤さん、DMM.comラボの加嵜さん、LTの皆様ありがとうございました。 togetter.com pandasを大規模データにつなぐIbis Ibis: すごい pandas ⼤規模データ分析もらっくらく #summerDS from Cloudera Japan www.slideshare.net Ibisはpandasの作者でもある Wes McKinney(@wesmckinn) の作っているライブラリです。 ひとこ

      「夏真っ盛り!Spark + Python + Data Science祭り」を開催しました&Ibisを紹介しました #summerDS - once upon a time,
    • 「データ分析の“便利屋”にはなるな」、大阪ガスのデータサイエンティストが講演

      「ビジネス現場から依頼を受けて仕事をしていると、結局はデータ分析の“便利屋”になってしまう。自分たちから現場に対して、こんなデータ分析をしませんかと“営業”していかなければならない」──。 ガートナー ジャパンが2013年5月27~28日に都内で開催しているイベント「ビジネス・インテリジェンス&情報活用 サミット 2013」で、大阪ガスのデータサイエンティストである河本薫氏が講演した。「分析力を武器とするIT部門になるには?」と題したテーマで語り、多くの聴衆を集めた(関連記事:ナニワのデータサイエンティストは、現場の「こうちゃうか?」を尊重)。 大阪ガス情報通信部ビジネスアナリシスセンターの所長で、自身を含めて9人のデータサイエンティスト集団を率いる河本氏は、自分自身のこれまでの苦労を惜しげもなく披露。「ビジネス現場から門前払いされたり、それこそ便利屋扱いされたり、人材不足に陥ったりと、組

        「データ分析の“便利屋”にはなるな」、大阪ガスのデータサイエンティストが講演
      • データ分析プロジェクトの品質をキープしつつ効率的な検証をサポートする一時ファイル群の管理 - クックパッド開発者ブログ

        研究開発部の takahi_i です。本稿はデータ分析、 機械学習関係のプロジェクトで数多く生成される一時オブジェクトおよびそれらのオブジェクトを保持するファイル(一時ファイル)を管理する取り組みについて解説します。 本稿の前半はデータを分析するプロジェクトの一般的なフローと起こりがちな問題(コードの品質管理)について解説します。後半はプログラム上で生成されるオブジェクト群をファイルに自動でキャッシュを管理するツール(Hideout)を使って、コードを整理整頓しやすくする施策について紹介します。 データを分析するプロジェクトの一般的なフロー まずデータを処理するプロジェクトや機械学習プロジェクトの典型的なフローについて考えてみます。まずは単純に機械学習器を取得した入力に対して適用するプロジェクト、次にもう少し複雑な事例、アプリケーションで利用するデータを生成するプロジェクトのフローについて

        • Home | Data Science at the Command Line

          👋 Hi there! I’m Jeroen. In 2021 I wrote the second edition of Data Science at the Command Line, which you can read entirely for free here. If you find this book helpful, consider spreading the word! You could, for instance, share it on Twitter, write a review on Amazon, or star the Github repository. Much appreciated! Read Data Science at the Command Line for free Be sure to let me know if you ha

            Home | Data Science at the Command Line
          • DataRobot homepage | DataRobot AI Platform

            Platform AI Platform The platform for generative and predictive AI. Learn more Documentation Pricing What’s New Demo Hub Explore Generative AI Product Offering Operate Confidently scale AI and drive business value with unparalleled enterprise monitoring and control. Deploy and Run Learn and Optimize Observe and Intervene Govern Unify your AI landscape, teams, and workflows for full visibility and

              DataRobot homepage | DataRobot AI Platform
            • R&D部部長が語る、ホットリンクにおける「データサイエンティスト定義と求められるスキル」の話|ホットピ|ホットリンク

              R&D部部長の 榊 です。今日は、当社におけるデータサイエンティストの定義と求められるべきスキルセットについて話したいと思います。 概要 下図のように当社における「データ分析を活用したSaasを開発する場合のデータサイエンティストの定義」を作りました。 既存の3つの定義から、良い部分を拝借しました。 各社ごとに、自社にあったデータサイエンティストを定義しておくのが重要ではないか? はじめに 当社は、「データとAIで意思決定をサポートする」を事業ミッションとして掲げており、特に去年から人工知能技術 (※) に長じた人材、言い方を変えればデータサイエンティストの採用と育成に力を入れてきました。しかし、特に社内で「データサイエンティストとは何か」の定義などを作ることもなく、当社に必要な人材のスキルを列挙し、そちらを募集要項に書くことで満足していました。 そんな中で、某強面の役員から、ある日 「そ

                R&D部部長が語る、ホットリンクにおける「データサイエンティスト定義と求められるスキル」の話|ホットピ|ホットリンク
              • Python使いで『今後はデータビジネスの現場かも』って人、NimData/Arraymancerをさわってみておこう。 - Qiita

                Python使いで『今後はデータビジネスの現場かも』って人、NimData/Arraymancerをさわってみておこう。Python機械学習Nimarraymancer創薬ダジャレ はじめに 本エントリーは、主には、python使いな人でデータビジネス界隈でのバッチ処理/ストリーム処理やIoTのエッジ端末側のことが気になっている人の流し読み向けポエムかと。 前提とする近未来像 IoT+AIな開発案件で、サーバー(クラウド)側での学習済モデルを迅速にフィールド展開(モバイル端末やIoTエッジ端末へのデプロイ)することがしばしば求められるようになっている状況。 #参考TensorFlow Liteのliteな話 IBM QやMS Q#など量子コンピューティングな界隈がざわついている年の瀬に地味な話だろうけど 、通信速度に制約ある限り、必要な話。今後の展開先としては、『自律的にふるまうドローン、

                  Python使いで『今後はデータビジネスの現場かも』って人、NimData/Arraymancerをさわってみておこう。 - Qiita
                • ビッグデータを活かすデータサイエンス -クロス集計から機械学習までのビジネス活用事例という本を執筆しました! - yokkunsの日記

                  前回の書籍「ビジネス活用事例で学ぶデータサイエンス入門」の姉妹本つくりました。 今回のはライト層向けの啓蒙的書籍です。 コードは一切ないです。 統計処理の解説をつけました。 用語解説を充実させました。 データサイエンスってなにしているの?的なことを軽く読みたい方ぜひ! 以下、「はじめに」を抜粋します。 はじめに 人間の感覚はとても優れています。ときにはデータでわかること以上のことに実感を伴って理解していたりします。しかしながら一方で、ある部分ではいいかげんなため、ある一面においてデータ分析がビジネスで効果をあげているのではないかと。 そのある一面とは他人の気持ちを想像するという一面になると考えます。経験することで生まれた感覚がデータを超えた、とても優れている機能であることは間違えないのですが、どこまでいっても自分の感覚という域をでません。ビジネスでは他人の気持ち、みんなの気持ちを上手に理解

                    ビッグデータを活かすデータサイエンス -クロス集計から機械学習までのビジネス活用事例という本を執筆しました! - yokkunsの日記
                  • Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ

                    Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ2023.11.16 08:00150,044 Thomas Germain -Gizmodo US- [原文] ( R.Mitsubori ) 明日天気になあれ。 ついに、「今日どんな服装で出かけたらいいか」ロボットが教えてくれる時代が来ましたよ。GoogleのAI部門であるGoogle DeepMindは、従来のシステムを90%以上上回る最新の天気予報モデルを発表しました。その名も「GraphCast」という機械学習モデルで、天気予報アプリよりも早く正確に、しかも効率的にこの先10日間のお天気を教えてくれます。 現地時間の14日、Googleの研究チームは論文を発表。そのなかで「我々はこれが、天気予報の転換点になると確信しています」と記しています。 大量の過去気象データから未来を予測現在の天気予報は一般的に「数値天気予報(N

                      Googleが最新の天気予報ソフトを開発、めっちゃ当たるってよ
                    • “データサイエンティスト=特殊な仕事”ではない、誰もがなれる「問題解決型」データサイエンティストとは

                      『MarkeZine』が主催するマーケティング・イベント『MarkeZine Day』『MarkeZine Academy』『MarkeZine プレミアムセミナー』の 最新情報をはじめ、様々なイベント情報をまとめてご紹介します。 MarkeZine Day

                        “データサイエンティスト=特殊な仕事”ではない、誰もがなれる「問題解決型」データサイエンティストとは
                      • 令和の「データサイエンティスト」に必要な能力

                        データサイエンティストに必要な能力 データサイエンティストという仕事が注目を集めています。インターネットの普及などITが進化したことで、企業が取り扱えるデータが格段に増えました。ビジネスにおいて、ヒト、モノ、金に次ぐ4つ目の経営資源として、データの活用が重要な要素となってきたのです。データを整理・分析し、ビジネスに活用する役割を担うのがデータサイエンティストです。 一般社団法人データサイエンティスト協会では、データサイエンティストに求められるスキルとして、3つの能力を定義しています。ビジネス力、データサイエンス力、データエンジニアリング力の3つです。 データを分析するだけであれば、データサイエンス力さえあればよいかもしれません。しかし、実際のデータサイエンティストには、データを処理すること(データエンジニアリング力)、分析すること(データサイエンス力)、その結果をビジネスに活用すること(ビ

                          令和の「データサイエンティスト」に必要な能力
                        • Jupyter だけで機械学習を実サービス展開できる基盤

                          2018/11/20開催の「Machine Learning Casual Talks #7」での発表資料です。 チームで開発中の、サイエンティストとエンジニアが効率よく 機械学習や分析結果をプロダクトへ反映するための基盤の紹介です。 https://mlct.connpass.com/event/104874/

                            Jupyter だけで機械学習を実サービス展開できる基盤
                          • 再現性なんてないさ(?)

                            (わざわざ手描きにしたのに結局著作権が危うい絵を描いている) どうもこんにちは、博士論文(仮)を提出したばかりのぴちぴちのD3、@calicolicaliです。学生最後ということで、院生しか登録できないAdvent calendarに登録させていただきました! ʕ◔ϖ◔ʔ 「統計について」という事前コメントをしましたが、 私の専門はアルゴリズム寄りのComputational Biologyで、これまではRNA二次構造予測ソフトウェアParasoRの開発や、配列アラインメントソフトウェアLASTの開発に関わらせていただいたりしてきました。(ご興味あればぜひ!)しかしこの分野では「網羅的な遺伝子データや配列情報を扱うためには統計や機械学習が必要!」ということで、日々これらの分野の勉強をしております。 そんな私が紹介する、今年読んだ一番好きな論文はこちら(`・ω・´)つ "Estimating

                              再現性なんてないさ(?)
                            • thinkpython.dvi

                              Think Python 2 Think Python: How to Think Like a Computer Scientist Allen B. Downey Copyright c �2013 ThinkPython: by is licensed under a Creative Commons 3.0 License 3 11 1 13 1.1 Python . . . . . . . . . . . . . . . . . . . . . . 13 1.2 . . . . . . . . . . . . . . . . . . . . . . . . . . 15 1.3 . . . . . . . . . . . . . . . . . . . . . . . . 16 1.3.1 . . . . . . . . . . . . . . . . . . . . . . .

                              • そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる - Qiita

                                データサイエンティストってなんだろう 掲題の通り、昨今色々と言われてるデータサイエンティストなる職業について考えてみる。 業界にいてもこの職種はとかく定義が曖昧で、統一的な見解がない。 まあ正直、『データサイエンティストなんて名乗りたい奴が名乗ればいーんじゃねーのぉ』という話ではあるのだが、せっかくなのでこの期に個人的な考えを書いておこうと思う。 なお、普段からデータサイエンティストについて考えている諸氏にとっては目新しいことは特に書いてないかもしれない どちらかと言えば、「データサイエンティストってどうやったらなれるんじゃい」、もしくは「流行りのデータサイエンティスト様を雇いたいけどどんな人採ればよいかのぅ」 って方々に見て欲しい記事なのでそのあたりはご了承願いたい 世間一般の見解を見てみる とりあえず世の中に既にある有名な幾つかの定義の俗説を見てみることにする。 "Data Scien

                                  そろそろデータサイエンティストの定義とスキルセットについて本気で考えてみる - Qiita
                                • スパースモデリングとは|仕組み・強み・ディープラーニングとの違いを解説 | Ledge.ai

                                  サインインした状態で「いいね」を押すと、マイページの 「いいね履歴」に一覧として保存されていくので、 再度読みたくなった時や、あとでじっくり読みたいときに便利です。

                                    スパースモデリングとは|仕組み・強み・ディープラーニングとの違いを解説 | Ledge.ai
                                  • 松原望 ― 総合案内サイト

                                    Andante sostenuto - Allegro con anima 優美にゆっくりと - 速く快活に生気を以って。 チャイコフスキー交響曲第4番などの速さと発想。(2005.11.9) 我が尊敬する人 聖学院大学はすでに退職し、東京大学名誉教授、(株)ベイズ総合研究所代表取締役として、研究・教育活動、著作活動、コンサルテーションを展開中(2019.9) 更新を再開します。ファイナンス、ベイズ統計学、AI関係を充実します。(2018.6.10) ことに好評の 「ベイズ統計学」(創元社) および 「ベイズの誓いーベイズ統計学はAIの夢をみる」 (聖学院大学出版会)のサイトを近々始めます。少々お待ちください。また、顔認証、動物認証、じゃんけんAI、数字認証などの面白い本を計画中です。 さらに、従来よりコンスタントに人気のある「入門確率過程」のファイナンス充実版の改定を近々に執筆開始します

                                    • 【コーポレート】データ専門研究開発組織「LINE Data Labs」を新設 | ニュース | LINE株式会社

                                      サービス上での機械学習、人工知能(AI)、大規模データ基盤領域における研究を推進 年内50人規模の組織を目指し、採用を強化 LINE株式会社(本社:東京都渋谷区、代表取締役社長:出澤 剛)は、LINEおよびLINE周辺サービス事業領域におけるデータの分析・研究を行う専門の開発組織として「LINE Data Labs(ライン データラボ)」を新設いたしましたので、お知らせいたします。 「LINE Data Labs」は、これまで各サービス事業領域ごとに存在していたデータチームを統合して新設されたデータ専門研究開発組織です。「LINE Data Labs」の設立により、各サービスの事業領域を超えて、ユーザーの利用動向等のデータを横断的に扱うことが可能になり、より精密なデータ分析や情報フィルタリングを実現し、これまで以上に効率的なデータ・情報活用を目指してまいります。 「LINE Data La

                                        【コーポレート】データ専門研究開発組織「LINE Data Labs」を新設 | ニュース | LINE株式会社
                                      • 海の向こうでも日本でも「データサイエンティスト」は雌伏の時 - 渋谷駅前で働くデータサイエンティストのブログ

                                        なかなか刺激的な翻訳記事が出ていたようで。ちなみに本家版の原典記事はこちら。 大体こういう話をするとよく炎上するんですが(笑)、前々からデータサイエンティスト(カナ)の需給状況とかについては延々とこのブログでも論じてきているので、便乗して日本での国内事情に関する与太話でも書こうかと思います*1。 そもそも日本国内に「データサイエンティスト」と呼ばれるにふさわしい人材自体がほとんどいない (from Wikimedia Commons) いつも色々な人に「そもそもデータサイエンティストって日本にどれくらいいるんですか?」とよく聞かれるんですが、これについては最近業界内の友人知人と話す機会が何度かあり、「おそらく首都圏に100人程度」「残りの地域は不明だがごく少数」というのが概ねコンセンサスの得られている数字だと思います*2。 これは実際に上記記事で挙げたような要件を満たし、なおかつデータ分析

                                          海の向こうでも日本でも「データサイエンティスト」は雌伏の時 - 渋谷駅前で働くデータサイエンティストのブログ
                                        • 過熱する“AI人材争奪戦” 「報酬以外の魅力必要」 DeNAの戦略

                                          ディー・エヌ・エーが、優秀なデータサイエンティストを獲得するため「Kaggle社内ランク制度」の導入を始めた。国内外で加熱するAI人材の争奪戦。同社はどうやって優秀な人材の獲得競争に勝とうとしているのか。 研究者やデータサイエンティストなど、優秀なAI人材の争奪戦が過熱している。米Appleや米Googleら大手IT企業が続々とAIベンチャーを買収する中、国内でもAI(人工知能)に造詣の深い人材の獲得で各社が競争を繰り広げている。 中でも、データ分析や機械学習のさまざまなコンペに参加できる米国発のプラットフォーム「Kaggle」(カグル)で優秀な成績を収めたKaggler(カグラー)と呼ばれるデータサイエンティストたちの需要が高まっている。

                                            過熱する“AI人材争奪戦” 「報酬以外の魅力必要」 DeNAの戦略
                                          • DataVehicle

                                            Data science for everyone データサイエンスを 身近にするのが 私たちの仕事です。 私たちデータビークルは、人間がデータから 価値を生み出すまでの全ての障壁をなくします。 会社情報をみる

                                              DataVehicle
                                            • Uber徹底研究 -MaaSを支えるデータサイエンス編-|Tack

                                              今回はUberが使用する高度な手法について紹介します。紹介するのは以下の5つですが、レコメンドに関しては次回に回します。今回からは少し専門的な内容になります。 ・需要予測 ・配車最適化 ・ダイナミックプライシング ・解約予測 ・レコメンド(ボリュームが多いので、次回説明) 本記事は連載4回目の投稿ですが、これまでの投稿は以下の通りです。 ・Uber徹底研究 -ビジネス概要編- ・Uber徹底研究 -UX改善編- ・Uber徹底研究 -ゲーミフィケーション・行動科学編- Uberのサービスは、まるで魔法を唱えてタクシーを召喚するかのように表現されますが、その魔法の裏にあるデータサイエンスを今回は紹介していきます。 ■需要予測昨今、様々な企業が需要予測を行っています。需要予測には、通常はいわゆる時系列モデル(ARIMA等)を活用した予測や、Xgboostやランダムフォレスト等の機械学習モデルを

                                                Uber徹底研究 -MaaSを支えるデータサイエンス編-|Tack
                                              • CometMLは「機械学習のためのGitHub」になることを狙う | TechCrunch Japan

                                                End-to-end encrypted messaging app, Signal, is getting closer to launching a much anticipated feature that will allow users to share only a username in order to connect with other users, rather than h

                                                  CometMLは「機械学習のためのGitHub」になることを狙う | TechCrunch Japan
                                                • JTP Technology Port - JTP株式会社

                                                  JTP Technology Portにアクセスいただきましてありがとうございます。 JTP Technology Port は、2021年3月31日ををもちまして閉鎖いたしました。 これまでご利用いただきました皆さまには、心より御礼申し上げます。 トップ に戻る

                                                    JTP Technology Port - JTP株式会社
                                                  • データサイエンティスト協会、データサイエンティストのミッション、スキルセット、定義、スキルレベルを発表

                                                    • K8Sで機械学習の予想システムを作成  - にほんごのれんしゅう

                                                      K8Sで機械学習の予想システムを作成 目次 - 機械学習の最小粒度としてのDocker, Dockerのデプロイ先としてのk8s - テキストを評価するAPIのDockerコンテナの作り方 - DockerコンテナのGoogle Cloud Container Registryへの登録 - K8Sへのデプロイ - 実際にアクセスする - まとめ 機械学習の最小粒度としてのDocker, Dockerのデプロイ先としてのk8s コンテナのオーケストレーションツールがk8sが他のツールを押しのけて、優位にたった状況からしばらく経過し、ドキュメントやユースケースが揃ってきました。 GCPではコンテナを使ったデプロイメントサービスはKubernetes Engineがデフォルトであり、WebUIやCUIでの操作例を示したドキュメントも充実してきました。 k8sは、ローリングリリースが簡単にできたり

                                                        K8Sで機械学習の予想システムを作成  - にほんごのれんしゅう
                                                      • Udemy資料

                                                        お知らせ 2023/5/20に大幅なコースの改訂作業を行いこちらのページはhttps://github.com/tsjshg/udemy-pyds へ移動となりました。 --- 以下の内容は古いコースの資料です。 --- コースのご案内 リンクはHTML形式のnotebookを表示します。右にあるアイコンからは、ipynb形式のファイルをダウンロードできます。 動画を公開してから時間が経ったため、ライブラリのバージョンが上がってしまい、そのままでは動かないコードが多くなってきました。申し訳ありません。順次動画を差し替える予定ですが、ひとまず[修正版]と書かれたリンクからあたらしいバージョンに対応したipynb形式のファイルをダウンロードできます。ファイル名に_rev_が付いています。最近学習をはじめた方はこの修正版をご活用ください。 一括ダウンロードはこちらから numpyを知ろう Lec

                                                        • Amazon.co.jp: Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理: Wes McKinney (著), 小林儀匡 (翻訳), 鈴木宏尚 (翻訳), 瀬戸山雅人 (翻訳), 滝口開資 (翻訳), 野上大介 (翻訳): 本

                                                            Amazon.co.jp: Pythonによるデータ分析入門 ―NumPy、pandasを使ったデータ処理: Wes McKinney (著), 小林儀匡 (翻訳), 鈴木宏尚 (翻訳), 瀬戸山雅人 (翻訳), 滝口開資 (翻訳), 野上大介 (翻訳): 本
                                                          • 「機械学習とビジネスを橋渡しするものこそ評価指標であり, "全てのビジネスは条件付期待値の最大化問題として書ける"」という話の問題点と代替案 - ill-identified diary

                                                            概要 はじめに I. 条件付き期待値が全てか? i 条件付き「期待値」だけでよいのか? ii 条件付き期待値の条件とはなにか? メディアミックスモデルを例に 外挿と選択バイアス 補足: 条件付き期待値の条件付けに関して II. 機械学習の性能評価 ≠ ビジネスモデル なのか? 分類モデルと確率の推定 確率推定の評価はできるのか III. こういう話の教科書・参考書はないのか? まとめ 参考文献 概要 『機械学習とビジネスを橋渡しするものこそ評価指標であり, ”全てのビジネスは条件付期待値の最大化問題として書ける”仮説についての一考察 - 株式会社ホクソエムのブログ』というブログ記事に対する私の昨日の twitter での連続投稿の話を書き改め, 説明不足な部分を補った. 昨日と同様に, (I) 条件付き期待値だけでよいか, (II) ビジネスモデルと機械学習の性能評価は一致しないのか, (

                                                              「機械学習とビジネスを橋渡しするものこそ評価指標であり, "全てのビジネスは条件付期待値の最大化問題として書ける"」という話の問題点と代替案 - ill-identified diary
                                                            • TechCrunch | Startup and Technology News

                                                              It’s that time of week again, folks. Welcome to Week in Review (WiR), TechCrunch’s regular digest of the past week in tech. New here? Not to worry — sign up here to get WiR in your i

                                                                TechCrunch | Startup and Technology News
                                                              • Retty データ分析チーム 2020年の振り返り - 意思決定支援/分析民主化/データ基盤/ML - Retty Tech Blog

                                                                この記事はRetty Advent Calendar 2020の21日目の記事です。 adventar.org 昨日は、森田さんのETL基盤でデータを汎用的に処理できるようにした話でした。 はじめに こんにちは。平野(@MasaDoN22)です。 Rettyデータ分析チームのマネージャーを担当しています。 去年、一昨年に引き続き、分析チームの1年の振り返りとして書きました。 今年を一言でいうと、持てる武器を最大限活用して、目の前の課題に向き合った一年でした。 内容としては、分析チームの役割である意思決定支援・分析民主化・データ基盤・MLに沿って書いた一年の総集編です。 その結果、今年も文量が多くなってしまったので、興味のある分野だけ抜粋してお読みいただけますと幸いです。 本記事の前提となる、Rettyデータ分析チームの役割や過去の取り組みは、以下記事を御覧ください。 engineer.re

                                                                  Retty データ分析チーム 2020年の振り返り - 意思決定支援/分析民主化/データ基盤/ML - Retty Tech Blog
                                                                • Easy PCA - 簡単に主成分分析ができるページ

                                                                  At this site, you can easily execute PCA(principal components analysis). You can try by clicking the 'Show Demo' button.

                                                                  • データサイエンティストは「アルゴリズム実装系」と「アドホック分析系」とに分けた方が良いかも - 渋谷駅前で働くデータサイエンティストのブログ

                                                                    最近色々なデータ分析の現場の方々と意見交換したり一緒に飲んだりするようになり、ますます現場ごとの仕事のやり方の違いや雰囲気の違い、はたまた価値観の違いといったことについてそこそこ深く知るようになってきました。 おかげさまで、今の僕の立ち位置は「データサイエンティストのエバンジェリスト」みたいな感じになってきておりまして*1、むしろもっと本業*2を頑張らねばと焦っているところです(笑)。ということでそんな中で思うようになってきたことを今回はちろっと。 最近何となく感じてる「データサイエンティスト」の境界線について 実は「データサイエンティスト」そのものと他の職種との境界線も変わってきたのかなという気がしてる一方で、「データサイエンティスト」の「中」にも内部区分としての境界線が引けそうだなぁという気もしてます、という。 データサイエンティストの新・3要素 まず、5月の講演会でお話した「データサ

                                                                      データサイエンティストは「アルゴリズム実装系」と「アドホック分析系」とに分けた方が良いかも - 渋谷駅前で働くデータサイエンティストのブログ
                                                                    • 「ウェブブラウザの閲覧履歴からユーザーを特定可能」とMozillaの研究者が発表

                                                                      ウェブブラウザのFirefoxを開発しているMozillaの研究者らが、ブラウザの閲覧履歴だけを使用して高い精度で個人を特定することができたとの研究結果を発表しました。この発表により、匿名化された閲覧履歴であればオンライン広告の広告主などに悪用されないというこれまでの考え方が覆されるとの見方が広がっています。 Replication: Why We Still Can't Browse in Peace: On the Uniqueness and Reidentifiability of Web Browsing Histories | USENIX https://www.usenix.org/conference/soups2020/presentation/bird Mozilla: there is a high probability that your browsing hi

                                                                        「ウェブブラウザの閲覧履歴からユーザーを特定可能」とMozillaの研究者が発表
                                                                      • Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All

                                                                        CDS is excited to announce the release of all materials for Yann LeCun’s Deep Learning, DS-GA 1008, co-taught in Spring 2020 with Alfredo Canziani. This unique course material consists of a mix of close captioned lecture videos, detailed written overviews, and executable Jupyter Notebooks with PyTorch implementations. The course covers the latest techniques in both deep learning and representation

                                                                          Yann LeCun’s Deep Learning Course at CDS is Now Fully Online & Accessible to All
                                                                        • notfound

                                                                          We are sorry, but, the blog or user you are looking for can not be found. Checkout some of the blogs in our showcase.

                                                                            notfound
                                                                          • Coursera | Online Courses From Top Universities. Join for Free

                                                                            7,000+ courses from schools like Stanford and Yale - no application required. Build career skills in data science, computer science, business, and more.

                                                                              Coursera | Online Courses From Top Universities. Join for Free
                                                                            • Data scienceをきわめて個人的な意思決定に活かす - 盆栽日記

                                                                              (R Advent Calendar @ Qiita 14日目) Data science for social good という動きがあります。 平たく言えば、データサイエンスをNPOとか社会的な活動にもっと活かそうぜという話です。 先のKDD 2014においてもワークショップが開かれていました。 http://dssg.uchicago.edu/kddworkshop/ また、O'Reillyから出ている「Machine learning for hackers」 (和書名:入門機械学習)の著者であるDrew ConwayもData science for social goodに関連したKDD2014の発表において以下のような発言をしています。 No young hacker grows up dreaming of selling ads! 夢のある仕事しようぜ!!!ってことなんだ

                                                                                Data scienceをきわめて個人的な意思決定に活かす - 盆栽日記
                                                                              • リクルートはどのようにしてデータ分析に取り組んでいるのか--理想と現実

                                                                                印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 前回の記事ではデータを活用できる組織になるためのポイントについて説明しました。また、これまでの連載記事を通じてデータ分析者が取り組むべきことをさまざまに説明してきました。今回からは実際にデータ活用を先進的に進められている企業担当者に実際にどの程度データ活用ができているのかをインタビューしていきます。 今回は株式会社リクルートライフスタイルでデータ分析を担当している高柳慎一さんにインタビューしました。 --現在担当している業務内容を教えてください。 現在は「じゃらん」「ポンパレ」といった自社ウェブサービスや集客分野で機械学習を用いた業務改善の全般を担当しています。 業務内容としては分析や機械学習のコードを書いている時間がだいたい8割程度で

                                                                                  リクルートはどのようにしてデータ分析に取り組んでいるのか--理想と現実
                                                                                • 依然として高まり続ける「データサイエンティスト」への関心と、それを追う「データエンジニア」と - 渋谷駅前で働くデータサイエンティストのブログ

                                                                                  今回の記事はいつものようにネタが見つからなくて困ったので窮余の一策としての与太話です。話題はこのブログで時々やっている「データサイエンティスト&関連職に関するGoogle Trendsを用いた意識調査」です。 ちなみに、某協会が学生向けのアンケートで意識調査を行った結果が最近報じられていて、SEやコンサルタントなど他職種と比べた場合にどれくらいの立ち位置にあるかの参考になるかもしれません。 対象となる職種 完全に独断と偏見に基づきますが、今年のスキル要件記事で定義した「データサイエンティスト」「機械学習エンジニア」「データアーキテクト」の3つと、さらに後二者の言い換えもしくは類似概念とされそうな「データエンジニア」「AIエンジニア」の2つを加えた、計5つを今回の調査対象としました。 特に「データエンジニア」についてはやはり「データアーキテクト」という語がいわば玄人の間で使われているのに対し

                                                                                    依然として高まり続ける「データサイエンティスト」への関心と、それを追う「データエンジニア」と - 渋谷駅前で働くデータサイエンティストのブログ