並び順

ブックマーク数

期間指定

  • から
  • まで

1 - 40 件 / 53件

新着順 人気順

data-scienceの検索結果1 - 40 件 / 53件

  • 総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門

    統計データを用いた分析事例を知り、 統計リテラシーを学ぶ ・大人がデータサイエンスを学ぶべき理由 ・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性 ・統計を利用する際の注意点 データ分析に必要な統計学の基礎を学ぶ ・データの種類 ・代表値~平均・中央・最頻値 ・ヒストグラムと相対度数 ・四分位・パーセンタイル・箱ひげ図 ・分散・標準偏差 ・相関関係 ・回帰分析 ・標本分布 ・信頼区間 データの見方と 適切なグラフの選び方を学ぶ ・統計表の見方 ・比率の見方①-クロスセクションデータ- ・比率の見方②-使い方と注意点- ・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点 誰もが使える公的統計データの取得方法と 使い方を学ぶ ・公的統計とは ・公的データの入手

      総務省統計局 データサイエンス・オンライン講座 社会人のためのデータサイエンス入門
    • chatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話

      先日、データ解析のセミナーを開催しました。 未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。 好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。 このハンズオンセミナーで予測モデルの作り方を知った友人がchatGPTにアドバイスをもらって、データサイエンスのコンペティションサイトに応募したところ、上位6.5%に入ることができたという報告を受け、驚愕しました。 chatGPTを上手く使えば素人がプロに勝つことも十分できるのだなと実感しました。 友人が参加したデータサイエンスのコンペは、SIGNATEの糖尿病予測問題でした。 以下のような進め方をしたとのことでした。 まず、問題の概要を説明して、どのように進めていけば良いかを確認したそうです。 そうすると、chatGPTからデータサイエンスの問題を解くための手順を一覧化してくれて

        chatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話
      • データエンジニア道の俺のバイブル

        先人の知恵に学ぶ データエンジニア道で、本当に良かった!読み物を、不定期に追記していく。 A Beginner’s Guide to Data Engineering — Part I データエンジニアをこれから始める人に、必ず薦める記事。データエンジニアの基本を学べるかつ、どういう世界に広がっていくのかまで、一気に学べるのでとても良い。 Functional Data Engineering — a modern paradigm for batch data processing 関数型パラダイムを使ったデータパイプラインの構築方法。これを初めて読んだ時の衝撃は今でも忘れないし、フルスクラッチからdbtを使ったデータパイプラインになっても健在な設計手法。 Engineers Shouldn’t Write ETL: A Guide to Building a High Function

          データエンジニア道の俺のバイブル
        • Amazon.co.jp: 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋: 高柳慎一 (著), 長田怜士 (著), 株式会社ホクソエム (監修): 本

            Amazon.co.jp: 評価指標入門〜データサイエンスとビジネスをつなぐ架け橋: 高柳慎一 (著), 長田怜士 (著), 株式会社ホクソエム (監修): 本
          • 「Databricks とは?何ができるか」新入社員が感じたイケてる機能10選 - Qiita

            目次 はじめに 背景と目的 Databricksとは何か 機能紹介 共通 データエンジニアリング 機械学習 Databricks SQL おわりに はじめに こんにちは。Databricks の新井です。Qiita 初投稿です。 2022年の7月よりソリューションアーキテクトとして働き始めました。 お客様に弊社製品を知っていただき、導入いただく際の技術サポートを行う役割です。 本記事では Databricks にご興味がある皆様に弊社プラットフォームを理解いただくために、新入社員の目線から便利だと感じた10個の機能をまとめました。 今後も記事執筆を継続するモチベーションに繋がりますので「いいね」や記事の保存、SNSで共有いただけると嬉しいです。宜しくお願いいたします! 背景と目的 皆様の中には Databricks という会社に馴染みがない方も多いと思います。 米国カリフォルニア州に本社が

              「Databricks とは?何ができるか」新入社員が感じたイケてる機能10選 - Qiita
            • Rを用いた データ解析の基礎と応用2022

              Step 3:データを可視化しよう! データ可視化の重要性 ggplot2でデータを眺めよう geom_histogram ヒストグラム geom_density 密度分布 geom_point 散布図 aes(color) 色を表現する facet_wrap, facet_grid グラフを分ける geom_boxplot 箱ヒゲ theme_*** 全体の雰囲気を変える color(aesの外) 線を特定の色にする fill(aesの外) 特定の色で塗りつぶす color(aesの中) 線を値に応じた色にする coord_cartesian 軸の範囲を変える labs タイトルや軸ラベルを書く/書き換える theme 文字の大きさなどを細かく設定 ggsave() 図をファイルとして保存 その他のグラフの描き方を知りたい方は ggplot2公式サイト Jaehyun Songさんの解説

              • データ整備の基礎

                2022/04/07 初版公開 お問い合わせ先 Twitter:@data_analyst_ メールフォーム:https://bit.ly/37orRqa 執筆者:しんゆう ブログ:データ分析とインテリジェンス https://analytics-and-intelligence.net

                  データ整備の基礎
                • 機械学習が独学できる日本語Youtube難易度別まとめ - Qiita

                  こんにちは。 在宅の機会が増えて以来Youtubeを見る機会が増え、機械学習などが勉強できるチャンネルをいくつか探しては見ていました。探した中でよかったと思ったものをメモしていたのですが、せっかくなので公開したいと思います。日本語のソースがあるもののみ対象にしており、『これ無料でいいのか?』と思ったチャンネルを紹介したいと思います。主観で以下のレベルに分けましたがあくまで参考程度にお願いいたします。 基本:Pythonを触ってみた人 Pythonの説明・動かし方などを解説していて、動画によっては踏み込んだ内容になる 応用:アルゴリズムを使いこなしたい人 「model.fit(X, y)して動かしてみた」よりも踏みこみ、Python自体の説明は少ない 発展:研究開発もしたい人 最新の手法の仕組みの理解などが主眼であり、Pythonの解説はほぼ無い もしおすすめのチャンネルございましたらぜひコ

                    機械学習が独学できる日本語Youtube難易度別まとめ - Qiita
                  • データサイエンス/AI/ディープラーニングの資格ガイド

                    AI/機械学習/データサイエンス関連で筆者が注目する、データサイエンティスト検定、G検定/E資格、統計検定、データサイエンス数学ストラテジスト、人工知能プロジェクトマネージャー試験という5つの認定資格や検定試験を紹介する。

                      データサイエンス/AI/ディープラーニングの資格ガイド
                    • Googleのデータアナリストから学ぶデータ解析の心得 - MyEnigma

                      分析者のためのデータ解釈学入門 データの本質をとらえる技術 目次 目次 はじめに Tweetメモ 参考資料 MyEnigma Supporters はじめに 下記の記事で、Googleのデータアナリストが、 データ解析の心得を公開しており、 シンプルながら心に響いたので、 連続Tweetとしてまとめてみました。 developers.google.com Tweetメモ Googleのデータアナリストが、大規模で多次元のデータを扱って、説得力のある提言をする秘訣について書かれたこの記事面白いな。心に響いた所をまたTweetでまとめてみよう。Good Data Analysis  |  ML Universal Guides  |  Google Developers https://t.co/swc35jjlTQ— Atsushi Sakai (@Atsushi_twi) 2022年3月1

                        Googleのデータアナリストから学ぶデータ解析の心得 - MyEnigma
                      • データサイエンティスト(及び他のデータ関連職)のスキル要件(2022年版) - 渋谷駅前で働くデータサイエンティストのブログ

                        (Image by mohamed_hassan from Pixabay) この記事は毎年恒例のスキル要件記事の2022年版です。昨年版は以下のリンクからご覧ください。 最初に正直に書いておくと、スキル要件自体は昨年版までとほぼ一緒で、大きなアップデートはありません。今回はまず最初に3職種の定義とスキル要件を並べた上で、それに解説を付すという形にしようと思います。 データサイエンティスト 定義 スキル要件 機械学習エンジニア 定義 スキル要件 データアーキテクト 定義 スキル要件 コメントなど 最後に データサイエンティスト 第一次ブームからそろそろ10年になりますが、この「データサイエンティスト」という語だけは変わらず生き残っているところを見るに、依然として期待も幻想も含めて注目され続けている職種といっても過言ではないでしょう。ただし、10年かけて多種多様な業界に浸透していったことで、

                          データサイエンティスト(及び他のデータ関連職)のスキル要件(2022年版) - 渋谷駅前で働くデータサイエンティストのブログ
                        • グロースの逆説 : メルカリで分析とサービスグロースをやる前に知りたかったこと|樫田光 | Hikaru Kashida

                          この記事ではメルカリという会社で4年ほどプロダクトやマーケティングの分析、グロースなどをやっていた僕( hik0107 / hikaru )がそこで得た学びをまとめておこうと思います。 金曜の夜だしこれまでの学びをまとめてる。自分がメルカリにはいる前に知っていれば、同じ成果を出すのに20%位の時間で出来たであろう、そんな圧倒的な知見たち。まあ、それを肌身を切って知るということが大事で、はじめから紙の上の知識として知っていても意味はなかったりする側面もあるのですが pic.twitter.com/jV1ZgHr0u5 — hikaru / 樫田光 (@hik0107) December 24, 2021 特に「こうやったらうまく行った」というよくある成功談ではなく、 「これをわかってなかったために時間を浪費した」 「結局の所、これが一番大事という当たり前の結論に達した」 などという"知ってい

                            グロースの逆説 : メルカリで分析とサービスグロースをやる前に知りたかったこと|樫田光 | Hikaru Kashida
                          • ペパボにおけるデータサイエンティストの職種要件をまとめました - Pepabo Tech Portal

                            この記事は、datatech-jp Advent Calendar 2021 の10日目の記事です。 技術部データ基盤チーム データサイエンティストの zaimy です。 今回、ペパボの職位制度におけるシニアポジションの一職種として、データサイエンティストの職種要件を整理したので内容を社外にも公開します。 主に、社内でデータサイエンティストについて説明したり、ジュニアポジションの方にデータサイエンティストという職種を知ってもらいこれからのキャリアパスの参考にしていただいたりするために、データサイエンティスト協会とIPAによるスキル定義を元に、ペパボのデータ基盤の定義や、ペパボで活用しているDX Criteria1のテーマに照らして簡潔にまとめたものです。 まえおき: ペパボの職位制度について データサイエンティストとは データサイエンティストのスキルセット 3つのスキル領域の概要 4等級シ

                              ペパボにおけるデータサイエンティストの職種要件をまとめました - Pepabo Tech Portal
                            • 2021年度版「データサイエンティスト スキルチェックリストver.4」およびデータサイエンス領域タスクリスト ver.3」を発表ニュース|一般社団法人データサイエンティスト協会

                              HOME ニュース プレスリリースの記事一覧 2021年度版「データサイエンティスト スキルチェックリストver.4」およびデータサイエンス領域タスクリスト ver.3」を発表 2021年度版「データサイエンティスト スキルチェックリストver.4」およびデータサイエンス領域タスクリスト ver.3」を発表 このたび、データサイエンティスト協会 スキル定義委員会(委員長:安宅 和人、副委員長:佐伯 諭)は、11月16日(火)に開催した「データサイエンティスト協会8thシンポジウム」内において発表した、データサイエンティストに必要とされるスキルをまとめた「データサイエンティスト スキルチェックリスト」の第4版を公開いたしました。 本内容は、2019年に第3版として公開したデータサイエンティストの「ミッション、スキルセット、定義、スキルレベル」および「スキルチェックリスト」を、現在のビジネス環

                                2021年度版「データサイエンティスト スキルチェックリストver.4」およびデータサイエンス領域タスクリスト ver.3」を発表ニュース|一般社団法人データサイエンティスト協会
                              • ヤングKagglerは、いかにしてグランドマスターになったのか

                                ヤングKagglerは、いかにしてグランドマスターになったのか:Kaggle グランドマスター インタビュー(前)(1/3 ページ) 24歳&26歳。世界でわずか230人前後しかいない「Kaggle グランドマスター」の称号を持つ2人の青年は、子どものころからプログラミングに親しんできた……わけではなかった。 Google社が所有するKaggle社が運営する「Kaggle」(カグル)という機械学習プラットフォーム上で開催されるコンペティションで、最高の称号「グランドマスター」を持つ人は日本国内で20人前後、世界でも230人前後。その希少な人材のうちの2人が、2021年に社会人デビューした。2人のグランドマスターは、どのようないきさつでKaggleに参加し、どのようにして最高位の称号を獲得し、どのような就職活動をしたのだろうか。 Kaggleのグランドマスターとは ラッパーがMCバトルで技を

                                  ヤングKagglerは、いかにしてグランドマスターになったのか
                                • 各業界でのデータサイエンスの活用について調べてみた(随時追加) – かものはしの分析ブログ

                                  都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーター ほしいものリスト 仕事で、いろんな会社でデータサイエンスってどう使われているのですか?と聞かれることがあり、自分としてはなんとなくしか掴めていないな、知ったかぶりしたくないなと思うところがあったので、やや手厚くリサーチをしてみようと思いました。 2022/3/6の段階では11つの市場しかないですが、最終的には30市場を目指します。 【2021/11/27追記】 公開したところ、それなりにこの記事に関心を持ってくださった方が多かったようなので、少しずつ事例を埋めていこうと思います。 業界

                                    各業界でのデータサイエンスの活用について調べてみた(随時追加) – かものはしの分析ブログ
                                  • 『データ分析のための統計学入門』pdf版が無料公開! 実際に読んだ感想は……?

                                    データ活用は過度な期待を超え、徐々にビジネスパーソンの基礎的なノウハウとして定着し始めています。データサイエンティストでなくとも、データ分析の基礎的な考え方やその手法について学びたいという方は多いはず。 皆さんは、2021年3月に初学者向けの入門書『データ分析のための統計学入門 原著第4版』日本語版pdfが何と無料で公開されたのをご存じでしょうか? 同書籍は以下のリンクから、閲覧可能です。 http://www.kunitomo-lab.sakura.ne.jp/2021-3-3Open(S).pdf 本記事では同書を書評し、データ活用・統計学初学者におすすめの使い方をレクチャーします。 『データ分析のための統計学入門』の内容は? 何が学べる? 『データ分析のための統計学入門』は米国のNPO OpenIntroが発行した書籍で、Mine Cetinkaya-Rundel、David M D

                                      『データ分析のための統計学入門』pdf版が無料公開! 実際に読んだ感想は……?
                                    • 100+ Best Free Data Science Books For Beginners And Experts

                                      In the previous post we’ve covered 100+ Free Machine Learning and Artificial Intelligence Books. If you haven’t checked make sure you spend 2 minutes after checking this post. In this post, You’ll see 100+ free data science books for beginners, intermediate and experts. The eBooks are updated in 2023 and available in pdf or html format. Note: All the books listed below are open sourced and are in

                                        100+ Best Free Data Science Books For Beginners And Experts
                                      • 22社、52人のデータサイエンティストに聞いてみた!「どんなお仕事してますか?」 | Da-nce

                                        データ分析とビジネス活用のプロとして、さまざまな業界・フィールドで活躍する「データサイエンティスト」。 スキルセットや必要な知識などが語られることはあるものの、まだはっきりとした定義がなく、いったいどんな人たちなのか?と疑問を持つ人も少なくないのでは。 そこで本企画では、企業で働くデータサイエンティストたちの"リアル"を調査。データサイエンティストを志した理由や興味深かった論文、普段の業務、自社で働く魅力などを22社、52人のデータサイエンティストに聞きました。 企業一覧 DataRobot Japan株式会社 株式会社GA technologies 株式会社HACARUS 株式会社JMDC 株式会社LIFULL MNTSQ株式会社 NABLAS株式会社 株式会社Rist Sansan株式会社 SOMPOホールディングス株式会社 株式会社ZOZO 株式会社ZOZOテクノロジーズ アスクル株

                                          22社、52人のデータサイエンティストに聞いてみた!「どんなお仕事してますか?」 | Da-nce
                                        • 分析者が知っておくと便利なプロジェクトマネジメントの話 - Qiita

                                          どうもこんにちは、Qiitaでは はじめまして。私です。普段は分析とかデータとかその辺の仕事をしてる者です。 Qiitaで分析とかプロマネの話をしていいのか悩んでたんですけどなんか大丈夫そうなのでここで書こうと思います、分析の話。 長文を読みたくない人のためのまとめ こんなことをダラダラと書いてます はじめに 分析スキルって一口に言っても色々あるけれども、私が面接とか人材育成とかの場面で人の分析スキルを推し量るときによく見ているのが、 データのハンドリングスキル データの分析設計力 統計、機械学習のスキル 分析プロジェクトマネジメント の4つの軸。特に「分析」というのは大抵は一つの目的に対して一つの分析結果を出すまでを一人で行うことも多いので、この分析自体を一つのプロジェクトとして完遂できる能力は極めて重要だったりする。 この記事では、この中でも4つ目、分析プロジェクトマネジメントのスキル

                                            分析者が知っておくと便利なプロジェクトマネジメントの話 - Qiita
                                          • データサイエンティストが語る「価値創出」の知見とは?──BCGのプロジェクト事例・開発ツールを紹介 - TECH PLAY Magazine

                                            世界をリードする経営コンサルティングファームのボストン コンサルティング グループ(BCG)は、2020年7月に大阪と京都にオフィスを開設。デジタル技術を活用したプロジェクトを通じてビジネスインパクトを生み出している。今回は、デジタル領域のプロジェクトを手がけるDigitalBCGのデータアナリティクスのエキスパート集団、GAMMAのメンバーが、実際のプロジェクト事例や開発ツール、働く環境などについて語った。 ■登壇者プロフィール ボストン コンサルティング グループ リードデータサイエンティスト 溝江 宏真氏 ボストン コンサルティング グループ シニアデータサイエンティスト 原島 慧氏 ボストン コンサルティング グループ アソシエイトディレクター ヴァンワースム ダニエル氏 ボストン コンサルティング グループ アソシエイトディレクター 泉 晃氏 ボストン コンサルティング グループ

                                              データサイエンティストが語る「価値創出」の知見とは?──BCGのプロジェクト事例・開発ツールを紹介 - TECH PLAY Magazine
                                            • どこにも遊びに行けないなら"はてブ"のデータ分析をして遊べばいいじゃない - ゆとりずむ

                                              こんにちは、らくからちゃです 2年連続ステイホームのゴールデンウィークになりそうです。 もはやゴールデンウィークって普段何してたのか忘れかけてきたので、過去の履歴を漁ってみたら、一昨年は伊豆半島の東側をぐるぐる回りながら下田までいってたみたいです。 そういやコロナ前のゴールデンウィークって何してたんだっけ?と思ってGoogleフォトのフォルダ漁ってみたら、伊豆半島をぐるぐるしてたらしい。 また落ち着いたら行きたいなあ。 pic.twitter.com/N0fNxIZ5Uq — らくからちゃ@育休中専業主夫 (@lacucaracha) 2021年5月3日 こんなどこにも行けない日には、家でデータ分析をするに限りますね!!(鼻息) 統計局が、e-statを使って遊ぶ方法も教えてくれるそうなので、ご興味がある方は是非! gacco.org 統計として公開されているデータを眺めてみるのも面白いっ

                                                どこにも遊びに行けないなら"はてブ"のデータ分析をして遊べばいいじゃない - ゆとりずむ
                                              • Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita

                                                こんにちは、Exploratoryの白戸です。 Appleは新型コロナウイルスの対策支援として、Appleマップでの経路検索をもとにした移動傾向のデータを公開しています。ところが、残念ながらこのデータはそのままでは簡単に可視化できるようなフォーマットになっておらず、ちょっとした加工を行う必要があります。 しかし逆に、加工の仕方さえわかってしまえばそれぞれの都市や地域の移動データを可視化することで、恐怖を煽るばかりのマスコミからは見えてこない現状を理解することができるようになります。 今回はこのAppleの移動傾向データを簡単に可視化できるようにするための基本的な加工方法を、みなさんと共有させていただければと思います。 データはこちらからダウンロードすることができます。 以下は「モダンでシンプルなUIを使ってデータサイエンスができる」Exploratoryを使って、「日本で最も自粛している都

                                                  Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita
                                                • データ分析のための統計学入門.pdf

                                                  • Go+: designed for data science

                                                    A static typed language. The simplest engineering language that can be mastered by children (script-like style). Performance: as fast as Go (Go+'s main backend compiles to human-readable Go). Fully compatible with Go and can mix Go/Go+ code in the same package (see Go/Go+ hybrid programming). No DSL (Domain Specific Language) support, but SDF (Specific Domain Friendliness). Support Go code generat

                                                    • Gradio vs Streamlit vs Dash vs Flask

                                                      IntroductionMachine learning models are exciting and powerful, but they aren’t very useful by themselves. Once a model is complete, it likely has to be deployed before it can deliver any sort of value. As well, being able to deploy a preliminary model or a prototype to get feedback from…

                                                        Gradio vs Streamlit vs Dash vs Flask
                                                      • はてなブックマーク3万件にみる技術トレンド2020年まとめ - Qiita

                                                        tl;dr 2020年1年間のはてなブックマークの人気エントリー3万件をもとに技術トレンドを分析。 その結論とPythonでグラフ化した手順を書き記します。 ※ご指摘がありましたが、技術トレンドというよりitニューストレンドと言った方が正しいかもしれません。踏まえてお読みください。 前置き 手元に2020年の1年間ではてなブックマークの技術カテゴリーにおいて人気エントリーに一度でも乗ったことのある記事のタイトルデータが3万件ほどあったため、形態素解析を行い単語の出現頻度順に並べてみました。欠損の割合としては多くても1割程度、つまり少なくとも9割程度のデータは揃っているはずなので精度はかなり高いと思います。 (※はてなブックマークはNewsPicksみたくインターネット上の記事をブックマーク・コメントでき、より多くブックマークされた記事が人気エントリーとしてピックアップされるサービスです。w

                                                          はてなブックマーク3万件にみる技術トレンド2020年まとめ - Qiita
                                                        • Interpretable Machine Learning

                                                          Interpretable Machine Learning A Guide for Making Black Box Models Explainable. Christoph Molnar 2021-05-31 要約 機械学習は、製品や処理、研究を改善するための大きな可能性を秘めています。 しかし、コンピュータは通常、予測の説明をしません。これが機械学習を採用する障壁となっています。 本書は、機械学習モデルや、その判断を解釈可能なものにすることについて書かれています。 解釈可能性とは何かを説明した後、決定木、決定規則、線形回帰などの単純で解釈可能なモデルについて学びます。 その後の章では、特徴量の重要度 (feature importance)やALE(accumulated local effects)や、個々の予測を説明するLIMEやシャープレイ値のようなモデルに非依存な手法(mo

                                                          • 特徴量エンジニアリングのライブラリ xfeat を使ってみて便利だったこと - Taste of Tech Topics

                                                            こんにちは。機械学習エンジニアをしている古賀です。 最近は愉快な上司@tereka114 のもと、精度の上がらないモデルに四苦八苦しています。 そんな私が普段データ分析をする際に難しいことの一つとして、特徴量エンジニアリングがあります。 特徴量エンジニアリングとは、元のデータに新たな特徴量を追加することでモデルの精度を向上させるプロセスのことです。 この結果によってモデルの精度が大きく変わりますが、正しく実行するにはデータへの深い理解やデータ分析力が必要になります。 私もあまり得意ではないのですが、これを簡単にする xfeat という便利なライブラリがあると上司が教えてくれたので、実際に使ってみて便利だったことをまとめました。 ※本記事は、Pythonその3 Advent Calendar 2020 の15日目の内容になります。 目次は以下です。 xfeat とは 準備 実行環境 xfea

                                                              特徴量エンジニアリングのライブラリ xfeat を使ってみて便利だったこと - Taste of Tech Topics
                                                            • Rustのデータサイエンスで使えそうなもののメモとリンク集

                                                              この記事はQiita https://qiita.com/exy81/items/1b13d0ef3832a76338eb から移行したものです。 evcxr pythonみたいにJupyterでインタラクティブに使いたいという場合におすすめ。 RustのREPLでJupyterでも使うことができる。cargoでインストールできる。 公式 https://github.com/google/evcxr Jupyterのでの使い方 https://github.com/google/evcxr/tree/master/evcxr_jupyter 紹介記事 https://qnighy.hatenablog.com/entry/2018/09/29/190000 dockerでの環境構築 https://dev.classmethod.jp/articles/use-rust-in-jupyt

                                                                Rustのデータサイエンスで使えそうなもののメモとリンク集
                                                              • 【保存版】データサイエンティスト転職を決めるポートフォリオのガイドライン【書籍化決定】 - Qiita

                                                                書籍化されました 本記事をベースに監修者の村上さんが1冊の本にまとめてくれました(感謝) データサイエンティストのキャリア面やポートフォリオの細かい部分をさらに追加・ブラッシュアップした内容になっています。 まえがき はじめに 皆さん、「データサイエンティスト」という職種をご存知でしょうか? この数年間で、AIやディープラーニングといったバズワードと共にデータサイエンティストというワードも、よく耳にするようになりました。最新の技術を扱えて、年収も高い非常に魅力的な職業なため、データサイエンティストへの転職を検討されている方もいらっしゃるのではないでしょうか? 実際、データサイエンティスト職への就職・転職希望者は年々増加しています。しかし、未経験の人材を育成できる会社はまだまだ少なく、未経験からの転職は転職希望者の増加に伴い高まっています。 データサイエンティストは求められるスキルの幅が広く

                                                                  【保存版】データサイエンティスト転職を決めるポートフォリオのガイドライン【書籍化決定】 - Qiita
                                                                • もし外資系企業の女子マネージャーが経営戦略部門の「データアナリスト」を務めたら|次郎花|note

                                                                  こんにちは、次郎花です☆ タイトル長い(笑)...ぱ、パクリなんかじゃないですよっ! はい。 というわけで、今回はわたくしのお仕事「データアナリスト」についてご紹介したいと思います。データアナリスト/データサイエンティスト(以下、DA/DS)のブームもそろそろバブルがはじける頃かと想像していますが(もうはじけてる?)、いまだに一定数の方が憧れを持って、あるいは異世界転生を狙ってジョブチェンジしようとしているこれらの職業。最近では、実際にDA/DSである方の現場の声なども散見されるようになり、どのような職業なのか実態が少しずつ広まってきたようにも思います。ですので、今さら感はありますが、私もご多分に漏れず知見を共有できたらという思いでこの記事を発信しようと考えました。 次郎花って?まずは、次郎花って誰やねん、というところからですね。わたくし次郎花はとある外資系企業のCEO直轄の経営戦略部門で

                                                                    もし外資系企業の女子マネージャーが経営戦略部門の「データアナリスト」を務めたら|次郎花|note
                                                                  • RにTorchとLightGBMがやってきた - 渋谷駅前で働くデータサイエンティストのブログ

                                                                    これまで、RとPythonは両方使える人が少なくないながらも開発陣やコミュニティの思想が違うせいもあってか、「Rは統計学向け」「Pythonは機械学習向け」的な住み分けが年々進み、特に機械学習関連の重要なフレームワーク・ライブラリ類はPython向けのみがリリースされることが多く、R向けにはリリースされないということが常態化している印象がありました。 そんな中、この9月にPythonの機械学習OSSを代表する2つのライブラリが相次いでR版パッケージを発表したので、個人的にはなかなか驚きました。中には「この2つがRに来たからにはもうPythonは触らない」と豪語する過激派の方もいらっしゃるようですが(笑)、それはさておき個人的な備忘録としてこの2つのR版パッケージを試してみた記録を記事として残しておこうと思います。 なお、以下のモデリングはほぼ何もチューニングを行っておりません。あくまでも「

                                                                      RにTorchとLightGBMがやってきた - 渋谷駅前で働くデータサイエンティストのブログ
                                                                    • データサイエンティスト生活でお世話になった本|武田邦敬|Kunihiro TAKEDA

                                                                      みなさんこんにちは。くにです。 データ分析の世界に足を踏み入れてから9年が過ぎました。 分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。 ポジションは変われど、データを扱う仕事をまだ続けています。 私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびに本を買い、その本でわからないことがあればまた本屋に行き、自分が少しでも理解できそうな本を探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。 こんな生活を続けているうちに、部屋が本だらけになってしまいました。 正直に言って読み切ったという実感のある本はありません。しかし、実務で何かしらお世話になった本は数多くあり、そういう本は手放さずに手元に置いています。

                                                                        データサイエンティスト生活でお世話になった本|武田邦敬|Kunihiro TAKEDA
                                                                      • データサイエンティストとして読んで役立った本たち@2020-07|だみ〜

                                                                        2016年10月に未経験・新人データサイエンティストで雇ってもらいました。当時はまだ業界が牧歌的だったのと、比較的書類上のスペックが高い若者だったのもあり、運良く拾ってもらえたのでした。今だと100%受かってないです。 そんな私が今までで読んだ本の中で、役に立った本をつらつら書いていきます。 現代の若者がどんどん優秀になっているので、これくらいでいまんとこいっぱしのデータサイエンティスト(@ビジネスサイド)になれるんだなあという基準を述べようかと思いました。何年か後に振り返りたいですね。 もちろん、これが誰かの学習の役に立てばと思っています。 ちなみに、アフィリエイト入れてないので気にせず買っていってください。 数学無難に解析学と線形代数学を勉強しておくといいと思っています。

                                                                          データサイエンティストとして読んで役立った本たち@2020-07|だみ〜
                                                                        • 時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ

                                                                          本記事では、時系列予測に利用できるpythonのライブラリの使い方について説明をします。 パッとライブラリを使うことを目指すため具体的なアルゴリズムの説明は省きます。 ※説明が間違えている場合があればご指摘いただけると助かります。 目次 利用データ ライブラリ Prophet PyFlux Pyro Pytorch Lightgbm 補足:Darts まとめ ソースコード このブログで記載されているソースコードはGitHubに上げておいたのでもしよろしければ参考にしてください。 github.com 利用データ 今回用いるデータはkaggleのM5 Forecasting - Accuracyと呼ばれるコンペティションで利用されたデータを用います。 作成したランダムなデータよりも実データのほうが予測をしている感があるからです。 予測に使うデータはwalmartの売上データです。 下図はその

                                                                            時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ
                                                                          • Data Platform Guide - 事業を成長させるデータ基盤を作るには #DataEngineeringStudy / 20200715

                                                                            Data Engineering Study #1 の発表資料です。 https://forkwell.connpass.com/event/179786/ 当日の動画はYoutubeで閲覧可能です。 https://www.youtube.com/watch?v=hFYNuuAaiTg 参考文献 『Software Design (ソフトウェアデザイン) 2020年7月号』 https://amzn.to/30YueL7 『データマネジメントが30分でわかる本』 https://amzn.to/3fmz8Gw

                                                                              Data Platform Guide - 事業を成長させるデータ基盤を作るには #DataEngineeringStudy / 20200715
                                                                            • 「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary

                                                                              データサイエンティストを生業にする手段と実態について述べる。 途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。 この記事で言いたいことは具体的には4つだ。 プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。 もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。 若者はワンチャンじゃなくて、ちゃんと化け物になれよ。 この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。 なろう系・始めてみよう系資料一覧 (最速・最短ルート用) まずは動かしてみよう。強くてニューゲームが体験出来るぞ! 入門以前の本 一般向け業界本 (AI業界と展望がわかる本) 技術者入

                                                                                「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
                                                                              • リテラシーレベルeラーニング教材・講義動画配信 | 数理・データサイエンス・AI教育強化拠点コンソーシアム

                                                                                リテラシーレベルモデルカリキュラム対応教材 利用条件とアンケート 東京大学と記載のあるスライド教材の利用についてはこちら(一部スライドは冒頭の利用条件をご参照ください)。 東京大学と記載のある講義動画の利用条件は、各動画の冒頭をご参照ください。 滋賀大学と記載のある教材の利用条件はCC BY-NC-SAです。 九州大学と記載のある教材の利用条件はCC BYです。 筑波大学と記載のある教材の利用条件についてはこちら 北海道医療大学と記載のある教材の利用条件はCC BYです。 東京都市大学と記載のある教材の利用条件についてはこちら 教材のアンケートはこちら モデルカリキュラムと対応する講義動画・スライド 1. 社会におけるデータ・AI利活用 2. データリテラシー 3. データ・AI利活用における留意事項 4. オプション 1. 社会におけるデータ・AI利活用 1-1. 社会で起きている変化

                                                                                • IT未経験からMLエンジニアになるまでの2年半でやったこと - MLaaSS - Machine Learning as a Self-Satisfaction

                                                                                  はじめに 自身の転職活動にあたり皆さんの転職エントリが非常に参考になったので、私も同じ境遇の方の参考になればと思い、書き残すことにしました。(ただ、本当に私と似た境遇の方にはなかなかリーチしづらい気がしていますが・・・) TLDR; 30歳でIT未経験からMLエンジニアに転職 約2年半独学で勉強(ほとんどkaggleしてただけ) 無関係に思えた現職での経験もなんだかんだ転職で役に立った 目次 自己紹介 現職について 転職の理由 勉強したこと 転職活動 終わりに 1.自己紹介 かまろという名前でTwitterなりkaggleなりをやっています。kaggleでは画像やNLPといったdeep learning系のコンペを中心に取り組んでおり、2019年の9月に金メダルを獲得しMasterになることができました。 恐らくここが他の転職エントリを書かれている方々と大きく異なる点かと思うのですが、現職

                                                                                    IT未経験からMLエンジニアになるまでの2年半でやったこと - MLaaSS - Machine Learning as a Self-Satisfaction