「data-science」を検索 - はてなブックマーク

1 - 40 件 / 1084件

新着順人気順

絞り込み

検索対象
ブックマーク数
期間
セーフサーチ

data-scienceの検索結果1 - 40 件 / 1084件

東大が無料公開している超良質なPython/Data Science/Cloud教材まとめ (*随時更新) - Digital, digital and digital
- 2410 users
- digitaldigital.hatenablog.com
- テクノロジー
- 2021/05/01
東京大学がちょっとびっくりするくらいの超良質な教材を無料公開していたので、まとめました Python入門講座東大のPython入門が無料公開されています。scikit-learnといった機械学習関連についても説明されています。ホントいいです Pythonプログラミング入門東京大学数理・情報教育研究センター: utokyo-ipp.github.io 東大のPython本も非常にオススメです Pythonによるプログラミング入門　東京大学教養学部テキスト: アルゴリズムと情報科学の基礎を学ぶ https://amzn.to/2oSw4ws Pythonプログラミング入門 - 東京大学数理・情報教育研究センター Google Colabで学習出来るようになっています。練習問題も豊富です https://colab.research.google.com/github/utokyo-ip
- python
- あとで読む
- 学習
- プログラミング
- aws
- 機械学習
- 勉強
- 大学
- 研究
- science
2021年「はてなブックマーク年間ランキング」トップ100 - はてなニュース
- 1968 users
- hatenanews.com
- テクノロジー
- 2021/12/29
はてなブックマークのブックマーク数が多い順に記事を紹介する「はてなブックマーク年間ランキング」の2021年版を発表します。上位トップ100の記事をピックアップしました（集計期間：2020年12月11日～2021年12月10日）。 2021年はてなブックマーク年間ランキング（2020年12月11日～2021年12月10日）順位タイトル 1位ルックバック - 藤本タツキ | 少年ジャンプ＋ 2位浄土真宗の僧侶です。初めて書き込みます。不慣れなため、先ほど書いた.. 3位京都大学、Pythonの基本を解説した無料の教科書「素晴らしすぎる」「非常にわかりやすくて良い」 | Ledge.ai 4位闇市化するAmazon「裏コマンド検索」で絞り込む 5位財テク (住宅購入編) - shunirr 6位台本11冊を入手　五輪開会式“崩壊”　全内幕　計1199ページにすべての変遷
「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
- 1346 users
- todes-mentor.hatenablog.com
- テクノロジー
- 2020/07/13
データサイエンティストを生業にする手段と実態について述べる。途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。この記事で言いたいことは具体的には4つだ。プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。若者はワンチャンじゃなくて、ちゃんと化け物になれよ。この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。なろう系・始めてみよう系資料一覧（最速・最短ルート用）まずは動かしてみよう。強くてニューゲームが体験出来るぞ！入門以前の本一般向け業界本 (AI業界と展望がわかる本) 技術者入
総務省統計局データサイエンス・オンライン講座社会人のためのデータサイエンス入門
- 1139 users
- gacco.org
- 学び
- 2023/06/04
統計データを用いた分析事例を知り、統計リテラシーを学ぶ・大人がデータサイエンスを学ぶべき理由・統計データからわかること① ・統計データからわかること② ・統計データからわかること③ ・統計リテラシーの重要性・統計を利用する際の注意点データ分析に必要な統計学の基礎を学ぶ・データの種類・代表値～平均・中央・最頻値・ヒストグラムと相対度数・四分位・パーセンタイル・箱ひげ図・分散・標準偏差・相関関係・回帰分析・標本分布・信頼区間データの見方と適切なグラフの選び方を学ぶ・統計表の見方・比率の見方①－クロスセクションデータ－・比率の見方②－使い方と注意点－・時系列データの見方① ・時系列データの見方② ・グラフの選び方① ・グラフの選び方② ・グラフを作る時・読む時の注意点誰もが使える公的統計データの取得方法と使い方を学ぶ・公的統計とは・公的データの入手
- 統計
- あとで読む
- データ
- 学習
- 勉強
- 入門
- データサイエンス
- グラフ
- 分析
- study
初学者に教えたい、MicrosoftがGitHubで公開している教材が最高だった！ - Qiita
- 1097 users
- qiita.com/ozora
- テクノロジー
- 2021/11/14
はじめにエンジニアやデータサイエンティストの人材育成のためのオープンソースな教材を探していたらMicrosoftがGitHubでかなり質の高い教材をweb開発、データサイエンティスト、機械学習、IoTの四項目を対象に提供してるのを発見したため共有したいと思う。正直、マイクロソフトと聞くとGoogleやらFacebookに比べていけてないイメージを持っていたけど、実際にMicrosoftのGitHubレポジトリを見て、彼らはここ数年で大きく変わったように思える。特に人材育成や学習教材に関しては世界一かもしれないなんて思っています。本記事では筆者が自信を持っておすすめするMicrosoftのオープン教材を紹介するのでぜひ自身の勉強や人材育成に生かしてもらえれば本記事を執筆した甲斐があります。（もちろん僕がお勧めしているだけでなくてGitHubのスター数も多く世界的に認められています！）こ
- github
- あとで読む
- 学習
- microsoft
- programming
- プログラミング
- 勉強
- git
- IoT
- web
この記事の元の本編は削除しました。｜樫田光 | Hikaru Kashida｜note
- 969 users
- note.mu
- テクノロジー
- 2019/07/17
これは何かGoogleの Material Design Guideline - Data Visualization がとても良くまとまっていたので、自分なりに和訳・編集してまとめたものです。 ※ 注意事項こちらはあくまで、もとのドキュメントを参考に筆者が和訳・編集したものになります。原文の完全な和訳ではなく、抜粋の範囲や、英=>和の際の意訳を筆者が恣意的に行っています。筆者の意訳・編集による曲解や元のドキュメントでのオリジナルの文意が気になる方は原文を読むことを強くおすすめします。和訳の公開の可否についてはGoogle社に直接問い合わせています。1 / 原理原則（Principles）データの可視化は、複雑で内容の多い情報をグラフィカルな形式で表現するコミュニケーション手段である。可視化の結果、データを比較しストーリーを伝えることが容易になり、データの利用者の意思決定の助け
Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した
- 955 users
- shunyaueta.com
- テクノロジー
- 2022/03/08
Google が公開している、より良いデータ分析のためのガイドブック「Good Data Analysis」で、データ分析の要所が簡潔にまとめられていて感動した 2022-03-08 Google の非公式ブログで、The Unofficial Google Data Science Blog というデータサイエンスをテーマにしたブログがある。その中で、 Practical advice for analysis of large, complex data sets の記事を元にして作られた Google Developers Guides: Machine Learning Guides > Good Data Analysis を昨日見かけて読んでいたら素晴らしいドキュメントだったので、ここでその感動を共有したかったので筆をとったしだい。 Good Data Analysis の概
chatGPTにアドバイスをもらったらデータサイエンスを知って1週間の友人がコンペで上位6.5%に入った話
- 948 users
- zenn.dev/pipon_tech_blog
- テクノロジー
- 2023/04/25
先日、データ解析のセミナーを開催しました。未経験の方でも、2時間で予測モデルを作成することができるハンズオンセミナーでした。好評だったので、その内容をYouTubeにまとめたのでご興味ある方はご覧ください。このハンズオンセミナーで予測モデルの作り方を知った友人がchatGPTにアドバイスをもらって、データサイエンスのコンペティションサイトに応募したところ、上位6.5%に入ることができたという報告を受け、驚愕しました。 chatGPTを上手く使えば素人がプロに勝つことも十分できるのだなと実感しました。友人が参加したデータサイエンスのコンペは、SIGNATEの糖尿病予測問題でした。以下のような進め方をしたとのことでした。まず、問題の概要を説明して、どのように進めていけば良いかを確認したそうです。そうすると、chatGPTからデータサイエンスの問題を解くための手順を一覧化してくれて
機械学習が独学できる日本語Youtube難易度別まとめ - Qiita
- 938 users
- qiita.com/fujimr_19xx
- テクノロジー
- 2022/04/05
こんにちは。在宅の機会が増えて以来Youtubeを見る機会が増え、機械学習などが勉強できるチャンネルをいくつか探しては見ていました。探した中でよかったと思ったものをメモしていたのですが、せっかくなので公開したいと思います。日本語のソースがあるもののみ対象にしており、『これ無料でいいのか？』と思ったチャンネルを紹介したいと思います。主観で以下のレベルに分けましたがあくまで参考程度にお願いいたします。基本：Pythonを触ってみた人 Pythonの説明・動かし方などを解説していて、動画によっては踏み込んだ内容になる応用：アルゴリズムを使いこなしたい人「model.fit(X, y)して動かしてみた」よりも踏みこみ、Python自体の説明は少ない発展：研究開発もしたい人最新の手法の仕組みの理解などが主眼であり、Pythonの解説はほぼ無いもしおすすめのチャンネルございましたらぜひコ
- 機械学習
- あとで読む
- 学習
- youtube
- python
- アルゴリズム
- 技術
- 研究
- プログラミング
- AI
データサイエンス初学者のための実践的な学習環境「データサイエンス100本ノック（構造化データ加工編）」をGitHubに無料公開 | 一般社団法人データサイエンティスト協会
- 836 users
- digitalpr.jp
- テクノロジー
- 2020/06/15
一般社団法人データサイエンティスト協会（所在地：東京都港区、代表理事：草野隆史、以下データサイエンティスト協会）は、構造化データの加工について実践的に学ぶことができる無料の学習環境「データサイエンス100本ノック（構造化データ加工編）」をGitHubに公開しました。「データサイエンス100本ノック（構造化データ加工編）」は、データサイエンス初学者を対象に、データの加工・集計、統計学や機械学習を駆使したモデリングの前処理等を学べるよう、データと実行環境構築スクリプト、演習問題をワンセットにしています。近年、データ活用の重要性についての認知が広がる中で、書籍やWebサイトなど、データ分析のスキル向上に役立つ情報源も多く提供されています。一方で、実践するための「データ」や「プログラミング実行環境」を持ち合わせていないことも多く、「実践力」を身につける機会が限られていました。特に、「構造化デ
文系大学生が機械学習を０から始めて９か月でKaggle銀メダルを獲得するまで - Qiita
- 774 users
- qiita.com/HayatoYamaguchi
- テクノロジー
- 2019/10/06
今回自分は０から始めて９か月でコンペで銀メダル(6385分の249位,top4パーセント)を獲得できました。自分の今までの流れをおさらいしていきます。それまでの僕のスペック数3と行列はほぼ何も分からないプログラムはrubyとjavaはそこそこに書ける、pythonは知らん勉強の流れ１２月末機械学習を始めると決心、とりあえず何をやればいいかよく分からないがpythonが必要らしいのでprogateでpythonをやってみる１月数学が必要らしいので、行列と微分積分について１から学んでみる。今から考えると、行列の基礎をさらえたのは良かったですが、それ以外はこの時間は絶対いらなかったなと考えています。微分積分行列２月 Udemyで多くの講座を受ける、詳細は以下の記事にまとまっています https://qiita.com/HayatoYamaguchi/items/c8051
大学で読んだ情報科学関連の教科書 - ｼﾞｮｲｼﾞｮｲｼﾞｮｲ
- 721 users
- joisino.hatenablog.com
- テクノロジー
- 2024/03/27
先日、博士（情報学）になりました。学部と大学院をあわせた 9 年間で読んだ情報科学関連の教科書・専門書を思い出を振り返りつつここにまとめます。私は授業はあまり聞かずに独学するタイプだったので、ここに挙げた書籍を通読すれば、大学に通わなくてもおおよそ情報学博士ほどの知識は身につくものと思われます。ただし、特に大学院で重要となる論文を読み書きすることについては本稿には含めておりません。それらについては論文読みの日課についてや論文の書き方などを参考にしてください。 joisino.hatenablog.com 凡例：（半端）とは、数章だけ読んだ場合か、最後まで読んだものの理解が浅く、今となっては薄ぼんやりとしか覚えていないことを指します。☆は特におすすめなことを表します。学部一年寺田文行『線形代数増訂版』黒田成俊『微分積分』河野敬雄『確率概論』東京大学教養学部統計学教室『統計学
- 学習
- あとで読む
- 本
- コンピュータサイエン
- book
- 数学
- 大学
- 研究
- 書籍
- 情報
日本のウェブデザインの特異な事例
- 704 users
- okuranagaimo.blogspot.com
- テクノロジー
- 2022/11/26
sabrinas.spaceより。 8週間もかからなかったはずのプロジェクト日本のウェブデザインはどう違うのか? 2013年のRandomwireのブログ投稿で、著者(David)は、日本のデザインの興味深い相違点を強調しました。日本人はミニマリストのライフスタイルで海外に知られていますが、ウェブサイトは奇妙なほどマキシマリストです。ページには様々な明るい色(3色デザイン原則を破っている)、小さな画像、そして多くのテキストが使われています。2022年11月に撮影されたこれらのスクリーンショットで、自分の目で確かめて下さい。ブログ投稿には、文化的専門家、デザイナー仲間、そして不満を抱く市民によって支持されている、考えられる理由がいくつか挙げられていました。この理論が今でも正しいのか、また、もっと定量的なアプローチが可能なのか気になったのでやってみました。私が見つけたもの各国の最も人
- デザイン
- あとで読む
- web
- design
- ui
- 日本
- webデザイン
- webdesign
- ネット
- 文化
データサイエンス・機械学習をやるためのエンジニアな本まとめ - 2019年版 - Lean Baseball
- 698 users
- shinyorke.hatenablog.com
- テクノロジー
- 2019/10/22
ここ1〜2年くらいで、業務やプライベートのデータ分析・データサイエンスで参考にした本（と一部本じゃないもの）をまとめてみました（注：もちろん全部読んでいます）.*1. なお, あくまでワタシ個人（@shinyorke）の見解に基づいた独自解釈であり、所属組織・チームの意向とは関係ありません（とだけ最初に断っておきます）. サクッとまとめると「レベル感（はじめて・経験者）」だけででなく,「エンジニア面を鍛える or 理論を固める」の軸で考えると良い書籍・学び方に出会える確率上がるエンジニアでも理論でもどっちから初めても良い, がどちらかが得意な方が絶対幸せ（≒片方だけじゃお話にならない可能性）個人的なオススメは「機械学習図鑑」「前処理大全」「機械学習のための特徴量エンジニアリング」そして「試して学ぶ機械学習」です. おしながきサクッとまとめるとおしながき対象読者&執筆者について
機械学習の勉強を始めて1年以内にkaggleで2位になったので、やったこと全部書く - kaggle日記
- 608 users
- aryyyyy.hatenablog.com
- テクノロジー
- 2020/06/05
皆さん初めまして！先日kaggleのARCコンペで2位になったのですが、 2位で終了しました！みなさんお疲れさまでした。コード書くの楽しかった。 pic.twitter.com/dLxl6Mlgoe — Aryyyyy (@aryyyyy13) 2020年5月28日僕のkaggle歴が浅めということもありtwitterでも結構反響があって、何人かの方にはわざわざDMまで頂いてどんな勉強をしたか聞いていただきました。なるほど需要があるならということで、今までのことをまるっと振り返ってみようと思います。これからkaggle始める方のためになれば幸いです。機械学習を始める前のスペック準備期間：2019年7月〜 kaggle初参加：2019年9月〜 kaggleちゃんと始める：2019年10月〜 DSB参加：2019年10月〜会社を休職して本格的に勉強開始：2020年1月前半〜手頃な
- kaggle
- 機械学習
- あとで読む
- 学習
- 勉強
- エンジニア
- AI
- study
- twitter
- techfeed
データサイエンティスト生活でお世話になった本｜武田邦敬｜Kunihiro TAKEDA
- 602 users
- note.com/ku2t
- 学び
- 2020/08/15
みなさんこんにちは。くにです。データ分析の世界に足を踏み入れてから9年が過ぎました。分析実務未経験でキャリアチェンジできたのは幸運としか言えませんが、ある意味無知だったからこそ無謀な挑戦ができたのかもしれません。この挑戦の泥臭い記録は、この記事に書きました。ポジションは変われど、データを扱う仕事をまだ続けています。私は実務で手を動かしつつ、不格好に失敗しながら学んできました。わからないことにぶつかるたびに本を買い、その本でわからないことがあればまた本屋に行き、自分が少しでも理解できそうな本を探して買いました。そして、気になる参考文献があれば、それも買って読んでみる…。こんな生活を続けているうちに、部屋が本だらけになってしまいました。正直に言って読み切ったという実感のある本はありません。しかし、実務で何かしらお世話になった本は数多くあり、そういう本は手放さずに手元に置いています。
- データサイエンス
- あとで読む
- 本
- 統計
- 機械学習
- データ分析
- データ
- 分析
- book
- 書籍
「あとで読む」タグで振り返る2021年〜今年の「あとで読む」、今年のうちに〜 - はてなブックマーク開発ブログ
- 597 users
- bookmark.hatenastaff.com
- テクノロジー
- 2021/12/20
今年も残すところあと少し。皆さんにとって、2021年はどのような一年でしたか？はてなブックマークでは今年もたくさんのエントリーがブックマークされ、コメント欄も盛り上がりました。データで見る「あとで読む」年末ということで、今回は「あとで読む」タグにフォーカスしたデータを集計しました。全ブックマークを対象にした「あとで読む」率、カテゴリー別「あとで読む」率、「あとで読む」が多いエントリーランキングを通して、2021年のはてなブックマークを振り返ってみましょう。全ブックマークを対象にした「あとで読む」率カテゴリー別「あとで読む」率「あとで読む」タグが多いエントリーは？ TOP10ランキング「あとで読む」タグの数が多かったエントリーランキングカテゴリー別「あとで読む」率の高かったエントリーランキング気になった記事を気軽に保存できる「あとで読む」機能 2021年の「あとで読
Appleの移動データを加工したらわかった東京の厳しい現実 - Qiita
- 573 users
- qiita.com/takatoshiroto
- テクノロジー
- 2021/04/07
こんにちは、Exploratoryの白戸です。 Appleは新型コロナウイルスの対策支援として、Appleマップでの経路検索をもとにした移動傾向のデータを公開しています。ところが、残念ながらこのデータはそのままでは簡単に可視化できるようなフォーマットになっておらず、ちょっとした加工を行う必要があります。しかし逆に、加工の仕方さえわかってしまえばそれぞれの都市や地域の移動データを可視化することで、恐怖を煽るばかりのマスコミからは見えてこない現状を理解することができるようになります。今回はこのAppleの移動傾向データを簡単に可視化できるようにするための基本的な加工方法を、みなさんと共有させていただければと思います。データはこちらからダウンロードすることができます。以下は「モダンでシンプルなUIを使ってデータサイエンスができる」Exploratoryを使って、「日本で最も自粛している都
- データ
- COVID-19
- 統計
- あとで読む
- apple
- Qiita
- data
- 分析
- データ分析
- 交通
データ分析のための統計学入門.pdf
- 571 users
- www.kunitomo-lab.sakura.ne.jp
- テクノロジー
- 2021/04/06
- 統計
- 統計学
- あとで読む
- pdf
- データ分析
- 学習
- statistics
- 入門
- 数学
- データ
ブラックフライデー＆サイバーセール開催！ Udemyでは何を買う？編集部の2021年イチ押しトピック10選 - はてなニュース
- 567 users
- hatenanews.com
- テクノロジー
- 2021/11/19
新型コロナウイルスの影響で、リモートワーク（テレワーク）やオンラインでの学習といった働き方・学び方の大きな変化は2021年も続いています。そんな2021年もあとわずか。やり残したことや学び残したことはありませんか？オンライン学習プラットフォーム「Udemy」では、2021年11月19日（金）～2021年12月1日（水）の間、年間最大のセール「ブラックフライデー＆サイバーセール」を開催します！対象の講座がなんと1,200円から購入可能になります。ブラックフライデーセールは11月19日（金）～11月26日（金）、サイバーセールは11月29日（月）〜12月1日（水）の開催です。11月27日（土）〜11月28日（日）はセール対象外なので、ご注意ください。講座は買い切りなので、おトクなこの期間に気になる講座を購入しておいて、時間ができたときに自分のペースで学んでみるのもいいかもしれません
- 学習
- あとで読む
- Udemy
- 開発
- 勉強
- プログラミング
- python
- ニュース
- wordpress
- git
タダで学べるデータサイエンス名著5冊【日本書は高額でも英語ができれば怖くない】 - Qiita
- 536 users
- qiita.com/Ringa_hyj
- テクノロジー
- 2020/05/07
この時期だからこそ自学しよう海外って太っ腹な組織が多いのか、無料で読める専門書がすごく多い。これ系のまとめ記事は他にもありますが、翻訳済の日本の本と、原著を並べて表示していきたいと思います。特にデータサイエンス分野に限って紹介。お高いあの名著も実は原著なら無料かも？ (2020年5月時点) 続編、データサイエンスの名大学講座を書きました (2020年8月) 1冊目邦題 : 統計的学習の基礎(1万5千円) 俗に言う「カステラ本」です。日本では2014年に翻訳されましたが、原著は2001年と今から約20年前に出版されました。内容からしても、当時は体系的に理論学習ができる刷新的な一冊だったのでしょう。まさに「アルゴリズム・理論の辞書」。年代的に古い感じはしますが、基礎はいつだって大切です。数字に強くないと絶対読み切れない。。。原著 : The Elements of S
- データサイエンス
- あとで読む
- 本
- 学習
- 統計
- データ
- 機械学習
- pdf
- 統計学
- ML
仕事で差をつけるChatGPT活用術。初心者でも使えるスゴいテクニックを達人に聞く - ミーツキャリアbyマイナビ転職
- 528 users
- meetscareer.tenshoku.mynavi.jp
- テクノロジー
- 2024/02/19
業務効率化に一役買ってくれると話題の「ChatGPT」。今や「大学生の4人に1人が就活でChatGPTを使っている」といったデータもあり、リリース当初はあまり興味のなかった方でも、最近は「自分の仕事でうまく使えたりしないかな？」なんて考える機会も増えてきたのではないでしょうか？ただ、ChatGPTが作業をどこまで効率化してくれるのかはまだまだ未知数です。時間を食う資料の作成やExcelの集計作業などをまるっとお任せできたらうれしいけど、思うようなアウトプットが得られず手間が増えたら、本末転倒な気もしますよね。それに、ChatGPTの生成データをめぐっては、権利関係や内容の中立性・正確性などの側面で一部懸念の声も挙がっています。業務内での利用を禁止する企業や、自身のコンテンツを「学習・流用」されないよう自衛措置を講じるクリエイターも存在します。使用にあたってのルールも、完全に整っている
- ChatGPT
- あとで読む
- AI
- 仕事
- テクニック
- 人工知能
- グラフ
- excel
- 資料
- 文章生成AI
This is The Entire Computer Science Curriculum in 1000 YouTube Videos
- 456 users
- laconicml.com
- テクノロジー
- 2021/01/13
This is The Entire Computer Science Curriculum in 1000 YouTube Videos In this article, we are going to create an entire Computer Science curriculum using only YouTube videos. The Computer Science curriculum is going to cover every skill essential for a Computer Science Engineer that has expertise in Artificial Intelligence and its subfields, like: Machine Learning, Deep Learning, Computer Vision,
【2021年】話題になった無料お勉強コンテンツ - まなめはうす
- 438 users
- maname.hatenablog.com
- テクノロジー
- 2021/12/30
社会人になってからの勉強って高尚な趣味になりがちで、次の仕事のイメージをもって勉強できる人ってなかなかいないと思っている。それでも、ただ楽しそうとか、やってみたいという好奇心持っている人は純粋に凄いなって思うので、そういう人に届くよう今年の人気コンテンツとなったリンクを整理しておく。無料コンテンツ勉強マニアの方が、この中からおすすめランキングなんて作ってくれたらさらに素晴らしいのになって思いながら。また、世界を広げるためにも裾野を広げるために無料公開に踏み切ったコンテンツ制作者の方々への想いには頭が下がるばかり。それはもう何か月もかけて作ったコンテンツが多くの人に読まれ、その中からさらにその世界を強くするだけの人が誕生してくれること良いですね。私個人としては、自分の世代にはまだ存在していなかった分野の基礎講座にはとても興味が引かれる部分で、知識の地盤というか、単語を正しく理解できるのが
- 勉強
- あとで読む
- 学習
- プログラミング
- 統計
- 無料
- まとめ
- コンテンツ
- データ
- AI
データエンジニア道の俺のバイブル
- 437 users
- zenn.dev/pei0804
- テクノロジー
- 2023/01/03
先人の知恵に学ぶデータエンジニア道で、本当に良かった！読み物を、不定期に追記していく。 A Beginner’s Guide to Data Engineering — Part I データエンジニアをこれから始める人に、必ず薦める記事。データエンジニアの基本を学べるかつ、どういう世界に広がっていくのかまで、一気に学べるのでとても良い。 Functional Data Engineering — a modern paradigm for batch data processing 関数型パラダイムを使ったデータパイプラインの構築方法。これを初めて読んだ時の衝撃は今でも忘れないし、フルスクラッチからdbtを使ったデータパイプラインになっても健在な設計手法。 Engineers Shouldn’t Write ETL: A Guide to Building a High Function
データサイエンティストとして読んで役立った本たち@2020-07｜だみ〜
- 432 users
- note.com/genuinedammy
- 学び
- 2020/07/24
2016年10月に未経験・新人データサイエンティストで雇ってもらいました。当時はまだ業界が牧歌的だったのと、比較的書類上のスペックが高い若者だったのもあり、運良く拾ってもらえたのでした。今だと100％受かってないです。そんな私が今までで読んだ本の中で、役に立った本をつらつら書いていきます。現代の若者がどんどん優秀になっているので、これくらいでいまんとこいっぱしのデータサイエンティスト（@ビジネスサイド）になれるんだなあという基準を述べようかと思いました。何年か後に振り返りたいですね。もちろん、これが誰かの学習の役に立てばと思っています。ちなみに、アフィリエイト入れてないので気にせず買っていってください。数学無難に解析学と線形代数学を勉強しておくといいと思っています。
全くのゼロから「駆け出しデータサイエンティスト」を育てる方法論 - 渋谷駅前で働くデータサイエンティストのブログ
- 430 users
- tjo.hatenablog.com
- テクノロジー
- 2019/11/17
(Image by Pixabay) 「データサイエンティスト」の第一次ブーム勃興から6年余り、人工知能ブームに便乗した第二次ブームで人口に膾炙してから3年余り、気が付いたら何やかんや言われながらもデータサイエンティスト及びその類似職が、じわじわと日本国内の産業各分野・企業各社に広まりつつあるように僕の目には映ります。そういう背景がある中で、ここ1年ぐらいの間にそこかしこで目立つようになってきたのが「ゼロからデータサイエンティストを育てたいのだがどうしたら良いか」という相談や議論。割とあるあるなのが「取引先がデータサイエンティストを採用して商談の席に同席させるようになって、彼らがデータサイエンスの知識を駆使してビシバシ突っ込んでくるのだが、こちらにデータサイエンティストがいないので対応できない」みたいなお話。これは実はUSでも同様だと聞くので*1、案外洋の東西を問わない課題なのかもしれま
- データサイエンス
- あとで読む
- 学習
- 統計
- データ
- 機械学習
- datascience
- 分析
- 教育
- data
2023年版：実務データ分析を手掛けるデータサイエンティスト向け推薦書籍リスト（初級6冊＋中級8冊＋テーマ別15冊） - 渋谷駅前で働くデータサイエンティストのブログ
- 427 users
- tjo.hatenablog.com
- テクノロジー
- 2023/02/07
(Image by wal_172619 from Pixabay) 去年で恒例の推薦書籍リストの更新は一旦終了したつもりだったんですが、記事を公開して以降に「これは新たにリスト入りさせないわけにはいかない！」という書籍が幾つも現れる事態になりましたので、前言撤回して今年も推薦書籍リストを公開しようと思います。初級向け6冊実務総論データサイエンス総論 R・Pythonによるデータ分析プログラミング統計学機械学習中級向け8冊統計学機械学習テーマ別15冊回帰モデル PRML 機械学習の実践 Deep Learning / NN 統計的因果推論ベイズ統計学時系列分析グラフ・ネットワーク分析データ基盤コメントや補足説明など完全なる余談初級向け6冊今回は新たに加わったテキストがあります。実務総論 AI・データ分析プロジェクトのすべて[ビジネス力×技術力＝価値創出
- 本
- あとで読む
- 統計
- データ
- 学習
- 書籍
- 分析
- データサイエンス
- データ分析
- book
ビジネスで使えるPythonを使った統計的データ分析手法まとめ - Qiita
- 414 users
- qiita.com/hikarut
- テクノロジー
- 2020/03/21
概要 WEB系のサービスで色々な試作を実施した後に効果を検証するのは非常に重要だと思いますが、そのやり方として基本的な統計学が十分に使えると思っています。今回は基本的な統計学からビジネスで使える試作の効果検証、データ分析を目的にPython+JupyterLab(Docker)を使った統計的データ分析のやり方をまとめました。また今回使ったnotebookは以下にもありますのでご参考ください。 https://github.com/hikarut/Data-Science/tree/master/notebooks/statisticsSample 環境以下を参考にDockerでJupyterLabが使える状態を前提とします。 Dockerで起動したJupyterLabでvimキーバインドを使う
- python
- あとで読む
- 統計
- 分析
- データ
- statistics
- プログラミング
- vim
- docker
- ビジネス
データエンジニアの私が機械学習・データサイエンスでオススメしたいスキルマップと本まとめ - 2020年版 - Lean Baseball
- 409 users
- shinyorke.hatenablog.com
- テクノロジー
- 2020/09/30
要約すると, データサイエンス・機械学習周りでよく聞かれること&回答を言語化しました. 「データサイエンティストやりたい」「機械学習エンジニアになりたい」というキャリア志望を持つ方は多いと思います. 私の周りでも, 公私ともにそんな志望者の相談を聞いたり, （主にインターンの学生さんですが）一緒に仕事をしたりする機会もメッチャ多いです. 「ビジネスサイド強いマン」「サーバーサイドエンジニア」という視点からデータエンジニア兼データサイエンティストな自分が, そんな彼ら彼女らにオススメしている, データサイエンティストを目指すためのスキルマップ各領域のスキルアップを実現するためにオススメしたい書籍を紹介したいと思います. なお, 昨年も同様のエントリーを書いておりそのUpgrade版となります. shinyorke.hatenablog.com このエントリーの対象読者データサイエンスに
実務の専門家として機械学習や統計分析を手掛けたい人にオススメの書籍初級5冊＆中級8冊＋テーマ別11冊（2020年2月版） - 渋谷駅前で働くデータサイエンティストのブログ
- 407 users
- tjo.hatenablog.com
- テクノロジー
- 2020/02/03
(Image by Pixabay) この記事は以下のオススメ書籍リスト記事のアップデートです。毎回の断り書きで恐縮ですが、この記事では「データサイエンティストや機械学習エンジニアなどデータ分析の実務の専門家として」*1機械学習や統計分析を手掛けていきたいという、主に初級ないし中級ぐらいのスキルレベルの人たちにお薦めしたい書籍を、初級向け5冊・中級向け8冊及び細かいテーマ別に11冊、それぞれ挙げていきます。スタンスとしては相変わらず「当座の最終到達点を『中級』に置いた時に最初に読んで内容をマスターしておくべき書籍」を初級に置いているので、世の中のこの手のお薦め書籍リストに比べると若干ハードな内容のものが初級向けに多いかもしれません。後はちょっと気が早いかもしれませんが、機械学習パートに関しては「AutoML時代にあっても実務の専門家であれば知っておくべき知識」を収めた書籍を選んでおきま
- 機械学習
- 統計
- あとで読む
- 本
- 学習
- 書籍
- データ
- book
- 統計学
- ML
データサイエンティストは何を勉強すべきか：「教養」と「必須」と「差別化」と - 渋谷駅前で働くデータサイエンティストのブログ
- 407 users
- tjo.hatenablog.com
- テクノロジー
- 2022/07/29
(Image by Wokandapix from Pixabay) 個人的な観測範囲での話ですが、データサイエンティストという職業は「21世紀で最もセクシーな職業」として刹那的な注目を集めた第一次ブーム、人工知能ブームに煽られて火がついた第二次ブーム、そして「未経験から3ヶ月で人生逆転」ムーブメントと折からのDXブームに煽られる形で沸き起こった第三次ブームを経て、何だかんだで社会に定着してきた感があります。で、このブログを始めた頃からの連綿と続くテーマになっていますが、いつの時代も話題になるのが「データサイエンティスト（になるに）は何を勉強すべきか」ということ。7年前から恒例にしてきた「スキル要件」記事では、基本的には「どれも必要な知識（学識）」であるという前提で分野・領域・項目を挙げてきました。少なくとも、最初の3回ぐらいはそういう認識でスキル要件記事を書いていた気がします。ところ
IT未経験からMLエンジニアになるまでの2年半でやったこと - MLaaSS - Machine Learning as a Self-Satisfaction
- 395 users
- mlaass1.hatenablog.com
- テクノロジー
- 2020/07/08
はじめに自身の転職活動にあたり皆さんの転職エントリが非常に参考になったので、私も同じ境遇の方の参考になればと思い、書き残すことにしました。（ただ、本当に私と似た境遇の方にはなかなかリーチしづらい気がしていますが・・・） TLDR; 30歳でIT未経験からMLエンジニアに転職約2年半独学で勉強（ほとんどkaggleしてただけ）無関係に思えた現職での経験もなんだかんだ転職で役に立った目次自己紹介現職について転職の理由勉強したこと転職活動終わりに 1.自己紹介かまろという名前でTwitterなりkaggleなりをやっています。kaggleでは画像やNLPといったdeep learning系のコンペを中心に取り組んでおり、2019年の9月に金メダルを獲得しMasterになることができました。恐らくここが他の転職エントリを書かれている方々と大きく異なる点かと思うのですが、現職
- kaggle
- あとで読む
- エンジニア
- 機械学習
- 学習
- python
- データサイエンス
- 転職
- 技術
- IT
「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売
- 389 users
- prtimes.jp
- テクノロジー
- 2020/08/20
「音源分離」の最新手法を解説した、中級者以上向けの実践的な技術書『Pythonで学ぶ音源分離』を8月24日に発売インプレスグループでIT関連メディア事業を展開する株式会社インプレス（本社：東京都千代田区、代表取締役社長：小川亨）は、「音源分離」技術の基礎から実装までを解説した書籍『Pythonで学ぶ音源分離機械学習実践シリーズ』を2020年8月24日（月）に発売いたします。 ■身近なものにも活用される技術「音源分離」の基礎と実装を解説する一冊近年、AIスピーカをはじめとした、人が話した音声を理解する音声認識システムがさまざまな場面で使われています。一般的に音声認識システムは、1人の声を聞き取ることを想定しており、聞きたい声以外の音が入ってきたときには、聞きたい声を正確に聞き取ることが難しくなります。「音源分離」とはこのようにさまざまな音が混ざった中から、欲しい音だけを抽出する技術で
- python
- あとで読む
- 音源分離
- 技術
- 本
- book
- 機械学習
- 音響
- books
- 音声
各業界でのデータサイエンスの活用について調べてみた（随時追加） – かものはしの分析ブログ
- 386 users
- kamonohashiperry.com
- テクノロジー
- 2021/11/24
都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーターほしいものリスト仕事で、いろんな会社でデータサイエンスってどう使われているのですか？と聞かれることがあり、自分としてはなんとなくしか掴めていないな、知ったかぶりしたくないなと思うところがあったので、やや手厚くリサーチをしてみようと思いました。 2022/3/6の段階では11つの市場しかないですが、最終的には30市場を目指します。【2021/11/27追記】公開したところ、それなりにこの記事に関心を持ってくださった方が多かったようなので、少しずつ事例を埋めていこうと思います。業界
【年末年始】2021年の「年間総合はてなブログランキング」トップ100と「はてな匿名ダイアリー」トップ50、一挙公開！ - 週刊はてなブログ
- 368 users
- blog.hatenablog.com
- 暮らし
- 2021/12/29
みなさんにとって2021年はどんな一年だったでしょうか？週刊はてなブログでは、毎週月曜日にはてなブログ・はてな匿名ダイアリーの記事を対象としてはてなブログ独自の集計を行い、「今週のはてなブログランキング」を公開。ランキングにはそのときどきの注目記事が集まっています。今回は、その総決算として2021年にもっとも注目を集めた「年間総合はてなブログランキング」トップ100の記事と、「はてな匿名ダイアリー」トップ50の記事を発表します！*1。集計期間は2021年1月1日～同12月22日です。 # タイトル／著者とブックマーク 1 東大が無料公開している超良質なPython/Data Science/Cloud教材まとめ (*随時更新) - Digital, digital and digital by id:touya_hujitani 2 高卒新人に資産運用を説明する - やしお by id
- はてな
- あとで読む
- ランキング
- 読書
- はてなブックマーク
- ブログ
- 本
- まとめ
- blog
- 2021
時系列予測で使えるpythonライブラリ一覧 - ざこぷろのメモ
- 360 users
- zakopilo.hatenablog.jp
- テクノロジー
- 2020/07/19
本記事では、時系列予測に利用できるpythonのライブラリの使い方について説明をします。パッとライブラリを使うことを目指すため具体的なアルゴリズムの説明は省きます。 ※説明が間違えている場合があればご指摘いただけると助かります。目次利用データライブラリ Prophet PyFlux Pyro Pytorch Lightgbm 補足:Darts まとめソースコードこのブログで記載されているソースコードはGitHubに上げておいたのでもしよろしければ参考にしてください。 github.com 利用データ今回用いるデータはkaggleのM5 Forecasting - Accuracyと呼ばれるコンペティションで利用されたデータを用います。作成したランダムなデータよりも実データのほうが予測をしている感があるからです。予測に使うデータはwalmartの売上データです。下図はその
LLMのプロンプト技術まとめ - Qiita
- 346 users
- qiita.com/fuyu_quant
- テクノロジー
- 2023/10/25
現在，34個掲載(一部執筆途中) よかったらData Science wikiのGPTsも見て下さい！はじめに今回はすぐに使えそうなプロンプトの工夫やフレームワークについて有名なものをまとめました．LMの出力の精度向上に役立てられればと思います．論文があるものについてはarXivに最初に投稿された順番で掲載しています．論文で精度向上が確認されているのは英語での検証がほとんどであるため，日本語で改善されるかは分かりません．全てのLLM(GPT-4,Llama2,...)で精度が改善するとは限りません． ※記事に誤り等ありましたらご指摘いただけますと幸いです．以下の記事では敵対的プロンプト技術をまとめています！目次 Zero-shot prompting Few-shot prompting 2021年〜 Generated Knowledge Prompting 2022年〜
- LLM
- AI
- ChatGPT
- あとで読む
- プロンプト
- prompt
- qiita
- GPT
- 人工知能
- 論文
22社、52人のデータサイエンティストに聞いてみた！「どんなお仕事してますか？」 | Da-nce
- 329 users
- da-nce.jp
- テクノロジー
- 2021/07/26
データ分析とビジネス活用のプロとして、さまざまな業界・フィールドで活躍する「データサイエンティスト」。スキルセットや必要な知識などが語られることはあるものの、まだはっきりとした定義がなく、いったいどんな人たちなのか？と疑問を持つ人も少なくないのでは。そこで本企画では、企業で働くデータサイエンティストたちの"リアル"を調査。データサイエンティストを志した理由や興味深かった論文、普段の業務、自社で働く魅力などを22社、52人のデータサイエンティストに聞きました。企業一覧 DataRobot Japan株式会社株式会社GA technologies 株式会社HACARUS 株式会社JMDC 株式会社LIFULL MNTSQ株式会社 NABLAS株式会社株式会社Rist Sansan株式会社 SOMPOホールディングス株式会社株式会社ZOZO 株式会社ZOZOテクノロジーズアスクル株
「全数調査なら何でもわかる」という誤解 - 間違えがちな母集団とサンプリングそしてベイズ統計 - - ill-identified diary
- 325 users
- ill-identified.hatenablog.com
- 世の中
- 2020/10/21
この文章は pandoc-hateblo で tex ファイルから変換しています. PDF 版はこちら 2021/10/15 追記: 後半のベイジアンブートストラップに関する解説はこちらのほうがおそらく正確です ill-identified.hatenablog.com 概要挑発的なタイトルに見えるかも知れないが, 私はしらふだしこれから始めるのは真面目な話だ — 正直に言えばSEOとか気にしてもっと挑発的なタイトルにしようかなどと迷ったりはしたが. 「全数調査できれば標本抽出の誤差はなくなるのだから, 仮説検定は不要だ」という主張を見かけた. いろいろと調べた結果, この問題を厳密に説明しようとすると最近の教科書には載ってない話題や視点が必要なことが分かった. ネット上でも勘違いしている or よく分かってなさそうな人をこれまで何度か見かけたので, これを機に当初の質問の回答のみならず関
- 統計
- あとで読む
- statistics
- 数学
- 調査
- データ
- サンプリング
- 確率