データ分析に関するPucchiのブックマーク (3)

  • KUT 計量経済学応用

    0.1 この資料について この資料は、高知工科大学 (KUT) 経済・マネジメント学群で2020年度に開講する「計量経済学応用」の補助教材である。 受講生は、以下の3点に注意されたい。 この資料は、授業の進捗にあわせてアップデートされる。 とりあえず、一通り書き終えた。 (2020-07-07) 公開時点(2Q開始時点)では、すべてのトピックの説明が完成していない。 各トピックの説明は順次追加する。 一度アップロードしたトピックの内容を修正するときは、Slack でアナウンスする。 ただし、誤字・脱字等については気付いたらアナウンスせずに修正する。 この資料以外の授業資料(解説音声付きスライドや配布資料など)は、KUTLMS (Moodle) にアップロードする。 この資料以外に教科書が必要である。 教科書:安井翔太. 2020.『効果検証入門:正しい比較のための因果推論/計量経済学の基礎

  • 「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary

    データサイエンティストを生業にする手段と実態について述べる。 途中、具体例・境界値の例として私個人の話もするが、なるべく一般性のある話をする。 この記事で言いたいことは具体的には4つだ。 プログラミングスクールをディスるなら代わりの入門方法を提供しようよ。 もう「未経験文系から3ヶ月でデータサイエンティストで一発逆転物語」を止めろ。*1 おじさんは人生逆転したいなら真面目にやれ。 若者はワンチャンじゃなくて、ちゃんと化け物になれよ。 この記事についてはパブリック・ドメインとして転載・改変・リンク記載を自由にしてよいです。 (続き書いた) a. 入門は辛いが… b. 思考停止でプログラミングスクールに通うな。 なろう系・始めてみよう系資料一覧 (最速・最短ルート用) まずは動かしてみよう。強くてニューゲームが体験出来るぞ! 入門以前の 一般向け業界 (AI業界と展望がわかる) 技術者入

    「未経験文系から3ヶ月でデータサイエンティストになって一発逆転」はここで終わり (2020/7/31 更新) - todo-mentor’s diary
  • 第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ|シティズンデータサイエンスラボ

    シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 データ整備のサグラダファミリアここまで「業務のためのデータ」をどう「活用のためのデータ」に加工するかを詳しく説明してきました。複数の表を結合するためのキーを確認し、それぞれの表の中に含まれる対象のデータを確認し、最終的にどのような切り口で1行ずつにまとめるのかを決めて、それぞれの項目を数値化したり分類したり、必要に応じてさまざまな集計をしたものが活用のためのデータです。その過程では、抜け漏れや異常値、表記の揺れなど、適切に対処しなければいけないことがあります。 データ分析においても、AI開発においても、多くの場合、実はこうしたデータの加工やそのためのクリーニングなどの作業に8〜9割もの時間や工数が費やされます。つまり「高

    第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ|シティズンデータサイエンスラボ
  • 1