タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

linuxとdataに関するU1and0のブックマーク (1)

  • 「コマンドラインではじめるデータサイエンス」Jeroen Janssensら - StatModeling Memorandum

    このではMasonとWiggins(2010)のデータサイエンスの定義に従って解析をすすめていきます。すなわち、(1)データの獲得、(2)データのクレンジング、(3)データの精査、(4)データのモデリング、(5)データの解釈の5ステップです。(5)はコンピュータの出番が少ないこともあり触れていません。(3)にはデータの可視化なども含まれているようです。僕が感じたこのの主な対象は(1)(2)であり、まごうことなき前処理です。 コマンドラインの全オプションを説明するのではなく、例を通してsort, uniq, grep, cut, sample, head, tail, tr, sed, awk, curl, scrapeなどの基的なコマンドラインをいかに組み合わせてデータを加工・集計するかの説明が丁寧であり、網羅的ではありませんがチュートリアルとして非常に有用だと思います。Linux

    「コマンドラインではじめるデータサイエンス」Jeroen Janssensら - StatModeling Memorandum
    U1and0
    U1and0 2019/01/01
    すごくよい講評です
  • 1