タグ

dataとwikipediaに関するchess-newsのブックマーク (2)

  • Tidy data - Wikipedia

    ここで、1つ目に掲げたものは整然でない(すなわち雑然である)。これに対して2つ目に掲げたものは整然である。 変数と列[編集] まずは両者において変数がどのように表示されているかを見てみたい。このデータにおいては、地点・時刻・天気という3つの変数がある。1つ目の表においては、地点の情報は列で表されているが、時刻の情報は行で表されている。天気の情報は複数の行と列にまたがっている。地点も時刻も天気も意味的には変数であるにもかかわらず、表出された構造が異なっている。そして、整然データの1つ目の条件(個々の変数が1つの列をなす)は満たされていない。 これに対して、2つ目の表ではどの変数も1つの列で表されている。地点の情報は縦一になっているし、時刻の情報も縦一になっている。天気も同様だ。つまり、こちらは1つの変数が必ず1つの列をなしており、整然データの1つ目の条件を満たしている。 観測と行[編集]

  • データサイエンス - Wikipedia

    データサイエンス(英: data science、略称: DS)またはデータ科学[1][2]とは、データを用いて新たな科学的および社会に有益な知見を引き出そうとするアプローチのことであり、その中でデータを扱う手法である情報科学、統計学、アルゴリズムなどを横断的に扱う。 概要[編集] データサイエンスは、統計的、計算的、人間的視点から俯瞰することができる。それぞれの視点がデータサイエンスを構成する質的な側面であり、これらの3つの視点の有機的結合こそがデータサイエンスという学問の神髄である(Blei and Smyth, 2017[3])。 これまでのデータ解析における現場の知識の重要性に対する認識不足が、データサイエンスという学問に対する幅広い誤解の源泉であると考えられる(Hernan, Hsu and Healy, 2018[4])。 手法・理論[編集] データサイエンスで使用される手法

    データサイエンス - Wikipedia
  • 1