タグ

pythonとpivotに関するU1and0のブックマーク (1)

  • pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) | note.nkmk.me

    pandas.crosstab()関数を使うとクロス集計分析ができる。 カテゴリデータ(カテゴリカルデータ、質的データ)のカテゴリごとのサンプル数(出現回数・頻度)の算出などが可能。 pandas.crosstab — pandas 0.22.0 documentation 出現回数ではなく、カテゴリごとの平均値などを算出したい場合はピボットテーブルpandas.pivot_table()を使う。以下の記事を参照。 関連記事: pandasのピボットテーブルでカテゴリ毎の統計量などを算出 ここでは、 pandas.crosstab()関数の基的な使い方 カテゴリごとの小計・総計を算出: 引数margins 全体・行ごと・列ごとに規格化(正規化): 引数normalize について説明する。 例としてタイタニックの生存情報のデータを使用する。Kaggleの問題からダウンロードできる。 im

    pandasのcrosstabでクロス集計(カテゴリ毎の出現回数・頻度を算出) | note.nkmk.me
    U1and0
    U1and0 2019/01/15
    第一引数indexに結果の行見出しとなるpandas.DataFrameの列(= pandas.Series)、第二引数columnsに結果の列見出しとなるpandas.DataFrameの列(= pandas.Series)を指定する。 pandas.pivot_table()と異なり、pandas.DataFrameオブジェクトとその列名で
  • 1