エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
kaggleのtitanic xgboostを使った生存者予測 [80.1%] - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
kaggleのtitanic xgboostを使った生存者予測 [80.1%] - Qiita
はじめに 前回はタイタニックのtrainデータを見て、生存率に関係のある特徴量とは何かを見てみました。 ... はじめに 前回はタイタニックのtrainデータを見て、生存率に関係のある特徴量とは何かを見てみました。 前回:kaggleのtitanic 特徴量生成の前のデータ分析 (こちらの記事も合わせて見ていただけると嬉しいです) その結果を元に、今回は欠損値の補完と必要な特徴量を追加して予測モデルに与えるデータフレームを作成します。 なお、今回は予測モデルとして、kaggleのコンペでもよく使われている「GBDT(勾配ブースティング木)のxgboost」を使うのでデータをそれに適した形にしていきます。 コードはGitHubでも公開しています。 xgboost.py 1. データの取得と欠損値の確認 import pandas as pd import numpy as np train = pd.read_csv('/kaggle/input/titanic/train.csv') test =