[B! Kaggle][LightGBM] misshikiのブックマーク

misshiki id:misshiki

KaggleとLightGBMに関するmisshikiのブックマーク (2)

第2回金融データ活用チャレンジ -効率的なデータ分析・予測を行えるコードの紹介- - Qiita
概要 SIGNATEで2024年1月18日～2024年2月15日において開催中のコンペ「第2回金融データ活用チャレンジ」のデータを可視化し、LightGBMでの予測を行ってみました。可視化はSeabornを活用することで、0,1のデータの分布を比較的簡単に見ることができるようになります。予測結果のファイル名を都度設定するのは面倒なので、notebookのファイル名がそのまま使えると便利ですよね。notebookの設定を自動的に読み取る方法も紹介します。とりあえずLightGBMで予測してみました。欠損値の補完などがなくても予測できてベースライン作成に便利です。 Confusion Matrix や Classification Reportを使って予測結果を出力できるようにしておきましょう。データのインポート・前処理ライブラリのインポート notebookの横幅を広げたいときに
misshiki 2024/02/15
“SIGNATEで2024年1月18日～2024年2月15日において開催中のコンペ「第2回金融データ活用チャレンジ」のデータを可視化し、LightGBMでの予測を行ってみました。”

LightGBM

機械学習

Kaggle
リンク
「初手LightGBM」をする7つの理由 - u++の備忘録
Kaggleなどのデータ分析コンペでテーブルデータを扱う場合、最近は取りあえずLightGBMを利用する場合が多いです。本記事では、初手の機械学習アルゴリズムとして「LightGBM」*1を採用する理由を紹介します。あくまで2019年10月末時点での個人の主観なので、ご参考までにご覧いただければと思います。 1. 欠損値をそのまま扱える 2. カテゴリ変数の指定ができる 3. 特徴量のスケーリングが不要 4. feature importanceが確認できる 5. 精度が出やすく最終的なモデルとして残る可能性が高い 6. 比較的大きいデータも高速に扱える 7. 過去の経験からハイパーパラメータの勘所があるおわりに初手としては、手の混んだ特徴量を作らずに、まずは何かしらの予測結果を生成したい場合も多いです。LightGBMは既存のデータセットを極力加工せずに利用するという観点で、特徴量
misshiki 2019/10/31
LightGBM

Kaggle

機械学習
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx