この記事は、kaggle Advent Calendar 2018 - Qiitaの24日目の記事です。 この記事では、先日終了したkaggleのPLAsTiCC コンペで私が行った、特徴の管理の仕方を紹介します。 コンペを約2ヶ月ほど戦い、数千の特徴を作り特徴管理が破綻しなかったので、最低限の管理はできていたとは思います。 ただし、これがベストだとは思っていなくて、強い方からマサカリ・アドバイスをもらって、より良い管理方法を模索したいという思いもあり、この記事を書いてみました。アドバイスなどあれば、是非コメントお願いします。 参考にした方法など コンペでの特徴管理にあたり、次の2つのブログを参考にしました。 Kaggleで使えるFeather形式を利用した特徴量管理法 feather - pandasの読み書きを高速化 基本的にこの記事の方法は、1.のブログで紹介されている方法を前提とし