📖 Data Preprocessing Cookbook 👨🍳 R言語でのモデリングおよび統計解析のためのパッケージを扱うtidymodelsの中から{recipes}, {embed}, {textrecipes} パッケージを使ったデータ前処理、特徴量エンジニアリングの手法を紹介します。 (余力があればPython、scikit-learn preprocessing等を利用した処理手順についても書きます) TOC パッケージ全般 データ整形 スケーリング処理 特徴量選択(フィルタ法) 次元削減 不均衡データに対する調整 欠損値への対応 kNN データ分割 特徴量エンジニアリング numeric categorical text date and time coordinates モデル・アルゴリズムあれこれ 線形回帰 ランダムフォレスト 評価指標あれこれ パラメータ探索 D