はじめに こんにちは、事業会社で働いているデータサイエンティストです。 本記事では、ディリクレ過程回帰モデルという、柔軟に独立変数(共変量、特徴量)と従属変数(結果変数)の関係性をモデリングする手法を紹介します。詳細はHannah, Blei and Powell(2011)を参照してください。 さて、ディリクレ過程回帰はノンパラメトリックベイズの一種なんですが、柔軟に独立変数と従属変数をモデリングする手法でいうとガウス過程で良いのでは?という疑問もあるかもしれません。 勉強不足の状態での個人的な意見になりますが、ガウス過程には二つの大きな課題があります: 独立変数と従属変数の関係を記憶する巨大な共分散行列の逆行列を求める必要があり、そもそもあまりスケールしません 曲線の当てはめに置き換えられるタスク以外で活用しにくい 一つ目の問題はEC2で強力なインスタンスを立ててそこで計算すればある程