かものはしの分析ブログ – データ分析などの情報を不定期で更新[B!]人気記事・評価

[Python]機械学習などでテキストデータを特徴量にする際のソースコード集

383 users

都内の事業会社で分析やWebマーケティングの仕事をしています。大学・大学院では経済学を通じて統計解析を行うなどしておりました。企業に勤めてからは、機械学習やテキストマイニング、クローリング技術などに関心を持っています。 Twitterアカウント Mr_Sakaue( SKUE ) GitHub 読書メーターほしいものリストテキストデータの特徴量化について仕事ではテキストデータを多用するので、機械学習などで扱うためにテキストデータを特徴量にするためのアプローチを色々と整理してソースコードを残しておきたいと思います。今回はあくまでも私の知っているものだけなので、網羅性はないかもしれませんが悪しからず。（2019/08/18 追記）Stackingをカジュアルに行えるvecstackというモジュールを用いた予測も試してみました。下の方の追記をご覧ください。アプローチテキストデータを特

テクノロジー
2019/06/24 00:28

Kaggleで使われた特徴量エンジニアリングとアルゴリズムまとめ – かものはしの分析ブログ

110 users

『かものはしの分析ブログ – データ分析などの情報を不定期で更新』

このページはまだブックマークされていません

キーボードショートカット一覧

公式Twitter

はてなのサービス

このページはまだ
ブックマークされていません