エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
特許文章版 分散表現:word2vecの学習済モデル ver1.0 - Qiita
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
特許文章版 分散表現:word2vecの学習済モデル ver1.0 - Qiita
分散表現公開 前回作った分散表現のバージョンアップ版(ver1.0) 特許版word2vec学習モデル(.model)214... 分散表現公開 前回作った分散表現のバージョンアップ版(ver1.0) 特許版word2vec学習モデル(.model)214MB注意 特許版word2vec学習モデル(.model.wv.vectors.npy)3160MB注意 特許版word2vec学習モデル(.model.trainables.syn1neg.npy)3160MB注意 2013~2015年に日本国特許庁で発行された全公開公報(150万件ほど)の全文を用いて学習 tokenizeはMeCab+NEologdです。 次元数は300次元 ただし、データが重すぎてエラーが出てcolaboratoryでは動かない場合があります。動作が確認できたのはGCEの n1-highmem-8 (8 vCPUs, 52 GB memory) です。これくらいのスペックがないと動かないかもしれません。 です。 model.corpus_cou