はじめに 本記事では、SCDV(Sparse Composite Document Vectors)により、Qiita記事のベクトルを作成した。 以降、Qiita記事のベクトルをQiitaベクトルと呼ぶ。 本記事の概要 [作成] Qiita記事を収集し、SCDVによるQiitaベクトルを作成 [実験] Qiitaベクトルを用いて、Qiitaでのタグ、投稿者、組織間の類似度を観察 [今後の課題] やってみると、微妙なところが気になったのでv0.1にした。試したいことが色々でてきた。 SCDVとは SCDVは、EMNLP2017で発表された文書ベクトル作成手法[元論文] 文書ベクトルは、以下の特徴を持つ。 Word-topics vectorにより高い表現力を実現 Word-topics vectorは、単語の潜在的な複数のトピックを考慮する。具体的には、単語ベクトルへソフトクラスタリング(G