サクサク読めて、アプリ限定の機能も多数!
「Wiki-40Bは、40言語以上のWikipediaを前処理して作られたデータセットです。このデータセットは言語ごとに学習/検証/テスト用に分かれているので、単語分散表現や言語モデルの学習・評価に使えます」
nilab のブックマーク 2020/09/28 12:56
Wikipediaの前処理はもうやめて「Wiki-40B」を使う - Ahogrammer「Wiki-40Bは、40言語以上のWikipediaを前処理して作られたデータセットです。このデータセットは言語ごとに学習/検証/テスト用に分かれているので、単語分散表現や言語モデルの学習・評価に使えます」2020/09/28 12:56
このブックマークにはスターがありません。 最初のスターをつけてみよう!
hironsan.hatenablog.com2020/09/26
最近の自然言語処理では、大規模なテキストから単語の分散表現や言語モデルを学習させて使っています。学習する際のテキストとしては、分量や利用しやすさの都合からWikipediaが選ばれることが多いですが、その前...
177 人がブックマーク・11 件のコメント
\ コメントが サクサク読める アプリです /
「Wiki-40Bは、40言語以上のWikipediaを前処理して作られたデータセットです。このデータセットは言語ごとに学習/検証/テスト用に分かれているので、単語分散表現や言語モデルの学習・評価に使えます」
nilab のブックマーク 2020/09/28 12:56
このブックマークにはスターがありません。
最初のスターをつけてみよう!
Wikipediaの前処理はもうやめて「Wiki-40B」を使う - Ahogrammer
hironsan.hatenablog.com2020/09/26
最近の自然言語処理では、大規模なテキストから単語の分散表現や言語モデルを学習させて使っています。学習する際のテキストとしては、分量や利用しやすさの都合からWikipediaが選ばれることが多いですが、その前...
177 人がブックマーク・11 件のコメント
\ コメントが サクサク読める アプリです /