エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
GCP dataflowを利用して、ニコニコ動画の全コメント41億件を、BigQueryへ入れる。 - Qiita
動画データは、2000万件ある。2000万件であれば、DBに入れられるが、コメント情報は、41億件あるため、B... 動画データは、2000万件ある。2000万件であれば、DBに入れられるが、コメント情報は、41億件あるため、BigQueryなどの大規模なデータ集計が得意なものに入れたほうが良いだろう。 今回は、GCPのDataFlowを利用して、BigQueryにニコニコ動画のデータを入れることにする。 結論 ニコ動画のコメント情報は、41億件あるため、DataFlowなどを用いて、大規模分散システムで入れるのに適している。 ニコ動のコメント情報は、動画IDがjson内に無く、アーカイブされたファイル名にあるため、そちらを取得してdataflowにデータを入れる。 Dataflowを用いてGCSにおいたzipファイルから、データをロードする。 サンプルコードはこちらにある。 コメントのロードのREADME コメント github readme ビデオ情報の README ビデオ情報 github rea
2022/01/08 リンク