エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
スクレイピングとテキストマイニングでエンジニアにとっての2018年10大ニュースを見つけ出した|仮想サーファー@さぼりエンジニア
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
スクレイピングとテキストマイニングでエンジニアにとっての2018年10大ニュースを見つけ出した|仮想サーファー@さぼりエンジニア
あと2週間ちょっとで2018年も終わってしまいますね。 今回は、エンジニアなら振り返っておきたい2018年... あと2週間ちょっとで2018年も終わってしまいますね。 今回は、エンジニアなら振り返っておきたい2018年の10大ニュースをまとめておきます。 一瞬ぼく自身が驚いたニュースなどをまとめようかとも思ったのですが、「一個人の記憶に残っているニュースを引き出してまとめても、チープなものにしかならないな...」 と思い、プログラミングの力に全面的に頼ることに。 ここ1年間のIT関連のニュースをメディアからスクレイピングしてきて、抽出結果を月ごとにテキストマイニングして出現率の高いワードを持っている記事を選定。 以下のような流れで記事を書きました。 1. スクレイピングできそうなITメディアサイト選出 2. サイト別にスクレイピングする(タグ名とか違うからしょうがない) 3. Spread Sheetに出力する 4. テキストマイニング(出現率高い単語で記事名検索) 5. 抽出された記事名/リンクを