エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント1件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
各種HTMLパーサーのパフォーマンス比較 – とまとのノート
⚠この記事は個人による適当な調査結果をまとめたものです。間違いなどありましたらご指摘いただきますと... ⚠この記事は個人による適当な調査結果をまとめたものです。間違いなどありましたらご指摘いただきますと幸いです。⚠ みなさん、スクレイピングしていますか?スクレイピング時のパーサーライブラリは、何を使っていますか? 私はRubyが好きなので、大体Nokogiriを使っています。 しかし先日、あるスクレイピングの作業中に、NokogiriのHTMLパーサーは少し遅いのでは…?と感じました。約10万件のデータをパースするのに、約10分ほど待たなければいけないのです。何度も回して試行錯誤しなければならなかったので、時間がかかって仕方ありませんでした。 そもそもRubyが遅いので、言語問わず他のパーサーを使えばもっと快適に作業できのでは?という考えから、今回は、いくつかの言語のHTMLパーサーのパフォーマンスを比較してみました。 比較結果やコードは GitHub(snakazawa/html-pars
2019/05/25 リンク