学生エンジニアのMoriです。 今回はWebクローリングでも多用する Nokogiri を使ったスクレイピングについて書きたいと思います。 目次 Nokogiriとは Nokogiriを使う準備 基本的な使い方 HTMLをDOMに変換する 要素ノードを取得する テキストノードを取得する 要素ノードの属性の値を取得する 要素ノードの配列を扱う 親子関係を利用して要素ノードを取得する 知ってると得する機能 DOMをHTMLに戻す 要素ノード内のHTMLを取得する 1. Nokogiriとは DOM操作するためのRubyのGemです。 Rubyでスクレイピングをする際には欠かせないGemの一つと言っても過言ではないでしょう。 これを用いてHTMLから任意の箇所の文字列を抜き出したり、動的にHTMLを作成することができます。 2. Nokogiriを使う準備 Rubyスクリプトの場合はコマンドライ