正規表現を使用して、htmlの中からリンクを探して一覧を抽出するサンプルです。 以下のようなhtmlから、リンクの一覧を抽出してみます。 <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd"> <html xmlns="http://www.w3.org/1999/xhtml" xml:lang="ja" lang="ja"> <head> <meta http-equiv="Content-Type" content="text/html; charset=UTF-8" /> <title>xxx</title> <link href="/xxx.css" rel="stylesheet" type="text/css" />