AutoPagerizeに関するoscdis765のブックマーク (1)

  • AutoPagerize Wiki: About SITEINFO (ja)

    AutoPagerizeの基的な動作は下の2つで、これが繰り返し行われます。 ページから「次のページのURL」を取り出す。 次のページを読み込み、「継ぎ足しに必要な部分」だけを取り出し、継ぎ足しを行う。 AutoPagerizeが動作するには、「次のページのURL」と「継ぎ足しに必要な部分」がどの部分であるかが分る必要があります。これらWebページによって様々なので、なかなか自動で見つけることはできません。そのためAutoPagerizeでは、自動でみつけるのは諦めて、Webページに応じて必要な情報をあらかじめ用意するという方法をとっています。AutoPagerizeでは以下の情報を利用するWebページごとに用意しています。 「次のページのURL」を示すXPath式 「継ぎ足しに必要な部分」を示すXPath式 どのWebページ(URL)に対して利用するのかを示す正規表現 これらの情報をま

  • 1