静岡県立中央図書館は、2021年度から静岡県立中央図書館がおこなっている「図書館DX実証実験」の一環として、静岡県内の自治体WebサイトにアップロードしたPDFを自動収集するクローリングシステムを株式会社Geolocation Technology(以下、Geolocation Technology社)と共同開発しました。 クローリングシステムにより、これまで人手で収集していたPDFを自動で収集することが可能になります。なお、公共図書館におけるクローリングシステムの開発は、全国初の取り組みとのことです。 45万件ものPDFを自動で収集静岡県立中央図書館らが開発したクローリングシステムは、これまで収集が難しかったとされる、静岡県内の自治体Webサイトのドメイン内に格納されているPDFを自動収集するというものです。 収集したたPDFの数は45万5133件。収集範囲はドメイン以下5階層目までです