前回の記事ではGoogle Pinpointを使ってスキャンPDFの文章を読み込み、単語や日付で絞り込む方法を解説しました。 Google Pinpointでは文章だけでなく、表や箇条書きなど何らかの構造を持つ文書を表形式で取得する「構造化データの抽出(Extract Structured Data)」と呼ばれる機能があります。この記事では、前回と同じく日本銀行のスキャンPDF資料から表をCSV形式で抽出する方法を解説します。 サンプルデータの読み込みまずサンプルデータをダウンロードします。 https://drive.google.com/file/d/1GEhAg86ks6WYC8H3d7L9YV_NdL5DILZK/view 前回と同様に、日本銀行の金融政策決定会合議事録から抜粋したものです。資料内にはいくつかグラフがありますが、スキャンPDFなのでそのままではコピーすることができま