タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

pdfに関するsiomarukoのブックマーク (1)

  • 【自動化】PDF内の表をPythonで抜き出す - Qiita

    PDFは扱いにくい PDFファイルをPythonで扱うのは大変です。 表がPDFの中に埋め込まれているケースも割とあります。 例えば 平成30年 全衛連ストレスチェックサービス実施結果報告書の中にはたくさんの表データが埋め込まれています。 例えばファイルの40ページの【表14 業種別高ストレス者の割合】を抜き出したいと思ったとします。 この表を選択して、Excelにコピペしてみましょう。 コピーして、Excelに貼り付けます。 おや?うまくいかないですね。 1つのセルの中に、全部のデータが羅列されてしまっています。 実はPythonを使ってこのPDF中の表を比較的簡単にcsvExcelに変換することができます。 PythonPDFの表をcsvPythonPDF内の表(テーブル)をcsvexcelに変換する手順は2ステップです。 ステップ1. PDFから表をpandasのData

    【自動化】PDF内の表をPythonで抜き出す - Qiita
  • 1