AKIMOTOのブックマーク - はてなブックマーク

AKIMOTO id:AKIMOTO

ブックマーク / develman.net (1)

Javaを使ってPDFからテキストを抽出する（Apache PDFBox 編） - デベルマン
最新の情報を利用する場合は、キャッシュレス・消費者還元事業（https://cashless.go.jp/）のページより入手してください。処理実装今回読み取りに使用するPDFは、以下のように店舗が一覧化されています。この一覧から、「No.」「都道府県」「市区町村」「事業所名（屋号）」「業種」「業種（サブカテゴリ）」「還元率」の7種類の情報を個別の文字列として取得しましょう。ちなみにいろいろひっかかるこの一覧。「伊達の牛タン本舗」の各店でスペース有り無しが混在しているのが細かいけどすごく気になるし、No.10001にはおそらく間違いが２つ存在してます。まず気になる文字化けはハイフン。その上で「だし廊」と「だし廊 -NIBO-」は別店舗。この一覧の作者は詰めが甘いように思う。。こんにちは！だし廊本店です！遅くなり申し訳ございません！今週の限定の献立表が出来ました！今週もだし廊でお待
AKIMOTO 2019/09/13
PDF

テキスト

テキスト抽出
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx