記事へのコメント11

    • 注目コメント
    • 新着コメント
    bomp
    bomp Illustratorがあれば簡単な場合と、Illustratorがあってもダメな場合がある。

    2020/03/06 リンク

    その他
    houyhnhm
    houyhnhm ホントにこれ辛い。

    2020/03/05 リンク

    その他
    warp9
    warp9 "2020年03月05日"の記事を"2021-04-09"に読んだ。 テキストの順番が変になる事もある。

    2020/03/05 リンク

    その他
    mojimojikun
    mojimojikun せやな。とはいえ、PDFDocument class https://developer.apple.com/documentation/pdfkit/pdfdocument の page.string で取り出した文字列で必要十分な場合も多いのでそれでやっちゃってる(それでユーザから文句が来たことも無い)

    2020/03/05 リンク

    その他
    yarumato
    yarumato “PDFファイルのテキスト化およびデータベース作成を行う団体FilingDBの報告。読み取り保護、ページ外の文字、余分なスペース、埋め込みフォント、テキストと段落の順序。ほとんどはOCRで解決するが欠点も”

    2020/03/05 リンク

    その他
    shimasoba
    shimasoba ふくろ文字もやっかいだよなー。

    2020/03/05 リンク

    その他
    strawberryhunter
    strawberryhunter 余分なスペースが入るのは、Wordなど元のアプリケーションを使う人の問題。代替手段はあっても、国際標準となったPDFとそのエコシステムに勝る形式はもう出てこない。コンビニのコピー機が対応してるとか最高じゃん。

    2020/03/05 リンク

    その他
    Fushihara
    Fushihara 総合的にOCRの方が早いんじゃ

    2020/03/05 リンク

    その他
    mouki0911
    mouki0911 そろそろPDFの代替手段が欲しい

    2020/03/05 リンク

    その他
    nisisinjuku
    nisisinjuku 仕様決めなかったのはミスだよね。転載不可の保護は良い。 "FilingDBは、PDFファイルからテキストを抽出する前に、他のフォーマットでデータが提供されていないかどうかを確認することを推奨しています。" おぃおぃ。

    2020/03/05 リンク

    その他
    timetrain
    timetrain 余分なスペースと改行はなあ。これのために一括置換を何回かすること多数

    2020/03/05 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    PDFからテキストを抽出するのはなぜ難しいのか?

    PDFファイルは、どんな環境のPCでもテキストや画像の表示を崩すことなく見られるデータ形式です。しかし...

    ブックマークしたユーザー

    • techtech05212024/03/25 techtech0521
    • hiroshe2022/04/22 hiroshe
    • koma_g2020/08/14 koma_g
    • yyoshia2020/06/22 yyoshia
    • John_Kawanishi2020/03/23 John_Kawanishi
    • daitom2020/03/08 daitom
    • taron2020/03/08 taron
    • kamiaki2020/03/06 kamiaki
    • wackunnpapa2020/03/06 wackunnpapa
    • otani00832020/03/06 otani0083
    • kuroyagi_h2020/03/06 kuroyagi_h
    • bomp2020/03/06 bomp
    • hidelocal2020/03/05 hidelocal
    • wfunakoshi2352020/03/05 wfunakoshi235
    • tachibanana382020/03/05 tachibanana38
    • advblog2020/03/05 advblog
    • flying-cat2020/03/05 flying-cat
    • houyhnhm2020/03/05 houyhnhm
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事