タグ

PDFとスキャンに関するmorobitokozouのブックマーク (2)

  • PDFで文字が検索できないけど?何が問題?どうしたら良い? - アンテナハウス PDF資料室

    PDFで文字が検索できないけど?何が問題? どうしたら良い? 更新日: 2020年1月30日 このページの目的 PDFで文字を検索するには、文字コードがPDFから取得できる必要があります。 PDF内の文字コードと検索に使用する文字コードが一致して、はじめて文字が検索にヒットするからです。 PDFで文字が検索できないのは、スキャナーを使用して保存した画像でPDF内部に文字コードがない場合、フォント埋め込みしたPDFPDFから正しい文字コードが取得できない場合、フォントがアウトライン化されてしまっている場合、などが考えられます。 これらのPDFを文字検索可能にする一般的な方法は、OCR(光学文字認識)を使ってPDFに文字コードを追加することです。ここでは、PDFで文字が検索できない場合に考えられる原因とその対応について考えてみます。 PDFで文字が検索できない場合に考えられる原因 原因1:

    PDFで文字が検索できないけど?何が問題?どうしたら良い? - アンテナハウス PDF資料室
  • 自炊したPDF加工についてのメモ — KaoriYa

    スキャナで書籍を自炊すると、閉じ方向やページレイアウトに不満が残ります。 それを修正する方法を備忘録として紹介します。 TL;DR スキャナで書籍を自炊したPDFを加工するには、 今のところ以下の方法が良いとの結論に達しています。 PDFtk で栞(しおり)を挿入する Perl + PDF::API2 で右綴じ&見開きを設定する 背景 少し前に入手した ScanSnap iX500 でのスキャンにも慣れてきて、 幾つか漫画もスキャンしたのですが2つほど大きな不満がありました。 1つは栞が設定できないことで、 特定のエピーソードを読むのに先頭から順にページ送りするのは、 なんともダルい作業です。 もう1つは見開きのためのページレイアウト。 一般に漫画は右綴じなのですが、 iX500 に付属のソフトは左綴じしか出力できません。 作者渾身の見開きページがまったく再現できずに残念なことになってしま

  • 1