タグ

pdfに関するendo_5501のブックマーク (7)

  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
    endo_5501
    endo_5501 2020/08/14
    “PDFファイルには、「どのフォントのどの文字を画面のどこに配置すればいいか」という情報が含まれています”
  • 「Markdown+CSS/TeXで冊子本を作ってみた」に参加してみた - 自己顕示欲の開放治療所

    Markdown+CSS/TeXで冊子を作ってみた」に参加してみた connpass.com 2019/11/16 訂正 訂正いただきました箇所、打ち消し線と + 記号で大体わかるように、なっているといいな、しました。 開始前 記事中のAmazonのリンクはアフィリエイトにしていますので嫌悪感を抱かれる方は気をつけてください。 アンテナハウス株式会社*1様主催のセミナーに参加してきました。以前『PDFインフラストラクチャ構造解説』のPOD(Print On Demand)を買ったときに存在を知り、ウェブサイトの「XMLに命をかけてくれ」というエピソード紹介が印象に残っていました。大規模、構造的ドキュメント用のソフトウェアに強みのある会社という理解です。 PDFインフラストラクチャ解説: 電子の紙PDFとその周辺技術を語り尽す 作者: 小林徳滋出版社/メーカー: アンテナハウスCAS電

    「Markdown+CSS/TeXで冊子本を作ってみた」に参加してみた - 自己顕示欲の開放治療所
  • pdf.jsなPDFビューアアプリをElectronで作った

    タイトルどおりですが、FirefoxのPDFビューアをスタンドアローン化したようなアプリを作りました。 azu/mu-pdf-viewer: PDF viewer on electron. 特徴は次の通りです。 PDF.jsベース J, Kでスクロールなどいじっています Drag and Dropをサポートしてます Install npm でインストールするか バイナリをダウンロードして使えます(OS Xのみ) https://github.com/azu/mu-pdf-viewer/releases/latest Travis CIとかでelectronを自動ビルドするのがかなり難しくなったので、自分用にOS X版のみバイナリを作ってます。 READMEにその他の環境のバイナリの作り方を書いてあります。 Usage npmでインストールした場合はCLIから起動できます。

    pdf.jsなPDFビューアアプリをElectronで作った
  • pdf.jsをつかってPDFの内容をcanvasにレンダリングする - みかづきブログ その3

    github.com すごいライブラリですね。さすがMozilla。 つかいかた 1. ライブラリをダウンロードして解凍 https://mozilla.github.io/pdf.js/getting_started/#download からライブラリをダウンロード 2. ソースを編集 viewer.htmlにアクセスした際、デフォルトではcompressed.tracemonkey-pldi-09.pdfを開くようになっているのですが、 web/viewr.js の28行目を編集することでデフォルトで開くPDFを変更できます。 3. サーバにアップ buildフォルダもwebフォルダもまとめてアップしましょう。 4. viewer.htmlにアクセス http://kimizuka.github.io/pdfjs/web/viewer.html PDFの内容がレンダリングされています。

    pdf.jsをつかってPDFの内容をcanvasにレンダリングする - みかづきブログ その3
  • OCRにより透明テキストつきPDFを作成可能になった「かんたん PDF ダイエット」

  • スキャンした書籍画像をPDFに·Scan Tailor MOONGIFT

    Scan TailorはWindows/Linux向けのオープンソース・ソフトウェア。最近書籍をスキャンしてデジタルデータ化するという話を良く聞く。確かに書籍のまま保存しておいても経年劣化したり、場所をとったりして不都合なこともあるだろう。デジタルデータ化してしまえば劣化することもなく、いつでも読めるのが便利だ。 半分に分割 そんな書籍をスキャンする専用のハードウェアもあるが、そんなのはもったいないと感じる人は全ページを写真で撮った後、Scan Tailorを使ってPDFにするのはどうだろう。Scan Tailorはまさにそのためのソフトウェアになる。 はじめに画像が入ったフォルダを指定して取り込む所から始まる。写真の取り込み位置を決めたり、ページを半分で分割すると言った操作もできる。自動で分割位置を定めてくれる機能が便利で、見開きのように半々で分けたり、バインダーを考慮してその部分だけを

    スキャンした書籍画像をPDFに·Scan Tailor MOONGIFT
  • 『Foxit Reader』が更新されました! Firefoxからのインライン閲覧に対応 | ライフハッカー・ジャパン

    Windowsのみ : 『Foxit Reader』、AdobeのAcrobat Readerの代用品として我々の前に登場したPDFビューアーがバージョン3.0に更新されました! 追加された機能の中でもFirefoxユーザにとって一際重要なのはPDF文書を『Foxit Reader』のFirefoxプラグインとして使用することが出来るようになり、インライン閲覧が可能になったということ。つまり従来ではPDFへのリンクは別途アプリを立ち上げなくてはならなかったのですがFirefoxのタブ内から簡単にPDFが見れるようになったわけです(Acrobat Readerでは対応していた機能ですが、『Foxit』では今回から対応)。 それ以外にも下記のような新機能が! ■ マルチメディアデザイン対応 ユーザーはマルチメディアを『Foxit Reader』で再生するだけでなく、マルチメディアファイルの追加

    『Foxit Reader』が更新されました! Firefoxからのインライン閲覧に対応 | ライフハッカー・ジャパン
  • 1