タグ

pdfに関するNaruhodiusのブックマーク (12)

  • Ruby/RailsでPDF作成Gemのまとめ - Rails Webook

    Rubyもしくは、RailsPDFを作成するGemとしてThe Ruby Toolbox - PDF Generationで確認すると、有名どころとしては、 Prawn(プローン) PDFKit (+ wkhtmltopdf) Wicked PDF (+ wkhtmltopdf) ThinReports(Ruty Toolboxにないけど) です。 まとめ それぞれRails上で使ってみて、比較してみました。 Gem名特徴所感 Prawn(プローン) コードのみでPDFを作成する。 二重線などは少し作り込みが必要。コードでガリガリPDFを作成するので自由度は高いが時間がかかる。 PDFKit (+ wkhtmltopdf) HTMLPDFに変換する。HTMLからPDFへの変換はwkhtmltopdfが行い、PDFKitはwkhtmltopdfのラッパー。 wkhtmltopdfがバグな

    Ruby/RailsでPDF作成Gemのまとめ - Rails Webook
  • さぼてん: 【PHP】PDFからテキストを抜き出すメモ【Python】

    何でもPDFで送ってくる人は止めて欲しいです。 Office系のファイルで送るのも控えて欲しいものです。テキストがコピーできるだけ後者の方がほんの少しだけマシでしょうか。 Xpdfに含まれるpdftotextというものを使う方法。 pdftotext:pdfファイルから文字抽出 - 個人的Linux PDFMinerというPythonライブラリもあります。純Pythonで書かれた PDFパーザとインタプリタ。PDFの解析とテキスト抽出に。 ほぼ PDF-1.7準拠。日縦書きと暗号化に対応。 「PDFMiner」を使ってテキストを抽出 - BoxHeadRoom PythonにはpyPdfというライブラリもあります。 Pure Python PDF to text converter - ActiveState Code 追記:2010/05/09 PHPではライブラリ見つけられませ

  • PDFからテキストを抽出する : mwSoft blog

    PDFの情報をテキストファイルで落としたかったので、URLを指定してテキストに変換するような簡単なスクリプトを書く。 すっかりご無沙汰でどうやって書くか忘れてしまったPythonさんを利用。そうか、xrangeはもうなかったか。 テキストの抽出にはxpdfを利用。以下、Ubuntuの場合。 # インストール $ sudo apt-get install xpdf # 文字コードを編集 $ sudo vi /etc/xpdf/xpdfrc # textEncoding UTF-8という行があるので、コメントアウトを外す 導入完了。pdftotextコマンドでPDFをテキストファイルに変換できる。1つ目の引数が対象のPDFファイル名、2つ目の引数が出力ファイル名。 $ pdftotext foo.pdf bar.txt 変換しただけだとPDF内で行替えをしているタイミングで改行コードが入ってし

  • PDFs made simple

    PDFs made simple We create solutions to generate rich, attractive and fully bespoke PDFs at incredible speeds. How it works Get in touch We have helped everybody from world-class universities to innovative financial services companies.

  • QA: Windows用のお薦めPDFビューア? | TeX

    Windows上でPDFによるプレビューが流行らない理由は,Adobe Readerの重さにあるのだろうと思います。 軽くて,ファイルを排他ロックせず,PDFファイルが更新されたら自動的に読み直して同じページを表示するようなWindowsPDFビューアはないでしょうか。 Mac上では,Mac OS X 10.5標準のPreviewや,TeXShopのPDFビューアのほか,Skimが便利そうです。

  • PDFの仕様書を読む 第20回 3.4.1 File Header | log log log

    PDFファイルの最初の行はヘッダで、準拠しているPDFの仕様のバージョンを記載している。PDF1.7に準拠している場合のヘッダは次のようになる。 %PDF-1.7 しかし、古いバージョンもPDF1.7を満たしているので、PDF1.7は以下のようなヘッダは全て受け付ける。 %PDF−1. 0 %PDF−1. 1 %PDF−1. 2 %PDF−1. 3 %PDF−1. 4 %PDF−1. 5 %PDF−1. 6 PDF1.4からはドキュメントのカタログディクショナリのVersionエントリでこのバージョン情報をオーバーライドできる(カタログディクショナリの位置はトレイラー中のRootエントリで与えられる)。オーバーライドによってPDFを生成するアプリケーションではバージョンの漸増的な更新が可能になる(詳細は3.4.5 Incremental Updates、ファイルの末尾に内容を追加していくと

    PDFの仕様書を読む 第20回 3.4.1 File Header | log log log
  • Kindle3向けdot by dotな自炊PDFを(真面目に)作成する - ただのにっき(2011-01-07)

    Kindle3向けdot by dotな自炊PDFを(真面目に)作成する ePUB 3.0が、縦書きやルビをサポートしてそろそろ仕様確定するそうで、それはそれでめでたいんだけど、各種デバイスがいつサポートするのかもわからんし、出版サイドにノウハウがつくのにも時間がいるだろうし、普及にはしばらくかかるだろう。 いっぽう、大長編「まおゆう」を自作したPDFで読んだり、最近高橋さんが作っているSONY Reader向けの青空文庫PDFKindleに入れてみた経験からすると、電子書籍は必ずしもリフローできるフォーマットである必要はないんじゃないかとも思い始めている。世に出回っている電子書籍端末は、3~4インチ(スマートフォン)、5~6インチ(KindleやSONY Reader)、10インチ前後(いわゆるタブレット)の3種類。だったらこれらに合わせて最低3種類のPDFを選択可能にしてくれれば

  • 【EPUB 変換】:簡単にPDFをEPUBに変換する方法はこれ!

    Q:EPUBとは何でしょうか。 A:EPUB(イーパブ)は、電子書籍の規格の1つであり、米国の電子書籍の標準化団体の1つであるInternational Digital PublishingForum(IDPF、 国際電子出版フォーラム)が普及促進している公開された仕様の電子書籍用ファイル・フォーマット規格です。 「EPUB」は"Electronic PUBlication"の意味を持ち「epub」「ePub」などと表記される場合もあります。EPUBは、HTMLやWebブラウザソフトのオープン性を保持しつつ、インターネット接続が切断された状態の携帯情報端末 (PDA) やノートパソコンなどでも電子書籍の閲覧が継続できるようにダウンロード配信を前提にパッケージ化された、XHTMLのサブセット的なファイル・フォーマット規格であり、画面の大きさに合わせて表示を調整する「リフロー機能」が特徴です。

    【EPUB 変換】:簡単にPDFをEPUBに変換する方法はこれ!
  • Ubuntu Linux(64bit)のAdobeReaderで日本語表示 - _development,

    Ubuntu Linux(64bit)で、日語のPDFを開くと「フォントパックをインストールせよ」的なダイアログメッセージが出て、フォントが下駄を履いてしまうことがある。 メッセージにランゲージパックのDLサイトらしきURLも表示されているのだが、訪ねてみるとリダイレクトされてDLサイトのTOPに飛ばされて、結局どれをDLするのかよくわからない。 ubuntu studioに日語Remixをいれたりして環境つくった際に漏れがあったのかどうかしらないが、あーだこーだしてるうちにランゲージパックっぽい"acroread-fonts"がaptにあることを発見したので、それを入れたら表示できるようになった。 やっほう。 $ sudo apt-get install acroread-fonts ... パッケージリストを読み込んでいます... 完了 依存関係ツリーを作成しています 状態情報を読

    Ubuntu Linux(64bit)のAdobeReaderで日本語表示 - _development,
  • はてなブログ | 無料ブログを作成しよう

    週報 2024/04/28 川はただ流れている 4/20(土) 初期値依存性 さいきん土曜日は寝てばかり。平日で何か消耗しているらしい。やったことと言えば庭いじりと読書くらい。 ベランダの大改造をした。 サンドイッチ 一年前に引っ越してからこんな配置だったのだけど、さいきん鉢を増やしたら洗濯担当大臣の氏…

    はてなブログ | 無料ブログを作成しよう
  • 第8回 PDFファイルの操作方法

    今回は,仕事でよく使うPDFファイルの操作方法を学びます。Javaを利用して,家計簿をPDFファイルとして作成してみます。ついでにPDFファイルの読み込み方法も覚えることにしましょう。PDFファイルの扱い方を習得すれば,仕事の大きな手助けになるはずです。 皆さんこんにちは,kikainekoです。この連載では,日々の定型的な業務をJavaで自動化してラクする方法を紹介しています。今回は,皆さんが仕事やプライベートでよく使っているPDFファイルをJavaから操作してみましょう! 便利なことに,JavaPDFファイルを操作するためのオープンソースのツールが,いくつか提供されています。今回は,その中でも日語の情報が比較的充実している「iText」というライブラリを使うことにします。iTextを使うと,JavaからPDFファイルを生成することができます(インストール方法は,以下のカコミ記事を参

    第8回 PDFファイルの操作方法
  • iTextを利用してJavaからPDF形式の帳票を出力する

    はじめに 現在のWebシステムにおいて帳票の出力を行う場合、PDF形式が選択されることが一般的になっています。その理由としては、データサイズをコンパクトにすることができる、情報の改ざんを防止できる、などが挙げられます。一般ユーザにも普及していますので、システム開発時に顧客からPDF形式での情報の出力を求められることも多いのではないでしょうか。 この記事では、「iText」というライブラリを活用して、PDFの出力を行う方法を解説します。 対象読者 Javaプログラミングで開発を行った経験のある方、および、Javaプログラミングに興味をお持ちの方を対象としています。 必要な環境 このサンプルアプリケーションを動作させるには、以下のソフトウェアが最低限必要です。環境についての詳細や設定方法については、サーバサイド技術の学び舎 - WINGSにある「サーバサイド環境構築設定」を参照してください。

    iTextを利用してJavaからPDF形式の帳票を出力する
  • 1