テレワークが主流でいろいろな書類をオンラインで発行することが多くなっている。印刷も可能な電子的な書類と言えばPDFだ。ここでは、HTMLファイルからPDFを作成するツール「wkhtmltopdf」を使って、手軽にPDFで納品書を作成してみよう。 名前と値段を入力するとひな形を元にPDFを生成する HTMLからPDFを作成する「wkhtmltopdf」を使ってみよう 納品書などの書類を作るにはExcelなどのツールを使うのが一般的だ。ExcelにもPDFファイルも出力する機能が標準でついている。しかし、簡単なツールを利用してPDFを出力できればもっと便利です。プログラムを作って処理の自動化ができる。 しかも、HTMLやCSSなどWebの技術を使ってPDFが出力できるなら、とても都合が良いと言える。というのも、そもそもHTMLはテキストをHTMLタグでタグ付けしただけのテキストファイルだ。つま
概要 Google翻訳APIをPythonで実行するでは、四苦八苦しながらも、Google翻訳APIにより、テキストファイルに書かれた英文を日本語に翻訳するPythonスクリプトを書いた。 元々の動機は論文の翻訳する際に、ちまちまGoogle翻訳にコピペするのが面倒くさいということであった。 そこで今回は、Pythonスクリプトを拡張し、PDFの論文を一気に翻訳するようにしたので共有したい。 そもそもなんで日本語に翻訳して論文を読むの? もちろん、細かい内容は原文を精読する必要がある。そりゃそうだ。 日本語で読む理由はなんといっても、論文の内容を俯瞰的に把握できるということに尽きる。 俯瞰的に把握できることで、以下のメリットがある。 俯瞰的に把握した上で原文を読むことになるため、より早く理解することができる。 俯瞰的に把握できるため、原文を読む前に、自分にとって読む必要がある論文かどうかか
PDFは扱いにくい PDFファイルをPythonで扱うのは大変です。 表がPDFの中に埋め込まれているケースも割とあります。 例えば 平成30年 全衛連ストレスチェックサービス実施結果報告書の中にはたくさんの表データが埋め込まれています。 例えばファイルの40ページの【表14 業種別高ストレス者の割合】を抜き出したいと思ったとします。 この表を選択して、Excelにコピペしてみましょう。 コピーして、Excelに貼り付けます。 おや?うまくいかないですね。 1つのセルの中に、全部のデータが羅列されてしまっています。 実はPythonを使ってこのPDF中の表を比較的簡単にcsvやExcelに変換することができます。 PythonでPDFの表をcsvに PythonでPDF内の表(テーブル)をcsvやexcelに変換する手順は2ステップです。 ステップ1. PDFから表をpandasのData
Markdown to PDF Markdownで書きたいけど、PDFで出力したい という機会はエンジニアはよく出くわすと思います。 「Markdown to PDF」といえばGitBook CLIが有名ですが、こちらはメンテナンスがストップされているため推奨されません(環境依存による不具合などが解決されない)。 GitBookほど多機能でなくても良いですが、綺麗にいい感じに出力したい…!と探し回っていたところ md-to-pdf が最も私の要件に合致したので使ってみました。 そんな私の要件はこちら。 CLIから出力したい ページ内リンクが作れる ページ分割ができる ページ数表示が簡単にできる 全体に対して簡単にテーマをCSSで適用できる いざという時にはHTML+CSSでカスタマイズができる それに対して md-to-pdf は以下のような機能があります。 ディレクトリ内のMarkdow
GitHub - bpampuch/pdfmake: Client/server side PDF printing in pure JavaScript PureJSでPDFの生成ができるライブラリ「pdfmake」 JSの変数でPDFドキュメントの内容を設定してPDF出力できる模様 関連エントリ 様々なグラフを描画できるJavaScriptライブラリ「NVD3.js」 データのビジュアリゼーションに使えるJSライブラリ「d3.js」
ドイツにあるルール大学ボーフム校とヴェストファーレン・ヴィルヘルム大学のセキュリティ研究者らが「暗号化されたPDFの内容を、パスワードなしで盗み出すことができる攻撃手法を発見した」と発表しました。「PDFex」と名付けられたこの攻撃手法はPDFの仕組みそのものを悪用しているため、Adobe Acrobat Reader DCやPDF-XChange Viewerといった特定のPDFビューワーソフトだけでなく、ChromeやFirefoxなどのブラウザで閲覧した場合でもPDFの暗号化を突破されてしまうとのことです。 PDF Insecurity Website https://pdf-insecurity.org/encryption/encryption.html Researchers Find New Hack to Read Content Of Password Protected
Windowsユーザーだった女子編集者が、実際にMacを使うなかで出合ったトラブルを解決する本連載。Macの「プレビュー」のPDF書き込みや分割・結合はとても便利。何らかのソフトが必要だったWindowsユーザーからすると、これだけでもちょっと興奮するレベルです。ですが、ページ数が多いと大変。OS Xに標準搭載の「Automator」ならワンボタンでPDFのマージができます。 私がこのように大量のPDFをくっつけたいのは、自宅でScanSnap iX500を愛用しているから。自動紙送(ADF)付きなので、A4サイズまでの紙ならどんどん吸い込んで高速読み取りしてくれるのですが、仕事柄雑誌の校正紙(ゲラ)などを読み取りたいことが多いです。これが基本B4サイズなんですよね。そうすると、クリアファイル状の「A3キャリアシート」に挟むことでスキャンできるわけですが、1枚ずつ取るのでファイルがバラバラ
PDF形式のファイルを連結したいけど、専用アプリを持っていない! ビジネスあるあるですよね。専用アプリを持っている人に頼むのも気が引けるので諦めているという人は、WebブラウザーのChromeで解決しましょう。 複数ファイルの連結や見開き化が可能 ExcelやPowerPointで作成したファイルをほかの人と共有するとき、PDF形式に変換することがよくありますよね。 PDFは異なるパソコンやスマートフォンでも表示が崩れないうえ、改ざんしにくく、ファイルサイズも小さいと、いいことずくめです。相手から受け取る資料にも、PDF形式のファイルが数多くあると思います。 ただ、同一の資料の前半部分と後半部分などで分割されていたりする場合、1つにまとめたくなりますが、PDF閲覧用の無料アプリ「Acrobat Reader DC」では、PDFファイルを連結できません。 サードパーティの専用アプリも知らない
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く