[B! PDF] s_ryuukiのブックマーク

FigmaとPHPで作る1ミリたりとも表示崩れしない最強の帳票印刷ソリューション

PHPカンファレンス小田原2024 の発表資料です。 https://phpcon-odawara.connpass.com/event/296492/ https://fortee.jp/phpconodawara-2024/proposal/7c57d5ca-213a-4d7a-aaf0-26ddc44897f0

s_ryuuki 2024/04/14

PDF
PHP

リンク

Google、PDF論文を劇的に読みやすくするChrome拡張「Google Scholar PDF Reader」

Google、PDF論文を劇的に読みやすくするChrome拡張「Google Scholar PDF Reader」米Googleが「Google Scholar PDF Reader」というPDF形式の論文を読みやすくするChromeブラウザ拡張機能の提供を開始した。プラットフォームやOSに依存せず、クリーンで、文章の構造が一貫しているPDFは、学術文書の標準的なフォーマットとして広く利用されている。しかし、一方で、引用されている他の文献にジャンプするのが難しかったり、あるいは特定のセクションを閲覧したくても、PDFの構造上、簡単に移動できないなど、閲覧性に関して不便と感じる面もある。Googleは「Google Scholar」という学術論文の検索エンジンを提供している。シンプルで分かりやすい画面構成で、良質な学術文書を効率的に見つけられるサービスである。Scholar PDF R

s_ryuuki 2024/03/22

リンク

Table TransformerとGPT-4Vを用いたPDF内の表の解析｜QunaSys

RAGは非常に有用なツールですが、PDFの論文などを扱う際には、表データを正しく読み取れない場合があります。表の構造を適切に処理することは難しく、いくつかの改善策が提案されています。例えば、RAGを構築するのに使われるライブラリであるLlamaIndexのドキュメントに以下のような情報があります。このドキュメントでは表を含むデータを扱う方法として、PDFを一旦すべて画像データに変換し、画像として表の形式を保持したままGPT-4Vでデータを解析することを提案しています。ただ、PDF1ページ分の画像をそのままGPT-4Vに解析させても精度はあまり良くないようで、後述するTable Transf ormerを使って表部分の画像のみ抽出してから解析を行うことで、より良い結果が得られたのことでした。本記事では、この方法を用いてPDF内の表の解析を試してみます。手順としては 1. PDFの全

s_ryuuki 2024/03/12

リンク

pdfからtextを抜き出す試行錯誤のメモ｜Kan Hatakeyama

これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。参考記事導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。解析コード： from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード： for structure in pdf_elements: print(structure) 結果：残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ

s_ryuuki 2024/02/24

PDF

リンク

iOSのPDFKitを利用してPDFを編集する

こんにちは！アルダグラムでエンジニアをしているbingyiです直近KANNAで開発した機能ではPDF編集を実装しました、今回の記事はiOSで実際のPDFファイルに線をどう書き込みを紹介します。まずはPDFKitを簡単に紹介します、PDFKitはiOSとmacOS用のフレームワークで、PDFドキュメントの表示、編集、アノテーションが可能です。主要なクラスには、PDFの内容を表すPDFDocument、PDFページを表すPDFPage、そしてPDFの表示に使われるPDFViewがあります。このフレームワークを使用することで、アプリ内でPDFの操作が容易になります。 PDFKit関連APIがまだUIKitが主に使われてるので今回PDF編集の実装もUIKitを利用します、この記事のため参考用のリポジトリも用意しました、興味がある方自分で試しても良いです PDFの表示 PDFを編集する前にまずP

s_ryuuki 2023/11/16

iOS
PDF

リンク

Markdownで技術同人誌のPDFが生成できるOSSを公開しました - Qiita

こんにちは、以前 FlightBooksというサービスを立ち上げていたのですが、2年ほどメンテしていなかったため、ローカル動作するOSS版として公開することにしました。 OSS版を作るにあたり、エディタ部分はVSCodeなりお好きなエディタを使ってもらうとして、 MarkdownからHTMLを生成する部分 HTMLからPDFを生成する部分を切り出して公開しました。ほかのサービスや技術と何が違うの？技術書をマークアップテキストで書くプラットフォームとしては、Re:VIEW、Vivliostyleなどがありますが、FlightBooksは「出版やDTPに関する知識がなくても印刷所にだしたい」というエンジニア諸氏のために開発されました。「商業印刷」にどこまで向き合うかご家庭のプリンタに印刷を指示すると、ファイルの情報がプリンタドライバに送信され、そこでインクの出し方を制御するためのデー

s_ryuuki 2023/11/06

リンク

MalDoc in PDF - 検知回避を狙って悪性なWordファイルをPDFファイルへ埋め込む手法 - - JPCERT/CC Eyes

JPCERT/CCは、7月に発生した攻撃に、検知回避を狙って悪性なWordファイルをPDFファイルへ埋め込む新しいテクニック（以降本記事ではMalDoc in PDFとする）が使用されたことを確認しました。今回は、使用されたMalDoc in PDFの詳細とその対策について解説します。 MalDoc in PDFの概要 MalDoc in PDFで作成されたファイルはPDFのマジックナンバーやファイル構造を持つにもかかわらず、Wordで開くことが可能なファイルとなります。このファイルをWordで開くことで、ファイルにMacroが設定されていた場合、VBSが動作し、悪性の挙動を行います。なお、JPCERT/CCが確認した攻撃では、ファイルの拡張子は.docとして使用されていたため、Windowsの設定で.docの拡張子にWordが関連付けされている場合、MalDoc in PDFで作成され

s_ryuuki 2023/08/22

リンク

ChatGPT Code Interpreterできること - Qiita

created by en-japan Yue.Pu Code Interpreter（コードインタープリター）とは、ChatGPTが提供する公式プラグインの一つで、このプラグインを利用することで、ChatGPT上でPythonを使ったコードの実行や、ファイルのアップロード・ダウンロードができるようになりますまず使い方現時点では課金アカウントしか使えません。 ChatGPTにログインし、左下の3点→「Settings」をクリックします。「Beta features」をクリックし、「Code interpreter」の右にあるトグルボタンをクリックします。 TOP画面に戻り、[New chat]をクリックし、「GPT-4」をクリックし「Code Interpreter」をクリックします。 ChatGPTのアイコンが紫色になっていれば設定完了です。入力画面の左端にある「＋」マークを押す

s_ryuuki 2023/07/26

リンク

macOS のデフォルト状態でコマンドラインからOCR処理を行う - TeX Alchemist Online

macOS 12 Monterey では，OSビルトインでのOCR機能が搭載されました。Preview.app で，画像やスキャンPDF（中身がスキャン画像のPDF）に対して，ただマウスでドラッグするだけで，中身の文字を認識して選択し，コピーできるようになっています。さらに，macOS 13 Ventura では，それが日本語にも対応しました。たとえば，（今や入手困難となってしまった）The TeXbook のアスキーによる日本語版をスキャンしたものを Preview.app で開くと，何もしなくても，文字選択できます。これをコピーして他のエディタにペーストすると， TEXの名称で気をつけなければならないことがほかにもある。Eの文字が不揃いになっていることだ。Eの文字を少し下げてあるのは、TeXが組版のためのシステムであることを印象づけるためであり、またほかのシステムの名称と区別するた

s_ryuuki 2023/06/29

Mac
PDF

リンク

電子帳簿保存法対応への第一歩はPDFから！書類の長期保存を見据えたファイル形式「PDF/A」とは何か[Sponsored]

s_ryuuki 2023/06/27

リンク

【その黒塗り意味ないですよ！】PDFの情報を完ぺきに隠すなら「墨消し機能」を使おう【柳谷智宣の「実は色々できるPDFの活用法」】

s_ryuuki 2023/06/27

PDF

リンク

JavaやC#のアプリケーションで、PDFの入出力や電子署名などを実現するオープンソースライブラリ「iText by Apryse」［PR］

JavaやC#のアプリケーションで、PDFの入出力や電子署名などを実現するオープンソースライブラリ「iText by Apryse」［PR］ここ数年でのリモートワークの普及は、多くの職場で紙の帳票を減らし、電子的な情報のやり取りを増やすことにつながりました。例えば社内文書の配布が紙から電子メールやグループウェアなどによる配信に変わり、取引先に郵送していた見積書や請求書もPDF文書を電子メールで送付するようになり、印鑑の押印が求められていた契約書もPDFの電子署名になる、などの変化が起きています。 PDF文書が活用される場面が増えてくれば、当然ながら業務システムにおいてもPDF文書の出力機能が求められるようになるでしょう。出力だけでなく、PDF文書の業務システムへの読み込み、電子署名の対応、複数のPDF文書の取り扱いなど、さらに柔軟な操作への要望が高まってくることも予想されます。こう

s_ryuuki 2023/06/27

PDF

リンク

新興組版システム typst のススメ

はじめに Typst とは、新しい組版ソフトウェアです。数式を多用する科学技術系の記事を書くのに向いています。ローカル環境で PDF にコンパイルすることもできますし、 Overleaf のようなオンラインの執筆環境も提供されています。この分野では LaTeX が歴史的にも非常に強く、なかなか代替のソフトウェアが出現しなかったのですが、ようやく注目にも値する品質のものが登場してきたという感じです。そもそも組版システムとはそもそも Qiita や Zenn でも数式を埋め込むことができるこの時代、ドキュメントを書くための専用の言語を使う理由は何でしょうか。 LaTeX はオワコンではないのでしょうか。組版システムというのは簡単には無くなりません。これは、ブログや Wiki などの Web の記事とは性質が異なるからです。組版システムは紙に印刷することを最終的な目的にしたシステムで

s_ryuuki 2023/06/04

PDF
Rust

リンク

C#/VB.NET：PDF にテキスト透かしを追加する - Qiita

透かしは、一般的に文書の著作権情報、作者、所属団体、または文書属性などを表示するために使用されます。テキスト注釈などとは異なり、テキスト透かしはページに描画される要素であるため、簡単に削除することができません。そのため、透かしは偽造防止にも非常に有効です。また、透かしにはテキスト透かしと画像透かしがあります。この記事では、Free Spire.PDF for .NET（無料版）を使用してPDFにテキスト透かしを追加する具体的な方法とサンプルコードを共有します。 Free Spire.PDF for .NETをインストールする方法1：NuGetでFree Spire.PDF for .NETをインストールする Visual Studioを開いて新しいプロジェクトを作成します。次に、「Solution Explorer」で「References」を右クリックし、「Nuget Manage P

s_ryuuki 2023/05/14

C#
PDF

リンク

話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握する - Qiita

話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDF OpenAI ChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに本記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する分割したテキストからテキスト間の関連を表すベクターデータを作成する作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与

s_ryuuki 2023/04/23

リンク

Readable

DeepL Pro をお使いの方は ~20 ページを目安に利用してください。 DeepL Free をお使いの方は 1 ページずつ利用してください。

s_ryuuki 2023/04/22

PDF
翻訳

リンク

C#でiText7を使ってPDFファイルのページ分割・結合をする - Qiita

C#でiText7を使う C#でiText7を使ってPDFファイルのページ分割と結合をやってみました。巷ではiTextSharpの情報は見かけるのですが、JavaではなくC#のiText7の記事が少ないと思い書いてみました。 iText7はiTextSharpの後継版で、.NET6と組み合わせればMacでも使えます。嬉しいなあ、クロスプラットフォーム動作確認は、 macOS Ventura 13.2 .NET6 Visual Studio for Mac 17.5 Preview iText7 7.2.5 で行いました。ページの分割以下、ちょっと難のあるサンプルですが、使い方の理解を目的に書いてみました。まず、9ページのパスワード無しのPDFファイルを用意します。それを適当なディレクトリに置いてください。ここではホームーディレクトリに置くことにしました。 Macで試したのでファ

s_ryuuki 2023/04/10

C#
PDF

リンク

gpt-indexで日本語PDFを読み込む【Python】 - Qiita

概要 gpt-index（llama-index）で、日本語PDFを安定して読めるようにするためのプルリクがマージされたので、使い方を紹介します。使い方 download_loaderでCJKPDFReaderをダウンロードして使います。 from gpt_index import download_loader CJKPDFReader = download_loader("CJKPDFReader") loader = CJKPDFReader() documents = loader.load_data(file='data/article.pdf') print(documents)

s_ryuuki 2023/02/19

リンク

Free PDF Reader - Sumatra PDF

SumatraPDF is one of those amazing open source programs that does everything a closed-source and/or commercial product does, but better in every way. "PDF readers have, over the years, managed to earn themselves something of a reputation for being slow, lumbering beasts – thanks largely to Adobe Reader. Sumatra PDF bucks the trend. It is small, svelte, lightweight and lightning fast."

s_ryuuki 2022/10/20

PDF

リンク

AndroidでWebView画面をPDF保存する

はじめにはじめまして、2022年4月よりスペースマーケットでアプリエンジニアを担当していますseoと申します。弊社では「スペースシェアをあたりまえに」をMISSIONに、スペースシェアのプラットフォーム事業を運営しております。その中で、法人のお客様のご利用も多く、利用前の見積書や利用後の領収書発行のニーズもたくさんございます。今回は、見積書や領収書などWebView画面をPDFファイルとして、ローカルストレージへ保存する機能を実装しましたので、実装の中身(Android編)をご紹介できたらと思います！最新版アプリにてご利用できますので、ぜひこちらのリンクよりダウンロードして、たくさんの素敵なスペースを利用してみてください✨ ゴール予約一覧画面から「領収書を表示する」ボタンを押すと、 WebViewの領収書が表示され、メニューから「PDFをダウンロード」を選択すると、保存する

s_ryuuki 2022/10/08

Android
PDF

リンク

はてなブックマーク

タグ

関連タグで絞り込む (57)

PDFに関するs_ryuukiのブックマーク (73)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

今週のはてなブックマーク数ランキング（2024年5月第1週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス