PHPカンファレンス小田原2024 の発表資料です。 https://phpcon-odawara.connpass.com/event/296492/ https://fortee.jp/phpconodawara-2024/proposal/7c57d5ca-213a-4d7a-aaf0-26ddc44897f0
Google、PDF論文を劇的に読みやすくするChrome拡張「Google Scholar PDF Reader」 米Googleが「Google Scholar PDF Reader」というPDF形式の論文を読みやすくするChromeブラウザ拡張機能の提供を開始した。 プラットフォームやOSに依存せず、クリーンで、文章の構造が一貫しているPDFは、学術文書の標準的なフォーマットとして広く利用されている。しかし、一方で、引用されている他の文献にジャンプするのが難しかったり、あるいは特定のセクションを閲覧したくても、PDFの構造上、簡単に移動できないなど、閲覧性に関して不便と感じる面もある。Googleは「Google Scholar」という学術論文の検索エンジンを提供している。シンプルで分かりやすい画面構成で、良質な学術文書を効率的に見つけられるサービスである。Scholar PDF R
RAGは非常に有用なツールですが、PDFの論文などを扱う際には、表データを正しく読み取れない場合があります。 表の構造を適切に処理することは難しく、いくつかの改善策が提案されています。 例えば、RAGを構築するのに使われるライブラリであるLlamaIndexのドキュメントに以下のような情報があります。 このドキュメントでは表を含むデータを扱う方法として、PDFを一旦すべて画像データに変換し、画像として表の形式を保持したままGPT-4Vでデータを解析することを提案しています。 ただ、PDF1ページ分の画像をそのままGPT-4Vに解析させても精度はあまり良くないようで、後述するTable Transformerを使って表部分の画像のみ抽出してから解析を行うことで、より良い結果が得られたのことでした。 本記事では、この方法を用いてPDF内の表の解析を試してみます。 手順としては 1. PDFの全
これは二段構えの構成を持っています。この二段構えを正確に検出し、テキストを理解することが望ましいです。 Unstructuredを使うPythonのライブラリであるUnstructuredを試してみましょう。 参考記事 導入は非常に簡単です。 pip install 'unstructured[pdf]' 実装も簡単です。 解析コード: from unstructured.partition.pdf import partition_pdf pdf_elements = partition_pdf("pdf/7_71_5.pdf") 表示コード: for structure in pdf_elements: print(structure) 結果: 残念ながら、2段組のカラムを正確に検出することはできませんでした。 Grobidを使うGrobidは、peS2oというオープンアクセス論文のコ
こんにちは!アルダグラムでエンジニアをしているbingyiです 直近KANNAで開発した機能ではPDF編集を実装しました、今回の記事はiOSで実際のPDFファイルに線をどう書き込みを紹介します。 まずはPDFKitを簡単に紹介します、PDFKitはiOSとmacOS用のフレームワークで、PDFドキュメントの表示、編集、アノテーションが可能です。主要なクラスには、PDFの内容を表すPDFDocument、PDFページを表すPDFPage、そしてPDFの表示に使われるPDFViewがあります。このフレームワークを使用することで、アプリ内でPDFの操作が容易になります。 PDFKit関連APIがまだUIKitが主に使われてるので今回PDF編集の実装もUIKitを利用します、この記事のため参考用のリポジトリも用意しました、興味がある方自分で試しても良いです PDFの表示 PDFを編集する前にまずP
こんにちは、以前 FlightBooksというサービスを立ち上げていたのですが、2年ほどメンテしていなかったため、ローカル動作するOSS版として公開することにしました。 OSS版を作るにあたり、エディタ部分はVSCodeなりお好きなエディタを使ってもらうとして、 MarkdownからHTMLを生成する部分 HTMLからPDFを生成する部分 を切り出して公開しました。 ほかのサービスや技術と何が違うの? 技術書をマークアップテキストで書くプラットフォームとしては、Re:VIEW、Vivliostyleなどがありますが、FlightBooksは「出版やDTPに関する知識がなくても印刷所にだしたい」というエンジニア諸氏のために開発されました。 「商業印刷」にどこまで向き合うか ご家庭のプリンタに印刷を指示すると、ファイルの情報がプリンタドライバに送信され、そこでインクの出し方を制御するためのデー
JPCERT/CCは、7月に発生した攻撃に、検知回避を狙って悪性なWordファイルをPDFファイルへ埋め込む新しいテクニック(以降本記事ではMalDoc in PDFとする)が使用されたことを確認しました。今回は、使用されたMalDoc in PDFの詳細とその対策について解説します。 MalDoc in PDFの概要 MalDoc in PDFで作成されたファイルはPDFのマジックナンバーやファイル構造を持つにもかかわらず、Wordで開くことが可能なファイルとなります。このファイルをWordで開くことで、ファイルにMacroが設定されていた場合、VBSが動作し、悪性の挙動を行います。 なお、JPCERT/CCが確認した攻撃では、ファイルの拡張子は.docとして使用されていたため、Windowsの設定で.docの拡張子にWordが関連付けされている場合、MalDoc in PDFで作成され
created by en-japan Yue.Pu Code Interpreter(コードインタープリター)とは、ChatGPTが提供する公式プラグインの一つで、このプラグインを利用することで、ChatGPT上でPythonを使ったコードの実行や、ファイルのアップロード・ダウンロードができるようになります まず使い方 現時点では課金アカウントしか使えません。 ChatGPTにログインし、左下の3点→「Settings」をクリックします。 「Beta features」をクリックし、「Code interpreter」の右にあるトグルボタンをクリックします。 TOP画面に戻り、[New chat]をクリックし、「GPT-4」をクリックし「Code Interpreter」をクリックします。 ChatGPTのアイコンが紫色になっていれば設定完了です。 入力画面の左端にある「+」マークを押す
macOS 12 Monterey では,OSビルトインでのOCR機能が搭載されました。Preview.app で,画像やスキャンPDF(中身がスキャン画像のPDF)に対して,ただマウスでドラッグするだけで,中身の文字を認識して選択し,コピーできるようになっています。さらに,macOS 13 Ventura では,それが日本語にも対応しました。 たとえば,(今や入手困難となってしまった)The TeXbook のアスキーによる日本語版をスキャンしたものを Preview.app で開くと,何もしなくても,文字選択できます。 これをコピーして他のエディタにペーストすると, TEXの名称で気をつけなければならないことがほかにもある。Eの文字が不揃いになっていることだ。Eの文字を少し下げてあるのは、TeXが組版のためのシステムであることを印象づけるためであり、またほかのシステムの名称と区別するた
JavaやC#のアプリケーションで、PDFの入出力や電子署名などを実現するオープンソースライブラリ「iText by Apryse」[PR] ここ数年でのリモートワークの普及は、多くの職場で紙の帳票を減らし、電子的な情報のやり取りを増やすことにつながりました。 例えば社内文書の配布が紙から電子メールやグループウェアなどによる配信に変わり、取引先に郵送していた見積書や請求書もPDF文書を電子メールで送付するようになり、印鑑の押印が求められていた契約書もPDFの電子署名になる、などの変化が起きています。 PDF文書が活用される場面が増えてくれば、当然ながら業務システムにおいてもPDF文書の出力機能が求められるようになるでしょう。 出力だけでなく、PDF文書の業務システムへの読み込み、電子署名の対応、複数のPDF文書の取り扱いなど、さらに柔軟な操作への要望が高まってくることも予想されます。 こう
はじめに Typst とは、新しい組版ソフトウェアです。数式を多用する科学技術系の記事を書くのに向いています。 ローカル環境で PDF にコンパイルすることもできますし、 Overleaf のようなオンラインの執筆環境も提供されています。 この分野では LaTeX が歴史的にも非常に強く、なかなか代替のソフトウェアが出現しなかったのですが、ようやく注目にも値する品質のものが登場してきたという感じです。 そもそも組版システムとは そもそも Qiita や Zenn でも数式を埋め込むことができるこの時代、ドキュメントを書くための専用の言語を使う理由は何でしょうか。 LaTeX はオワコンではないのでしょうか。 組版システムというのは簡単には無くなりません。これは、ブログや Wiki などの Web の記事とは性質が異なるからです。 組版システムは紙に印刷することを最終的な目的にしたシステムで
透かしは、一般的に文書の著作権情報、作者、所属団体、または文書属性などを表示するために使用されます。テキスト注釈などとは異なり、テキスト透かしはページに描画される要素であるため、簡単に削除することができません。そのため、透かしは偽造防止にも非常に有効です。また、透かしにはテキスト透かしと画像透かしがあります。この記事では、Free Spire.PDF for .NET(無料版)を使用してPDFにテキスト透かしを追加する具体的な方法とサンプルコードを共有します。 Free Spire.PDF for .NETをインストールする 方法1:NuGetでFree Spire.PDF for .NETをインストールする Visual Studioを開いて新しいプロジェクトを作成します。次に、「Solution Explorer」で「References」を右クリックし、「Nuget Manage P
話題の ChatGPT + LangChain で、膨大な PDF ドキュメントの内容を爆速で把握するPDFOpenAIChatGPTlangchain記事投稿キャンペーン_ChatGPT はじめに 本記事では、ChatGPT と LangChain の API を使用して、PDF ドキュメントの内容を自然言語で問い合わせる方法を紹介します。 具体的には、PDF ドキュメントに対して自然言語で問い合わせをすると、自然言語で結果が返ってくる、というものです。 ChatGPT と LangChain を使用することで、下記のような複数ステップの仕事を非常に簡単に実行させることができます。 PDF ドキュメントからテキストを抽出して複数に分割する 分割したテキストからテキスト間の関連を表すベクターデータを作成する 作成したベクターデータをベクターストアに格納しておく ChatGPT に外部から与
C#でiText7を使う C#でiText7を使ってPDFファイルのページ分割と結合をやってみました。 巷ではiTextSharpの情報は見かけるのですが、JavaではなくC#のiText7の記事が少ないと思い書いてみました。 iText7はiTextSharpの後継版で、.NET6と組み合わせればMacでも使えます。 嬉しいなあ、クロスプラットフォーム 動作確認は、 macOS Ventura 13.2 .NET6 Visual Studio for Mac 17.5 Preview iText7 7.2.5 で行いました。 ページの分割 以下、ちょっと難のあるサンプルですが、使い方の理解を目的に書いてみました。 まず、9ページのパスワード無しのPDFファイルを用意します。それを適当なディレクトリに置いてください。ここではホームーディレクトリに置くことにしました。 Macで試したのでファ
概要 gpt-index(llama-index)で、日本語PDFを安定して読めるようにするためのプルリクがマージされたので、使い方を紹介します。 使い方 download_loaderでCJKPDFReaderをダウンロードして使います。 from gpt_index import download_loader CJKPDFReader = download_loader("CJKPDFReader") loader = CJKPDFReader() documents = loader.load_data(file='data/article.pdf') print(documents)
SumatraPDF is one of those amazing open source programs that does everything a closed-source and/or commercial product does, but better in every way. "PDF readers have, over the years, managed to earn themselves something of a reputation for being slow, lumbering beasts – thanks largely to Adobe Reader. Sumatra PDF bucks the trend. It is small, svelte, lightweight and lightning fast."
はじめに はじめまして、2022年4月よりスペースマーケットでアプリエンジニアを担当していますseoと申します。 弊社では「スペースシェアをあたりまえに」をMISSIONに、スペースシェアのプラットフォーム事業を運営しております。 その中で、法人のお客様のご利用も多く、利用前の見積書や利用後の領収書発行のニーズもたくさんございます。 今回は、見積書や領収書などWebView画面をPDFファイルとして、ローカルストレージへ保存する機能を実装しましたので、実装の中身(Android編)をご紹介できたらと思います! 最新版アプリにてご利用できますので、ぜひこちらのリンクよりダウンロードして、たくさんの素敵なスペースを利用してみてください✨ ゴール 予約一覧画面から「領収書を表示する」ボタンを押すと、 WebViewの領収書が表示され、 メニューから「PDFをダウンロード」を選択すると、 保存する
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く