はじめに 本記事ではNode.js環境でTypeScriptを用いてPDFテキストを抽出する手順について、プロジェクトのセットアップから扱います。また、型定義を参照しつつサンプルコードに解説を加え、筆者の環境で遭遇したエラーも簡単に取り上げています。 想定読者 PDFをTypeScriptで扱いたい人。 使うもの/環境 2023年3月上旬、下記の環境化での実装です。 OS: Windows 11 VSCode コードの実行はCode Runnerを使用。 Node.js v16.13.2 16系だとエラーが生じます。本文ではそのエラーも扱います。 TypeScript v4.5.5 インストール済であること、文法の知識は前提としています。 pdfjs-dist PDF.jsのnpmライブラリ PDFの操作に使用 サンプルPDF 日本語、テキストのみ。 Marked Contentは対象外。