タグ

pdfに関するrryuのブックマーク (6)

  • 理論上最大サイズのPDFファイルはドイツより大きくなるというのは本当なのか?

    インターネット上に散乱するネットミームのひとつに「ページ寸法を最大にしたPDFファイルはドイツの国土面積を上回る」というものがあります。これが果たして当なのか、ソフトウェア開発者のアレックス・ウルチャン氏が解説しました。 Making a PDF that’s larger than Germany – alexwlchan https://alexwlchan.net/2024/big-pdf/ 問題のミームが以下。理論上最大サイズのPDFファイルは381キロメートル四方の大きさになり、ドイツの大きさを上回ると主張されています。ところが、この主張には何の裏付けも説明もなく、なぜ381キロメートルが上限なのかはわかりません。 by NordNordWest 一部の人は「PDFファイルリーダーの上限に由来する」と指摘していて、Adobe Acrobatの仕様を取り上げて「Adobe Acr

    理論上最大サイズのPDFファイルはドイツより大きくなるというのは本当なのか?
    rryu
    rryu 2024/02/06
  • PDFをコピペするとなぜ“文字化け”が起きてしまうのか 変換テーブル“ToUnicode CMap”が原因だった

    NTT Tech Conferenceは、NTTグループのエンジニアたちが一堂に会し、NTTグループ内外のエンジニアたちと技術交流を行うためのカンファレンスです。ここで、細田氏が「PDFのコピペが文字化けするのはなぜか?〜CID/GIDと原ノ味フォント〜」をテーマに話します。まずは文字化けが起こってしまう原因について。 原ノ味フォントの作成者 細田真道氏(以下、細田):細田です。ふだんはNTTグループのどこかでDX仕事をしていますが、今日はぜんぜん仕事とは関係なく、個人的にやっているオープンソースなどの話をしたいと思います。よろしくお願いします。 簡単に自己紹介をします。楽譜を作成するプログラム「LilyPond」のコミッターと、GNUの公式文書フォーマット「Texinfo」のコミッターをしています。あとで話しますが、「原ノ味フォント」を作っていて、すごく似たような名前で「原ノ町」という

    PDFをコピペするとなぜ“文字化け”が起きてしまうのか 変換テーブル“ToUnicode CMap”が原因だった
    rryu
    rryu 2021/05/29
    グリフから文字コードへの逆変換なので部首漢字などの同一のグリフが割り当てられている文字が化ける可能性があると。
  • プログラマーから見たPDFファイル - アンテナハウス PDF資料室

    更新日: 2020年8月14日 このページの目的 プログラマーは、クライアントから提供されたPDFファイルで、その要求を実現させようとしたとき、PDFのどんなところを見ているのでしょうか。このページでは、ちょっと珍しい視点でPDFファイルを解き明かしていきます。 自分でプログラムを書いてPDFファイルからテキストデータを取り出したいという人も、ぜひご一読ください。 はじめに PDFファイルをクリックすると、あたかも紙に印刷したかのように、どんなマシンでも同じような見た目で文章や画像がディスプレイに表示されます。 この単純な事実は、日常的にPDFファイルを利用していると当たり前に感じられるかもしれません。しかし、よくよく考えると驚くべきことです。 いったい、どのような仕組みがあれば、「過去から現在に至るさまざまな種類のコンピューターで見た目を変えずに同一の紙面を再現する」という目的を達成でき

    プログラマーから見たPDFファイル - アンテナハウス PDF資料室
    rryu
    rryu 2020/08/15
    PDFの中身は「スタックマシンなPostScriptで書かれたプログラム」で最終的にそういう絵になればいいだけだからやり方は様々という…
  • Google Chrome PDFビューワーの情報漏えいの脆弱性についてまとめてみた - piyolog

    Exploit検出のサービスを公開しているEdgeSpotはChromePDFビューワーに情報漏えいの脆弱性が確認されたとして不具合に係る情報を公開しました。ここでは関連する情報をまとめます。 脆弱性の概要 EdgeSpotがChrome PDFビューワーの情報漏えいの脆弱性を次の記事にまとめている。 blog.edgespot.io 概要は以下の通り。 影響 ユーザーが意図せずHTTPリクエストを送出し、情報漏えいする恐れ 影響を受ける対象 Google Chrome (72.0.3626.119で発生を確認) 脆弱性の名称 無し CVE 確認できず PoC インターネット上で脆弱性の利用が既に確認されている。 対策 2019/3/1時点で未修正。 修正されるまでAdobe製のPDFリーダーの利用を推奨。 2019年4月下旬ころ修正の予定と発見者は報告。 Edge、Adobe Acro

    Google Chrome PDFビューワーの情報漏えいの脆弱性についてまとめてみた - piyolog
    rryu
    rryu 2019/03/02
    なぜChromeは悪い予感しかしないPDFのJavaScript埋め込みに対応してしまったのか…
  • パスポート更新申請のPDFの仕様が酷いと聞いたので確認してみた - Windows 2000 Blog

    3rdに引っ越しました。 2010/12/31 以前&2023/1/1 以降の記事を開くと5秒後にリダイレクトされます。 普段の日記は あっち[http://thyrving.livedoor.biz/] こちらには技術関係のちょっとマニアックな記事やニュースを載せます。 Windows2000ネタ中心に毎日更新。 <body xmlns="http://www.w3.org/1999/xhtml" xmlns:xfa="http://www.xfa.org/schema/xfa-data/1.0/"><p style="font-family:'Times';font-size:24pt;letter-spacing:0in"> Please wait... </p> <p style="font-family:'Times';font-size:12pt;letter-spacing:

    パスポート更新申請のPDFの仕様が酷いと聞いたので確認してみた - Windows 2000 Blog
    rryu
    rryu 2016/06/10
    見る環境によって全く違うものが表示されるPDFとは。portableとは一体なんだったのか……
  • 詳細PDF入門 ー 実装して学ぼう!PDFファイルの構造とその書き方読み方 - プログラムモグモグ

    PDFのファイル構造を理解すると、テキストエディタでも直接PDFファイルを作ることができるようになります。このエントリーではPDFファイルの基礎要素を説明し、簡単なPDFファイルを例にしてファイル構造を説明します。更に、テキストを渡すとPDFファイルを吐いてくれる簡単なプログラムや、PDFを読み込んで簡単な解析をするプログラムを書いてみます。 目次 目次 まえがき オブジェクト 間接参照 ファイル構造 Hello, world! ヘッダ トレーラ 相互参照テーブル PDFを生成するプログラム 日語の扱い方 日語を含むPDFを生成するプログラム グラフィックス PDFを読むプログラム あとがき まえがき 1990年代前半、アドビシステムズは、どのプラットフォームやデバイスでも文書を確実に表示・共有できることを目的としてPDFファイルフォーマットを開発しました。 PDFの表示ソフト

    詳細PDF入門 ー 実装して学ぼう!PDFファイルの構造とその書き方読み方 - プログラムモグモグ
    rryu
    rryu 2015/09/16
    PDFの中身を見るとテキストファイルなのがびっくりするが、こんなフォーマットだったのか。テキストなのにバイナリ的にアクセスする気満々なのが時代を感じる。
  • 1