記事へのコメント26

    • 注目コメント
    • 新着コメント
    xnissy
    xnissy pdfからコピペしてググるとなぜかヒットしない、というので気付く。見た目は一緒で気付けないから非常に困る。

    2023/01/08 リンク

    その他
    skam666
    skam666 “康煕部首(中略)U+2F00-U+2FD5に配置されているので通常の漢字(U+4E00以降)より前にある。そのため、仮想PDFプリンタなどで変換するときに誤って参照されている可能性がある”

    2021/03/26 リンク

    その他
    jitojito
    jitojito Print To PDF は印刷情報からPDFを作るからか、外字などもアウトラインでPDFになって見える反面文字情報がなくなる。これをAcrobat

    2020/10/02 リンク

    その他
    gogatsu26
    gogatsu26 “フォントに「メイリオ」を指定して 長崎県 とだけ書いた .docx ファイルを用意し、Microsoft Print to PDF を使って PDF に変換すると、「長 (U+9577)」が「⾧ (U+2FA7)」に変換される”

    2020/10/02 リンク

    その他
    Akaza
    Akaza “Word で直接 PDF ファイルを保存すると、変換されずに保存できる”

    2020/10/02 リンク

    その他
    sds-page
    sds-page SJISのエディタに張り付けた時に化けるので気づいた。SJISをないがしろにした呪いじゃ(言いがかり)

    2020/10/02 リンク

    その他
    zu2
    zu2 “この文字は 康煕部首 (Kangxi Radicals) というもので、部首としての文字である”

    2020/10/02 リンク

    その他
    TakamoriTarou
    TakamoriTarou PDFの最適化処理の中に、スキャンした文字をよく似たグリフに置き換えて軽くすると言う奴が確か会ったはずだけど、あのあたりの誤爆なのかしら。プリンタでスキャンしたPDFの文字が一部おかしくなるアレ

    2020/10/02 リンク

    その他
    himako13
    himako13 あるある。PDFからメモ帳にコピペすると見える

    2020/10/02 リンク

    その他
    raebchen
    raebchen 自分は、なんでエクスポートのpdfと、Microsoft print to pdfの2種類があるのか、ずっと謎なんだが😳

    2020/10/02 リンク

    その他
    kouhii
    kouhii 日本語があやしい海外のゲームとかでメッセージにサイズが違う文字がポツポツ混じってたりするのもこれ関係あるんだろうか

    2020/10/02 リンク

    その他
    yarumato
    yarumato “PDFの一部の日本語の漢字が、見た目は同じだけど異なる謎の文字(康熙部首文字 Kangxi Radicals)に変換されることがある。Microsoft Print to PDFを使ってdocxをPDFに変換すると再現。Word で直接PDF保存すると変換されずに保存”

    2020/10/02 リンク

    その他
    issm
    issm j[charset][unicode][kanji]

    2020/10/02 リンク

    その他
    ya--mada
    ya--mada マジか、まだまだマルチバイト文字の処理はおざなりなんだな…。

    2020/10/02 リンク

    その他
    Sinraptor
    Sinraptor 部首について論じてる文書だと非常に困るな

    2020/10/02 リンク

    その他
    everybodyelse
    everybodyelse ひえーーーーー

    2020/10/02 リンク

    その他
    furu_ichi
    furu_ichi 忘れた頃にこの問題にハマりそうな気がするのでブックマークしておこう。

    2020/10/02 リンク

    その他
    kenjiro_n
    kenjiro_n 部首漢字が悪さをするという話。この概念が広まっていないということでか「謎の漢字」というタイトルになっている。

    2020/10/02 リンク

    その他
    DustOfHuman
    DustOfHuman 康煕部首問題、文字列扱ってるといつしかぶち当たりますね……「NFKC正規化処理」って始めて知りましたが組文字(㍑みたいなやつ)まで正規化される問題はあるようです

    2020/10/02 リンク

    その他
    stealthinu
    stealthinu 部首を表すためだけの漢字がありそれが混ざる時がある。仮想PDFプリンタでPDFに変換するとき、少なくともフォントがメイリオでMS print to PDFだと化けるらしい。

    2020/10/02 リンク

    その他
    ajisaiotoko
    ajisaiotoko なんか長崎連呼してもらって嬉しい(故郷

    2020/10/02 リンク

    その他
    side_tana
    side_tana へー

    2020/10/02 リンク

    その他
    udzura
    udzura なるほど

    2020/10/02 リンク

    その他
    nakag0711
    nakag0711 これpdfの仕様書からコピーするとコードにまじっちゃうんだよね。ms printのせいか

    2020/10/02 リンク

    その他
    fujihiro0
    fujihiro0 リンクたどると根深い問題であることがわかる。Acrobat Distiller でも再現するそうだ。 https://b.hatena.ne.jp/entry/espresso3389.hatenablog.com/entry/20090526/1243327471

    2020/10/02 リンク

    その他
    efcl
    efcl PDFのコピペで生まれる謎の感じ 康煕部首 (Kangxi Radicals)

    2020/10/01 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    PDF に謎の漢字が含まれるとき

    gistfile1.md PDF に謎の漢字が含まれるとき PDF などの中にある一部の日語の漢字が、見た目は同じだ...

    ブックマークしたユーザー

    • techtech05212024/04/05 techtech0521
    • xnissy2023/01/08 xnissy
    • utgwkk2021/07/11 utgwkk
    • skam6662021/03/26 skam666
    • thotentry_hatebu1972020/12/12 thotentry_hatebu197
    • rinsuki2020/11/21 rinsuki
    • akishin9992020/10/15 akishin999
    • Pahud2020/10/06 Pahud
    • funaki_naoto2020/10/05 funaki_naoto
    • anxiety392020/10/04 anxiety39
    • schrift2020/10/03 schrift
    • uk-ar2020/10/03 uk-ar
    • flying-cat2020/10/02 flying-cat
    • jitojito2020/10/02 jitojito
    • gogatsu262020/10/02 gogatsu26
    • neunzehn2020/10/02 neunzehn
    • Akaza2020/10/02 Akaza
    • sds-page2020/10/02 sds-page
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事