タグ

ブックマーク / moji-memo.hatenablog.jp (139)

  • 最近、モリサワのようすがちょっとおかしいんだが。 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    ところで、モリサワのPr6Nフォントがやばいらしいですね。 twitterで話題になってたね。 まとめを読んでも、ちょっとわかりにくかったんですけど、どういうことなんですか? リュウミンとかのPr6/Pr6Nには複数のバージョンが存在して、新バージョンで作ったデータを旧バージョンの環境で開くと、豆腐になっちゃう文字があるんだよね。 うー、それはかなりイヤですね。 だよね。新バージョンのほうは、IVS(異体字シーケンス)対応版なんだけど、cmapも新しいのになってるから。 しーまっぷ? cmapっていうのは、符号位置とグリフの対応表。DTP用の日語OpenTypeフォント(Adobe-Japan1フォント)には、Unicodeに入ってないグリフもたくさん入ってるでしょ。 入ってますね。 「Unicodeに入ってない字」はcmapには載ってない。でも、そういう字が後からUnicodeに収録さ

    最近、モリサワのようすがちょっとおかしいんだが。 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 豆腐のいろいろ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    欠字を意味するいわゆる「豆腐」の表示には、フォントのGID=0に割り当てられているグリフが用いられる*1。 こんなかんじ。まあ、XP以前のMSフォントが表示するような「・」は「豆腐」とは呼ばないだろうけど。 *1:このエントリの最初のバージョンには「ヒラギノなどのAdobe-Japan1フォントではGID=0にグリフが割り当てられていないので、OS X上のInDesignでよく見かける豆腐は、フォールバックで表示されるAquaKanaのGID=0だと思う」と書きましたが、それは勘違いでした。Adobe-Japan1フォントも豆腐(nofdef)グリフを持っています。@monokanoさん、ご指摘ありがとうございます!

    豆腐のいろいろ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    seuzo
    seuzo 2014/01/10
  • 爆発するIPAmj明朝 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    IPAmj明朝を含むPDFを、iOSのメールアプリやiBooksで表示すると、特定のグリフが爆発する。 爆発前というか、爆発しない環境での表示は、こんなかんじ。 爆発するグリフをOTMaster Lightというツールで見てみた。爆発していた。 「Gridfit」のチェックを外したら、普通に表示された。 GridfitというのはTrueTypeフォントのヒンティング処理(の一部)だと思うが、そこから先はよくわからない。ただ、まったく別系統のアプリ(OTMasterとAppleのiOSアプリ)で同じ現象が見られるということは、たぶん(少なくとも)IPAmj明朝側には問題がありそう。メリー・クリスマス。

    爆発するIPAmj明朝 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    seuzo
    seuzo 2013/12/24
    アヴァンギャルド...(違
  • CJK統合漢字拡張Fがヤバイ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    がCJK統合漢字拡張F1/F2に提案している文字には、すでにUCSに入っている漢字と見分けがつかない例がいくつもある。これらは、提案書*1に「Similar and Variation」として既存の文字の符号位置が記載されているものの一部であり、つまり、似ている漢字の存在は百も承知で提案しているわけだ。 以下、そのような例を拾ってみた。左右に並べた文字のうち「UCS」欄に符号位置が入っているほうが、既存のもの。個々の文字について述べることはしないが、要するに「別字の衝突であれば、形が同じでも別の符号を与える」ということだろう。 だが、ちょっと待ってほしい。それって実はものすごく根的な方針転換じゃないですか? 「機」の簡体字の「机」も「つくえ」の「机」も、形が同じである以上、同じ符号位置(U+673A)に包摂・統合するというのがCJK統合漢字の大原則であったはず*2。ここでいきなりそれ

    CJK統合漢字拡張Fがヤバイ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • iPhone間の新しい文字化け「兄化け」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    iPhone間の新しい文字化けパターンが発見されたのでメモ*1。この少なくとも3つのダメな仕様が重なって発生する文字化けは、発見者によって「兄化け」と命名された*2。 「兄化け」は、兄がSoftBankまたはauのiPhoneでメッセージアプリを、妹がiPhoneのメールアプリでdocomo.ne.jpアドレスを使っている場合に発生する。兄が絵文字入りのメールを送信すると、妹の環境では絵文字が豆腐に化け、それを引用して返信すると、今度は兄の側でメッセージ全文が化ける。 以下、この文字化けの理屈について。兄のメッセージアプリは、絵文字入りのメッセージをUTF-8で送信。キャリアの送信側のサーバが、これをドコモのShift_JISに変換する。しかし、妹のiPhoneのメールアプリはドコモのShift_JISに対応していないので、ドコモの絵文字を単に「Shift_JISの未定義領域の文字」として

    iPhone間の新しい文字化け「兄化け」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • iOS 7のメールアプリの絵文字トラブルまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    この項10月28日追記。iOS 7.0.3でSoftBank iPhoneのメールアプリの仕様が修正された。iOS 7.0.3にアップデートした場合、いちばん下の図(au→SoftBank)における2つの豆腐は、絵文字で表示される。 iOS 7のメールアプリでは(原因の多くはサーバ側にあるのだが)絵文字の表示におけるトラブルが多発している。これらの問題は、キャリアのメールアドレスを利用している場合に発生するので、ドコモ(@docomo.ne.jp)、au(@ezweb.ne.jp)、SoftBank(@i.softbank.jp)の組み合わせとトラブルの関係を、しくみも含めてまとめてみた*1。 受信側が@docomo.ne.jpで送信側が他のキャリアのアドレスである場合、絵文字は表示できない。iモード絵文字にない文字のほうが(フォールバックによってテキストとして)表示される可能性がある、と

    iOS 7のメールアプリの絵文字トラブルまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 日本がCJK統合漢字拡張F1に提案中の518字 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    が拡張F1に提案中の漢字のリスト。拡張F1はまだ最初の段階なので、今後出入りのある可能性がある。 このリストを見て「誤字じゃん」と言う人もいるかもしれないが、2013年現在、UCSに入っていない戸籍統一文字・住基ネット統一文字・登記固有文字のうち、最優先で符号化が進められているのがこれら拡張F1の518字である。その背後には、もっと数の多い拡張F2候補が控えているし、そのまた背後には、符号化のゴールが見えていない登記固有文字が存在する。 JMJ番号 文字画像 JMJ-059293 JMJ-056820 JMJ-059294 JMJ-056821 JMJ-059296 JMJ-059297 JMJ-057545 JMJ-059298 JMJ-056838 JMJ-056837 JMJ-056845 JMJ-059300 JMJ-059301 JMJ-056860 JMJ-056863 J

    seuzo
    seuzo 2013/09/03
    文字アニメ(ブログ)というジャンル?!
  • 文字鏡ソースの文字のその後 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    今昔文字鏡をソースとして2001年に日からISO/IEC 10646に提案された文字(1028字)のうち、拡張Cにも拡張Eにも入らなかったもの(264字)について、主に自分用に軽くメモ。3つのグループに分けて表にした(文字画像は文字鏡フォント)。それぞれの事情については、あまり深追いしていない。 最初の提案書(http://appsrv.cse.cuhk.edu.hk/~irg/irg/IRG18.htm)だけに存在し、次の段階(http://www.cse.cuhk.edu.hk/~irg/irg/irg19/N895-Japan_C1.zip)では消えていた58字。ほとんどは「やっぱり拡張Bに入ってました」ということだろうと思う。 JK番号 文字画像 JK-00060 JK-02784 JK-09655 JK-12138 JK-15622 JK-45444 JK-50651 JK-6

  • 「闘」の旧字体をめぐって - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    改定前の常用漢字表では、「闘」の旧字体(康熙別掲字)がつぶれていて、字体が判別できない。この字を、JIS X 0213は下図のような例示字体で収録した。そして改定常用漢字表も、おそらくそれに倣っている。以下、「どうしてこれがこれになるの?」という素朴な疑問を出発点として調べてみた*1ことをメモしておくが、あらかじめ断っておくと、特におもしろい新事実が明らかになったりするわけではない。 「闘」の康熙別掲字の可能性があるのは、Unicodeの符号位置でいえばU+9B2CまたはU+9B2D。汎用電子(Hanyo-Denshi)のIVDには5種類、Adobe-Japan1のIVDには3種類の異体字が登録されている。 また、わたしのMacに入っている中文フォント(Songti SC)の字体、『明朝体活字字形一覧』(文化文化部国語課)に掲載されている字体なども含めると、「鬥」の中の「斲」の左の部分(

    「闘」の旧字体をめぐって - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • Windows 8のIVS実装についてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    関連するエントリのインデックス。タイトルだけでは中身がわかりにくかったりするので、こういう形でまとめておくことにした。基的に、説明は上から順に読んでいただくのがいいかと。 説明(対話形式) MS122とは何か(昔のグリフで出ています) VistaにおけるMS明朝の字形変更(俺のMS明朝がこんなに可愛いわけがない) MS明朝・MSゴシックのIVS実装(人生がときめくWindows 8のIVS実装) メイリオのIVS実装(もし田村ゆかりがメイリオの実装に突っ込んだら) Windows 8のIVS実装一覧表 HTML版 画像版

    Windows 8のIVS実装についてのまとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 人生がときめくWindows 8のIVS実装 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    皆さんこんにちは、片づけコンサルタントのこんまり先生です。 いきなりの個人名詐称……。 今日は、Windows 8のIVS実装について説明するわよ。 「わよ」? 最初に結論を言っちゃうと、Windows 8のMS明朝・MSゴシックがIVSでサポートしているのは、MS122から「筵」を引いて「濹」を足した122文字ね。 ん? 以前のエントリでも言ったように、Windows Vistaで変更された文字のうち、jp90タグやJIS90互換フォントパッケージによって昔のグリフに戻せる122字を、MS122と呼ぶんだけどね。 MS122はいいんですけど、そこからまた引いたり足したりするんですか? うん。 じぁあまず、マイナス分の「筵」は、何なんですか? MS122のうち「喩」と「筵」については、XPグリフがJIS90の例示と一致しないんだよね。 ホントだー。 だから「喩」と「筵」のXPグリフ(JIS

    人生がときめくWindows 8のIVS実装 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 昔のグリフで出ています - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    今日はWindows 8のMS明朝における122字のIVS実装について説明しようと思ってたんだけど……。 気が変わったんですか? 話が長くなりそうなんで、詳しいことは後日に回して、今回は説明のカギになる「MS122」という文字集合に焦点を絞って語ってみようかと。 「MS122」ですか? トラック野郎が荷台に貼ってるお茶目なステッカーの「人110」と、ちょっとだけ似てますね。 あー、こないだそれ貼ってるトラック見た見た! 正確には「美人110番の車」な。って、「MS122」と、ひとかけらも似てないだろが! まさかのノリツッコミ。 まず、基を押さえておくとWindows Vistaでは…… 強引な軌道修正。 ……JIS X 0213:2004の例示にあわせる方向で、MS明朝の字形を変更したわけだ。 はいはい。それが122字だったんですね? まあ、落ち着こうぜ。変更された字は、漢字だけでも

    昔のグリフで出ています - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • IVS本へのツッコミ・まとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の非公式正誤表のようなもの*1。第1章と第2章はWindows 8の話なので、見ていない箇所もある。間違いの量に興味がある方は、最初から読まずに、第4章(時系列的にはこれが最初のエントリ)あたりからどうぞ。 IVSへのツッコミ 第2章までへのツッコミ 第2章番外編「先生怒らないからリュウミンは手を挙げなさい」 第3章へのツッコミ 第4章へのツッコミ 第5章へのツッコミ 第5章番外編「この「邉」を作ったのは誰だぁ!!」 巻末付録の文字コード表へのツッコミ 関連するかもしれないエントリ セミナーでMicrosoftの人に質問するためのアンチョコ IVSアドインをインストールしてみたよ *1:さまざまな人からの情報をベースにしています。個々にお名前を挙げることはしませんが、皆さんありがとうございます!

    IVS本へのツッコミ・まとめ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    seuzo
    seuzo 2013/05/08
    まとめ
  • IVS本へのツッコミ・第5章編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかでは、この章は比較的ラク(突っ込みどころが少ない)かと思っていたら、そんなことなかった*1。 pp.141-142 人名用漢字の文字数として常用漢字までカウントしている。 戸籍法・戸籍法施行規則における常用漢字・人名用漢字の情報が古い(常用漢字改定以前)。常用漢字は「1,945字」ではなく「2,136字」。漢字の表(一)は「776字」ではなく「649字」。漢字の表(二)は「209字」ではなく「212字」。常用漢字と人名用漢字の合計(子の名に使える字)は「2,930字」ではなく「2,997字」。 「使われている漢字の種類」というタイトルの図だが、Adobe-Japan1-6の「23,058字」は漢字以外の字を多数含んでいる。 日語漢字能力検定の情報が古い(常用漢字改定以前)。2級の範囲は常用漢字なので「約1,945字」では

    IVS本へのツッコミ・第5章編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
    seuzo
    seuzo 2013/04/26
  • この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)のなかで、目玉がWindows 8のIVS対応を紹介している第2章だとするなら、背骨といえるのが、IVSという枠組み自体について解説している第5章だよね。 たとえがしっくりきませんが、こだわらずに先に進みましょう。 その第5章のなかでも、IVSの基中の基をわずか1行に凝縮して視覚化しているのが、図5-7だ。 はいはい。 で、今日は図5-7に突っ込んでみようと。 もちろん、突っ込みますよー! あのさ、そういうテンションいらないから。この図なんだけど、どう? んー、解説抜きで見せられても、ちょっと難しいですね。 いや、当は難しくないんだよ。「漢字に異体字セレクタを付けるとグリフを指定できます」って言ってるだけの図なんだから。 この真ん中の「E010B」が右では「E0110」に変化してるのは、どういう意味なんですか? 誤植だね。

    この「邉」を作ったのは誰だぁ!! - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 先生怒らないからリュウミンは手を挙げなさい - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    IVSファンの皆さん、こんにちは。 いえ、ぜんぜんファンとかじゃないですから。 『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)の目玉と言えるのが、表2-7の「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だよね。 そうなんですか? Microsoftの人が執筆しているIVSなんだから、焦点は当然Windows 8のIVS対応。皆さんそこが知りたいわけでしょ? なるほど。 そこで、この表2-7に突っ込んでみよう、と。 やっぱり突っ込むんだ……。 表のタイトルは大切だから、しっかり頭に入れておくといいぞ。「Windows 8におけるJIS X 0208:1990字形と異体字セレクター」だ。 はいはい。Windows 8ではIVSをどのように駆使して「Vistaで変更される以前のMS明朝のグリフ」を表示するのか……ってことですね。 でさ、「字形

    先生怒らないからリュウミンは手を挙げなさい - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • IVS本へのツッコミ・付録の「文字コード表」編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)へのツッコミ第2弾。このは、巻末に付録として2つの文字コード表を掲載しており、ページ数では全体の約半分に及ぶのだが、これらの表にもいろいろ問題があるように思う。 「USC」が215回出現 2つの文字コード表のうち「文字符号対応表(CP932とJIS文字コード)」(pp.218-325)のほうから見ていくこととする。 まず、全ページで(100ページ以上に渡って)「UCS」が「USC」になっている。 フォントの問題 「IPAmj明朝」欄の表示に使われているのはIPAmj明朝ではなくIPAex明朝だと思う(下図を参照)。 ちょっとわけがわからない。 「IPAmj明朝」欄の0x02から0x1b(制御文字領域)に記号や罫線素片が入っているが、IPAmj明朝にもIPAex明朝にも、このような文字は入っていない。 フォールバックで別のフォン

    IVS本へのツッコミ・付録の「文字コード表」編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 『Unicode IVS/IVD入門』へのツッコミ・第4章編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    『Unicode IVS/IVD入門』(田丸健三郎、小林龍生)を読んでいたら、いくつか気になる点があったので、まとめてみることにした。とりあえず、第4章(37ページ分)だけ。時間と気力があれば、今後、他も追加していくかも*1。組版上の突っ込みは(ひどい例以外は)省いた*2。 p.103 ISO/IEC 8859は《中略》パート16まで定義されています(パート15は破棄)。 破棄されたのはパート12。 p.104 「ISO-10646」の文字集合 「ISO-10646」→「ISO/IEC 10646」。 たとえば、1面19区75点を符号位置とする文字をシフトJISで8ビット符号化した場合0x8A6Bとなる文字を例に見てみましょう。この文字は、葛飾区の「葛」という文字ですが 「葛」はシフトJISで「0x8A6B」ではなく「0x8A8B」。 p.106 「U+000000」→「U+0000」(U

    『Unicode IVS/IVD入門』へのツッコミ・第4章編 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • セミナーでMicrosoftの人に質問するためのアンチョコ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Windows 8のIVSサポートについて、セミナーでMicrosoftの人に質問するための想定問答集(PDF)をtwitterで公開しつつ更新中(http://dl.dropbox.com/u/50939295/NAOI/MS_IVS_Q.pdf)。 Microsoftの人になりきって大いに語っているが、内容は「わたしの想像」に過ぎないので、あしからず。あと、あくまでネタなので、会場で実際にこういう質問が出るって期待しないでね!

    セミナーでMicrosoftの人に質問するためのアンチョコ - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    そんなわけで、アイルランドがUCS(Unicode)に押し込んだ3つのハンドジェスチャーのうち最後の1つが、これなんだけどね。 わあ! またやばそうなのが来ました! これがやばく見えるなら、それは心の鏡に映ったきみ自身のやばさを見てるんじゃないかな。 ちょっと何言ってるかわかんないです。 『スタートレック』って観たことある? わりと最近のリメイク版なら観ましたけど。 んー、それはリメイク版じゃなくて、映画版の第11作だろうな。まあ、そんなことはいいんだけど、つり眉でおかっぱ頭でエリートくさいスポックっていうバルカン星人が出てきたでしょ? 名前は忘れましたけど、いましたね、おかっぱ星人。 で、そのバルカン星人のスポックが、手をこんな形にして「長寿と繁栄を!」って言ってなかった? 言われてみれば、そんなシーンがあったような、なかったような。 それがバルカン式挨拶(Vulcan salute)だ

    バルカン星人のUnicode侵攻 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ