タグ

Unicodeに関するnaglfarのブックマーク (7)

  • Unicode変体仮名フォント

    Unicode10.0で規格化された変体仮名を収録したフォントです。 これで「生𛁛𛂦゙」も書けます。 IPAmj明朝フォント(Ver.004.01)の変体仮名グリフのみを取り出してUnicodeのコードポイントを与えたものです。 U+1B001からU+1B11Eまでの286文字のみのフォントなので、一般的なフォントと組み合わせて使ってください。おまけで𛂦゙ 𛂱゙ 𛂱゚の合成グリフ(ccmp)も入ってます。 Unicode code chart Kana Supplement(PDF) Kana Extended-A(PDF) 収録グリフの根拠となるのは、IPAのMJ文字情報一覧表 変体仮名編です。

  • 「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記

    自分の知らないCJK Ideographのバリエーションがまだあったことに戦慄している pic.twitter.com/kUlyRLDDTM— moriyoshit (@moriyoshit) March 9, 2017 などというツイートをしたところ、思ったより反響があったのでまとめておく。 上記ではあいまいに「バリエーション」などと書いたが、Unicodeとそれを扱う環境においては、バリエーションと一口に言っても次のような状況がある。 意味論的に等価な異なる字形の集合 同じ字形で異なるコードポイントの集合 aは結構なじみ深いと思う。 a-1. 異なるコードポイントにそれぞれ異なる字形が割り当てられているもの 例: 「東」(U+6771) ⇔「东」(U+4E1C) 「斉」(U+6589) ⇔「齊」(U+9F4A) 「高」(U+9AD8) ⇔「髙」(U+9AD9) a-2. 同じコードポイ

    「ユニコード」で予期せぬ目に遭った話 - moriyoshiの日記
  • Swiftでの文字列比較におけるUnicode正規化を巡る注意点 - Qiita

    Stringの比較は正規化をかけた上で行われる Swiftの文字列比較は,Unicode正規化をかけた上で行われます。 たとえば,次の例をご覧ください。 let gaC = "\u{304C}" // 「が」の結合形 let gaD = "\u{304B}\u{3099}" // 「が」の分解形 // NSString としての文字数(UTF16での文字数)は異なる (gaC as NSString).length // => 1 (gaD as NSString).length // => 2 // String としての比較 gaC == gaD // => true (!!) これは,こちらのサイトによると, Depending on your requirements, this may or may not be what you want, but it is certainl

    Swiftでの文字列比較におけるUnicode正規化を巡る注意点 - Qiita
    naglfar
    naglfar 2014/10/27
    Swift 使う予定がなくて一安心……。これは確かに闇としか言いようがない。
  • 全角チルダ問題

    JenkinsとDockerって何が良いの? 〜言うてるオレもわからんわ〜 #jenkinsstudyKazuhito Miura

    全角チルダ問題
    naglfar
    naglfar 2014/07/07
    ぐええええ。全角チルダ滅ぶべし。いや全角チルダ自体に詰みはないと思うが。
  • 箇条書きなどの冒頭の中黒 - なんでやねんDTP・新館

    twitterのフォロワーからご質問があったので、DMでお応えし、twitterにも流しておいたのだが、記事にしておく。 箇条書きなどの段落冒頭に中黒を利用している例をみかけるが、InDesignの「文字組みアキ量設定」では中点類の段落先頭は(基的には)「アキなし(0%)」に設定されており、Illustratorでは「アキなし(0%)固定」というのが実状で、中黒が段落冒頭に位置する場合は前に四分アキを挿入してやらないと全角ドリにならない*1。 このような場合、私はビュレット(U+2022)の等幅全角字形(CID12256)を使用している。中黒よりは少し大きいが、文中の中黒との差別化に繫がり、却ってこの方が都合がよい。 上の画像は中黒を選択した状態での字形パレットの表示(InDesign上でUnicode順)*2 これは何もtips的な使い方ではなく、ウィキペディアでは「ビュレット(記号)

    箇条書きなどの冒頭の中黒 - なんでやねんDTP・新館
    naglfar
    naglfar 2010/07/03
    HTML では ul を使用するわたしに死角はなかった。でもプレーンテキストやドキュメントでは気をつけよう。
  • サロゲートペア入門:CodeZine

    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicode

  • JIS2004制定時の変更点 - CyberLibrarian

    2000年に定められたJIS X 0213(JIS拡張漢字)は2004年に改定され、JIS X 0213:2004になりました。JISの例示字形と表外漢字字体表の印刷標準字体とが異なっている178字のうち、168字を印刷標準字体に変更し、10字を新たに追加しています。10字を追加したのは、JISの例示字形と印刷標準字体の両方が既にUnicodeで別字として規定されているためです。下記は、その変更点です。一部の文字はUnicodeの数値文字参照で記述しているため、OSやブラウザのバージョンなどの環境によっては、文字化けする可能性があります。なお、経済産業省の報道発表(PDF)でも新旧の字体を見ることができます。 印刷標準字体に変更したもの(168字) これらには、字体を変更するもの、筆押さえの有無や接触の位置などのフォント間(平成明朝体とMS明朝体など)の微細なデザイン差を統一するもの、3部

  • 1