タグ

文字コードに関するgrafiのブックマーク (12)

  • Mac OS Xの文字コード問題に関するメモ

    文字情報基盤(Moji_Joho)のIVS登録にともなう公開レビュー(PRI 259)にコメントした。PDFはこちら。日語。もう、最初から最後まで日語。 安岡孝一さんが挙げていた(yasuokaの日記:文字情報基盤のIVS登録第1弾)ような「Hanyo-DenshiとMoji_JohoでIVSをシェアしようとしてるが、グリフに差異が見られる例」については、いくつか見つけたものの、リストの最初のほうしかチェックできなかったので、言及するのを断念。他にも、CJK互換漢字グリフの扱い、Ken Lundeさんが挙げていた(CJK Type: PRI 259)U+6723とU+81A7の問題など、いろいろ論点はあると思うが、今回はスルーした。 iPhoneや携帯における絵文字の扱いに関して、SoftBankへの要望がいくつかあるので(それから、先日コメント欄でお願いされたので)、メモ。 その1・

    Mac OS Xの文字コード問題に関するメモ
  • base-unicode-symbols

  • Bug #2154: filesystem encoding of UNIX - Ruby master - Ruby Issue Tracking System

  • ASCII文字コード : IT用語辞典

    当サイト「IT用語辞典 e-Wordsイーワーズ」はIT(Information Technology:情報技術)用語のオンライン辞典です。コンピュータ・情報・通信などを中心とする各分野の用語について、キーワード検索や五十音索引から調べることができます。用語の意味や定義、概要や要約、略語や別表記、英語表記や綴り、フルスペル、読み方や発音、仕組みや役割、歴史や由来、語源、構造や構成、要素、特徴、機能や性能、諸元、規格や仕様、標準、原因や要因、手法や方法、方式、種類や分類、利点やメリット、欠点やデメリット、問題点、対義語や類義語との違い、用例や事例、具体例、画像や図表、関連用語、外部資料や別の辞典による解説へのリンクなどを掲載しています。

  • Unicode-symbols - HaskellWiki

    Overview An overview of the packages that provide Unicode symbols. Naming: A package X-unicode-symbols defines new symbols for functions and operators from the package X. All symbols are documented with their actual definition and information regarding their Unicode code point. They should be completely interchangeable with their definitions. Alternatives for existing operators have the same fixit

  • Category:Unicodeに存在しない文字 - Wikipedia

    Unicodeに存在しない文字に関するカテゴリ。 このカテゴリは、Unicode上に存在しない文字は検索機能による検索がとても困難なため、それらUnicodeに存在しない文字が含まれる記事を一覧化し、利用者の便宜を図るためのカテゴリである。 このカテゴリに含まれる記事 Unicodeに存在しない文字群(トンパ文字、神代文字など)、Unicodeに存在しない記号の群(洗濯表示など) Unicodeに存在しない学術記号 Unicodeに存在しない漢字 Unicodeで表現できない合字(「トキ」「ト云」などの合略仮名など) Unicodeに存在しない漢字を構成要素の組み合わせで表記したもの Unicodeに存在しない組文字(MacJapaneseの有限会社など) Unicodeに存在しない囲み文字(大⃝や小⃝、控⃝など) Unicodeに収録が提案されているがまだ収録されていない文字(CJK統合

  • [Bug #1685] Some windows unicode path issues remain - Ruby Forum

    Issue #1685 has been updated by B Kelly. File spatulasnout-unicode-mkdir-diffs.txt added File test_io_unicode_paths.rb added Hi, I'll be needing win32 unicode path support for my current project, so I would like to try to tackle the remaining issues. I started with a relatively easy one, Dir.mkdir For Dir.mkdir, I took an approach similar to what was already in place for rb_sysopen(), which is tha

  • GitHub - knu/ruby-unf: A wrapper library to bring Unicode Normalization Form support to Ruby/JRuby

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - knu/ruby-unf: A wrapper library to bring Unicode Normalization Form support to Ruby/JRuby
  • GitHub - knu/ruby-unf_ext: Unicode Normalization Form support library for CRuby

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    GitHub - knu/ruby-unf_ext: Unicode Normalization Form support library for CRuby
  • Unicode正規化

    正しい並び替えでは、表示は(A)のままですが、間違った並び替えでは、正規結合クラスが互いに等しいMACRONとACUTEを並び替えたため、表示は(B)のように、eの上のアクセント記号の位置が入れ替わってしまいます。 正規分解・互換分解 ある文字列の正規分解 (Canonical Decomposition) を得るには、まず、それぞれの文字を正規マッピングによって再帰的に、可能な限り、分解します。すなわち、1回分解した後に現れた文字がなおも分解可能であればさらに分解します。分解マッピングがその文字自身である場合は、分解不可能なので、そのままです。 しかし、分解しただけでは必ずしも正しい結果が得られません。つまり、結合文字の順序の一意性を保証するため、分解後の文字列に対して正規順序アルゴリズムを適用しなければなりません。このように、正規マッピングによる再帰的分解と、正規順序アルゴリズムによ

  • UTF-8 - Wikipedia

    * 第1バイトがE0のときに第2バイトが80-9Fの範囲を、または同F0のときに80-8Fの範囲を取るものは冗長な符号化となるため許されない。第1バイトがEDのときに第2バイトがA0以上となるものはサロゲートペアのための符号位置にあたり、また同F4のときに90以上となるものはUnicodeの範囲外となるため、UTF-8ではやはり許されない。 Unicodeの符号位置を2進表記したものを、上のビットパターンのx, yに右詰めに格納する(最少のバイト数で表現するため、yの部分には最低1回は1が出現する)。符号化されたバイト列は、バイト順に関わらず左から順に出力する。 1バイト目の先頭の連続するビット "1"(その後にビット "0" が1つ付く)の個数で、その文字のバイト数がわかるようになっている。また、2バイト目以降はビットパターン "10" で始まり、1バイト目と2バイト目以降では値の範囲が

    grafi
    grafi 2012/03/07
    エンコード体系がなんか再帰的っぽくて楽しい。
  • Lionのヒラギノはどこが変わったのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Lionでは、ヒラギノProNとStdNのバージョンが8.10になり(LeopardとSnow Leopardは8.00)、IVS(異体字シーケンス)に対応した。それ以外の(Nの付いていない)ヒラギノは変わっていない。 テキストエディットでフォントをヒラギノProNにして「厩」と入力し、その後ろに文字ビューアからU+E0100をドラッグ&ドロップしてみると、文字の形が変わるのを確認できると思う。Adobe-Japan1のIVD(2007-12-14)は、フルサポートするにはAdobe-Japan1-6が必要となる。先行してこれをサポートしたした小塚Pr6NやイワタPr6/Pr6Nとは異なり、ヒラギノ(ProNでも、ほぼAdobe-Japan1-5相当)では部分的なサポートとなっている。 今回のバージョンアップにともない、cmapも新しくなった。グリフの総数は変わっていないが、Unicode

    Lionのヒラギノはどこが変わったのか - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 1