タグ

ブックマーク / www.linux.or.jp (1)

  • Manpage of UTF-8

    Section: Linux Programmer's Manual (7) Updated: 2001-05-11 Index JM Home Page roff page 名前 UTF-8 - ASCII と互換性のある多バイト Unicode の符号化 説明 ユニコード (Unicode) 3.0 文字集合は 16 ビットのコード空間を占める。 最も単純な Unicode の符号化方法 (UCS-2) では、文字は 16 ビット・ワード (16 ビット文字の列) で構成される。 この列には、 aq\0aq や aq/aq のような (ファイル名や C のライブラリ関数の引き数の内部で) 特殊な意味を持つ 16 ビット文字が含まれることがある。 さらに、ほとんどの Unix ツールは ASCII ファイルを入力として期待するので、 大幅な変更なしには 16 ビットワードを文字として読む

  • 1