タグ

charsetに関するtzk2106のブックマーク (2)

  • 漢字コードについて - とほほのWWW入門

    コンピュータの内部では文字を数値として扱います。例えば 'A' という文字には65(16進数で0x41)というコードが割り当てられています。これを文字コードと呼びます。アルファベットや数字などのいわゆる半角文字は1バイト(8ビット)で表すことができますが、日語の漢字を含む文字コードは最低でも2バイト(16ビット)を必要とします。この、漢字を含む多バイト系のコードを漢字コードと呼びます。(実際にはひらかな、カタカナ、全角英数字も含まれるので漢字コードという呼び名は適切ではないのですが...) 現在主に使用されている文字コードの体系として以下のものがあります。 ASCIIコード ... いわゆる半角英数文字 JISコード ... 電子メール転送などに使用 シフトJIS ... 主にWindowsMacintoshで使用 EUC ... 主にUNIXで使用 Unicode ... 日ではま

  • 文字コード表 日本語EUC(euc-jp)

    EUCの1バイトコード(半角文字)のエリア 0x00〜0x1f、0x7f は制御コードです 0x20〜0x7e はASCII文字です EUCの2バイトコード(全角文字)のエリア(JIS X 0208の漢字エリア) 上位1バイト  0xa1〜0xfe 下位1バイト  0xa1〜0xfe その内、水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです EUCの半角カタカナのエリアは2バイトコードで別にエリアに設けています 上位1バイト  0x8e 下位1バイト  0xa1〜0xdf

  • 1