[B! charset] tzk2106のブックマーク

tzk2106 id:tzk2106

charsetに関するtzk2106のブックマーク (2)

漢字コードについて - とほほのWWW入門
コンピュータの内部では文字を数値として扱います。例えば 'A' という文字には65(16進数で0x41)というコードが割り当てられています。これを文字コードと呼びます。アルファベットや数字などのいわゆる半角文字は1バイト(8ビット)で表すことができますが、日本語の漢字を含む文字コードは最低でも2バイト(16ビット)を必要とします。この、漢字を含む多バイト系のコードを漢字コードと呼びます。(実際にはひらかな、カタカナ、全角英数字も含まれるので漢字コードという呼び名は適切ではないのですが...) 現在主に使用されている文字コードの体系として以下のものがあります。 ASCIIコード ... いわゆる半角英数文字 JISコード ... 電子メール転送などに使用シフトJIS ... 主にWindowsやMacintoshで使用 EUC ... 主にUNIXで使用 Unicode ... 日本ではま
tzk2106 2017/07/14
文字

漢字

文字コード

jis

charset
リンク
文字コード表日本語EUC(euc-jp)
EUCの1バイトコード（半角文字）のエリア 0x00〜0x1f、0x7f は制御コードです 0x20〜0x7e はASCII文字です EUCの2バイトコード（全角文字）のエリア（JIS X 0208の漢字エリア）上位1バイト　 0xa1〜0xfe 下位1バイト　 0xa1〜0xfe その内、水色エリアはJIS X 0208 (1990) to Unicode 漢字コード表に存在しないコードです EUCの半角カタカナのエリアは2バイトコードで別にエリアに設けています上位1バイト　 0x8e 下位1バイト　 0xa1〜0xdf
tzk2106 2017/07/14
漢字

文字コード

unicode

日本語

EUC

charset

　正規表現
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx