タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

CharacterSetに関するkyousuke104のブックマーク (1)

  • [2] 様々な文字コード - インターネットメールの注意点

    なのですが、実際に使われるときは文字数とバイト数がうまく対応しなくて混乱するので注意してください。 例えば、ISO-2022-JPだとエスケープシーケンスが現われるたびに3バイトずつ増えます。 EUC-JPだと「次の文字はJIS X 0201」という意味で制御文字SS2を付けるので、1文字2バイトに見えるし、「次の文字はJIS X 0212」という意味で制御文字SS3を付けるので、1文字3バイトに見えます。 Unicodeはもっと複雑です。 更に、行の区切りを表す制御文字CRとLFがあれば、そのぶんバイト数が増えます。 [*] KI/KO 文献によっては、ESC $ @とESC $ BをKI、ESC ( BとESC ( JをKOと書いていますが、正しくありません。インターネット関連の規格には、KI/KOという言葉は出てきません。 日語拡張されたEBCDICにはKI/

  • 1