エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
記事へのコメント2件
- 注目コメント
- 新着コメント
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
UTF-16は、実は5種類ある! - 小池啓仁 ヒロヒト応援ブログ By はてな
ユニコードは、コード自体は一つ(ユニーク)なのだけど、そのエンコードの方法には沢山があります。 よ... ユニコードは、コード自体は一つ(ユニーク)なのだけど、そのエンコードの方法には沢山があります。 よく使われるエンコードは、UTF-8とUTF-16です。 UTF-8は、Web系やPerlでよく使われていて、1バイト文字はアスキーコードと互換性があり、漢字は3バイトでエンコードします。 一方、UTF-16は、なんとUTF-16だけでも5種類のエンコード方法があるのです。知っていましたか? 基本的に文字を2バイトのコードで表現するエンコードです(今回サロゲートペアについての説明はパス)。 バイトの並び方の違いでビックエンディアンとリトルエンディアンがあり、なおかつ、各々にBOM(Byte Order Mark)が付くエンコードがあります。 まず、BOMの付かない、以下の2通りのエンコードがあります。 BOMの付かないビックエンディアンをUTF-16BEといます。 BOMの付かないリトルエンディ
2017/06/27 リンク