タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

仕事とツールと文字コードに関するdaisukeeHTNのブックマーク (1)

  • UTF-8のBOM付き・BOM無しの違いと確認方法

    文字コードの一種であるUnicodeにはBOM無しとBOM付きの2種類が存在します。BOMはバイトオーダーマーク(byte order mark)の略で、Unicodeで符号化したテキストの先頭に付与される数バイトのデータのことです。 今回はUTF-8のBOM付き・BOM無しの違いと確認方法について紹介します。 BOM付き・BOM無しの違いについて プログラムがテキストデータを読み込む際に先頭の数バイトによりUnicodeのデータであることやどの種類の符号化形式を採用しているのかを判別しています。BOM付きのUTF-8であれば先頭の3バイトがBOMであり、<0xEF 0xBB 0xBF>というデータになります。 Microsoft ExcelなどのアプリケーションによってはBOM付きでなければ符号化方式がUTF-8なのかUTF-16なのか、またはUTF-32なのか、あるいはまったく別の文字

    daisukeeHTN
    daisukeeHTN 2020/04/17
    TeraPad、秀丸、メモ帳の仕様
  • 1