記事へのコメント23

    • 注目コメント
    • 新着コメント
    kappaseijin
    kappaseijin ケン・トンプソンの業績たどったらUTF-8もロブ・バイクと作っていた。さす。UTF-8は'/'を含まないのでFileSystemSafeって別命あるけどPlan9のために作ったのね。納得

    2022/02/05 リンク

    その他
    hiroomi
    hiroomi “UTF-8は、データ交換方式・ファイル形式として一般的に使われる傾向にある。”

    2018/12/23 リンク

    その他
    meg_nakagami
    meg_nakagami “サロゲートペアのままUTF-8と同等の符号化を行う符号化は、CESU-8 (Compatibility Encoding Scheme for UTF-16: 8-Bit) として別途定義されている。”

    2016/03/31 リンク

    その他
    ngyuki
    ngyuki 知らなかった。。。 "Unicodeによる定義[6]とIETFによる最新の定義[7]では、5-6バイトの表現は不正なシーケンスである。"

    2013/05/28 リンク

    その他
    tsupo
    tsupo 脚注9: 現在のOracle Databaseでは、CESU-8を「UTF8」として、「普通のUTF-8」を「AL32UTF8」として扱っているため注意を要する

    2013/04/03 リンク

    その他
    kovayan
    kovayan BOMで詰まる

    2013/03/22 リンク

    その他
    grafi
    grafi エンコード体系がなんか再帰的っぽくて楽しい。

    2012/03/07 リンク

    その他
    speg03
    speg03 実行可能スクリプトでバイト順マーク(BOM)がついているとシェバング(#!)が機能しない。

    2012/01/18 リンク

    その他
    sucrose
    sucrose ChromeでBOMの有無でつまった

    2011/09/22 リンク

    その他
    syuu1228
    syuu1228 @fedorakenken 何を知りたいのか知らんけど

    2011/06/29 リンク

    その他
    hoppie
    hoppie しかし、テキストデータがUTF-8で符号化されていることの標識として、データの先頭にEF BB BF (16進。UCSでのバイト順マークU+FEFFのUTF-8での表現) を付加することがある。

    2011/01/28 リンク

    その他
    DNPP
    DNPP なお、1バイトが9ビットである処理系では、この問題をあまり発生させずに符号化できるはずである。このアイディアに基づいたジョークRFCがRFC 4042 “UTF-9” として2005年4月1日に公開された。

    2010/12/26 リンク

    その他
    asari3
    asari3 Unicodeによる定義[5]とIETF による最新の定義[6]では、5〜 6バイトの表現は不正なシーケンスである。

    2010/07/12 リンク

    その他
    FTTH
    FTTH 「なお、1バイトが9ビットである処理系では」 ←本題じゃないけどあるのかそんなの。「1バイト=8ビット」は辞書的な定義だと思ってたよ。

    2009/11/20 リンク

    その他
    pha
    pha UTF-8NとかUTF-8-MACとかあるのか よくわからん。。。

    2009/11/20 リンク

    その他
    stibbar
    stibbar ASCIIと同じ部分は1バイト、その他の部分を2〜6バイトで符号化する。4バイトのシーケンスでは21bit(0x1FFFFF)まで表現することができるが、Unicodeの範囲外となる17面以降を表すもの(U+10FFFFより大きなもの)は受け付けない。また5

    2009/10/26 リンク

    その他
    skyriser
    skyriser BOMとか日本語は4バイトだったりとかの話。 日本語3バイトは知ってたけど4バイトもあったのか…。

    2009/01/13 リンク

    その他
    masakanou
    masakanou 読む

    2008/06/05 リンク

    その他
    overdrive_596
    overdrive_596 bomについて。>UNIX系ではbomがあると先頭のインタプリタコマンドを認識しない。

    2008/05/14 リンク

    その他
    night_hike
    night_hike バイトオーダーマーク(BOM)「BOMありをUTF-8、なしをUTF-8Nと呼ぶこともある(ほぼ日本のみ)」BOMが余分なデータとみなされて問題となる場合もあれば、逆にBOMがないとUTF-8と認識できないプログラムも存在する

    2008/04/28 リンク

    その他
    hizous
    hizous 「UTF-8のBOMを認識しないプログラムでは、BOMが余分なデータとみなされて問題となる場合もある。逆にBOMがないとUTF-8と認識できないプログラムも存在する。」

    2008/01/10 リンク

    その他
    mogwaing
    mogwaing 文字境界の判別方法

    2007/03/11 リンク

    その他
    paella
    paella UTF-8がどういうデータ構造を持っているか。文字コードの判別処理に必要なものなので、覚えておこう

    2007/02/28 リンク

    その他

    注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています

    アプリのスクリーンショット
    いまの話題をアプリでチェック!
    • バナー広告なし
    • ミュート機能あり
    • ダークモード搭載
    アプリをダウンロード

    関連記事

    UTF-8 - Wikipedia

    * 第1バイトがE0のときに第2バイトが80-9Fの範囲を、または同F0のときに80-8Fの範囲を取るものは冗長な...

    ブックマークしたユーザー

    • kappaseijin2022/02/05 kappaseijin
    • Itisango2021/01/04 Itisango
    • hiroomi2018/12/23 hiroomi
    • mnru2018/09/04 mnru
    • shiumachi2018/01/04 shiumachi
    • naochin2017/11/08 naochin
    • mixedjuicegofyugofyu2017/01/03 mixedjuicegofyugofyu
    • meg_nakagami2016/03/31 meg_nakagami
    • kjw_junichi2015/04/17 kjw_junichi
    • TokyoIncidents2014/11/28 TokyoIncidents
    • otauwohikki2014/07/01 otauwohikki
    • kadoppe2014/01/30 kadoppe
    • hirom122013/08/19 hirom12
    • nabinno2013/07/16 nabinno
    • susumu_bb2013/07/11 susumu_bb
    • ngyuki2013/05/28 ngyuki
    • i-saint2013/05/20 i-saint
    • tsupo2013/04/03 tsupo
    すべてのユーザーの
    詳細を表示します

    同じサイトの新着

    同じサイトの新着をもっと読む

    いま人気の記事

    いま人気の記事をもっと読む

    いま人気の記事 - テクノロジー

    いま人気の記事 - テクノロジーをもっと読む

    新着記事 - テクノロジー

    新着記事 - テクノロジーをもっと読む

    同時期にブックマークされた記事