タグ

文字コードに関するyassan0627のブックマーク (6)

  • RubyでShiftJISのファイルを扱う(1.9.3, 2.0系対応版)|TechRacho by BPS株式会社

    morimorihogeです.更新が不定期ですみません.最近夕立が改二になりましたが3-4が越せません.(*1 普段Ruby/Railsを使っていると,基的に文字コードはUTF-8を使っているかと思います.Rubyは割と文字コードについてはバージョン毎に扱いが変わっており,以下の様な挙動になります. 1.8.7以前: デフォルトUS-ASCII,日語を扱う際は$KCODEの指定を明示的に呼び出す 1.9.3以前: デフォルトUS-ASCII,日語を扱う際はcoding: utf-8等のマジックコメントを記述する 2.0.0以降: デフォルトUTF-8 というわけで,ここ最近のプロジェクトRuby 2.0系を使うのであれば,マジックコメントも何も必要無くUTF-8を使うことができます. しかし,レガシーシステムとの連携といった理由で他の文字コードのデータを読み書きする必要は依然存在し

    RubyでShiftJISのファイルを扱う(1.9.3, 2.0系対応版)|TechRacho by BPS株式会社
  • Unicode一覧表

    Unicode(UTF-8)の文字コード表を出力します。区分名に「*」が付いているものは合成用文字です。 表示: 【使い方】 左肩の区分メニューをクリックすると、その区分にある文字を一覧表で表示します。 一覧表の文字やコード番号をクリックすることで、上記フォームに文字が入力表示されます。 様々な機器で見比べることでフォントの違いを比較することが出来ます。 ブラウザの設定や、OSに組み込まれたフォントの仕様によって表示される文字が異なります。 文字コードを調べたいときは、フォームに文字を入力し、検査ボタンを押してください。 コード表の右上にあるURLをクリックするとURLの後ろに#で始まるハッシュがつきます。そのURLをブックマークすることで、表示の区分を直接開くことが出来ます。 【ご注意】 全コードの出力はかなり大きな表となるため、ブラウザの動作が遅くなったり、動かなくなる場合があります。

  • PHP5.4のhtmlspecialcharsに非互換問題

    第3引数を指定していない場合の影響前述のように、htmlspecialchars関数の第3引数を指定していない場合、PHP5.3までは、文字エンコーディングがISO-8859-1が指定されたとみなされます。この場合、入力内容にかかわらず不正な文字エンコーディングと判定されることはありません。したがって、文字エンコーディングのチェックが働かない代わりに、エラーになることもありませんでした。 これに対して、PHP5.4の仕様により文字エンコーディングがUTF-8とみなされた場合に、Shift_JISやEUC-JPの2バイト文字が入力されると、高い確率で「UTF-8として不正」というエラーになり、htmlspecialchars関数の出力は空になります。つまり、プログラムが正常に動作しません。 htmlspecialchars関数の第3引数を指定しておらず、内部文字エンコーディングがShift_

  • 付録D URLエンコーディング(URLエンコード または URLエスケープ)

    フォームから問い合わせ文字列を受け取ったり、 クッキーを発行するとき、 HTTPプロトコルとCGIが適正に処理できるデータ形式に変更する必要があります。 そこで、 付録Dでは、 HTTPクライアントとCGIプログラムで行われている、 URLエンコーディングについて解説します。 実はRFCで"%16進数表記"でエンコードしなくて良い文字が規定されてはいます。 しかし、 実際にエンコードされる文字はプログラムによってまちまちで、 統一されているわけではないのが2003年8月の現状です。 D.1 URLエンコーディングとデコーディング まずは手っ取り早くURLエンコーディングの方法とデコードする方法について挙げ、 後からじっくりとHTTPやCGIの仕様ではどうなっているか解説します。 D.1.1 エンコードする方法 URLエンコードは1文字(ただし1バイト = 1オクテット)毎に行います。 その

  • PHPの文字化けを本気で解決する - ぎじゅっやさん

  • [PHP4]phpの文字化けとphp.iniの設定

    output_buffering = On output_handler = mb_output_handler magic_quotes_gpc = Off default_charset = Shift_JIS [mbstring] mbstring.language = Japanese mbstring.internal_encoding = EUC-JP mbstring.http_input = auto mbstring.http_output = SJIS mbstring.encoding_translation = On mbstring.detect_order = auto mbstring.substitute_character = none output_buffering = Off magic_quotes_gpc = Off default_charse

  • 1