タグ

関連タグで絞り込む (2)

タグの絞り込みを解除

文字コードに関するhoppieのブックマーク (2)

  • Ruby - 闘うITエンジニアの覚え書き

    Ruby on Railsで一躍有名になったスクリプト言語。 オブジェクト指向的な言語構造になっているが、通常の手続き型のプログラミングも可能。 Rubyは、強力なテキスト処理能力、シンプルな文法などの特長を持つ。 インタプリタ型言語なのでコンパイルは不要。 《関連》 ・Rubyのインストール ・Rails のインストール ・Ruby on Rails ◆使える文字コード一覧の確認 ruby -e "puts Encoding.name_list" ◆規定の外部エンコーディングの確認 ruby -e "puts Encoding.default_external" ◆DB、外部ファイルの文字コード周りのエラー対応 エラー例) invalid byte sequence in Windows-31J → 外部エンコーディングの指定で解決 ※環境変数LANG 又は Encoding.defau

  • 統計学の力を借りて、文字化け退散! | 月と燃素と、ひと匙の砂糖

    どの方式も、ASCIIを基として、ASCIIでは使われていないデータ部分を使って日語(やその他の言語)を表現しています。その使い方はそれぞれの符号化方式で異なるため、「このデータの並びはShift_JISでしか使われないはず…だから、このテキストはShift_JISだろう」みたいな感じで、文字コードの推定ができます。 たとえば、昔のYahoo!JapanはEUC-JPで書かれていた(今はUTF-8)のですが、そのとき、ページの最初のほうにこんな感じのコメントが入っていました。 <!-- 京 --> 趣味によっては「美乳」とか使うみたいです(笑 この「京」や「美乳」をEUC-JPでエンコードしたバイト列、「0xB5 0xFE」や「0xC8 0xFE 0xC6 0xFD」は、Shift_JISにもISO-2022-JPにも、さらにUTF-8にも決して現れないデータの並びです。だから、ブラウ

  • 1