タグ

Internetと文字コードに関するtsupoのブックマーク (10)

  • 携帯絵文字のSJIS拡張とUnicode PRIVATE AREA変換ルールはcp932と基本的に同じ - Bulknews::Subtech - subtech

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    携帯絵文字のSJIS拡張とUnicode PRIVATE AREA変換ルールはcp932と基本的に同じ - Bulknews::Subtech - subtech
    tsupo
    tsupo 2007/11/13
    こんなことに何で2年間きづかなったんだろうなぁ。 → miyagawaさんでも、こういうことあるのか。
  • KDDI/AUでutf-8のHTMLフォームから送られてくる絵文字コード - Bulknews::Subtech - subtech

    はてなグループの終了日を2020年1月31日(金)に決定しました 以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記 このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。 終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。 はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記 ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記 はてなグループ日記のエクスポートデータは2020年2月28

    KDDI/AUでutf-8のHTMLフォームから送られてくる絵文字コード - Bulknews::Subtech - subtech
    tsupo
    tsupo 2007/11/12
    マジックナンバー 1792 // 表示のほうのSJIS <-> Unicode の関連付けがめちゃくちゃすぎる上に softbank の絵文字領域 とかぶってるので、KDDI はこっちだけ使うように変更しろ → 絵文字いやーん
  • はてなダイアリーで欧州文字が表示できるのは国際化なのか? - in between days

    人力検索で「ダイアリーとグループ日記の違い」についての質問(question:1179986333)があって、大雑把にグループの利点としてUTF-8だから多言語なひとにはオススメ的なことを書いたところ、コメント欄でid:sibazyunさんから 私のダイアリーでは、utf-8で字上符(アクセント記号、ウムラウトの類)をいれているし、「編集」で過去のを見ると、utf-8ので出ています。つまり、欧文系を書くには問題ない、ということです。 http://q.hatena.ne.jp/1179986333#comment という物言いが付いたので調べてみました。結論から言うと確かに 欧文系を書くには問題ない です。実際の例を下に示します*1 テスト test à test ですが詳しく見てみるとこれはどうやら「UTF-8ではない」ようです。というかやはりEUCの仕様の枠内にあるシングルシフトという

    はてなダイアリーで欧州文字が表示できるのは国際化なのか? - in between days
    tsupo
    tsupo 2007/05/25
    「テスト test 醇A test」 → 「醇」になってるよ ><
  • Matzにっき(2007-03-12)「あいうえお」はインド由来

    << 2007/03/ 1 1. [Ruby] Rubyist Magazine - Rubyist Magazine 0018 号 2. ストレートタイプのスマートフォン「NOKIA E61」レポート 3. ITmedia エンタープライズ:TopCoderで世界と渡り合う日IBMの異才 - 夷藤勇人 4. My Sleepless Nights in the Big Apple: Apple、サブノート市場へ再参入へ 5. ITmedia Biz.ID:失敗しないプロジェクトマネジメント -- AppleはてなGoogleに学ぶ3つのヒント 6. 平成19年度「情報大航海プロジェクト(モデルサービスの開発と実証)」に係る委託先の公募について 7. [言語] PyCon 2007 Review 8. [Ruby] deep_science:Re:バザール「オープンソース、そして「R

    tsupo
    tsupo 2007/03/18
    インド方言の一つBrahmi語の文字一覧。ちょっと母音が多いがおおむね「あいうえお」の順番に並んでいる。他のインド語でも同様の順序らしい。子音も「あかさたな〜」に近い → そ、そーだったのか
  • - 教えて!goo

    tsupo
    tsupo 2007/03/14
    IEのみ、確認画面から「戻る」ボタンを押すと(「戻る」をクリックすると項目を入力する申込みフォームに戻ります)その申込みフォームが今度は文字化けします → (少なくともIE6では)これはどうしようもないです
  • ミラクル・リナックス:Samba 国際化プロジェクト > iconvについて

    オープンソースソフトウェアおよびフリーソフトウェアにおいてもソフトウェアの 国際化対応を行うために文字列処理の際に UCS(Unicode) を使う事が多くなってき ています。 UCS を用いる主な理由としては、各国のエンコーディングを考慮したコードを書か なくてもプログラム内部では UCS で処理して入出力の際にエンコーディング変換 を行えば良いという考えがあるようです。 UCS と各エンコーディングの変換を行う関数として iconv() がありますが、オー プンソースソフトウェアやフリーソフトウェアで利用されている libiconv や glibc2 での iconv() の実装では日語での利用が実用にならないという問題があ ります。 この問題に対して各ソフトウェアの日のコミュニティーが個別に対応していると いうのが現状で、必ずしも包括的な解決策がとられているわけではありません。

    tsupo
    tsupo 2007/03/05
    「libiconv/glibc」の問題点 に関する資料 / よくまとまってる。ただ、cp932 と Shift_JIS の間での変換を行なう場合の問題点とかまでは書かれてないですね。
  • ウノウラボ Unoh Labs: 日本語とPHP

    yamaokaです。 PHPで日語を扱う場合、mbstringモジュールを利用する場合が多いと思います。 日語に特有の機能(カタカナの全角/半角変換など)も備わっていて、とても便利です。 しかし、日以外ではmbstringモジュールはあまり利用されていないようです。 代わりに利用されているのがiconvモジュールで、 最近話題のフレームワーク、symfonyでも 国際化の機能を実現するために内部で利用されています。 iconvモジュールはPHP 5でPHP体に組み込まれました。 別途用意して組み込む必要があるmbstringモジュールと違って、最初から使用できるので便利ですね。 PHPのマニュアルのiconv関数のページを見ると、 いくつかの関数が定義されているのがわかります。 それぞれ、mbstring関数との 対応表を作ってみました。 iconv関数mbstring関数

    tsupo
    tsupo 2007/03/05
    Windows 版の iconv.dll の問題点をまとめたページ、作った方がいいかな。私自身は、iconv にパッチ当てる方法じゃなくて、自前のラッパでくるんで使ってます。iconv の問題はラッパで吸収するというやり方
  • memo.xight.org - PHPの文字化け - 5つの誤解と5つの対策

    Summary 設定すべき項目は以下. ;; Disable Output Buffering output_buffering = Off ;; Set HTTP header charset ; default_charset = EUC-JP ;; Set default language to Japanese mbstring.language = Japanese ;; HTTP input encoding translation is enabled. mbstring.encoding_translation = off ;; Set HTTP input encoding conversion to auto mbstring.http_input = pass ;; Convert HTTP output to EUC-JP mbstring.http_output

    tsupo
    tsupo 2007/02/15
    「デフォルトの文字コードのことではない」のになぜ default_charset という名前にしたのか? 「内部エンコードのことではない」のになぜ internal_encoding という名前にしたのか? 誤解させるのが目的?
  • 帰納法障碍: Bloglines & IE6 問題の対処法判明

    IE6 でBloglines のMy Feeds が表示されない問題の対処法が判明。 各所の情報を総合すると、「2バイト文字(要するにに日語)を含み、かつ、長すぎる」フィードタイトルをリネームすればオッケーの模様。 具体的には、Firefox など別なブラウザを使った上で「Show All」(オプションの表記は英語版)で全てのフィードを表示させ、左ペインのフィード名が化けてる(「?」などに置き換えられてる)モノを探して「Edit Subscription」で適当にリネームすればよい。右ペインのタイトルは化けててもいいみたいだ。 Firefox + IE Tab で検証しただけだが、素のIE でも恐らく大丈夫だろう。 ひとつでも化けてるとダメみたいなので、根気よく探していただきたい。 Firefox 愛用者の俺としては軽くなってラッキーくらいに思ってたのだが、困ってる人が多いみたいなので渋

  • yohgaki's blog - これからのプログラムの作り方 - 文字エンコーディング検証は必須

    (Last Updated On: 2016年3月3日)最近PostgreSQLMySQL両方にSJISエンコーディングを利用している際のエスケープ方法の問題を修正がリリースされています。この件は単純に「データベースシステムにセキュリティ上の脆弱性があった」と言う問題ではなく「アプリケーションの作り方を変える必要性」を提起した問題です。 参考:セキュアなアプリケーションのアーキテクチャ – sandbox化 PostgreSQLMySQLの脆弱性は特にSJIS等、マルチバイト文字に\が含まれる文字エンコーディングが大きな影響を受けますが、同類の不正な文字エンコーディングを利用した攻撃方法が他の文字エンコーディングでも可能です。例えば、UTF-8エンコーディングは1文字を構成するバイト列の最初のバイトの何ビット目までが1であるか、を取得してUTF-8文字として1バイト~6バイト必要なのか

    yohgaki's blog - これからのプログラムの作り方 - 文字エンコーディング検証は必須
    tsupo
    tsupo 2006/06/12
    最も単純な例としてはUTF-8文字の中にASCIIの特殊文字を埋め込む方法が考えられます。この壊れたUTF-8文字列をASCIIとして処理してしまうと様々な問題が発生してしまうことは容易に想像できます。
  • 1