タグ

文字コードに関するvndnのブックマーク (5)

  • character-sets

    Last Updated 2022-07-14 Available Formats XML HTML Plain text Registry included below Character Sets Registration Procedure(s) Expert Review Expert(s) Martin Dürst Reference [RFC2978] Note These are the official names for character sets that may be used in the Internet and may be referred to in Internet documentation. These names are expressed in ANSI_X3.4-1968 which is commonly called US-ASCII or

  • rawurlencodeの文字コード

    rawurlencodeって文字コードによってエンコードの結果が違うのね。 おかげで少々ハマった。 例えば、「ぬこー」という文字列の場合だと EUC 「%A4%CC%A4%B3%A1%BC」 Shif-JIS 「%82%CA%82%B1%81%5B」 UTF-8 「%E3%81%AC%E3%81%93%E3%83%BC」 という感じ。 とりあえず自分用にrawurlencodeを各エンコードで実行する スクリプトを作ってみた。 rawurlencode変換器 あと、いつも思うんだけど、PHPの関数の実行結果を ちょっと見てみたいってときに、web上にそういうのを 手軽に実行できるようにしてるところがなんでないんだろう。 md5の計算はphpspotさんのところにあったけど、sha1とかpreg_matchとかを ちょっと試せたら嬉しいのにな。 また自分用に必要になったら作ろう。

    rawurlencodeの文字コード
  • UTF-8で変換できない機種依存文字を置換する

    Summary UTF-8 のページから (株) や ローマ数字の I などの文字をメールで送信すると,文字化けする. 文字化けしそうな文字を,ad hoc に機種依存しない文字に変換する. ローマ数字もカッコで括るか,スペースを挿入したほうが良いかも. Source function replaceText($str){ $arr = array( /* --- 0x2100 - 0x2138 (文字種記号) --- */ // 0x2100 - 0x210F '\xE2\x84\x80' => 'a/c', '\xE2\x84\x81' => 'a/s', '\xE2\x84\x82' => 'C', '\xE2\x84\x83' => '?', '\xE2\x84\x84' => '?', '\xE2\x84\x85' => 'c/o', '\xE2\x84\x86' => 'c/u

  • 美しき日本語の悲しい定め - ビジネススタイル - nikkei BPnet

    美しき日語の悲しい定め なにがなんでも社長の名前はこの漢字で! ほとんどの制作現場で、困った経験があると思われるのが「旧漢字問題」である。企業Webサイトの役員一覧などの氏名表記を、「社長の苗字はこの漢字で表示して」と旧漢字を指示されることだが、はっきりいって、悩ましい展開になる場合が少なくない。とりわけ会社案内などの印刷物を拡大コピーし、「この漢字」とFAXで送られてくると、間違いなく厄介な状況が長引く。 既にお気づきかもしれないが、要するに、JIS第一水準・JIS第二水準にはない漢字を表示せよ―とのご指示である。正直なところ、これには困ってしまう。 どういうわけか、役員などの皆さまには、旧漢字の氏名をお持ちの方が多い。いや、逆に旧漢字の氏名をお持ちだからエラクなるのか、とにかくフォントがない文字を表示せよとの厳命なのだ。まるで錬金術ならぬ錬文字術で、無から有をつくれと指示され

  • これでもmbstringの自動文字エンコード認識を使いますか? - よくきたblog

    $ php -dmbstring.language=Japanese -dmbstring.internal_encoding=EUC-JP -r ' mb_language( "ja"); var_dump( mb_detect_encoding( "あいうえお", "Shift_JIS,UTF-8,EUC-JP,ASCII"));' string(4) "SJIS"

  • 1