タグ

charsetに関するseiunskyのブックマーク (6)

  • いいから聞け! 俺が文字コードについて教えてやるよ Advent Calendar 特別編 - 谷本 心 in せろ部屋

    長らく更新の止まっている「いいから俺文字コード」シリーズですが、 このたび、Java Advent Calendarの一環として復活させました! Java Advent Calendarって? エントリーはJava Advent Calendarの5日目です。 Java Advent Calendarについては、以下のサイトをご覧ください。 http://atnd.org/events/22434 前の4日目は @akirakoyasu さんの「SDKで身近になるAmazon Web Service」 http://www.akirakoyasu.net/2011/12/04/easily-use-aws-through-sdk/ S3、SimpleDBSESの使い方をサンプルコードつきで紹介しています。 次の6日目は @shuji_w6e さんの「JUnit のセカイ」 http:/

    いいから聞け! 俺が文字コードについて教えてやるよ Advent Calendar 特別編 - 谷本 心 in せろ部屋
  • 日本語文字コード

    フォームメール(mb_send_mail)php ジェネレーター オープンフォトライブラリー自由に画像を登録・紹介できます 文字コード(日語漢字コード表) 日語漢字コード表が、Shift-JIS、EUC-JP、JIS、UTF-8と複数存在する事から、 ホームページ作成・維持管理、データ収集をする上で、文字コードについての多くの諸問題が発生します。 その解決に少しでもお役に立てれば幸いです 文字コード表(実体) シフトJISコード表 Shift-JIS による一覧表 EUCコード表 EUC-JP による一覧表 JISコード表 JIS による一覧表 JIS X 0201 (1976) to Unicode 文字コード表 Shift-JIS による一覧表 JIS X 0208 (1990) to Unicode 漢字コード表 Shift-JIS による一覧表(UTF-8のコードはこちらにあり

    seiunsky
    seiunsky 2009/08/19
    おぉ、すごい。これは昨年くらいに知っていれば有効活用できたのにな・・・><
  • Web上の日本語EUCデータに指定すべきエンコーディングは何か - なるせにっき

    語EUCは当初、G0にUS-ASCII、G1にJIS X0208-1990、G2にHalf Width Katakana、G3にユーザ定義文字が定義されていました。その後、これを拡張しつつ多くの亜種が作られました。まずはこの亜種のうちの主要なものを挙げます。 まず、日語EUCの国家標準は結局作られませんでしたが*1、IANA Character Set Registry*2に登録されているEUC-JP*3(以下、この仕様をeucJPと呼ぶ)は「標準」にかなり近いものということができるでしょう。これはG0にUS-ASCII、G1にJIS X0208-1990、G2にHalf Width Katakana、G3にJIS X0212-1990を指定しています。つまり、このエンコーディングはJIS X 0212を収録しているのが特徴です。 次に、eucJP-open系があります。このエンコー

    Web上の日本語EUCデータに指定すべきエンコーディングは何か - なるせにっき
  • NKF の --cp932 オプションがおかしい - tmtms のメモ

    いや --cp932 の来の動きを知らないので、おかしいというより自分の期待通りではないというべきかもしれません。 文字コードの変換の際、JIS 規格じゃなくて Windows がやっているような変換をして欲しいときに、--cp932 をつけとけば良きにはからってくれるんじゃないかなぁ…と漠然と思っていたのです。 UTF-8 から ISO-2022-JP への変換の場合、「-Wj --cp932」としておけばよいと思ってたらうまくいきません。梯子高を変換してみます。 $ ruby -rnkf -e 'puts NKF.nkf("-Wj --cp932", "\xe9\xab\x99").unpack("H*")' 1b242844747b1b2842「1b24427c621b2842」を期待したのですが「1b242844747b1b2842」になってしまいました。これじゃアレなので見やす

    NKF の --cp932 オプションがおかしい - tmtms のメモ
    seiunsky
    seiunsky 2009/06/12
    NKFの動作・オプションについて。ここら辺の情報ってあまりないので助かります></っていうか、 --oc なんてオプションあるのね・・・
  • character-sets

    Last Updated 2022-07-14 Available Formats XML HTML Plain text Registry included below Character Sets Registration Procedure(s) Expert Review Expert(s) Martin Dürst Reference [RFC2978] Note These are the official names for character sets that may be used in the Internet and may be referred to in Internet documentation. These names are expressed in ANSI_X3.4-1968 which is commonly called US-ASCII or

    seiunsky
    seiunsky 2008/12/01
    文字コードのおそらく、正式名称
  • 文字化け - BugbearR's Wiki

    2017-04-16 FreeBSD/mpd 2016-12-23 RecentDeleted Blogアプリ 日記 2016-11-17 当にあった怖いコード/1 2016-05-16 .NET 2015-07-06 書きたいこと 2015-07-05 postgres Java/変数の初期化に安易に空オブジェクトを代入しない 2015-06-30 PukiWiki/1.4/マニュアル/プラグイン/u 当にあった怖いコード/15 2014-10-01 日記/2014-10-01 2014-09-09 日記/2014-09-09 2014-08-13 日記/2014-08-10 2014-05-28 バグパターン/日時 バグパターン 2014-04-13 IPv6 2014-03-20 パスワード問題 2014-01-27 DNS/ルートサーバーは13台という神話 2014-01-25

  • 1