タグ

rubyとm17nに関するmrknのブックマーク (2)

  • Ruby 1.9 で絵文字変換 - なるせにっき

    浅草 jpmobile 会議 なる場で、Ruby 1.9 で絵文字変換したいときはどうすることになるのか説明せよというので、資料として書く。 利用者側がどう使うかは Ruby M17N の設計と実装 や るりま の String#encode や Encoding、Encoding::Converter クラスあたりを見てください。 で、実装の話です。 Encoding を司るのは encoding.c 各Encoding の体は enc/*.c 変換器を司るのは transcode.c 各変換器の体は enc/trans/*.trans 各変換テーブルは enc/trans/*-tbl.rb つまり、 各ケータイ文字コードに対応する encoding のファイルを作る (実は CP932 や UTF-8 のレプリカで良い (ENC_REPLICATE)) それぞれの encoding

    Ruby 1.9 で絵文字変換 - なるせにっき
  • Ruby 1.9.1のm17nについてメモ - monthly gimite

    2009/2/8追記: 今はもう↓の公式ドキュメントやid:macksさんのドキュメントなどいろんな情報が出ているので、このメモの存在意義は微妙ですが、一応1.9.1に合わせて修正しておきました。 多言語化 class String class IO この辺のドキュメントが見つからず(まだない?)、いろいろ試行錯誤して分かったことをメモ。 まず、Ruby 1.9では文字列オブジェクトがそれぞれ文字コードを持っている。 p "a".encoding #=> #<Encoding:US-ASCII> ファイルの先頭に # -*- encoding: UTF-8 -*- と書いておくと、文字列リテラルのencodingがUTF-8になる。 p "あ".encoding #=> #<Encoding:UTF-8> p "a".encoding #=> #<Encoding:UTF-8> これを書か

    Ruby 1.9.1のm17nについてメモ - monthly gimite
  • 1