タグ

文字コードと中国に関するardarimのブックマーク (3)

  • 中国人を悩ませるレアな名字の文字コード問題

    印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」(信息技術中文編碼字符集)が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される」と反射的に考えてしまうかもしれないが、これは文字コードの標準規格を新たに導入するという話だ。珍しい名字などに使われ、既存の文字コードに未登録の漢字に対応しようというものになる。 中国の面積は日の国土の約25倍で、約14億人の人口を擁している。一部の地域限定で使われている漢字や、少数民族の固有名詞でのみ用いられている漢字もある。文字コードに含まれない漢字を使っている人は約6000万人もいるそうだ。例えば、山東省青島市郊外にシュイユー村という地元ではまあまあ

    中国人を悩ませるレアな名字の文字コード問題
    ardarim
    ardarim 2023/05/31
    日本にも戸籍文字の問題があるけどその規模がデカい版だな / ↓今回は国内規格GBへの収載なのでUnicode対応はまだ先ですかね
  • Chinese to Chinese Conversion

    The Pitfalls and Complexities of Chinese to Chinese Conversion 汉字简繁转换的复杂性和陷阱 漢字簡繁轉換的複雜性和陷阱 Jack Halpern President, The CJK Dictionary Institute Jouni Kerman Chief of Software Development, CJK Dictionary Institute Contents Abstract 1. Introduction 2. The Four Conversion Levels 3. Discussion and Analysis 4. A New Conversion Technology Acknowledgements References Appendixes About the Authors The CJK

  • GB 18030の 「𢒉」 | yasuokaの日記 | スラド

    山東省の一部の地域にある「シャン」という姓の漢字(文字の上部が彡、下部が且)は非常に珍しく、漢字コードが割り当てられていなかった。このため、運転免許証や銀行通帳に正しい姓名を印刷することができない。 このような煩わしさを解決するため、シャン一族は発音が同じ別の2種類の漢字を、姓として使うことにした。 それって、U+22489の「𢒉」なので、GB 18030だと[95 39 B7 39]にあると思うのだけど…。ちなみに、元ネタの中国新聞網のページでも、やはり「𢒉」がコンピュータで使えない文字として紹介されている。うーむ、GB 18030って山東省には普及してないのかしら?

    ardarim
    ardarim 2010/08/18
    地方政府だとGB18030なんて知らない古いシステム使ってたりするんじゃないかしらん。繁体の話だけどこういうネタとかに近いかも→http://tw.myblog.yahoo.com/kelly-cave/article?mid=11999&sc=1
  • 1