タグ

文字コードと行政に関するardarimのブックマーク (17)

  • 電子行政における第3・第4水準漢字

    JIS X 0213 for e-Government Koichi YASUOKA ( 606-8265 47) Center for Informatics in East Asian Studies, Institute for Research in Humanities, Kyoto University (47 Kitashirakawa-Higashi-Oguracho, Sakyo, Kyoto 606-8265 JAPAN) 2014 8 JIS X 0213 3 4 1, 2) 3 3, 4) 3 5) 303 2,136 3,000 3,000 JIS 1 JIS 2 3,000 3,000 1 2 2,136 6) 1 2 2,132 4 ( ) 3 5) 1,022+22 7) 姸 幷 42 3 3,000 1 2 3,000 8) 3,000 8) 3,000

  • 第1回 「個人番号」では串刺し検索ができない

    マイナンバー法案が、国会で審議中だ。システム調達は巨額で、特需が生じると分析する向きもあるが(関連記事)、システム調達費用が巨額になるのには、それなりに理由がある。マイナンバーはかなり複雑なシステムであり、要求要件が非常に難しいからだ。 連載では、マイナンバーのシステムが抱える複雑さや、システムを開発する上での難しさを解説する。連載第1回である今回は、マイナンバーがどのような設計原理に基づいているのか。以下に示した図を基に、例を挙げて説明しよう。 サーバーをまたいでの串刺し検索が許されていない マイナンバーの特徴は、「個人番号を使ったサーバーをまたいでの串刺し検索が、一切できない」という点にある。例として、「ある人物の年金加入記録を郵送したところ、転居先不明で日年金機構に戻ってきてしまった」という場合を考えてみよう。 マイナンバーを導入すると、日年金機構は以下の手順で、転居先を調べる

    第1回 「個人番号」では串刺し検索ができない
    ardarim
    ardarim 2013/05/17
    システム受注するベンダーは売上も大きいけど開発や保守が大変そうだな…。ここまでして不完全なシステムをごり押しする理由ってなんなんだろ
  • [続報]住基ネット障害の原因は「文字化け」、231市町村に影響

    2013年3月26日から発生していた住民基台帳ネットワークシステム(住基ネット)の障害の原因が、データベース(DB)に情報を書き込む際の文字コードの誤り(文字化け)にあったことや、障害が影響した市町村の合計が231に及んでいたことなどが分かった。総務省が4月2日に発表した(関連記事:全国200の自治体で住基ネットが利用不可能になる障害が発生)。 今回の障害は、自治体にある住民基台帳システムと住基ネットを接続する「コミュニケーションサーバー」のハードウエアとOSを231の自治体で更新し、それに伴い、コミュニケーションサーバーのアプリケーションに対して、新OSに対応させる修正プログラムを適用することで発生した。 コミュニケーションサーバーのアプリケーションは、氏名・住所・生年月日・性別という4つの「人確認情報」を、DBサーバーである「Oracle Database」に保存する際に、住基ネ

    [続報]住基ネット障害の原因は「文字化け」、231市町村に影響
  • 常用漢字は「外字」なのか | yasuokaの日記 | スラド

    榎並利博の『電子行政における外字問題の解決に向けて』(富士通総研経済研究所研究レポート, No.400, 2013年2月)を読んでほしい、とアチコチから連絡をいただいた。読んでみたのだが、2010年の『常用漢字表』改定にまつわる議論を全くフォローしておらず、そのために、正直かなり頓珍漢な内容となっている。それを端的に示しているのが、【追補2】の以下の文章だろう(p.41)。 時代に即して合理的に物事を考え、外字問題を解決していくのは、来国語審議会の役割ではないだろうか。国語審議会の存在意義が問われていると言っても良いだろう。 存在意義も何も、国語審議会は2000年12月に、『表外漢字字体表』の答申をもって解散した。いまさら存在意義とか言われても、読者は困惑するばかりだろう。こういう調子なので、文化審議会国語分科会が答申した『改定常用漢字表』も全く理解しておらず、その結果、以下のようなわけ

  • 住基コードの「邉」と「邊」 | yasuokaの日記 | スラド

    思うところあって、住民基台帳ネットワーク統一文字の「邉」と「邊」に対して、現時点でのIVDがどう対応しているか、チェックしてみた。 9089 (U+9089 U+E0100) BD27 (U+9089 U+E0105) BD29 BD2A (U+9089 U+E0102) BD2B BD2C (U+9089 U+E010A) BD2D BD38 BD47 BD49 (U+9089 U+E0109) BD4A BD4B BD4C (U+9089 U+E010E) BD4E BD4F BD50 BD64 (U+9089 U+E0103) BD65 BD69 BD73 908A (U+908A U+E0100) BD45 (U+908A U+E0102) BD46 BD51 BD5E BD5F BD60 BD61 (U+908A U+E0107) BD62 BD63 BD6A (U+908A

  • 文字情報基盤構築のフォント公募 | yasuokaの日記 | スラド

    経済産業省の『平成22年度電子経済産業省推進費(文字情報基盤構築に関する研究開発事業)に係る委託先の公募』に関して、この3週間というもの、あちこちから私(安岡孝一)のもとに質問があった。いいかげん、同じことばかり答えるのも飽きてきたので、今までに答えた内容を、ざっと、ここにまとめておくことにする。 事業は、(1)文字情報基盤の将来像や課題を整理するための調査研究と、(2)この調査研究を進める上での調査の素材となるフォントの整備の2つの内容により構成される。

    ardarim
    ardarim 2010/09/02
    公募案を作るようなお役人さんたちはここまでの見識は持ち合わせてないってだけなのかな。ないから作ろうみたいな単純な話だと思ってるのかもしれない。
  • 「遷」の戸籍統一文字 | yasuokaの日記 | スラド

    『汎用電子情報交換環境整備プログラム成果報告書』(平成21年3月、日規格協会)を元に、戸籍統一文字とUnicodeとの対応表を作りかけているのだが、これがなかなかに手強い。まだ作業途中なのだが、U+9077「遷」に対応する戸籍統一文字は、443810、443930、444570、444170、443850、444060、444660の7つが見つかっている。しかも、この中には当用漢字字体表の「遷」は含まれていないようだ。うーむ。 また、対応上、微妙な問題を含む文字も数多くある。たとえば031240と000100は、私(安岡孝一)個人としては両方ともU+5341「十」に対応させてしまいたいところだが、それは「えだなし派」の方々には耐えられないだろう。けど、PRI 167の締切は待ってくれないし、さて、どうしたものか。

  • U+90F7 U+E0101というIVS | yasuokaの日記 | スラド

    Ken Lundeとも話したのだが、Adobe-Japan1のCID+13725を「U+90F7 U+E0101」というIVSで表現したのは、やはりまずかったように思う。もちろん、CID+13725は「郷」(U+90F7)の異体字なのは間違いないが、でも「鄕」(U+9115)の方が親字として適切だったと思うのだ。この問題が極端な形で現れたのが、今回のPRI 167のIP9115なのだが、このあたりに関して、私の知る限りのところを記しておこうと思う。 このIP9115のグリフは、元々、日規格協会の文字フォント開発・普及センターが平成7年度事業として、情報処理振興事業協会(IPA)からの請負委託により、平成明朝体W3の一部としてデザインしたものだ。この事業は、JIS X 0221-1995のJAPANESE IDEOGRAPHICS SUPPLEMENT 3の中で大漢和辞典に収録されている漢

    ardarim
    ardarim 2010/04/17
    いままでの文字行政の破綻がこういう避けられない形で表面化してきているのか。
  • 戸籍統一文字のIVS化 | yasuokaの日記 | スラド

    汎用電子情報交換環境整備プログラムのIVS化に対する登録レビューがちゃんと昨年度中に始まった、という連絡をいただいた。以前、日経ITproの「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」でも書いたが、日はJTC1/SC2/WG2/N3530で戸籍統一文字や住民基台帳文字なんかをISO/IEC 10646に追加要求している。でも、互換漢字での追加は、やっぱりブが悪そうなので、IVSによる追加も模索しているわけだ。 ただ、現状のドラフトは、ギリギリ昨年度内に仕上げたものなので、実はかなり問題がある。たとえば、JTFA2A「飯」は、来U+98EFの異体字として登録されるべきなのだが、ドラフトからは抜け落ちている。JTFA2B「飼」やIB0457「館」も、それぞれU+98FCとU+9928の異体字なのだが、やはり載っていない。端的に言えば、『汎用電子情報交換環境整備プログラム

  • 情報機器との関係で「叱・填・剥・頬」の許容について考慮すべき | yasuokaの日記 | スラド

    小形さんのとこ経由で、昨日の漢字小委員会の資料のコピーをいただいた。ざっと、目を通してみたのだが、資料2の『意見募集で寄せられた「意見の概要」』の以下の部分が、かなり気になった。 4 字体(67件) ○情報機器との関係で「叱・填・剥・頬」の許容について考慮すべき ○デザイン差として加える字について考慮すべき ○試案の字体に賛成 ○追加される字種の字体をこれまでの字体と統一すべきである この『情報機器との関係で「叱・填・剥・頬」の許容について考慮すべき』というのは、たぶん私(安岡孝一)の意見を含んでいると思うのだが、だとすると、「機器」というのを強調されるのは微妙にマズイ。というのも、現実の問題は「機器」で起こるのではなく、その間の「やりとり」において起こるからだ。 たとえば、文化庁ホームページの文字コードで示した例において、「𠮟」(口へんに七)をマトモに検索できるようにしようとすると、ユ

  • 文化庁ホームページの文字コード | yasuokaの日記 | スラド

    今日が「改定常用漢字表試案への意見」の〆切なので、景気づけに文化庁ホームページの「サイト内検索(e-Gov)」で、問題の4字を検索してみることにした。 「𠮟」検索不能 「塡」検索不能 「剝」検索不能 「頰」検索不能 …っていうか、このホームページ、そもそも文字コードがShift_JISなんだけど。その上、HIDDENパラメータの中に「JCODE=SJIS」ってのがあって、e-GovにはシフトJISしか渡せなくなってる。 仕方がないので、【改定常用漢字表試案への意見】テンプレートで最初に示した4字を、代わりに検索してみた。 「叱」31件ヒット 「填」65件ヒット 「剥」316件ヒット 「頬」6件ヒット ふーん。表外漢字字体表を9年前に答申して、5年10ヶ月前にはJIS X 0213まで改正させたのに、文化庁内部ですらまだこんな状態なのね。まあ、常用漢字表が改定されたら、e-Govの作り直し

    ardarim
    ardarim 2010/01/07
    まあ縦割り行政なんてそんなものでしょう…
  • 「シフトJIS」では対応不可能な新常用漢字表 | yasuokaの日記 | スラド

    今日発売された『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、早速、文化審議会国語分科会に陳情したいのだがどうしたらいいのか、という質問が複数あった。文中の どうしても「𠮟」がサポートできそうにないなら、その旨を文化審議会国語分科会に陳情する、という手も残されている。新しい常用漢字表は改正案の段階であり、2009年12月24日までは一般からのコメント(パブリックコメント)を受け付けているからだ。「𠮟」ではなく「叱」を常用漢字にしてほしい、あるいは、「𠮟」の「許容字体」として「叱」を認めてほしい、と陳情するのだ。 に呼応したものだ。とりあえず、パブリックコメントのページをお教えしたが、うーむ、文中にURLかメールアドレス(kanzihyo@bunka.go.jp)く

    ardarim
    ardarim 2009/12/22
    陳情しようにもそもそもシフトJISで書けないのか… こういうところに既に問題が潜んでいることを理解してるのかな
  • どうして常用漢字表を改定するハメになったのか | yasuokaの日記 | スラド

    『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、「そもそもどうして常用漢字表を改定しなきゃいけないんですか」と質問された。それはもちろん、平成17年3月30日に文部科学大臣から諮問第15号「情報化時代に対応する漢字政策の在り方について」が文化審議会に対して…、と答えかけて、私(安岡孝一)自身、途中で答につまってしまった。だって、文部科学大臣の諮問は、以下のようなものだったはずだ。 種々の社会変化の中でも,情報化の進展に伴う,パソコンや携帯電話などの情報機器の普及は人々の言語生活とりわけ,その漢字使用に大きな影響を与えている。このような状況にあって「法令,公用文書,新聞,雑誌,放送など,一般の社会生活において,現代の国語を書き表す場合の漢字使用の目安」である常用漢字表(昭和5

    ardarim
    ardarim 2009/12/22
    先に改定ありきで、なんとか作文したのかなあ。多分。
  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
  • MiAU勉強会の反省 - もじのなまえ

    前回のエントリでご案内した第4回 MIAU勉強会ですが、ぶじに終了。その画面資料ですが下記にて公開します。 RFCから見た新常用漢字表の矛盾と整合 以前にも書きましたが、自分の仕事については誉めてくれるより批判的な意見の方がより参考になります。参加者のご意見で最後に発言してくださった方が、文字コードの話の部分と新常用漢字表(仮)の部分とで違和感があるという趣旨の指摘をしてくださいましたが、あらためて画面を見直すと、たしかにそうだなあと。 会場では別の部分でお答えしたのですが、振り返ってみればもっと違う言いようがあった。わざわざ来てくださった直井さんも、後半が飛躍しすぎといっていたけど、おそらく同趣旨のことではないか。 この発表を考えていた際、ずっと思っていたことは、「一部のRFCやXMLで規定されている互換漢字の置き換え処理/使用禁止と、常用漢字表の考え方の間には共通点があるように思えるが

    MiAU勉強会の反省 - もじのなまえ
  • JIS X 0213は改正しないと新常用漢字表に対応できない? - もじのなまえ

    書いておかないと忘れそうなのでメモ。 前日のエントリに対するUnicodeさん、mashabowさんのご指摘について調べるうちに、ハタと気づいたこと。 完全に見落としていたのですが、今までなんとなく「新常用漢字表」の「(付)字体についての解説」の「1 明朝体のデザインについて」は、表外漢字字体表におけるそれと下位互換だと思っでいたのですが、まったくの思い違いでした。 表外漢字字体表の「表外字だけに適用されるデザイン差について」(漢字使用の実態への配慮から、字体の差と考えなくてもよいと判断したもの)で挙げられていたものを、新常用漢字表はまったくふれていません。そもそも新常用漢字表における「1 明朝体のデザインについて」は改定されていません。 表外漢字字体表で挙げられているうち、新常用漢字表の追加字種に関わるものは以下のとおりです。 A 画数の変わらないもの (2) 傾斜・方向に関する例 (3

    JIS X 0213は改正しないと新常用漢字表に対応できない? - もじのなまえ
  • 常用漢字の見直し(2009年1月19日) : 漢字・韓国語・中国語が好きな福岡人

    常用漢字の見直し(2009年1月19日) 昨日、経済産業省と文化庁に問い合わせをした。 経済産業省に問い合わせた理由は、 今回の『常用漢字表』の改定で試案が出る段階になり、 前から書いている4字体の件も含めて、 どういう見解なのか知りたかったからだ。 先ず経済産業省に問い合わせして、 産業技術環境局標準課情報電気標準化推進室に回してもらい、 そこの漢字を専門としている方に取り次いでもらった。 その方に新『常用漢字表』の試案では、 JIS X 0213でないと符号化できない 字体(「剥」「填」「頬」「叱」の印刷標準字体の4字体)が 出て来るが・・・、の話をすると、 JIS X 0208は旧規格であり、 今回の『常用漢字表』の改定はJIS X 0213で字体が表現できれば 問題ないとのことだった。 続けて『常用漢字表』の改定がされても、 JIS X 0208はもう改定することはないと。 この規

    常用漢字の見直し(2009年1月19日) : 漢字・韓国語・中国語が好きな福岡人
    ardarim
    ardarim 2009/01/27
    お役所仕事の典型という感じ
  • 1