タグ

politicsと文字に関するmyrmecoleonのブックマーク (7)

  • 基本4情報での名寄せは難しい|MORIDaisuke

    先日は住所の件でお楽しみでしたね。 私も楽しくなってしょうもないツイートをしたところ、@masanorkさんから有用な情報をいただいてしまいました。 異体字に加えて外字も根深いですし、日付型に収まらない住基の生年月日とか、屋号を含んだ個人事業主の口座名義とか、外国人氏名における住民登録のアルファベットと口座名義のカタカナとの解離とか、旧姓併記の例外処理とか、文字列型に刻まれたバッドノウハウの塊ですね https://t.co/GOaytijfst — Masanori Kusunoki / 楠 正憲 (@masanork) June 6, 2023 このとき、私はごく簡単な「名寄せの難しさ」の社内研修資料を作っている最中だったのですが、この情報が大変参考になりました。 一方、私だけが得をしているのがなんとなくムズムズしてきたので、ここにアウトプットしてスッキリしようと思います。 なお、住所

    基本4情報での名寄せは難しい|MORIDaisuke
    myrmecoleon
    myrmecoleon 2023/06/19
    「カタカナよりも揺れる気満々です。」揺れる気満々好き
  • 文字コード | 衆議院議員 河野太郎公式サイト

    2023.05.10 官報に使われる「官報文字」というものがあります。 そこには渡辺さんの「辺」の異体字が140文字も登録されています。 日語の常用漢字には2136文字ありますが、そこには邉や邊などは入っていません。 そこでJISの第四水準までを含むJIS X 0213という標準を定め、スマホやパソコンではここまでを標準的に表示できるようにしています。 ところが我が国の戸籍で使ってもよいとされている文字はそれを遙かに超えていて、少なくとも55,270文字もあります。 全ての国民の氏名をコンピュータで扱えるようになることを目指して、戸籍統一文字や住基ネット用の統一文字を網羅した「文字情報基盤」を2011年に策定し、それにあわせたフォントを作成し、無償で提供しています。 この「文字情報基盤」(MJ)には、58,862文字が含まれています。 しかし、このMJを全庁的に採用している自治体は、川口

    文字コード | 衆議院議員 河野太郎公式サイト
  • 47NEWS(よんななニュース)

    新潟佐渡市の最北端、海を眺めてゆったりどうぞ♪ 「SADO二ツ亀ビューホテル」が3月リニューアル! テラス新設、通年営業へ 世界遺産登録による訪日客の増加見込む

    47NEWS(よんななニュース)
    myrmecoleon
    myrmecoleon 2010/04/13
    「鳩山由紀夫首相は「平仮名の『がい』表記に意味がある」と語っていた」……。
  • 条例に絵文字は使えるか - 自治体法務の備忘録

    携帯電話でのメールをPCに送られると、絵文字が化けて正しい表示にならないのは皆さんご承知のとおり。あまり使用しないのも「オトナ」のルールですよね。 法制執務なんて、「オトナ」のルールの固まりみたいなものですから、絵文字なんてないかと思っていましたが、tihoujitiさんにご紹介が先を越された(http://d.hatena.ne.jp/tihoujiti/20091207/p2) 47都道府県これマジ!?条例集 (幻冬舎新書) 作者: 長嶺超輝出版社/メーカー: 幻冬舎発売日: 2009/11/26メディア: 新書購入: 9人 クリック: 243回この商品を含むブログ (12件) を見るに目を疑う実例がありました(52ページ)。 【川俣町「友♡ゆう♡の日」を定める条例】 (目的) 第1条 川俣町は、青少年の未来の豊かな個性や新たな文化の創造性を醸成するため、家庭や地域社会とのふれあいを一

    myrmecoleon
    myrmecoleon 2009/12/09
    事例があるのか。
  • 中国が簡体字の新規範漢字表をまもなく発表 - huixingの日記

    現在、中国では漢字の繁体字と簡体字をめぐっての論議がにぎやかだが、中国中国社会科学院が簡体字の規範漢字表をまもなく発表する予定だ。簡体字で問題となっている主に3つの事項について調整が入るもの。一つ目はまず同音代替の問題で、干犯、干净、干部、主干などの干はすべて同じ「干」であり簡素化しすぎているのでこれを調整する。2つ目は、符号代替の問題で、邓(鄧)の又部分と灯(燈)の丁部分と澄(澄)の登部分は繁体字では同じ登なのに簡体字でちがう部分に変わってしまっていることを調整する。3つ目は草書体の楷書化で、簡体字に応用されている草書体部分は楷書体とバランスがあわないのでこれを解消する。全体的に言えば今回の規範漢字表の発表では問題改正は除々に行われるもので、大規模な改正はないとのこと。この動きが当に実現すればいい方向に動いているといえる。まあ、個人的には广や贮のようなどう見てもバランスの悪い簡体字が

    中国が簡体字の新規範漢字表をまもなく発表 - huixingの日記
  • “情報化時代”に追いつけるか? 審議が進む「新常用漢字表(仮)」: 第3部 印刷文字から符号化文字へ第7回 『議員氏名の正確な表記』と人名表記の位相文字

    ● 書体の違いを規定する常用漢字表「明朝体活字と筆写の楷書との関係について」 前回は漢字字体の歴史をさかのぼることで、『議員氏名の正確な表記』(以下『正確な表記』)が「書体の違い」を無視してしまっていることを指摘した。しかし、このような事細かな漢字字体の歴史を、誰もが知っているはずもない。そのような中で衆議院事務局が書体の違いを無視してしまったとしても、それは仕方のないことではないだろうか? それが違うのだ。もう27年も昔から、これは数ページの簡単なルールにまとめられている。それが他ならぬ常用漢字表の「字体についての解説」だ。この中の一節「明朝体活字と筆写の楷書との関係について」では、以下のように書かれている。 字体としては同じであっても、明朝体活字(写真植字を含む。)の形と筆写の楷書の形との間には、いろいろな点で違いがある。それらは、印刷上と手書き上のそれぞれの習慣の相違に基づく表現の差

  • “情報化時代”に追いつけるか? 審議が進む「新常用漢字表(仮)」: 第3部 印刷文字から符号化文字へ第6回 漢字の字体史から見た『議員氏名の正確な表記』

    ● 日の明朝体には存在しない「縦棒の信」 前回は『議員氏名の正確な表記』(以下、『正確な表記』)の作成において、忠実に「書かれた字のとおり」を目指したつもりでも、しんにょうの形に見られるように実際には無意識のうちに包摂していることを指摘した。つまり『正確な表記』は、作成者が思っているほどには「書かれた字のとおり」にはなっていない。では、こうした矛盾が『正確な表記』そのものに、どのような影響を及ぼしているのだろう。以下、具体的に見ていこうと思うが、これにあたってまず第3回で図1として掲げたものを再掲する(図1)。 ◇図1 『議員氏名の正確な表記』にある字をMac OS Xの上から分類したもの。(1)ではUnicodeの符号位置を、(2)ではCID番号を併記した。(3)は筆者による作字。いずれもヒラギノ明朝を使用。(4)の吹き出し内のフォントのみMS明朝を使用。なお、ピンクで示したUnico

  • 1