タグ

文字コードに関するkaeru-no-tsuraのブックマーク (32)

  • Unicode 版美乳テーブルを探せ

    美乳テーブルとは 「美乳テーブル」という物がある。 「EUC-JP の文章を Shift_JIS だと誤認識されない様に、EUC-JP 固有のバイト値を文章先頭付近に埋め込んでおく」という物。 具体的に、Shift_JIS には 0xFD と 0xFE が現れず、EUC-JP にはそれが現れるので、その値を含む文字コードを書いておこうという事で、その文字の集合に付いた名前。 “美” = 0xC8FE、“乳” = 0xC6FD。 各文字エンコーディングの事情 但し、これは EUC-JP での話。 一応、文章の先頭付近に日語の文字を書いておくのは、他の文字エンコーディングでも認識のヒントにはなるけど。 逆に「Shift_JIS の文章を EUC-JP だと誤認識されない様にする」には、EUC-JP にはないバイト値の 0x80〜0xA0 を書けばいいんだろうけど、これは沢山ありそうだから、慎

  • 余録:日本人の目には、どう見てもひらがなの「も」である… | 毎日新聞

    人の目には、どう見てもひらがなの「も」である。しかし、トルコで「₺」を見かけたら、それは通貨「リラ」を示すマークだ。円の「¥」にあたる▲以前は、「L」に横棒で、イギリスのポンドマークそっくりだった。先祖が同じ古代ローマの単位、リブラだから不思議ではない。それを2012年にわざわざ「₺」に変えた人は、当時のエルドアン首相、現大統領である▲いかりの右半分の形をしているため、エルドアン氏は「安全な港」の意味が込められていると強調していた。2の横棒は、厳密には20度の右肩上がりでなければならない。「評価の上昇」を表すそうだ。慢性的なインフレにより、通貨の評価は右肩下がりの連続だったのだ▲そのトルコリラに再び試練である。評価の急降下に見舞われ、歯止めをかけたい大統領は、国民に手持ちの米ドルや金を売ってリラを買い支えるよう呼びかける。安全な港どころではない▲荒波の上空には、トランプ米大統領による

    余録:日本人の目には、どう見てもひらがなの「も」である… | 毎日新聞
  • Jアラート訓練メールで文字化け | スラド IT

    Jアラートによる情報伝達訓練が18日に実施されたのだが、島根県と岡山県で訓練メールの文字化けが発生した。 文字化け部分は

    kaeru-no-tsura
    kaeru-no-tsura 2017/08/18
    文字コードといえば安岡さんだ
  • なぜ日本が世界共通語「Emoji」を生み出したのか、そしてその影響とは/古川健介『TOKYO INTERNET』|PLANETS

    なぜ日が世界共通語「Emoji」を生み出したのか、そしてその影響とは/古川健介『TOKYO INTERNET』 Daily PLANETSでは毎月第2水曜日に、古川健介さんの連載『TOKYO INTERNET』を配信しています。 今回のテーマは、日社会で生まれ世界中に普及した「Emoji」です。この独特の表現形式がどのようにして生まれたのかを、日語のデザイン特性や表現の歴史から紐解きます。 (イラスト・たかくらかずき) 絵文字の簡単な歴史を振り返る今回のテーマは「絵文字」です。絵文字の普及には日が大きな影響を与えており、日絵文字を生み出した、といっても過言ではありません。 絵文字の起源には諸説あり、いま使われているような絵文字の原型は、もともとはアメリカの雑誌で使われた顔文字から、という説(※1)や、「:-)」という横から見た時に笑顔に見えるという、英語圏の顔文字が起源だ、とい

    なぜ日本が世界共通語「Emoji」を生み出したのか、そしてその影響とは/古川健介『TOKYO INTERNET』|PLANETS
  • 葛の字の取り扱い - 葛城市

    市名の「葛」の字 葛城市の「葛」の字は、正しくは官報告示された「」の字です。 「 」は「」の字の異体字で、全く同じ意味を持つ漢字です。 � 市名が決まるまでの経緯 葛城市は平成16年10月に旧新庄町と旧當麻町が合併して誕生しました。 当時普及していたOS(WindowsXPやそれ以前のWindows等)を搭載したパソコンでは、「葛」の字は「」と表示されていました。 当時は特別なアプリケーションや外字等を使用しない限り、「 」を表示することは難しかったのです。 そのため、当時(平成15年)の合併協議の中で、パソコン等での申請などの利便性を考慮し、市の名前には「」の字を採用することが決まりました。 JIS漢字コード表の改正 このため、最近のパソコンでは、以前とは逆に「 」が標準で表示されるようになり、「」を表示するのが難しくなりました。 葛城市役所では、市役所へ提出される申請や届出の書類等に「

    kaeru-no-tsura
    kaeru-no-tsura 2016/02/29
    そしてこちらは決定のタイミングが悪く、改正後延々と迷惑を被ることになった側
  • 「葛」の字の不思議|葛飾区公式サイト

    このページ上では「」と「」の字も表示するために、ふたつの文字を画像処理しております。文字を拡大してご覧になりたい方は、PDFをご利用ください。 「かつしか」という地名 は古代のと呼ばれた地域のごく一部にしか過ぎません。古代の「かつしか」という領域は広大なものでした。古代の「かつしか」は、(・江戸川・墨田・江東区)と、千葉県市川・柏・流山・松戸・船橋市や埼玉県栗橋および茨城県古河・総和市までおよぶ広い地域がその範囲でした。 「かつしか」の地名は、当時の全体の地形的特徴を捉えることで説明ができます。つまり、「かつしか」の「かつ」は丘陵や崖などを指し、「しか」は砂州などの低地の意味をもっています。「かつしか」とは、利根川流域の右岸に低地、左岸に下総台地が広がる旧の地理的な景観から名付けられたと考えられます。 文字拡大版(PDFファイル 35.7KB) 「」と「」 ところで、「かつしか」という漢字

    「葛」の字の不思議|葛飾区公式サイト
    kaeru-no-tsura
    kaeru-no-tsura 2016/02/29
    やっぱり文字コード関係でいちばん問題が出るのは人名地名なんだなー
  • 漢これ - 漢字これくしょん

    まずはUnicodeの漢字にどのようなものがあるのか、コード表で確認しましょう。 Unicodeコード表 膨大な漢字を正しく表示するには、対応フォントが必要です。ここでは漢字の揃ってるフリーフォントを紹介します。 全てのUnicode漢字を含む 花園明朝フォント Adobeが開発したオープンソースのSource Han Sans (源ノ角)フォント IPAの戸籍・登記に対応したフォントIPAmj明朝フォント 漢字をただ眺めるための電子書籍です。いくつか種類がありますが、それぞれ収録漢字が違ったりフォントが違ったりします。EPUBがダウンロード可能な他、iBooksとKoboの電子書籍ストアでも無料ダウンロード可能です。 EPUBファイルはダウンロードして、お好みのEPUBリーダでご覧ください。フォント埋め込みのものは、対応するリーダで見る必要があります。iBooks /Kobo(iOS,A

    漢これ - 漢字これくしょん
  • 中国語繁体字の標準化にぶつかって

    今年の10月、私はサンフランシスコで行われるW3C主催のTPACというイベントとブック・イン・ブラウザ会議に参加するため、シリコンバレーに向かった。 太平洋を越えて台湾からアメリカ西海岸へ行くには、とても費用がかかる。数年前、私がまだ取材記者だった頃は、東京、香港、上海、サンフランシスコ、クパチーノなどで行われるIT企業主催のメディアツアーによく招待された。しかしいまや私は、収益の安定しないスタートアップ企業の経営者である。いちばん安い宿と航空券をみつけても10万台湾ドル(日円で約40万円)の出費となり、自分の事業になんら利益をもたらさないかもしれない旅行にとってはとても痛い。 そこで私は、9月に自分のブログに、この会議に参加しなければならない理由を書いた記事を投稿して資金援助を募り、ペイパルと銀行の口座を用意した。二週間もしないうちに、クラウドファンディングは成功した。 標準化の世界と

  • 全角チルダ問題

    JenkinsとDockerって何が良いの? 〜言うてるオレもわからんわ〜 #jenkinsstudyKazuhito Miura

    全角チルダ問題
  • 第1回 漢字コードの基礎、JISコード

    官庁や自治体における、いわゆる行政情報システムでは、一風変わった漢字コードが用いられている。人名や地名に必要な漢字を、それぞれの省庁が思い思いの形で、情報システムに搭載してきたためだ。特集では、これら行政情報処理用漢字コードのうち、現在かなり大きなシェアを持つ3つの漢字コードの現状をお伝えしようと思う。 その3つとは、総務省系の「住民基台帳ネットワーク統一文字」、法務省系の「戸籍統一文字」および「入国管理局正字」だ。さらに、これら3つの漢字コードを一体に統合すべく構築されつつある、経済産業省系の「文字情報基盤(IPAmj)」を最終回で扱う。 ただ、これら4つの漢字コードを理解するためには、JISで制定された漢字コードの理解が不可欠なことから、第1回の今回は、「JIS X 0213」と「JIS X 0212」について、行政情報処理の視点、特に異体字処理の視点から述べることにする。 マイナ

    第1回 漢字コードの基礎、JISコード
  • 文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog

    ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか

    文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog
  • Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか?お願いします。 - リクエスト... - Yahoo!知恵袋

    リクエストありがとうございます。 過去に私が答えた回答に相手をバグらせるUnicodeがあるので、コピペしてお使いください。 http://m.chiebukuro.yahoo.co.jp/detail/q11115690096 また、このような行為はサーバーに負荷を与える妨害行為としてLINEの利用規則12に違反するので、自己責任でお願いします。 追加: iPhoneには効かないかもしれません

    Unicodeを送られてLINEを初期化されたんですけど、強力なUnicodeありませんか?お願いします。 - リクエスト... - Yahoo!知恵袋
    kaeru-no-tsura
    kaeru-no-tsura 2014/01/05
    安岡孝一先生の降臨まだー?
  • 文字化けで打線組んだwwwwwwwwwwww : 日刊やきう速報

    http://hayabusa.2ch.net/test/read.cgi/livejupiter/1379336082/

    文字化けで打線組んだwwwwwwwwwwww : 日刊やきう速報
  • 日本の文字とUnicode - 第4回 漢字とUnicode - 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第4回は、漢字とUnicodeの関係です。 Unicodeには、漢字が大量に収録されています。 ざっくり言えば、Unicodeに収録されている文字のうち、 およそ3分の2にあたる70,000字強が、漢字なのです。 最初はU+4E00~U+9FFF(コード表参照)に、約20,000字の「CJK統合漢字」が収録されているだけでした。 次にU+3400~U+4DBF(コード表参

  • 日本の文字とUnicode - 第3回 ひらがな・カタカナとUnicode - 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第3回は、ひらがな・カタカナとUnicodeの関係です。 UnicodeのU+3041~U+3096には、ひらがなが収録されています(コード表参照)。 UnicodeのU+30A1~U+30FAには、カタカナが収録されています(コード表参照)。 ひらがなとカタカナは、Unicode上での順序が、 ほぼ同じになるように収録されています。 たとえば、ひらがなのU+305F~U

  • SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    下図は、SoftBank iPhoneのMailが用いるShift_JISのIBM拡張文字領域*1。どうだ、驚いたろう。 SoftBank iPhoneのMailは、charset=Shift_JISをよく使う。髙村薫の「髙」や宮﨑あおいの「﨑」などのWindows外字もShift_JISで送るし、絵文字もShift_JISで送る。しかし、WindowsのIBM拡張文字領域とSoftBankの絵文字領域は、もともと衝突しており、共存できない。なので、SoftBank iPhoneのShift_JISでは、IBM拡張文字のうち下図ピンク部分が使えない。 だったらその分は、NEC選定IBM拡張文字のほうを使えばいいじゃないですか、どうせダブってるんだから(下図)。というのが、大ざっぱに言えば、SoftBank iPhoneのMailが用いるShift_JISである。 その外字領域をまとめると、

    SoftBank iPhoneのShift_JISがすごいことになっている件 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • IVS入力ツールsvivsを公開しました - しろもじメモランダム

    前回のエントリで「試作中」と書いたIVS入力ツールの svivs だが、とりあえずある程度までできあがったので、このへんで一旦公開してみる。バージョン1.0.0。Windows XP でしか動作確認をしていないが、Adobe AIR で動くので一応 Mac でも大丈夫。 IVS(異体字シーケンス)入力ツール svivs - しろもじ作業室 IVS(異体字シーケンス)入力ツール svivs の使い方 - しろもじ作業室 残念ながら、前回のエントリで書いた「動作が思ったよりも重い感じ」はそれほど改善されていない。テキストエリアの処理がもっさりげな感じ。しかもこのテキストエリア、実のところハイライトさせる処理で Splitting a surrogate pair とかいってコケることがある*1。実際のコードではサロゲートペアをちゃんとペアとして扱っている(はず!)にも関わらず。この問題をどうに

  • void (日下部陽一) 氏、半角カタカナの置換をし忘れる - Togetter

    いつも半角カタカナを〓に置換して、機種依存文字の危険性を丁寧に指摘して下さる void さんですが、今日は置換をし忘れたようで。何か script 通してるのかと思ったら、手動でやっているっぽい。

    void (日下部陽一) 氏、半角カタカナの置換をし忘れる - Togetter
  • H2.10.20法務省民二第5200号通達に対抗するには | yasuokaの日記 | スラド

    Yahoo!知恵袋のこの質問での私(安岡孝一)の回答を読んだ方から、「該当の字」が掲載されている漢和辞典が見つからなかったらどうすればいいのか、という趣旨の質問をいただいた。問題を少し整理してみよう。 H2.10.20法務省民二第5200号通達に基づき、戸籍の氏における「該当の字」が「正字」に変えられてしまった場合、対抗する手段は大きく3つある。1つは「該当の字」が掲載された漢和辞典を見つけて、戸籍を担当する市役所(区役所・町役場・村役場)に持ち込む方法。もう1つは、戸籍地を管轄する家庭裁判所に、戸籍訂正を申し立てる方法。最後の1つは、戸籍を担当する役所/役場の住所地を管轄する家庭裁判所に、市町村長の処分に対する不服申立をおこなう方法。最初の方法については、ここに詳しく書いておいたので、残る2つの方法について説明しよう。 2つ目の方法は、役所/役場から「該当の字」の変更について、変更時点で

    kaeru-no-tsura
    kaeru-no-tsura 2011/08/18
    そしてその後の補足
  • 婚姻についての質問です。婚姻届を提出するため、本籍地から全部事項証明書を取り寄せました。しかしその証明書の氏の漢字が戸籍謄本とは異なっ... - Yahoo!知恵袋

    まず1つ。 「戸籍謄」は、電算化(パソコンで扱うこと)がされてから、「戸籍全部事項証明書」へと名前が変わりました。 今でも便宜上「戸籍謄」と呼ぶ事が多いですが、電算化された役所の物の正式名称は「戸籍全部事項証明書」なのです。 そして次に、これは非常に大切なことなのですが、該当する漢字はどのような漢字ですか? 前の方の回答は誤っていまして、「旧字体」は「新字体」へ勝手に改められる事はありません。 役所が「旧字体」ではなく「誤字」であると判断した場合に、半強制的に「新字体および通用字体」へ変更しやがるのです。 「誤字」と判断されていた場合は、基的には半強制的に通用字体へと置き換えられてしまうのですが、家に通知が来次第、断ることも出来ます。 どちらにしろ、役所の誤りで「俗字・旧字」を「新字体・通用字体」へ置き換えてしまった場合は、誤りが証明でき次第、訂正させる事が出来ます。 しかし「誤字」

    婚姻についての質問です。婚姻届を提出するため、本籍地から全部事項証明書を取り寄せました。しかしその証明書の氏の漢字が戸籍謄本とは異なっ... - Yahoo!知恵袋