タグ

文字コードに関するardarimのブックマーク (264)

  • Adobe-Japan1-6文字コレクションに対応する日本語OpenType®フォントについて

    ホーム サポート Font / Type Adobe-Japan1-6文字コレクションに対応する日語OpenType®フォントについて 概要 各種オペレーティング・システムがJIS2004基準の文字の形に対応した日フォントの搭載を開始したことなどを背景に、JIS2004基準のフォントの重要性が高まっています。アドビ®が2007年11月にリリースしたAdobe® Font Folio™ 11には、Adobe-Japan1-6文字コレクションに対応するJIS2004基準の日語OpenTypeフォント(Pr6Nフォント)及びかなフォントを拡張した日語OpenTypeフォント(PlusNフォント)が含まれています。 文書では、主にAdobe-Japan1-6対応のJIS2004基準の日語OpenTypeフォント(Pr6Nフォント)の特長について説明します。 Adobe-Japan1-

  • The results from a 7.5-year experiment are in: Unicode and OpenType are successes!

    CJK Type Blog CJK Fonts, Character Sets & Encodings. All CJK. #AllOfTheTime. HOME > The results from a 7.5-year experiment are in: Unicode and OpenType are successes! 和文 中文 Dr. Ken Lunde Approximately 7.5 years ago — at the end of 2002 — I commissioned the suite of Unicode CMap resources for Adobe-Japan1-x (it was Adobe-Japan1-5 at that time, and Adobe-Japan1-6 was finalized less than two years la

  • 絵文字を「符号」として処理する難しさ~日本のモバイルウェブのカオスぶり バイドゥ「絵文字の意味検索」ができるまで(1)

    ardarim
    ardarim 2010/07/09
    こんなマニアックなネタ書くのは…と思ったらやっぱり小形さんだった
  • August 29, 2005

  • 「遷」の戸籍統一文字 | yasuokaの日記 | スラド

    『汎用電子情報交換環境整備プログラム成果報告書』(平成21年3月、日規格協会)を元に、戸籍統一文字とUnicodeとの対応表を作りかけているのだが、これがなかなかに手強い。まだ作業途中なのだが、U+9077「遷」に対応する戸籍統一文字は、443810、443930、444570、444170、443850、444060、444660の7つが見つかっている。しかも、この中には当用漢字字体表の「遷」は含まれていないようだ。うーむ。 また、対応上、微妙な問題を含む文字も数多くある。たとえば031240と000100は、私(安岡孝一)個人としては両方ともU+5341「十」に対応させてしまいたいところだが、それは「えだなし派」の方々には耐えられないだろう。けど、PRI 167の締切は待ってくれないし、さて、どうしたものか。

  • U+90F7 U+E0101というIVS | yasuokaの日記 | スラド

    Ken Lundeとも話したのだが、Adobe-Japan1のCID+13725を「U+90F7 U+E0101」というIVSで表現したのは、やはりまずかったように思う。もちろん、CID+13725は「郷」(U+90F7)の異体字なのは間違いないが、でも「鄕」(U+9115)の方が親字として適切だったと思うのだ。この問題が極端な形で現れたのが、今回のPRI 167のIP9115なのだが、このあたりに関して、私の知る限りのところを記しておこうと思う。 このIP9115のグリフは、元々、日規格協会の文字フォント開発・普及センターが平成7年度事業として、情報処理振興事業協会(IPA)からの請負委託により、平成明朝体W3の一部としてデザインしたものだ。この事業は、JIS X 0221-1995のJAPANESE IDEOGRAPHICS SUPPLEMENT 3の中で大漢和辞典に収録されている漢

    ardarim
    ardarim 2010/04/17
    いままでの文字行政の破綻がこういう避けられない形で表面化してきているのか。
  • The "Hanyo-Denshi" IVD Collection submission (aka, PRI 167) - Typblography

    This site has been archived. Please visit the Adobe Blog for the latest Adobe articles.

    ardarim
    ardarim 2010/04/13
    汎用電子情報交換環境整備プログラム
  • グーグルが絵文字を世界標準に提案した理由--国際化エンジニアに聞くプロジェクトの舞台裏(後編)

    2008年11月27日、Googleは日の携帯電話の絵文字をUnicodeに収録する計画を公表した。Googleはどんなプロセスを経て絵文字をUnicodeに提案すると決めたのだろうか。2月25日に公開した前編はこちらから。 Apple絵文字提案に加わったいきさつ ――「絵文字シンボル符号化の提案(PDF)」(ISO/IEC 10646への提案書)を読むと、GoogleだけでなくAppleの名前もあります。これはどういう経緯なのでしょう。 2008年8月になって、Appleさんが200文字だったか300文字だったか、UTCのシンボル小委員会に絵文字のプロポーザルを出して来たんです。私達のプロポーザルでは約720文字あったんですが、より少ないコアセットにしようというものでした。Appleさんは、720文字も出したら通らないのではないかという危機感を持っていたようです。この年の秋に日でi

    グーグルが絵文字を世界標準に提案した理由--国際化エンジニアに聞くプロジェクトの舞台裏(後編)
  • グーグルが絵文字を世界標準に提案した理由--国際化エンジニアに聞くプロジェクトの舞台裏(前編)

    はじめに 2008年11月27日、Googleは日の携帯電話の絵文字をUnicodeに収録する計画を公表した。これまで7回にわたってお伝えしてきた連載「絵文字が開いてしまったパンドラの箱」は、この公表から後の動きを追ったものだ。 では、それ以前の同社は何をしていたのか? つまり、Googleはどんなプロセスを経て絵文字をUnicodeに提案すると決めたのだろう。今回ご報告するのはこのことだ。 インタビューに答えてくれたのは桃井勝彦氏。氏は大学時代にスカラシップ(奨学金)で渡って以来米国に暮しつづけている。言語学・日語学を専攻する大学院生、大学教員などの経歴も持ち、1996年に学術界からNetscape国際化部門に入社。2004年にMozilla Japanの設立にかかわった後、2005年にGoogleに移った経験豊かな国際化エンジニアだ。マウンテンビューにある米社にあって、今回の符号

    グーグルが絵文字を世界標準に提案した理由--国際化エンジニアに聞くプロジェクトの舞台裏(前編)
  • 戸籍統一文字のIVS化 | yasuokaの日記 | スラド

    汎用電子情報交換環境整備プログラムのIVS化に対する登録レビューがちゃんと昨年度中に始まった、という連絡をいただいた。以前、日経ITproの「漢字1文字が最大8バイト、Unicodeの「IVS」とは?」でも書いたが、日はJTC1/SC2/WG2/N3530で戸籍統一文字や住民基台帳文字なんかをISO/IEC 10646に追加要求している。でも、互換漢字での追加は、やっぱりブが悪そうなので、IVSによる追加も模索しているわけだ。 ただ、現状のドラフトは、ギリギリ昨年度内に仕上げたものなので、実はかなり問題がある。たとえば、JTFA2A「飯」は、来U+98EFの異体字として登録されるべきなのだが、ドラフトからは抜け落ちている。JTFA2B「飼」やIB0457「館」も、それぞれU+98FCとU+9928の異体字なのだが、やはり載っていない。端的に言えば、『汎用電子情報交換環境整備プログラム

  • U+7F50 U+E0101というIVS | yasuokaの日記 | スラド

    人名用漢字の新字旧字「缶」と「罐」の読者から、「罐」の簡易字体(Adobe-Japan1のCID=14187)に関して質問があった。確かにこの漢字のIVS「U+7F50 U+E0101」は、かなりマズイものの一つだ。 この簡易字体が「罐」(U+7F50)の異体字なのは確かだが、だからと言ってIVSで表現するのはスジが悪くて、やはりU+9FCCあたりに追加すべきだったと思う。「權・灌・勸・歡・觀」と「権・潅・勧・歓・観」はCJKにおいて分離されているのだから、「罐」とその簡易字体だけをIVSで扱わなければならないのは、かなりおかしな状態だ。しかし、CID=14187は「U+7F50 U+E0101」となってしまったため、CJK Extension Dにすら収録されそうにない。 ただ、こういう恣意的なIVSの追加が増えると、結局、全く同じ字体が別字のIVSとしてどんどん追加される、という事態を

  • EZweb絵文字の「色」 | yasuokaの日記 | スラド

    iモード絵文字の「色」の読者から、「KDDIのN3777の方はどうなのか」とご質問があった。正直なところ、NTTドコモよりKDDI(au)の方がひどい。以下、EZweb「シフトJIS」F756とF757の文字(絵文字番号23と24)を例にして、問題点をあげつらってみよう。 EZwebのオリジナル絵文字(のちのTypeA)では、F756が白ヌキの小さい丸(littlecircle1)で、F757が黒ベタの小さい丸(littlecircle2)だった。これがカラー化(のちのTypeB)されて、F756が青い小丸、F757が赤い小丸となった。ところがTypeCでは、F756が緑の小丸、F757が赤の小丸となり、さらにTypeDでは、これが逆転して、F756が赤の小丸、F757が青の小丸となった。 つまり、色という点では全く一定していなかったことから、UCSとの対応に関しては、EZwebのオリジナ

    ardarim
    ardarim 2010/03/24
    みんな過去は無かったことにしたいのね
  • IVS Support: The Current Status and the Next Steps

    CJK Type Blog CJK Fonts, Character Sets & Encodings. All CJK. #AllOfTheTime. Chinese Dr.Ken Lunde For those who are not aware, IVSes (Ideographic Variation Sequences) are a standardized Unicode mechanism for representing otherwise unencoded variant forms of CJK Unified Ideographs using “plain text,” specifically via a sequence of a Base Character (aka, a CJK Unified Ideograph) followed by a Variat

    ardarim
    ardarim 2010/02/22
    XPとかVista用のIVSサポートパック出してくれないものかねえ。
  • 絵文字が開いてしまった「パンドラの箱」第7回--そして舞台はダブリンから東京へ

    地図が国際規格にふさわしくない理由 2009年4月21日、ここはアイルランドのダブリン・シティ大学です。ISO/IEC 10646を審議する第54回WG 2会議は、2日目の日程に入っていました。この日はいくつかの分科会に分かれテーマ別に審議が進められます。そのうちの一つ、Emojiアドホック会議では、GoogleAppleによって提案された絵文字の審議がおこなわれていました。 開催前は激しい対立が予想されていましたが、いざフタを開けるとGoogleAppleが一員であるアメリカ・ナショナルボディ(以下、ナショナルボディはNBと略)の大幅な妥協によって合意が成立していきます。残ったのは議長が後回しにしておいた「議論の余地のあるもの」だけになりました。 これは全部で3種類あります。まずは5文字の「日文化に依存したアイコン文字」です。どんな文字か確認してみましょう。 図1 日文化

    絵文字が開いてしまった「パンドラの箱」第7回--そして舞台はダブリンから東京へ
  • 文字コードについてのメモ

    JIS X 0213のあまり代表的でないかもしれない符号化方式 (2009/2) 「符号化文字集合 coded character set」という語の定義 MeadowでJIS X 0213を使う (2001/05) 波ダッシュはチルダではない (2001/03) 新JIS漢字リンク集 (2000/12) JIS X 0213の代表的な符号化方式 (2000/11) SKKでJIS X 0213を使う (2000/09) エスケープシーケンスの表。主に日語用。 そのHTML版 (2000/08) 新JIS漢字実践情報 (2000/04) (新)JIS漢字の横線を使いこなす (2000/03/27) JIS漢字とUCSの文字の対応について ウェブページを「EUC」で符号化することにつ いて 矢野啓介 <yano{AT}moon{DOT}email{DOT}ne{DOT}jp> ({AT}

  • プロジェクトX0213

    JIS X 0213利用者有志による、相互扶助を目的としたウェブサイトです。 このサイトはβ版です。 JIS X 0213 Wiki JIS X 0213のコード対応表 (2006年5月公開) 常用漢字と文字コードの対応表 - 2010年に改定された常用漢字とJIS X 0213およびUnicodeとの対応表 (2012年7月公開) 人名用漢字と文字コードの対応表 - 2012年現在の人名用漢字とJIS X 0213およびUnicodeとの対応表 (2012年7月公開) [NEW!] 日語ローマ字綴りのための拡張ラテン文字コード表 (2013年10月公開) 漢字検索 - JIS第1〜第4水準の漢字が読みや構成要素などから検索できます (2007年6月公開)

  • 参考資料 - CyberLibrarian

    図書館員のコンピュータ基礎講座 TOP 参考資料 基礎情報 2進数、16進数と10進数 情報の単位 論理演算 数詞 ローマ数字 年月の表現 西暦・和暦対照表 暦の年月と季節 暦注 月の大小 紙の寸法 人名 文字、文字コード Unicode JIS X 0208コード表 JIS X 0212コード表 JIS X 0213コード表 JIS83制定時の変更点 JIS90制定時の変更点 JIS補助漢字および拡張漢字で復活した字体 JIS2004制定時の変更点 JIS X 0208およびJIS X 0213の字形・字体の変更点 JIS包摂規準 新旧字体表 常用漢字表 人名用漢字 文字 > ラテン文字 | ラテン特殊文字 | キリル文字 | ギリシア文字 | アラビア文字 書字方向 ローマ字 点字表 URIで使用できる文字 文字サイズ GB 2312-80コード表 Big5-1984コード表 KS X

  • jisx0213 infocenter

    わたしは――この命にかえても、“字”という魔術をおさめたい。この世の中の不思議を知りたいんです。…………神様、お願いです、わたしに教えて下さい。“字”という魔術を JISX0213 InfoCenter JIS X 0213:2000 関連データです。ご自由に(利用したり加工したり配布したりして)お使いください。データは、死にたい程度にはチェックしていますが、保証しろといわれても困ります。なにか問題があったら、earthian@tama.or.jpにメールすると直るかも。 ● allファイル(all0c23.zip,zip圧縮,944k) 全データまとめてダウンロード。といってもコード表2種にmiscファイル、この3つをまとめただけのもの。 ● miscファイル(misc0c23.zip,zip圧縮,523k) コード表以外のデータファイルをまとめてあります。 ● コード表(jisx021

  • 情報機器との関係で「叱・填・剥・頬」の許容について考慮すべき | yasuokaの日記 | スラド

    小形さんのとこ経由で、昨日の漢字小委員会の資料のコピーをいただいた。ざっと、目を通してみたのだが、資料2の『意見募集で寄せられた「意見の概要」』の以下の部分が、かなり気になった。 4 字体(67件) ○情報機器との関係で「叱・填・剥・頬」の許容について考慮すべき ○デザイン差として加える字について考慮すべき ○試案の字体に賛成 ○追加される字種の字体をこれまでの字体と統一すべきである この『情報機器との関係で「叱・填・剥・頬」の許容について考慮すべき』というのは、たぶん私(安岡孝一)の意見を含んでいると思うのだが、だとすると、「機器」というのを強調されるのは微妙にマズイ。というのも、現実の問題は「機器」で起こるのではなく、その間の「やりとり」において起こるからだ。 たとえば、文化庁ホームページの文字コードで示した例において、「𠮟」(口へんに七)をマトモに検索できるようにしようとすると、ユ

  • ぼくの大好きな符号化文字 - もじのなまえ

    ときどき私的な席で「どんな仕事をしてるんです?」と聞かれます。「フリーライターです」と答えるとたいていは納得してくれますが、なかには「で、どんなものを書いてるんです?」と突っ込んでくる人もおられる。 すると、はたと考え込んでしまいます。もちろん自分がどんなことを書いているかは分かっている。同時に、それがすごく面白いと思っているから原稿に書いているわけです。でも、その面白さを専門外の人にも分かりやすく説明するって、案外むずかしいものです。もっとも、それをすることは自分の足下を見つめ直すことになるのかもしれません。 1989年の印刷文字 ぼくの専門は符号化文字です。文字コードとかフォントとか、符号化文字に関わる全般。このブログでこのところ集中的に取り上げている常用漢字表の改定も、そうした視点から見ています。では、その符号化文字とはなにか? もう20年以上も前、1989年だったと思います。手塚治

    ぼくの大好きな符号化文字 - もじのなまえ
    ardarim
    ardarim 2010/01/12
    良まとめ。惜しむらくは「文字コード」でなく「符号化方式」の方がよかったか。専門用語を使わないという軛であえてこうしたのかな… 「専門外の人にも分かりやすく説明するって、案外むずかしい」あるある!