タグ

charcodeに関するkenjiro_nのブックマーク (125)

  • japanese font, charactor code / 日本語フォント、文字コード

    書籍 文字コードに関する入門 文字コード超研究 図解雑学 文字コード インターネット時代の文字コード 漢字問題と文字コード JIS規格 JISハンドブック 情報基 - JIS X 0201,0208,0213,0221等の規格が載っている(目次のpdf)。 PCやUNIXでの文字処理について パソコンにおける日語処理・文字コード - (サポートページ) UNIX System 5—リリース4国際化機能 CJKV日中韓越情報処理 - ((著者)Ken Lunde's Home Page) 各国の文字コード 文字コードの世界 - 出版元のページ 文字符号の歴史—欧米と日編 文字符号の歴史 アジア編 漢字について e康煕字典 日語版 [CD-ROM] - (出版元のページ) 日の漢字 知っておきたい漢字の知識 メーリングリスト JIS X 0213 Mail Listの御案内 UTF-

  • なぜ半角カナは嫌われるのか(メモ) - 半角カタカナ、1バイトカナなどの話

    このメモの内容もかなり古くなってしまいました。歴史的価値だけはまだあるかもしれないので、このまま置いておきます。 くれぐれも論争の根拠にこのメモを使わないようにお願いします。 俗に言う『半角カナ』とは JIS X 0201の右半面(カタカナ集合)。 この文字が漢字のサイズの半分(横が半分で縦はそのまま)で表示される端末を 主に利用しているユーザーがこう呼びはじめた。 『半角カナ』と呼ぶのがなぜ不正確なのか 文字のコードと表示される文字の大きさ(や、色や諸々)には関係はありません。 ですから、JIS X 0201カナを指して『半角カナ』と呼ぶのは間違いです。 MacintoshやWindowsなどで、『プロポーショナルフォント』を利用した場合、 『半角』という大きさが何を指すかを考えてみてください。 ワープロなどで字の大きさについて『半角』という表現をする場合がありますが、 これはこれで問題

    kenjiro_n
    kenjiro_n 2010/02/21
    ←文中ではまったく考慮されていないがこのタグで。史料として一定の価値はあるが。
  • 2010-02-14 - 未来のいつか/hyoshiokの日記

    例えば、次の言葉の意味を知りたい、聞いたことがあるけどよく分かっていないプログラマにとって、お勧めの書籍だ。Unicode/UTF-8/UTF-16/USC-2/JIS X0208/JIS X0212/JIS X0213/SJIS/EUC-JP/CP932/ISO-2022-JP/ASCII/Latin-1/ISO 10646/ISO 8859-1/サロゲートペア/文字化け/機種依存文字/半角カナ/絵文字… JIS X0208やJIS X0213の解説などは圧巻である。書籍にはWebにない利点がある。Webには即時性があるが、文字コードの解説においては、即時性はそれほど求められない。字体ないし字形の差異についてWebではその字体ないし字形がなければ表現しようがないが、書籍であれば細部までこだわって表現できる。 例えば、包摂された「辻」という字の一点しんにょうと二点しんにょうの字体の差はWe

    2010-02-14 - 未来のいつか/hyoshiokの日記
  • [ワード] 半角・全角の数字が混在する文章を、一発で半角に統一したい - OKWAVE

    No1さんの方法だけでは、カタカナや記号文字も半角になります。 それでも良いなら[文字種の変換]だけで対応して下さい。 英字と数字のみなら、[検索]と[文字種の変換]を組み合わせて 変換します。 メニューの[編集]→[検索]又は[Ctrl+F]で検索タブが開きます。 【全角→半角】 [検索する文字列]に 『[a-zA-Z0-9]』 (0、9、は全角。[ ]、-、は半角) [見つかったすべての項目を強調表示する]にチェックを入れます。 [オプション]ボタンを押し[検索オプション]が開きます。 [ワイルドカードを使用する]にチェックを入れます。 [すべて検索]ボタンを押して、文書の中の全角又は半角の数字が 全て選択状態になったら、 メニューの[書式]→[文字種の変換] 【全角→半角】[半角]を選択します。 【半角→全角】[全角]を選択します。

    [ワード] 半角・全角の数字が混在する文章を、一発で半角に統一したい - OKWAVE
  • 1億人を代表して、皆さんにお願いします。 - もじのなまえ

    日はWG 2東京会議の2日目、午前11時から昼をはさんで午後4時まで、Emoji Ad-Hoc会議が開催され、その場でぼくたちが提出した「A Proposal to Revise a Part of Emoticons in PDAM 8」(N3711)が審議されました。 その冒頭で、趣旨説明をしたわけですが、その草稿を公開します。これは開会直後に趣旨説明が必要であることが分かり、会議の最中に即席で書いたものです。内容的にはN3711のサマリーになっています。 来なら英語でスピーチするところですが、ぼくにはとても無理。そこで日ナショナルボディのご好意により、関口委員長自ら通訳してくださいました。まだるっこしい日語の話を辛抱強く聞いてくださった各国ナショナルボディの諸氏にも深く感謝。 私達は日の携帯電話ユーザーとして、UCSが絵文字を収録することを支持します。 それは日での絵文

    1億人を代表して、皆さんにお願いします。 - もじのなまえ
  • 「Unicodeに入った漢字」と「まだUnicodeにない漢字」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ

    Acrobat 9に付属するKozMinPr6-Regular 6.004は、最新のcmap(「CMapのバージョンの違い」を参照)を採用しており、Unicode 5.1で追加された7文字の漢字が、新たにUnicodeの符号位置と対応付けられている(下図)。 これら7文字はもともとAdobe-Japan1をソースとしてISO/IEC 10646に提案されたものである。提案時には「この7文字がUnicodeに収録されれば、Adobe-Japan1の漢字はすべてUnicodeのIVS(異体字シーケンス)で表現することができる」と考えられていたのだろう。 しかしその後、Adobe-Japan1異体字シーケンス登録の1回目の公開レビュー(http://www.unicode.org/ivd/pri/pri98/index.html)を経て、下図グレー字の20文字(下に付した数字はCID)が「Uni

    「Unicodeに入った漢字」と「まだUnicodeにない漢字」 - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
  • 33466 – Conversion tables between KPS 9566-2003(N. Korean) & Unicode

    kenjiro_n
    kenjiro_n 2010/01/28
    北朝鮮の文字コードをどうOOoで取り扱うかという話。結局担当者がいないため流れた様子。
  • ぼくの大好きな符号化文字 - もじのなまえ

    ときどき私的な席で「どんな仕事をしてるんです?」と聞かれます。「フリーライターです」と答えるとたいていは納得してくれますが、なかには「で、どんなものを書いてるんです?」と突っ込んでくる人もおられる。 すると、はたと考え込んでしまいます。もちろん自分がどんなことを書いているかは分かっている。同時に、それがすごく面白いと思っているから原稿に書いているわけです。でも、その面白さを専門外の人にも分かりやすく説明するって、案外むずかしいものです。もっとも、それをすることは自分の足下を見つめ直すことになるのかもしれません。 1989年の印刷文字 ぼくの専門は符号化文字です。文字コードとかフォントとか、符号化文字に関わる全般。このブログでこのところ集中的に取り上げている常用漢字表の改定も、そうした視点から見ています。では、その符号化文字とはなにか? もう20年以上も前、1989年だったと思います。手塚治

    ぼくの大好きな符号化文字 - もじのなまえ
  • 文化庁ホームページの文字コード | yasuokaの日記 | スラド

    今日が「改定常用漢字表試案への意見」の〆切なので、景気づけに文化庁ホームページの「サイト内検索(e-Gov)」で、問題の4字を検索してみることにした。 「𠮟」検索不能 「塡」検索不能 「剝」検索不能 「頰」検索不能 …っていうか、このホームページ、そもそも文字コードがShift_JISなんだけど。その上、HIDDENパラメータの中に「JCODE=SJIS」ってのがあって、e-GovにはシフトJISしか渡せなくなってる。 仕方がないので、【改定常用漢字表試案への意見】テンプレートで最初に示した4字を、代わりに検索してみた。 「叱」31件ヒット 「填」65件ヒット 「剥」316件ヒット 「頬」6件ヒット ふーん。表外漢字字体表を9年前に答申して、5年10ヶ月前にはJIS X 0213まで改正させたのに、文化庁内部ですらまだこんな状態なのね。まあ、常用漢字表が改定されたら、e-Govの作り直し

  • Cygwin 1.7系初となるメジャーリリース「Cygwin 1.7.1」リリース | OSDN Magazine

    12月23日、Windows向けのLinux互換環境「Cygwin」の新版「Cygwin 1.7.1」がリリースされた。Cygwin 1.7系では初となる安定版リリースで、IPv6サポートの追加やデフォルト文字コードがUTF-8になるなど、多数の変更が行われている。 CygwinはLinux APIをエミュレーションするDLL(cygwin1.dll)と、ツールコレクションから構成される「Linux風環境」。Cygwinを導入することで、Windows上でLinux/UNIX互換のシェルや各種ツール、ライブラリなどを利用できるようになる。また、Linux/UNIX向けソフトウェアをWindows環境に移植する際にも多く用いられている。 Cygwin 1.7.1では、従来レジストリに記録されていたマウントテーブルがLinuxと同様/etc/fstab以下に保存されるようになったほか、複数のC

    Cygwin 1.7系初となるメジャーリリース「Cygwin 1.7.1」リリース | OSDN Magazine
    kenjiro_n
    kenjiro_n 2009/12/24
    これで7にも対応するのか。いままでもVistaはだめだと思ってたんだが。あと文字コードが基本UTF-8になるからエディタの用意も含め面倒くさそうだ。
  • 人名用漢字の制限強化を大阪府が要望 | yasuokaの日記 | スラド

    人名用漢字の新字旧字のネタを探すべく、『戸籍』の第834号(2009年11月)を読んでいたところ、2009年10月21~22日に共立女子学園講堂で開催された「第62回全国連合戸籍住民基台帳事務協議会総会 速報」(pp.24-62)の中で、大阪府が以下の要望を提出しているのを見つけた(p.56)。 〔40〕戸籍使用可能文字の縮小および明確な範囲確定を要望する。 (理由) 平成6年の7005号通達以降,戸籍に用いることのできる文字は流動的であり,戸籍事務担当者が様々な辞書を用いて確認を行っているが,非常に非効率で業務担当者の負担になっている。 また個人の氏名は,戸籍事務だけでなく,自治体全体で個人情報の連携データとして必須項目であり,情報量の多い中で即時性,正確性を確保するために,その手法としてコンピュータに頼らざるを得ないのが現状である。 そのような中で一般的にコンピュータにより表現できな

  • ワープロの絵文字 | yasuokaの日記 | スラド

    SHARP書院WD-A521のマニュアル「WD-A521/A541/A551 日語ワードプロセッサ取扱説明書(文書編)」を読んでいたところ、文字コードの記号一覧のところに、絵文字が160種類ほど収録されているのを見つけた。絵文字の中にマル金とマルビが含まれていることから、あるいは1984年頃にデザインされた可能性が考えられるが、WD-A521それ自体は1990年11月の発売だ。だとすると、これより古い書院にも、絵文字が搭載されているのかもしれない。 ただ、ワープロのマニュアルは、どこの図書館を探しても所蔵がない。SHARPも、既に当時のマニュアルは破棄してしまっており、全く在庫がないようだ。だとすると、個人蔵のマニュアルを探すことになるのだけど、全く雲をつかむような話で…。この日記を読んだ方で、手元に古いワープロ(書院に限らない)のマニュアルをお持ちの方は、ぜひ文字コードのページを調べて

  • 常用漢字表のUnicode補助文字問題 - Cafe Babe

    京大の安岡先生が常用漢字表でUnicode補助文字(Unicode Supplementary Character)の領域に割り当てられている文字がレガシーなシステムでうまく扱えないことを問題にしている. どうして常用漢字表を改定するハメになったのか(yasuokaの日記) まあ,Shift-JISや日語EUCを使って実装しているシステムで扱えないのは当然だが,Unicodeを使っているシステムでも正しく扱えるとは限らない.というのは,Unicode補助文字というのは,U+10000〜U+10FFFFの領域に符号化されており,UTF-16ではサロゲートペアを使って表現され,UTF-8では4バイトに符号化されるからだ.文字がU+0000〜U+FFFFだけにあることを前提に実装された古いシステムでは,何が起こるかわからない.この辺は,我々がJava言語に対しておこなった話が参考になるとおもう

    常用漢字表のUnicode補助文字問題 - Cafe Babe
  • どうして常用漢字表を改定するハメになったのか | yasuokaの日記 | スラド

    『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、「そもそもどうして常用漢字表を改定しなきゃいけないんですか」と質問された。それはもちろん、平成17年3月30日に文部科学大臣から諮問第15号「情報化時代に対応する漢字政策の在り方について」が文化審議会に対して…、と答えかけて、私(安岡孝一)自身、途中で答につまってしまった。だって、文部科学大臣の諮問は、以下のようなものだったはずだ。 種々の社会変化の中でも,情報化の進展に伴う,パソコンや携帯電話などの情報機器の普及は人々の言語生活とりわけ,その漢字使用に大きな影響を与えている。このような状況にあって「法令,公用文書,新聞,雑誌,放送など,一般の社会生活において,現代の国語を書き表す場合の漢字使用の目安」である常用漢字表(昭和5

  • HTML/XMLの文字参照にサロゲートペアは使えない | emkの日記 | スラド

    HTML 4 文字参照で使える符号位置(厳密には符号位置ではないのですがここでは深入りしません)の範囲はSGML宣言で定められています。

    kenjiro_n
    kenjiro_n 2009/12/12
    常用漢字追加に関してslashdot.jpで日記を書くとRSSが一部システムで読めなくなってしまった件の説明。
  • 「シフトJIS」では対応不可能な新常用漢字表 | yasuokaの日記 | スラド

    今日発売された『新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能』(日経コンピュータ, No.745 (2009年12月9日), pp.89-93)の読者から、早速、文化審議会国語分科会に陳情したいのだがどうしたらいいのか、という質問が複数あった。文中の どうしても「𠮟」がサポートできそうにないなら、その旨を文化審議会国語分科会に陳情する、という手も残されている。新しい常用漢字表は改正案の段階であり、2009年12月24日までは一般からのコメント(パブリックコメント)を受け付けているからだ。「𠮟」ではなく「叱」を常用漢字にしてほしい、あるいは、「𠮟」の「許容字体」として「叱」を認めてほしい、と陳情するのだ。 に呼応したものだ。とりあえず、パブリックコメントのページをお教えしたが、うーむ、文中にURLかメールアドレス(kanzihyo@bunka.go.jp)く

  • 新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)

    普段使用する漢字の指針となる「常用漢字表」が、2010年度にも改正される。新たに追加される196文字の中に、文字コード「シフトJIS」にない漢字が含まれているため、情報システムに大きな影響を与えそうだ。最新のJIS規格「JIS X 0213:2004」の改正に委員としてかかわった京都大学人文科学研究所附属東アジア人文情報学研究センターの安岡孝一准教授が、問題の核心を解説する。     (日経コンピュータ) 2009年11月10日、文部科学省の「文化審議会国語分科会」において、常用漢字表の改正案が承認された。現行の常用漢字表にある1945字から「銑」「錘」「勺」「匁」「脹」の5字を削除し、新たに196字を追加する改正案で、2010年度の内閣告示を目指している。 新しい常用漢字表が告示されると、「シフトJIS」や「EUC-JP」といった従来からある文字コードを使用するシステムで大きな問題が生じ

    新常用漢字表が迫るUnicode移行、「シフトJIS」では対応不可能 | 日経 xTECH(クロステック)
    kenjiro_n
    kenjiro_n 2009/12/11
    あーあ、恐れていた縦割り行政の弊害が最悪の形で噴き出しましたよ。泥縄でJIS第5水準の制定をしないといけないんですよね?
  • Ubuntu 9.10 | kondouの日記 | スラド

    ついに子供がインフルエンザにかかった。しょうがないので、医者に連れていって、タミフルもらって自宅で看病。と上の子は実家に避難。 そういうわけで、パソコンをいじっていたら、いつのまにか Ubuntu 9.10 をインストールしていた。前から、次のような不満があったので、そろそろ替えなければ、と思っていたのだが、安定稼働しているのをいじるのも面倒くさくて放っていたのだ。 Flashのバージョンが古い。今入っているバージョンは 9.0.31.0 なのだが、そろそろサポートを切られている。nico動が見れない、mixi アプリが動かない。なぜか? glibc のバージョン(2.3.4)が古いから。 ALPSLAB route が、Flash ベースから Silverlight 3.0 ベースに変更になってしまう。Linux なら novel の moonlight になるが、これも glibc

    kenjiro_n
    kenjiro_n 2009/12/10
    UTF-8をベースにしているので面倒だという話。
  • UnicodeとUTF-8の違いは? - Humanity

    という2chのスレがかなり勉強になったのでまとめ。 少しでも有用だと思ったものは載せてあるので結構長いです。 Unicodeのような文字集合(符号化文字集合?)やUTF-8のようなエンコーディング方式に限らず色んな文字コードにまつわる話があります。 たびたび話が繰り替えされますがそれは確認ということで。 (元スレ) 追記:簡単にまとめました。 1 :デフォルトの名無しさん:2007/04/30(月) 20:02:37 ビッグインディアンとかなんとかかんとか 3 :デフォルトの名無しさん:2007/04/30(月) 20:05:48 また、頭の悪そうなスレが・・・ >>1 それは魚とマグロの違いを訊ねるようなもんだ。 4 :デフォルトの名無しさん:2007/04/30(月) 20:06:49 魚と鮪というよりは、魚と刺身の違いのような気がする。 5 :デフォルトの名無しさん:2007/04/

    UnicodeとUTF-8の違いは? - Humanity
  • 「「絵文字の議論は、これでいいのだろうか。」へのお答え」へのコメント - Cafe Babe

    小形克宏氏は,残念ながら山太郎氏が「絵文字の議論は、これでいいのだろうか。」で言いたかった真意を誤解しているように見える. 「絵文字の議論は、これでいいのだろうか。」へのお答え(もじのなまえ) 山氏の指摘にもあるように,実は小形氏の発言の「攻撃的な」姿勢と事実と異なる推測は,すでにいろいろなところで問題にされている.例えば,GoogleやUnicodeコンソーシアムは,当に「世界征服を目論む陰謀組織」なのだろうか?(笑) この原因は,小形氏が今回の事情を勘違いしていることにあると思っている.いつかは直接の関係者から真実が知らされると思っていたし,今まで得られた情報を分析すれば容易に気が付くだろうとも思っていたが,さしつかえないと思う程度まで事情を書くことにする. 今回の提案の大元は,Gmailの携帯絵文字対応である.これは,日のキャリアや日の携帯ユーザからの要望を受けて,Goog

    「「絵文字の議論は、これでいいのだろうか。」へのお答え」へのコメント - Cafe Babe