[B! unicode] mrknのブックマーク

mrkn id:mrkn

unicodeに関するmrknのブックマーク (18)

http://www.cl.cam.ac.uk/~mgk25/ucs/wcwidth.c
mrkn 2013/03/01
unicode

east_asian_width
リンク
Unicodeに不愉快な絵文字が - 帰ってきた💫Unicode刑事〔デカ〕リターンズ
ちょっと先の話なんだけどさ。たぶん来年（2014年）、Unicodeに絵文字がまたどっさり入るんだよね*1。それは楽しみですねー。どんなのが入るんですか？たとえば、こんなの*2とか……。 …………。えーっと、他にはね……。もういいです。【今回の話題に関連するISO/IEC JTC1/SC2/WG2の資料】 2011-09-23 Updated proposal to add Wingdings and Webdings Symbols 2012-02-16 Disposition of comments on SC2 N 4201（PDAM text for Amendment 1.2 to ISO/IEC 10646 3rd edition） 2012-10-09 Disposition of comments on SC2 N 4228（PDAM text for Amend
mrkn 2013/02/01
"REVERSED HAND WITH MIDDLE FINGER EXTENDED"

unicode

emoji
リンク
ＭＳゴシックの文字幅 - なるせにっき
こんな場末の日記をわざわざ見に来る方は UAX #11: East Asian Width なんかは当たり前に読み込んでいると思うんですが、読み込んだ人はきっと気づくと思うんです、このドキュメントはあてにならないことに。じゃあどうすればいいかってなるんですが、端的には融通の効かない奴に合わせるわけですな。それはアプリ側のこともフォント側のこともあるんですが、今回はフォント側の事を考えることにします。フォント側のことを考えるってことは、要するにフォントは不動と考えるってことで、そういうフォントって要するにＭＳゴシックのことなので、これを測ることにするわけです。さて、どうやって測るかというと、実際に描画して測るわけです。Tex tRenderer.MeasureTextとかでも行けそうに思えるんだけど、グリフがない場合に fallback しちゃうんでうまくいかない。 using Syste
mrkn 2011/08/29
unicode

font

glyph

east_asian_width
リンク
Unicode 6.0.0
Unicode® 6.0.0 Released: 2010 October 11 (Announcement) Version 6.0.0 has been superseded by the latest version of the Unicode Standard. Unicode 6.0.0 is a major version of the Unicode Standard. This page summarizes the important changes for the Unicode Standard, Version 6.0.0. In the discussion below, shortened references to "Unicode 6.0" or "Version 6.0" specifically refer to Version 6.0.0. Cont
mrkn 2011/04/11
character_encoding

unicode

emoji
リンク
JIS X 0221
Copyright (c) 2017 Ministry of Economy,Trade and Industry. All Rights Reserved.
mrkn 2011/04/09
character_set

character_encoding

jis

jisx0221

iso

iso10646

unicode

ucs
リンク
東アジアの文字幅 - Wikipedia
この記事には複数の問題があります。改善やノートページでの議論にご協力ください。出典がまったく示されていないか不十分です。内容に関する文献や情報源が必要です。（2017年4月）独自研究が含まれているおそれがあります。（2017年4月）出典検索?: "東アジアの文字幅" – ニュース · 書籍 · スカラー · CiNii · J-STAGE · NDL · dlib.jp · ジャパンサーチ · TWL 「東アジアの文字幅」（英: East Asian Width）は、Unicode標準の附属書 (英: Unicode Standard Annex) の一つ。Unicodeに収録されている各文字の文字幅に関するヒントを与える East_Asian_Width 参考特性（英: informative property）を定めている。概要[編集] 東アジアのマルチバイト文字コード規格は必
mrkn 2011/02/01
unicode

character_width

fullwidth

halfwidth
リンク
「Java 6 でIVSを比較すると何が起こるか」の記事の誤り - Cafe Babe
以下の記事に誤りが散見されるが，それが広まるのは望ましくないので，ここで誤りを指摘しておく．「Java 6 でIVSを比較すると何が起こるか」（yanok.net）まず，Javaの文字列の同一性判定の話である．これは想像通りですね。単にcharの列を比較しただけの結果になっています。つまり、見た目の区別がつかなくても容赦なく別々の文字列として扱っています。これが何をもたらすかというと、Stringクラスで比較しているプログラムに対しては、"与" と "与[0E0100]" と "与[0E0102]" を、見た目の区別がないにもかかわらず、人が入力し分けてやらないと困ることになるということです。 Java言語でUnicode文字列が同一性を判定するには，いくつかの方法がある． java.lang.String#equals()…単なるUnicode文字シーケンスの同一性を判定する ja
mrkn 2011/01/13
java

unicode
リンク
UTN #28: Nearly Plain-Text Encoding of Mathematics
Summary This document provides describes a format for lightly marked-up representation of mathematical expressions in Unicode. Status This document is a Unicode Technical Note. Sole responsibility for its contents rests with the author(s). Publication does not imply any endorsement by the Unicode Consortium. This document is not subject to the Unicode Patent Policy. For information on Unicode Tech
mrkn 2010/10/28
mathematics

unicode

tex
リンク
#600246 - screen: Fix screen outputs screen "ÿ" after a connected character - Debian Bug report logs
Debian Bug report logs - #600246 screen: Fix screen outputs screen "ÿ" after a connected character Reported by: Nobuhiro Iwamatsu <iwamatsu@debian.org> Date: Thu, 14 Oct 2010 23:39:01 UTC Severity: important Tags: confirmed, patch, upstream Found in versions 4.1.0~20120320git db59704-5, screen/4.0.3-14 Fixed in versions screen/4.1.0~20120320git db59704-1, screen/4.8.0-6 Done: Axel Beckert <abe@debia
mrkn 2010/10/15
debian

screen

unicode
リンク
glibc の wcwidth の話の続き - diary of a madman
glibc の wcwidth() の「曖昧な文字幅」についての動作の話の続き。やっぱり、UTF-8 の charmap を全部書き換えてしまうのは良くないと思い、以下のようにしてみた。まず、/usr/share/i18n/charmaps/UTF-8.gz を改造して ambiguous width な文字の幅を 2 にしたものを /usr/share/i18n/charmaps/UTF8-8-CJK.gz として設置。*1 次に UTF-8-CJK を使って locale を再作成 $ sudo localedef -i ja_JP -c -f UTF-8-CJK ja_JP.UTF-8あるいは、/etc/locale.gen を以下のように書き換えて locale-gen コマンドを実行しても同じ。(Debian 特有?) en_US.UTF-8 UTF-8 ja_JP.EUC-
mrkn 2010/10/15
wcwidth

debian

unicode

glibc

encoding

m17n
リンク
http://www.unicode.org/Public/6.0.0/ucd/EmojiSources.txt
mrkn 2010/10/14
unicode

emoji

docomo

kddi

softbank
リンク
「Unicode 6.0」が策定、絵文字が国際標準に
mrkn 2010/10/14
絵文字の Unicode 化には Google, DoCoMo, KDDI, SoftBank, Apple が関わってるので、経緯を知らない人は調べようね。あと参考: http://code.google.com/p/emoji4unicode/

unicode

emoji

mobile

google

docomo

kddi

softbank

apple
リンク
グーグルが絵文字を世界標準に提案した理由--国際化エンジニアに聞くプロジェクトの舞台裏（後編）
2008年11月27日、Googleは日本の携帯電話の絵文字をUnicodeに収録する計画を公表した。Googleはどんなプロセスを経て絵文字をUnicodeに提案すると決めたのだろうか。2月25日に公開した前編はこちらから。 Appleが絵文字提案に加わったいきさつ ――「絵文字シンボル符号化の提案（PDF）」（ISO/IEC 10646への提案書）を読むと、GoogleだけでなくAppleの名前もあります。これはどういう経緯なのでしょう。 2008年8月になって、Appleさんが200文字だったか300文字だったか、UTCのシンボル小委員会に絵文字のプロポーザルを出して来たんです。私達のプロポーザルでは約720文字あったんですが、より少ないコアセットにしようというものでした。Appleさんは、720文字も出したら通らないのではないかという危機感を持っていたようです。この年の秋に日本でi
mrkn 2010/03/02
culture

unicode

emoji

google

apple

microsoft

mobile
リンク
そろそろUnicodeについて一言いっておくか - 未来のいつか/hyoshiokの日記
文字コードの標準化について日記を書いたのだが、内容がいまいちだったのでボツにして気を取り直してUnicodeについて一言いっておくことにする。先日、といっても昨年(２００８年)の10月なんだけど、その中でちょと文字コードの標準化について話をしている。*1 もう1つ自分の経験としてあるのが、漢字の文字コードがあるんですけど、番号で言うとJIS X 0208とか0212とか規格の番号で皆言うわけなんですけど、実は1988年にその日本語の文字コードの改正の委員会にいたんですね。その当時、私は 30歳ぐらいなんですけど、「富士通」とか「日立」とか「NEC」の部長さんぐらいの偉い人たちが来てて、私なんか外資系で且つ30前後のぺーぺーだから、全然格下なんですよ。そういうところで議論の主軸を担ってるのは、「富士通」「日立」「NEC」「日本IBM」「東芝」「沖」、外資でいえば「ユニシス」とかの錚々たる
mrkn 2009/04/20
閉じ込もっちゃアカンよな

history

unicode
リンク
絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット
前回までを振り返る--Unicodeコンソーシアムの影響力前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC（Unicode Technical Committee/Unicode技術委員会）で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソー
mrkn 2009/03/19
mobile

emoticon

emoji

unicode
リンク
絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道
Unicodeが携帯電話の絵文字を収録へ絵文字ってなに？そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな！　8割の女性は「恋人以外にも使う」』（RBB NAVI）なんていうニュースもありました。携帯電話の個人普及率が9割を上回る（平成20年内閣府消費動向調査）この国において、絵文字はごくありふれたものになっている現実があります。 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するもの
mrkn 2009/03/01
絵文字標準化の話って最近になって盛り上がてるけど、実は 2007年に既に Working Draft が出てる http://sites.google.com/site/unicodesymbols/Home/emoji-symbols

google

unicode

emoticon
リンク
Emoji Symbols (Unicode Symbols)
This proposal has been approved, and Emoji symbols were added in Unicode 6.0. They have been growing and flourishing since then. The rest of this page (and much of this site) is only of historic/archival interest. The proposal for encoding of Emoji symbols as Unicode characters covers the Emoji symbols that are in widespread use by DoCoMo, KDDI and Softbank for their mobile phone networks. These s
mrkn 2009/03/01
mobile

unicode

google

emoticon
リンク
҉←「文字の流れを左右逆にする特殊文字」のトリック : 亜細亜ノ蛾 - Weblog
この文字は何？ 2007-08-31T14:53:00+09:00 追記某ブックマークサイトからお越しの皆様へ。おかげで、色々な情報を知ることができました。ありがとうございます！下の「種明かし？」に追記しました。何となく種明かしになったのでは、と。まぁ、ムダ知識程度にお楽しみください。トラックバック先に有益な情報があるので、そちらもどうぞ。 ‫‬‭‮‪‫‬‭‮҉ はてなブックマーク経由で、上の不思議な記号のことを知りました。──フォントによっては見えなかったり、？や□になっていると思いますが、実際は「, で丸を描いたような記号」です。どう不思議かは、下のフォームに文字を入力してみると、すぐわかるかと。この記号を消さないように、何か入力してみてください。環境によると思いますが、入力した文字の流れが左右反対になります。とくに、日本語入力中でも反対になるのにビックリ（Windows XP
mrkn 2007/08/30
「҉」はCOMBINING CYRILLIC MILLIONS SIGN (U+0489) という単なる記号．‫ (U+202B) 等は RTL 埋め込み文字の類→http://www.decodeunicode.org/u+202B

Unicode

BiDi
リンク
1