[B! unicode][文字] kappaseijinのブックマーク

kappaseijin id:kappaseijin

unicodeと文字に関するkappaseijinのブックマーク (2)

Twitter時代の文字の数え方 | 配電盤
入力「×」のブラウザでは、「𠮷」が2文字とみなされるため、2文字目まで、つまり「𠮷野」までしか入力できません。 Mozillaの文書には、Unicode code pointsで数えると書いてあるので、そのうち改善されるのかもしれませんが、現時点ではTwitterのために「maxlength="140"」を使うことはできません。 pattern属性 Firefox 21とChrome 27、IE 10、Opera 12.15は、「pattern=".{0,3}"」（任意の文字からなる0から3文字）のような正規表現を使った検証にも対応していますが、やはり「𠮷野家」は4文字とみなされてしまいます。 JavaScript 追記：javascript – でBMP以外のUnicode文字をきちんと扱う（404 Blog Not Found） JavaScriptでは、文字列strの長さをst
kappaseijin 2013/03/30
Unicode

文字
リンク
「Java 6 でIVSを比較すると何が起こるか」の記事の誤り - Cafe Babe
以下の記事に誤りが散見されるが，それが広まるのは望ましくないので，ここで誤りを指摘しておく．「Java 6 でIVSを比較すると何が起こるか」（yanok.net）まず，Javaの文字列の同一性判定の話である．これは想像通りですね。単にcharの列を比較しただけの結果になっています。つまり、見た目の区別がつかなくても容赦なく別々の文字列として扱っています。これが何をもたらすかというと、Stringクラスで比較しているプログラムに対しては、"与" と "与[0E0100]" と "与[0E0102]" を、見た目の区別がないにもかかわらず、人が入力し分けてやらないと困ることになるということです。 Java言語でUnicode文字列が同一性を判定するには，いくつかの方法がある． java.lang.String#equals()…単なるUnicode文字シーケンスの同一性を判定する ja
kappaseijin 2011/01/16
CafeBabe

Java

IVS

6

Unicode

ユニコード

比較

文字

文字列
リンク
1

お知らせ

もっと読む

公式Twitter

@HatenaBookmark
リリース、障害情報などのサービスのお知らせ
@hatebu
最新の人気エントリーの配信

キーボードショートカット一覧

j次のブックマーク

k前のブックマーク

lあとで読む

eコメント一覧を開く

oページを開く

設定を変更しましたx