タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

unicodeとnormalizationに関するkei2100のブックマーク (3)

  • 文字コード嫌いだ - Qiita

    WEBシステムの構築をしていて、文字コード関連でつまずくことがよくある。 そのたびに、何やったけ?って悩むことが嫌なのでまとめていきます。文字コード関連は、ほんとにめんどくさくていやだ。クライアントも、サーバもDBも全部UTF-8にしてやれば良いのに。。。 全角チルダ問題 簡単にいうと、SJISとUTF-8で文字コードもマッピングがずれている問題。 なんでこんなことになっているのか。。。 どのような事象か 見た目がほぼ同じな「〜」(波ダッシュ)、「~」(全角チルダ)という二つの文字がそれぞれUTF-8で「0x301C」「0xFF5E」の文字コードが割り当てられています。しかし、Sjisでは、「〜」(波ダッシュ)が「0x8160」、「~」(全角チルダ)は対応なしとなっています。そのため、SJISに変換するときに対応する文字がないということがあり得てしまいます。 ■SJISとUnicodeの変

    文字コード嫌いだ - Qiita
  • Find all Unicode Characters from Hieroglyphs to Dingbats – Unicode Compart

    Unicode-Compart is a site dedicated to Unicode and all things related to Unicode, characters, glyphs and internationalization

  • ハイフンに似てる文字の文字コード - Qiita

    語環境ではハイフンっぽく見える文字が何種類も有ります。 そのせいで、住所入力欄などでハイフン(っぽい文字)でバリデーションにひっかかってイライラするということが多々有ります。 一般のユーザーがハイフンっぽい文字の違いを理解しているはずもないので、ハイフン系文字の内、特定の1つだけを許容するようなバリデーションルールを設定してしまうと、ユーザビリティを低下させてユーザの離脱を招きます。 ハイフンっぽいものは全部入力できるようにして、サーバサイドで統一的な文字に置換するほうが良いでしょう。 というわけで、日語環境で入力できるハイフンをまとめてみました。 文字 UTF-8 Unicode 説明

    ハイフンに似てる文字の文字コード - Qiita
    kei2100
    kei2100 2016/10/14
    ハイフン ダッシュ hyphen dash
  • 1