タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

Unicodeに関するmasutaka26のブックマーク (3)

  • 濁点の合成文字がソースコードに入っちまった💢 -> gitのpre-commit hookで打ち勝った ·

    濁点文字をソースコードに入れてしまって不具合を起こしてしまうということがありました。 自分の書いたカタカナの濁点が合成文字になってて(バ= ハ+゛みたいなやつ)そのバグに気づかなくて30分ぐらい無駄にしたアカウントです — hoshinotsuyoshi🥴 (@hoppiestar) July 23, 2018 なんという不覚。。 githubで見ても手元のvimで見ても見た目上は全く違いがわからんという状態。 いや、見た目でわかると思ったんですけどね� ちょっと以下3つの「バ」を見てください。 濁点アリの1文字「バ」 U+30D0 KATAKANA LETTER BA バ これが普通のバ。 2文字「ハ」+「゛」 U+30CF KATAKANA LETTER HA U+309B KATAKANA-HIRAGANA VOICED SOUND MARK ハ゛ 👆くっつきかたが、ちょっと不自

    濁点の合成文字がソースコードに入っちまった💢 -> gitのpre-commit hookで打ち勝った ·
  • 絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama

    UnicodeのUTF-16エンコーディングではほとんどの文字(コードポイント)は2バイトで表現されるが、Unicodeに後から追加収録された文字の多くは4バイトで表現される。4バイト文字がうまく扱えないプログラムというのはわりとよくある。しかし世界中で広く使われるようになった絵文字がよりによって4バイト文字であるせいで、そのような文字が扱えない問題がよいペースで解決に向かいつつある。それについて少し説明してみようと思う。 Unicodeが80年代から90年代初頭にかけてデザインされたときの目標の一つは、Unicodeに含まれる文字数を65536個以内に収めることだった。現代の文章を実用的なレベルで表すためには、漢字などを含めてもそれだけの種類の文字があれば十分だと考えられたのだ。当然これは1文字を2バイトで表すことを念頭に置いていた。つまりコンピュータの揺籃期から当時に至るまで単純に英語

    絵文字がある種のUnicodeバグを世界から一掃しつつある件について|Rui Ueyama
  • フォントは自由に変えられる。だから絵文字で何かを伝えるのはナンセンス。そんなことも分からなかったのか、Googleよ。

    Unicodeに絵文字が多数追加されたことは、以前から批判していたのだが、やはりというか何と言うか、しょっぱい問題が起こりつつある。 macOS SierraやiOS 10でピストル絵文字🔫が水鉄砲に変わることで起こる問題。 | AAPL Ch. 絵文字フォント次第で形が変わる。故にフォントが変わればニュアンスも変わる。自分と相手、あるいは今使っている機種と将来使う機種が同じフォントを使っているとは限らない。だからフォントを変更することで様々な問題が起きるわけである。 根的な問題=性質が異なるものを混ぜてしまった文字と絵は質的に性質が違う。 文字はその見た目ではなく、文字を組み合わせた単語、単語を並べた文章によって意味を持つ。フォントが違っても、見た目の違いはあれど、文章そのものの意味は変わらない。どのようなフォントで読んでも意味は通じるのである。 ところが、絵文字はそうは行かない

    フォントは自由に変えられる。だから絵文字で何かを伝えるのはナンセンス。そんなことも分からなかったのか、Googleよ。
    masutaka26
    masutaka26 2016/11/24
    文字コードは史上最高のバッドノウハウなのに、絵文字が入って完全なカオスが出来上がった気が
  • 1