タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字コードとwebに関するImamuのブックマーク (2)

  • インターネットの怪異 - インターネット

    そのことに最初に気付いたのは、ずいぶん前だったような気がする。 通勤時間の暇潰しのためにWikipediaのアプリを入れてたまに読んでいるのだが、そのアプリの機能として「よく読まれている記事」という一種のアクセスランキング機能がある。例えば芸能人が不祥事を起こしたり亡くなればその人のページが翌日ランクインするし、何かの事件の判決が出たらその事件のページがランクインしたりする。ある意味では「ネットユーザーの興味の総意」みたいなところがあるランキングである。 しかし、ある時奇妙な項目がランクインしていたのを目にした。それは「今昔文字鏡」というソフトウェアに対する記事である。あまり一般に知られたソフトではないにも関わらず、今世間一般で話題になっている数々の項目を抑えてランクインしていたのである。 ja.wikipedia.org これだけなら「まぁ一部で何か話題になったんだろう、たまにはそんなこ

    インターネットの怪異 - インターネット
    Imamu
    Imamu 2019/04/25
    「なにせ今昔文字鏡を作っていた研究会は19年2月に解散とその項目にある。もはや話題が生まれようもないのだ」「Wikipediaに説明を丸投げ」「対照表を作った人物はどうやら今昔文字鏡というソフトのあり方に相当な不満」
  • 文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog

    ごあいさつ 皆様はじめまして、文字コードおじさんです。細々とカメラ屋を営んでおりましたが、エンジニアとしての技量を評価され、ALBERTのシステム開発・コンサルティング部で働くことを許されました。特技はサーバーの統廃合です。 今回は最初ということですが、Unicodeにおける全角・半角の取り扱いについて触れてみようと思います。なお、さも連載するかのように第1話と銘打っていますが、上層部の無慈悲な裁決によっては1話打ち切りもありえますので、その際はご容赦ください。 固定観念を捨てよう 「全角50文字、半角100文字まで」といったような文言を見かけたことがあると思います。 特にUnicode以前のレガシーな処理系では全角文字に2バイト、それ以外は1バイトという割り当てが慣習となっていました。 このため、「全角=2バイト文字、半角=1バイト文字」という観念が世間に定着しているのが現状です。 しか

    文字コード地獄秘話 第1話:Unicodeにおける全角・半角 - ALBERT Engineering Blog
    Imamu
    Imamu 2014/04/21
    「Unicode Standard Annex #11」「East Asian Width」「Unicodeの文字は下記の6つに分類」Fullwidth/Halfwidth/Wide/Narrow)/Ambiguous(文脈次第で全角・半角か取扱いが変わる・ギリシア文字、キリル文字など)/Neutral(アラビア文字、ヘブライ文字など)
  • 1