タグ

Unicodeに関するodzのブックマーク (7)

  • Emacs22 UTF-8 における文脈依存な文字幅の問題について

    UTF-8 には文字の幅が文脈依存 (ambiguous) となる文字があって、 矢印や記号 (■▲)、罫線などの文字は状況に応じて文字幅が変化します。 下の 2 つの画像は Emacs で同じファイルの内容を narrow character として判定させた場合と、 wide character として判定させた場合のスクリーンショットです。 narrow wide 現状、 Emacs22 はこれらの文字をデフォルトで narrow character として判定します (※のように化けてしまう文字もあります)。 文字によって幅を変えるプロポーショナルフォントを前提としたテキストであれば あまり問題にはならないと思いますが、等幅フォントに向けて書いたテキストでは 表示がガタガタになってしまい問題になります。 これらの文字を wide character として判別させるには以下の設定を

  • UTF-8 エンコーディングの危険性 - WebOS Goodies

    的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるかもしれません。しかし、複数のモジュールで構成されるような規模の大きいアプリケーションでは、そのすべてが適切な処理を行っていると保証するのも、なかなか難しいかと思います。ここはやはり、すべての外部入力に含まれる不正なシーケンスを、水際で正規化するという処理を徹底するのが一番かと思います。 例えば Ruby の場合、不正な UTF-8 コードを検出する最も簡単な方法は、 String#unpack を使って UCS へ変換してみることです(昨日の記事への kazutanaka さんからのはてぶコメントにて、 iconv でも同様なこ

    odz
    odz 2007/02/23
    ふむ
  • UTF-16の誕生 | yasuokaの日記 | スラド

    たとえば「16ビットのコードを2つ組み合わせることで急場をしのいだ」といった書き方は、いかにも行き当たりばったりでサロゲートペアを作ったように見えますが、実際には最初から計画的にサロゲート用のコードはリザーブしてあったわけですよね。 「最初から計画的にサロゲート用のコードはリザーブしてあった」というのは、どう考えても嘘だ。この際だからUTF-16の誕生に関して、私の知る限りのことを記しておこうと思う。 Joseph Dermansly BeckerがJTC1/SC2/WG2に『Proposal for Extended UCS-2 being also a Proposal for Extended Unicode』を提出したのは、1993年4月のことだ。後にJTC1/SC2/WG2 N883と呼ばれるこの文書において、Beckerは、High Half Zoneとして2C00~2FFFを

    odz
    odz 2007/01/03
  • ganaware - Overview

    You signed in with another tab or window. Reload to refresh your session. You signed out in another tab or window. Reload to refresh your session. You switched accounts on another tab or window. Reload to refresh your session. Dismiss alert

    ganaware - Overview
    odz
    odz 2006/12/18
    OSX のファイル名は濁点「゛」や半濁点「゜」のついたひらがなやカタカナは 2 文字で表現される
  • Perl vs Windows改行コード - 2006-11-15 - D-5 出張版

  • Aprotool ComWin Official Page

    (Last updated May.24 2016) Please go to this page for Japanese. Mirror sites are the following. http://hp.vector.co.jp/authors/VA002891/index.htm Wellcome to ComWin/Aprotool home page. These pages introduce the latest information of ComWin/Aprotool. ComWin is a command manager for window system. It provides keybord oriented operation in a window system. You can get more conforatable environment in

  • IBM Globalization - ICU

    Three critical imperatives will determine a smarter, more responsive business: IT will become decentralized, open and secure. Automation will fuel the future of work. Winners will scale the value of data with AI. Our hybrid cloud software helps you achieve these initiatives: Build upon an open, modular services architecture for any cloud. Protect and extend existing investments. Support from an ec

    IBM Globalization - ICU
  • 1