タグ

UTF-8に関するk1LoWのブックマーク (4)

  • Can't convert string from 'UTF-8' to native encoding

    現場で Subversion の運用を担当しているが、「現行 repository のデータを複製して、新たに repository を作成する。」という作業をすることになった。現行 Java プログラムを流用して新たに作成するためだ。以前にも同様の作業をしていた。個人的な手順は、ざっくりと以下のとおり。 $ CurrentRepository=/var/svn/current $ NewRepository=/var/svn/new $ mkdir -p /var/svn/tmp/current $ svn checkout file:///${CurrentRepository} /var/svn/tmp/current $ svnadmin create ${NewRepository} $ svn import -m "Importing new project" /var/svn

  • 文字コード戦争 - 備忘録 @ Wiki

    *iconvでの文字コード変換 iconvを使用した文字コード変換ではまったので注記 **UTF-8<=>Shift-JIS 文字コードをUTF-8とShift-JISで相互変換する場合に特定の文字が処理系で違うコードに変換されるようです。(ソフト依存??) その他の文字についてはまだ調べてないが、「-」(IMEでは[全]マイナスと表記)をWindows上でUTF-8として入力すると、EF BC 8D(EFBC8D)となる。 しかし、調べてみると、正しくはE2 88 92(E28892)らしく、iconvで「UTF-8->Shift-JIS->UTF-8」の変換を行うと「Shift-JIS->UTF-8」のところで不可逆な変換となりバグってしまう。 とりあえず、IMEからの入力は無理っぽかったので、iconvでE2 88 92のコードに変換してからコピペした。 ほかにもこんな文字があるのか

    文字コード戦争 - 備忘録 @ Wiki
  • preg_replace()で文字化け

    ► 2018 (1) ► 1月 (1) ► 2017 (4) ► 6月 (3) ► 5月 (1) ► 2016 (15) ► 12月 (4) ► 11月 (1) ► 10月 (2) ► 7月 (3) ► 6月 (1) ► 5月 (3) ► 1月 (1) ► 2015 (13) ► 12月 (1) ► 10月 (1) ► 9月 (1) ► 6月 (1) ► 5月 (1) ► 3月 (2) ► 2月 (3) ► 1月 (3) ► 2014 (11) ► 12月 (1) ► 9月 (2) ► 8月 (2) ► 6月 (1) ► 4月 (4) ► 2月 (1) ► 2013 (15) ► 12月 (3) ► 11月 (3) ► 8月 (2) ► 7月 (4) ► 5月 (1) ► 4月 (2) ► 2012 (7) ► 10月 (1) ► 7月 (1) ► 4月 (3) ► 1月 (2) ► 20

    k1LoW
    k1LoW 2009/12/24
    multi byte
  • Emacs22 + UTF-8 における文脈依存な文字幅の問題について

    UTF-8 には文字の幅が文脈依存 (ambiguous) となる文字があって、 矢印や記号 (■▲)、罫線などの文字は状況に応じて文字幅が変化します。 下の 2 つの画像は Emacs で同じファイルの内容を narrow character として判定させた場合と、 wide character として判定させた場合のスクリーンショットです。 narrow wide 現状、 Emacs22 はこれらの文字をデフォルトで narrow character として判定します (※のように化けてしまう文字もあります)。 文字によって幅を変えるプロポーショナルフォントを前提としたテキストであれば あまり問題にはならないと思いますが、等幅フォントに向けて書いたテキストでは 表示がガタガタになってしまい問題になります。 これらの文字を wide character として判別させるには以下の設定を

  • 1