[B! 文字コード] [6ページ] morobitokozouのブックマーク

http://homepage.mac.com/travellers/blog/C746134881/E1616758770/

morobitokozou 2006/02/10

とりあえず iconv での Decomposed した Unicode の変換には、UTF-8-MAC と覚えておきましょう。

リンク

Converting to Precomposed Unicode

Q: Unicode 文字列を合成済みの文字の形式に変換する方法はありますか？ A: Mac OS X 10.2 で導入された API を使用して、文字列を合成済みの Unicode に変換できます。以下に、合成済みの Unicode と分解された Unicode の違い、なぜ合成済みの Unicode に変換する必要があるのか、および変換方法について説明します。合成済みの文字と分解された文字特定の Unicode 文字は、複数の方法でエンコードできます。たとえば、Á（A アキュート）は、U+00C1 (LATIN CAPITAL LETTER A WITH ACUTE) のような合成済みの文字、または U+0041 U+0301（LATIN CAPITAL LETTER A に続く COMBINING ACUTE ACCENT）のような分解された文字のいずれかをエンコードできます。W

morobitokozou 2006/02/10

Q: Unicode 文字列を合成済みの文字の形式に変換する方法はありますか？

リンク

Unicode正規化

正しい並び替えでは、表示は(A)のままですが、間違った並び替えでは、正規結合クラスが互いに等しいMACRONとACUTEを並び替えたため、表示は(B)のように、eの上のアクセント記号の位置が入れ替わってしまいます。正規分解・互換分解ある文字列の正規分解 (Canonical Decomposition) を得るには、まず、それぞれの文字を正規マッピングによって再帰的に、可能な限り、分解します。すなわち、1回分解した後に現れた文字がなおも分解可能であればさらに分解します。分解マッピングがその文字自身である場合は、分解不可能なので、そのままです。しかし、分解しただけでは必ずしも正しい結果が得られません。つまり、結合文字の順序の一意性を保証するため、分解後の文字列に対して正規順序アルゴリズムを適用しなければなりません。このように、正規マッピングによる再帰的分解と、正規順序アルゴリズムによ

morobitokozou 2006/02/10

文字コード

リンク

Termnalと日本語文字コード変換

- コマンドラインで日本語を - on Mac OS X　2(3)/12704 更新:2013/05/19 ←ホームページ vimとnvi-m17nのページへ→ 注意：このページの内容については、何ら動作を保証するものではありません。使用するときは個人の責任でお願いします。 Mac OS Xにはコマンドを打ち込んで様々な操作を行うための"Terminal"というアプリケーションが入っています。(/Applications/Utilities内)　Terminalでは現在(Mac OS X 10.3.*)、日本語入力・表示ができるようになっています。しかし、バックスペースの動作がちょっとおかしかったり(漢字半分だけカーソルが戻るとか)、文字化けしたりする(特に日本語文字コードをEUCにしていると)ことがまだあります。ということで、「CUIで快適に日本語を使える環境をでっちあげよう！」という

morobitokozou 2006/02/07

リンク

文字コードについて

文字コード、標準化について文字コードについての実用的な説明です。文字コード表 JIS X 0201、JIS X 0208、JIS X 0213のJIS、EUC-JP、Shift_JIS、Unicodeの文字コード表と、JIS X 0221のUnicodeの文字コード表です。 JIS X 0211 の制御コード表（JIS制御コード） JIS X 0201 の文字コード表（JISローマ字：ASCII、JISカナ） JIS X 0201 の文字コード一覧（Unicode対応） JIS X 0208 の文字コード表（JIS漢字：第1・第2水準） JIS X 0208 の文字コード一覧（Unicode対応） JIS X 0213 の文字コード表（JIS漢字：第1・第2・第3・第4水準）［UTF-8テキスト版］ Unicode、常用漢字、人名漢字対応 JIS X 0213 の文字コード一覧［U

morobitokozou 2006/02/05

文字コード

リンク

http://www.dbms.cs.gunma-u.ac.jp/~kubota/bac/kishuizon.html

morobitokozou 2006/01/09

リンク

『Travellers Tale: Mail.app や Thunderbird 1.5 の日本語ファイル名が文字化けする件』

morobitokozou 2005/11/14

リンク

Unicode対応文字コード表

�$B!!�(BUnicode�$BBP1~$N�(B JIS X 0201 �$B$N�(BJIS�$B%m!<%^;z$H�(BJIS�$B%+%J$NJ8;z%3!<%II=$G$9!#�(B �$B!!�(B�$BJ8;z%3!<%I$K$D$$$F�(B�$B$N%Z!<%8$d!"�(B�$BJ8;z%3!<%I0lMw$K$D$$$F�(B�$B$N@bL@$b$"$j$^$9!#�(B JIS�$B%m!<%^;z!'�(BASCII�$B!&J8;z%3!<%II=�(B JIS SJIS EUC UTF-8 UTF-16 �$B;z�(B 20 20 20 20 0020 21 21 21 21 0021 ! 22 22 22 22 0022 " 23 23 23 23 0023 # 24 24 24 24 0024 $ 25 25 25 25 0025 % 26 26

morobitokozou 2005/10/06

文字コード

リンク

改行コード(HTML, Java, URL, エスケープシーケンス)

改行コード: HTML 10進, HTML 16進, Java 16進, URL 16進, エスケープシーケンス

morobitokozou 2005/10/06

文字コード

リンク

文字コードの話

本稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次はじめに第1章日本語のコード体系第2章 ASCIIと1バイト文字コード第3章 JIS漢字コードとエンコーディング法第4章 ISO 2022 第5章 ISO 2022の実例第6章中国語・韓国語の文字コード第7章 ISO 10646とUnicode おわりに参考文献はじめに ASCIIだけで用が足りるアメリカと違って、私たちは日本語を扱わなくてはならないため、より深く文字コードの問題と関わらざるをえません。それでも、MS-DOS/WindowsやMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日本語コードに頭を

morobitokozou 2005/10/05

リンク

JavaScriptにおけるURLエンコードの処理

このメモは、JavaScriptでクッキーを処理する場合のポイントをお示しし、URLエンコードに関わるトラブルを回避していただくことを目的にしています。お急ぎの方は3章と4章を飛ばして読んで頂いて構いません。なおこのメモはなるべくIEでご覧下さい。目次 1. 1　クッキーとURLエンコーディング 2. 2　URLエンコーディングとは 3. 3　JavaScriptにおけるescape()とunescape()関数 4. 4　JavaScriptにおけるencodeURI、decodeURI、encodeURIComponent、decodeURIComponent 5. 5　それでは一体どうすればよいか？ 6. 6　UTF-8のURLエンコード・デコード関数の例：プログラム例 7. 7　JSPとJavaScript間のクッキーによるデータ交換例 HTMLテキスト以外にウェ

morobitokozou 2005/10/04

リンク

はてなブックマーク

タグ

関連タグで絞り込む (68)

文字コードに関するmorobitokozouのブックマーク (111)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第4週）

今週のはてなブックマーク数ランキング（2024年5月第3週）

今週のはてなブックマーク数ランキング（2024年5月第2週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス