タグ

文字と文字コードに関するskypenguinsのブックマーク (2)

  • 日本の文字とUnicode - 第3回 ひらがな・カタカナとUnicode - 大修館書店 WEB国語教室

    現代において、文字を書くということは、コンピュータやケータイのキーを打つことと、ほぼ同義になってきています。そして、現代のコンピュータにおいて文字を扱うためには、文字コード、それもUnicodeの助けを借りるしかなくなってきています。でも、Unicodeは日語に特化して作られたわけではないので、日の文字を扱おうとした場合、色々とヤヤコシイ点があったりします。それらのヤヤコシイ点を、できるだけ平易に説明するこのシリーズ、第3回は、ひらがな・カタカナとUnicodeの関係です。 UnicodeのU+3041~U+3096には、ひらがなが収録されています(コード表参照)。 UnicodeのU+30A1~U+30FAには、カタカナが収録されています(コード表参照)。 ひらがなとカタカナは、Unicode上での順序が、 ほぼ同じになるように収録されています。 たとえば、ひらがなのU+305F~U

  • 不思議な文字 pͪoͣnͬpͣoͥnͭpͣa͡inͥ

    "ダイアクリティカルマーク(英語: diacritical mark)は、ラテン文字等の文字で、同じ字形の文字であるが、発音が区別されるべき場合に文字に付される記号のこと。あえて日語の文字で似た概念を探せば、濁点と半濁点に相当するであろう。" "コンピュータ処理では、ダイアクリティカルマークのついた文字に独立した文字コードを与えているもの(ISO/IEC 8859、Unicode、JIS X 0213など)が多いが、別の方法として、親字の前または後に特殊なコードを置くことによって表記する方法がある。前に置く例としてはISO/IEC 6937(英語版)が、後に置く例としてはUnicodeでCombining Diacritical Marksと呼ばれる一連のコード(U+0300からU+036Fまで)がある。"

  • 1