タグ

Unicodeに関するy-kawazのブックマーク (5)

  • Twitterに登場する動物ʕ•̫͡•ʔの顔文字を構造解析する - RyoAnna

    Tweet Twitterで見かけるようになったオバケのような動物の顔文字。 Yahoo知恵袋にこの顔文字についての問い合わせがあった。 ✔ 最近ʕ•̫͡•ʔとか༼⍨༽を見かけますが、これはどんな仕組みになっているのですか? - Yahoo!知恵袋 質問の回答として当ブログの記事がリンクされているが、この顔文字は当に合成用区分符号で構成されているのだろうか。 気になったので調べることにした。 実は、先の記事でUnicoder Liteを紹介した後、アプリの作者さんからメールを頂いていた。 そこにUnicoder Pro (App Store 450円)なら顔文字を解析できると書いてあったので試した。 簡単にできた。 1)IPA発音記号拡張 0295 2)一般句読点 2022 3)合成用区分符号 0361 4)合成用区分符号 032B 5)一般句読点 2022 6)IPA発音記号拡張 02

    Twitterに登場する動物ʕ•̫͡•ʔの顔文字を構造解析する - RyoAnna
    y-kawaz
    y-kawaz 2011/06/18
    今後作るWEBサービスやアプリはʕ•̫͡•ʔ程度の顔文字はサラッと表示できるようにしておかないと時代についてけなくなるかもなw、とはいえ多分ユニコードとフォントを適切に扱えば良いだけなんだけど。
  • Twitterで見かけるハミ出した顔文字の正体 - RyoAnna

    少し前からTwitterで見かけるようになった、上下に飛び出す変な顔文字。 気持ち悪いのであまり関わらないようにしていたのだが、この顔文字の謎が明らかになったのでお伝えしたい。 いつものようにiPhoneのApp Storeをぶらぶらしていた時のこと。 Unicoder Lite (App Store)というアプリが気になりダウンロードした。 起動するとなにやら見慣れた文字が。 顔文字でよく使われるギリシャ文字やキリル文字だ。 しばらく眺めているとこんな符号が。 合成用区分符号 これが上と下の行にはみ出す顔文字の正体だった。 ためしに作ってみよう。 ベースとなる顔文字を置く。 左目に合成用区分符号を入れる。 続いて右目に。 見事にはみ出す。 Unicode(ユニコード)とは、世界中のコンピュータの文字を符号化したもの。その "U+0300-036F" に配置されているダイアクリティカルマー

    Twitterで見かけるハミ出した顔文字の正体 - RyoAnna
    y-kawaz
    y-kawaz 2011/06/08
    はみ出す顔文字の正体!ユニコードは奥が深いな。
  • Unicodeの似た文字を整理してみた - y-kawazの日記

    XMLやCSV等のデータをJavaで色々加工して出力したりといったことをしてると必ずハマるのが波線などの文字化け問題です。 文字化けが発覚するたびにググって場当たり的な対処を繰り返すのに疲れたのでよく問題になる文字と形が似た文字をリストアップして、更にそれをJavaで各種エンコーディングに変換したらどの文字になるかを頑張って纏めました。 ついでに文字化けしないよう上手いこと出力可能な文字に置換する関数も作ってみました。 Javaの変換テーブル 表中の U,S,W,E,J はそれぞれ、UTF-8、Shift_JIS、Windows-31J、EUC-JP、ISO-2022-JP で出力した際の文字です。 見た目で分からないくらい似た文字ばかりなので、各セルにマウスカーソルを乗せたらツールチップで確認できるようtitleにコードポイントを書いておきました。 分かりやすいよう、青は文字化けなし、黄

    Unicodeの似た文字を整理してみた - y-kawazの日記
    y-kawaz
    y-kawaz 2010/11/12
    Unicodeの似た文字を整理してみた。/Javaの文字化け対策関数を追記した。/ちなみに記者さんが思い思いにあまり深く考えずに入力した文章を明らかな文字化け無しで大体そのまま表示したかっただけだからね。
  • 「Unicode 6.0」が策定、絵文字が国際標準に

    y-kawaz
    y-kawaz 2010/10/14
    ブコメ見ると勘違いしてる人が居るようだけど、コードが決まったってだけで、絵文字の見た目に関してはフォントの問題で図にあるのは只の1例、携帯端末で表示するのはカラフルな絵文字が割り当てられると思うよ。
  • 絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ

    WG 2ダブリン会議に持ち込まれた絵文字の提案 2009年4月21日火曜日、ここはイギリスのお隣、アイルランドの首都ダブリン郊外です。広大なキャンパスをかまえるダブリン・シティ大学の一画では、前日から11カ国のナショナルボディ(以下、NB)と2つの組織のリエゾンメンバー(連絡担当会員)が集まって、第54回WG 2会議が開かれていました。 大学の正門から真っ直ぐに延びた広い道を100メートルばかり行った突き当たりに、巨大なる工学部校舎が建っています。その建物の奥深く、2階にあるミーティングルームでは、先ほどから重苦しい空気が立ちこめていました。 ここで開かれていたのはWG 2の会議ではなく、特定のテーマを扱うアドホック会議です。「Ad-Hoc Committee on Emoji Encoding」(以下、Emojiアドホック会議)。──そう、2月のUTC会議を無事に通過したGoogle

    絵文字が開いてしまった「パンドラの箱」第6回--Google・Apple提案とそのシナリオ
  • 1