タグ

charsetに関するLianのブックマーク (6)

  • コンピューターで全漢字使用可に 6万字コード化 | NHKニュース

    語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。 このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進め

    コンピューターで全漢字使用可に 6万字コード化 | NHKニュース
    Lian
    Lian 2017/12/27
  • 温泉マーク なぜ変える?|NHK NEWS WEB

    「何で変えるの?!」「残してほしかった」「お年寄りが分かりにくくなる」ー。今、あるマークの見直しがネット上でちょっとした話題になっています。湯気のあがる様子を描いた、あの「温泉マーク」です。日人にはすっかりおなじみのマークですが、国の委員会はデザインを見直す議論を始めました。日発祥のものも多い「ピクトグラム」とも呼ばれる案内用マーク。なぜ今、見直すのでしょうか。(経済部 野上大輔) 人が駆け出すようなデザインの「非常口マーク」、男女が並んだ「トイレマーク」。私たちの身の回りには、一目見ただけでそこに何があるかが分かるマークであふれています。こうした案内用のマークは「ピクトグラム」と呼ばれています。文字と違って一目で分かる便利さから、日だけではなく世界中で使われています。 ところが、これらのデザインを見直そうという会議が今月から経済産業省で始まりました。国土交通省や警察庁、JRなどの公

    温泉マーク なぜ変える?|NHK NEWS WEB
    Lian
    Lian 2016/10/05
    Unicodeにもemojiにも登録されてるのになぁ……
  • utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる

    RailsMySQLのcollationをサーバー側のデフォルトのutf8_general_ciからutf8_unicode_ciにわざわざ変えてるのどうせ大した理由じゃないだろと思って掘ってみたらやっぱり大した理由じゃなかった… https://t.co/6NeetGhTF0— Ryuta Kamizono (@kamipo) April 18, 2014 Railsでcollationとしてutf8_unicode_ci(RailsのDEFAULT_COLLATION)が採用されるのはcharsetが未指定もしくはutf8(RailsのDEFAULT_CHARSET)のときだけで、utf8mb4にすることとかは全く考慮されてない。— Ryuta Kamizono (@kamipo) April 19, 2014 @frsyuki MySQLのcharset utf8のときのデフォルト

    utf8_unicode_ci に対する日本の開発者の見解 - かみぽわーる
  • Unicodeのすべての文字を1ページで | 配電盤

    この記事で作るもの:Unicode 6.0のすべての文字を1ページで (PDF, 23MB) ヨハネス・ベルガーハウゼン, シリ・ポアランガン『世界の文字と記号の大図鑑 ー Unicode 6.0の全グリフ』(研究社, 2014)の著者はUnicode 6.0の全109242文字を2時間30分かけて見るビデオの作者ですか。今度は1024ページの書籍。「Decodeunicode」で画像検索すると原著が出てきますが、楽しみですね。(追記:世界の文字と記号の大図鑑) 「Unicodeのすべての文字を印刷したって、前にもなかったっけ?」と思って棚を探したのですが、勘違いでした。 頭に浮かんだのはThe Unicode Consortium『The Unicode Standard, Version 5.0』(Addison-Wesley Professional, 2006)(文献リストあり

    Unicodeのすべての文字を1ページで | 配電盤
    Lian
    Lian 2014/09/02
    1.2m x 1.2mとかB0でも印刷できないやん
  • Unicodeの全文字セットと便利ツールが揃った -Unicode character table

    Unicodeの全文字セットを見やすくまとめたUnicode character tableを紹介します。 見たことのない文字や記号を眺めているだけで、ちょっと楽しいです。 Unicode character table 上記キャプチャだと2スクロール分のスクロールバーしか表示されていませんが、テーブルは無限スクロールとなっており、スクロールするとどんどん表示されます。

  • コンピュータとかバイクとか。 Ruby UTF-8 から Shift_JIS(Windows-31j) へ変換するときにエラー

    残念ながら、世の中はWindowsを中心に回っているため、CSVをやりとりするときには、文字コードをShiftJISにすることが求められたりします。 RubyプログラムをLinuxで書いていると文字コードは基的にUTF8になるので、文字コード変換をする必要が出てくるわけですが、kconvやString#encode(Ruby 1.9以降)を使ってSJISに変換する際にエラーを吐かれる文字がいくつかあります。 詳しくは、下記の参考ページに書かれていますが、全角チルダ(ウェーブダッシュ,wave-dash)やハイフン(hyphen)、セントやポンドなどの記号が当てはまります。 文字コードで言うと、U+301C、U+2212、U+00A2、U+00A3、U+00AC、U+2014、U+2016あたりですね。 参考:マニアックなプログラミング備忘録「文字化けについて」 というわけで、文字列をkc

    Lian
    Lian 2013/02/12
  • 1