タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

encodingに関するYaSuYuKiのブックマーク (6)

  • C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita

    C++ Advent Calendar 2018 この記事はC++ Advent Calendar 2018 15日目の記事です。 14日目: VTKライブラリ 16日目: C++のエラー処理との付き合い方 当初見積もりよりも大幅に長い記事となり、投稿したのは12/22で1週間遅刻です。すみません。 お知らせ cpprefjpにchar8_t型追加について解説を書きました。ぎゅぎゅっとコンパクトに、また査読を受けて中立的な表現で書いていますので、よければどうぞ。 UTF-8エンコーディングされた文字の型としてchar8_tを追加 - cpprefjp C++語リファレンス 追記 全ての開発者が知っておくべきUnicodeについての最低限の知識 - GIGAZINE Unicodeについて簡潔にまとまってるいい記事を見つけました。 Caution この文章には以下の要素が含まれます。苦手

    C++標準化委員会、ついに文字とは何かを理解する: char8_t - Qiita
    YaSuYuKi
    YaSuYuKi 2018/12/23
    欧米を放置して、メモリを直接制御できる、より合理的で扱いやすく、まともにutf-8を扱える新しい言語を作る時ではないかという気がしてきた。この問題は中韓と手を組めるはず。メモリを制御しないのはRustで
  • コンピューターで全漢字使用可に 6万字コード化 | NHKニュース

    語の漢字は、戸籍などに使われているものも含めると6万字あるのに対し、コンピューターは、実は1万字しか扱うことができません。これに対し、このほど15年越しの作業の末、6万字すべてが統一の規格にまとめられて、コンピューターがすべての漢字を扱えるようになり、ビッグデータの活用をはじめさまざまな効果が期待されています。 中には、メーカーなどが独自に対応した外字もありますが、コードが無いために、メーカーごとの互換性が無く、データを受け渡してもコンピューターが認識できずに「文字化け」してしまったり、ある人の名前に名の外字を充てたものと略字を充てたものの2つのデータがあった場合、コンピューター上では、別の人と認識されてしまったりするなどの問題が起きていました。 このためIPA=情報処理推進機構は平成14年から、経済産業省とともに外字を含めたおよそ6万字の漢字1つ1つに、コードを割りつける作業を進め

    コンピューターで全漢字使用可に 6万字コード化 | NHKニュース
    YaSuYuKi
    YaSuYuKi 2017/12/24
    一瞬、大漢字辞典に出ているような漢字まで全部網羅したのかと思ったがそんなことはなかった。けど非常に重要な事だ
  • 「絵文字に平等をサポートしてください」人種差別の指摘にゆれるUnicode 

    YaSuYuKi
    YaSuYuKi 2014/10/07
    この問題の恐ろしいところは、Unicodeを捨てても逃れられないことだ。新しい文字コード規格は、必ず、Unicodeに対して上位互換性を求められる
  • 第1回 漢字コードの基礎、JISコード

    官庁や自治体における、いわゆる行政情報システムでは、一風変わった漢字コードが用いられている。人名や地名に必要な漢字を、それぞれの省庁が思い思いの形で、情報システムに搭載してきたためだ。特集では、これら行政情報処理用漢字コードのうち、現在かなり大きなシェアを持つ3つの漢字コードの現状をお伝えしようと思う。 その3つとは、総務省系の「住民基台帳ネットワーク統一文字」、法務省系の「戸籍統一文字」および「入国管理局正字」だ。さらに、これら3つの漢字コードを一体に統合すべく構築されつつある、経済産業省系の「文字情報基盤(IPAmj)」を最終回で扱う。 ただ、これら4つの漢字コードを理解するためには、JISで制定された漢字コードの理解が不可欠なことから、第1回の今回は、「JIS X 0213」と「JIS X 0212」について、行政情報処理の視点、特に異体字処理の視点から述べることにする。 マイナ

    第1回 漢字コードの基礎、JISコード
    YaSuYuKi
    YaSuYuKi 2014/06/30
    現在最先端の暗黒……
  • Unicode - perl+javascript - にプログラムでよく使われる英語の記号の読み方を調べさせる : 404 Blog Not Found

    2014年03月29日00:00 カテゴリTipsLightweight Languages Unicode - perl+javascript - にプログラムでよく使われる英語の記号の読み方を調べさせる プログラマのための 文字コード技術入門 矢野啓介 プログラマーたるもの、プログラムに出来ることを自らやるべからず。 挑戦者求む!【英語英語でなんて読むか知ってる? by @masuidrive 増井 雄一郎│CodeIQ プログラムでよく使われる英語の記号の読み方知っていますか? というわけでリハビリをかねて。 dankogai/js-charnames 使い方 git cloneしてmakeしてください。 charnames.jsというファイルが出来るので、あとはこんな感じで使って下さい。 Charnames['']=''; Unicode 6.1的に、というのか生成する時に使った

    Unicode - perl+javascript - にプログラムでよく使われる英語の記号の読み方を調べさせる : 404 Blog Not Found
  • tabs vs spaces

    YaSuYuKi
    YaSuYuKi 2013/12/16
    調べたところ、Unicodeには13種類も空白文字があるらしい http://ja.wikipedia.org/wiki/Unicode%E6%96%87%E5%AD%97%E3%81%AE%E3%83%9E%E3%83%83%E3%83%94%E3%83%B3%E3%82%B0
  • 1