タグ

関連タグで絞り込む (1)

タグの絞り込みを解除

文字コードに関するprozorecのブックマーク (3)

  • UTF-8の文字コード表 - 備忘帳 - オレンジ工房

    UTF-8の文字コード表なのです。いつも検索して、よそ様のページを参照させていただいていたのですが、面倒なので自分で作りました。 perlのスクリプトでガーッと出したので、見栄えはアレですが、とりあえず。 1バイト文字 2バイト文字 3バイト文字 E2 9C 80 ~ Dingbats、昔からある記号、絵文字とか E3 80 80 ~ 全角ひらがな・カタカナ EF BC 80 ~ 全角英数字、半角カナ 4バイト文字 F0 9F 8C 80 ~ たぶん今どきの皆さんの言う絵文字 F0 9F 98 80 ~ 顔文字 更新履歴 (2018-05-10 追記) コード表を全体的に再出力しました。変更点は以下の通りです。 unicode追加面、4バイト文字の表もつくりました。 各文字ブロックにタイトルを付けました。英語タイトルはUnicode仕様書PDFへ直リンクしています。 表示されてないけど、ど

  • Perl5.8 の UNICODE 対応

    perl は 5.8 から Unicode(utf-8) がサポートされました.5.6 でも Unicode に対応はしていましたが,ぜんぜん使い物にならず,ようやく 5.8 でまともに使えるようになったということです.ただせっかく使えるにもかか わらず perldoc などを見てもイマイチ使い方がわからないので,独自にまと めてみたのがこのページです. 誤った書き方や勘違いをしてい ることもあるので,形式的ですがこのページの内容は無保証です. 内容 文字コード変換 perlIO jperlからの移行 UTF-8フラグ 文字コード自動判別 Unicode Standard Unicode 正規化 その他 参考資料 文字コード変換 とりあえず perl5.8 で新しく組み込まれた機能を見るために,euc-jp から shift_jis への変換スクリプトをいくつか載せます. openを利用し

  • 本を読む 濁点問題

    こんにちは。これは編集者アドベントカレンダーの12月4日の記事です。 この記事では、濁点問題という極めてちっちゃい話題を取り扱います。なにせ1文字の片隅ですし。 編集者の一般的な仕事についてのちゃんとした話題は、ほかの方々の記事にご期待ください。私も期待しています。 百聞は一見にしかず 濁点問題を理解するために、まずはMicrosoft Wordの画面キャプチャーをご覧ください。 赤丸で囲んだ2つの文字は、同じ「が」という文字に見えます。しかしこれは、「が」と「が」という異なる文字です。スペルチェックの波線が付いているほうが「が」です。 この記事は何ではないか 濁点問題というと、比較的詳しい方には、ファイル名の問題と思われがちです。iOS 10でのKindleアプリの不具合なども問題になりましたし。が、ここで扱うのはファイルの内容(テキスト)のほうの問題です。 ファイルのテキストの問題

    prozorec
    prozorec 2017/12/04
    Firefoxで見る限りは両方とも同じに見えるが、テキストエディタにコピーしたら、違いは明らかだった
  • 1