並び順

ブックマーク数

期間指定

  • から
  • まで

481 - 520 件 / 9104件

新着順 人気順

Unicodeの検索結果481 - 520 件 / 9104件

  • 幽霊文字 - Wikipedia

    幽霊文字(ゆうれいもじ、英:ghost letter)は、JIS基本漢字に含まれる、典拠不明の文字(漢字)の総称。幽霊漢字(ゆうれいかんじ)、幽霊字(ゆうれいじ)とも呼ぶ。 概説[編集] 河内𡚴原地区(滋賀県犬上郡多賀町)の地名看板。幽霊漢字「妛」は「𡚴」の誤字である可能性が指摘されている。 1978年に当時の通商産業省が制定したJIS C 6226(後のJIS X 0208)では、いわゆるJIS第1・第2水準漢字として6349字が規定された。この漢字集合を「JIS基本漢字」と呼ぶ。このとき典拠として次の4つの漢字表に含まれる漢字が採用された[1]。 標準コード用漢字表(試案): 情報処理学会漢字コード委員会(1971年) 国土行政区画総覧: 国土地理協会(1972年) 日本生命収容人名漢字: 日本生命(1973年、現存せず) 行政情報処理用基本漢字: 行政管理庁(1975年) しかし

    • 絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット

      前回までを振り返る--Unicodeコンソーシアムの影響力 前回はどこまでお話ししましたっけ。世界中の文字の収録を目的とした文字コード規格、Unicodeは、米国のIT企業を中心に結成されたUnicodeコンソーシアムが制定するデファクト規格に過ぎないこと。しかし公的な国際機関が定めるデジュール規格ISO/IEC 10646と同期することで、WTO/TBT協定にもとづき世界中の国々に普及させられるメリットを得たこと。 また、Unicodeコンソーシアム自体はオープンな組織だけれど、意志決定を行うUTC(Unicode Technical Committee/Unicode技術委員会)で一票を投じる権利を持つのは一握りの団体に限られること。そしてUTCはISO/IEC 10646のアメリカ・ナショナルボディであるL2委員会と合同でしか開催されておらず、同時にL2委員会とUnicodeコンソー

        絵文字が開いてしまった「パンドラの箱」第3回--Unicode提案の限界とメリット
      • javascript - hanzenkaku.js で半角全角処理 : 404 Blog Not Found

        2012年08月13日06:00 カテゴリLightweight LanguagesTips javascript - hanzenkaku.js で半角全角処理 まあ車輪の再発明もいいところなのですが、車軸に合う車輪が見つからなかったということで。 dankogai/js-hanzenkaku DEMO まずは実際にお試しを。 全角: 半角: 全methodは以下のとおり。textarea内でいろいろと書き換えてみてください。 /* Functinal */ p( HanZenKaku.h2z('コガイダン') ); p( HanZenKaku.z2h('コガイダン') ); p( HanZenKaku.hw2fw('dankogai') ); p( HanZenKaku.fw2hw('dankogai') ); p( HanZenKaku.fs2hs('a space') ); p

          javascript - hanzenkaku.js で半角全角処理 : 404 Blog Not Found
        • Perl で utf8 化けしたときにどうしたらいいか - TokuLog 改メ tokuhirom’s blog

          Blog Search when-present<#else>when-missing. (These only cover the last step of the expression; to cover the whole expression, use parenthesis: (myOptionalVar.foo)!myDefault, (myOptionalVar.foo)?? ---- ---- FTL stack trace ("~" means nesting-related): - Failed at: ${entry.path} [in template "__entry.ftlh" at line 3, column 25] - Reached through: #include "__entry.ftlh" [in template "entry.ftlh" at

          • Unicode table for you

            The code for this toy is contained in this page, and is available under both the GPL and MIT licenses. View source and help yourself.

            • MySQLの日本語コレーション - tmtms のメモ

              4月にMySQLの日本語コレーションについて語り合う場に呼ばれていろいろ話を聞いてきました。すぐにブログを書こうと思ったんですが、はや2ヶ月経過…。 ときどき、自分がMySQLの文字コードに関して発表する際に、次のようなスライドをいれてるんですが、 MySQL 8.0 でとうとう日本語コレーションが入ることになったのに、なんか期待してたのと違いました。 で、その辺の話を聞きました(2ヶ月も経ってるのでうろ覚え)。 Q. わざわざ日本語ロケール作るんだったら日本人が扱いやすいロケールにしてほしい utf8mb4_ja_0900_as_csはMySQLが独自に考えたものではない。Unicode規格に従っている。過去にいろいろ独自にやって失敗してきてるので、もう独自にやるのは避けたい。 ai(accent insensitive)で「ハ」=「パ」=「バ」になるのも、ci(case insensi

                MySQLの日本語コレーション - tmtms のメモ
              • ニコニコ動画の1.5GBの新仕様って、何が変わって、どうすればいいの?

                  ニコニコ動画の1.5GBの新仕様って、何が変わって、どうすればいいの?
                • 文字コードの話

                  本稿は、1996年に筆者が大学の所属サークルの機関誌に寄稿した記事をもとに加筆訂正したものです。(最終更新 1999.7.31) 目次 はじめに 第1章 日本語のコード体系 第2章 ASCIIと1バイト文字コード 第3章 JIS漢字コードとエンコーディング法 第4章 ISO 2022 第5章 ISO 2022の実例 第6章 中国語・韓国語の文字コード 第7章 ISO 10646とUnicode おわりに 参考文献 はじめに ASCIIだけで用が足りるアメリカと違って、 私たちは日本語を扱わなくてはならないため、 より深く文字コードの問題と関わらざるをえません。 それでも、MS-DOS/WindowsやMacを使う限りでは、 ASCIIとシフトJIS(たまにJIS)を知っていれば済みますが、 UNIXやインターネットを使い始めると、 JIS・EUC・シフトJISとさまざまな日本語コードに頭を

                  • セキュリティ専門家でも間違える!文字エンコーディング問題は難しいのか?

                    (Last Updated On: 2018年8月13日)一見徳丸さんのブログは分かりやすいように思えますが、それは単純な実験により分かりやすいように見えるだけで複数の間違いがあります。 その間違いとは 意図の取り違い – 誤読 言語の仕様と実装の理解不足 HTTPやPHP仕様の理解不足 セキュリティ対策をすべき場所の理解不足 です。(※0) 徳丸さんは非常勤とは言え、国の出先機関の研究員であるし、その出先機関は職務放棄とも言える文書(「例えば、PHPを使用しない」と勧める文書)を公開している(いた?)のでしっかり反論しておく必用がありますね。IPAのあの文書は職務放棄と言える文書だと思っています。これについても後で意見を述べます。 意図の取り違い – 誤読 最初の間違いは私のブログのエントリ「何故かあたり前にならない文字エンコーディングバリデーション」に対する理解です。特にPHPユーザに

                      セキュリティ専門家でも間違える!文字エンコーディング問題は難しいのか?
                    • Twitter時代の文字の数え方 | 配電盤

                      入力「×」のブラウザでは、「𠮷」が2文字とみなされるため、2文字目まで、つまり「𠮷野」までしか入力できません。 Mozillaの文書には、Unicode code pointsで数えると書いてあるので、そのうち改善されるのかもしれませんが、現時点ではTwitterのために「maxlength="140"」を使うことはできません。 pattern属性 Firefox 21とChrome 27、IE 10、Opera 12.15は、「pattern=".{0,3}"」(任意の文字からなる0から3文字)のような正規表現を使った検証にも対応していますが、やはり「𠮷野家」は4文字とみなされてしまいます。 JavaScript 追記:javascript – でBMP以外のUnicode文字をきちんと扱う(404 Blog Not Found) JavaScriptでは、文字列strの長さをst

                      • ことばマガジン:朝日新聞デジタル

                        能登半島地震 パレスチナ情勢 速報 朝刊 記事一覧 紙面ビューアー 夕刊 記事一覧 紙面ビューアー 連載 ランキング その他 コメントプラス ニュースの要点 特集 動画・音声・写真 土曜別刷り「be」 記者イベント 天気 数独 12星座占い サイトマップ 検索 ヘルプ Q&A(よくある質問) 総合ガイド お申し込み ログイン マイページ 有料会員紙面ビューアーコース登録済み 無料会員(クーポン適用中)紙面ビューアーコース登録済み 無料会員紙面ビューアーコース登録済み 朝日ID会員 紙面ビューアーコース お客様サポート(個人設定) お客様サポート(個人設定) お客様サポート(個人設定) メール設定 スクラップブック MYキーワード 会員特典・プレゼント 提携プレミアムサービス ログアウト

                          ことばマガジン:朝日新聞デジタル
                        • Text Escaping and Unescaping in JavaScript(Unicode の文字列をエスケープする JavaScript)

                          Notes No data is sent to the server (i.e. everything is done in JavaScript). Conversion from Unicode to other encodings such as Shift_JIS can be slow first time as it needs to initialize internal conversion tables. Surrogate pairs in UTF-16 are supported. Try inserting \uD840\uDC0B in the second form. Three-byte characters in EUC-JP are not supported. Links JavaScript Unicode Charts Try GNU Libidn

                          • Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加

                            Unicode 12では4つの言語(script)、554種類の文字が追加されました。これによりUnicodeに収録されている言語は150、文字は13万7292種類になりました。 追加された文字には日本語の文字が7種類、小さな文字としての「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が含まれています(通常の大きさの文字は以前からありました)。これらは古い文書を記述するために使われるとされています。 そのほか、現在のイラン南西部に存在したアケメネス朝で使われていたアラム語のElymaic文字。南インドのサンスクリット語、カンナダ語で使われていたNandinagari文字。ラオス、タイ、ベトナム、フランス、オーストラリア、カナダ、米国などで使われていた現代White Hmong語、Green Hmong語のNyiakeng Puachue Hmong文字。インド、ミャンマー、ブータンの現代Wanc

                              Unicode 12.0正式版が登場。日本語では小文字の「ゐ」「ゑ」「を」「ヰ」「ヱ」「ヲ」「ン」が追加。新元号が発表され次第、次の12.1で新元号キャラクタを追加
                            • 「HTMLでは環境依存文字(①や©など)を文字参照にしなければいけない」という誤解と、本当に置換すべき文字

                              HTMLファイルで特殊記号を使う際、① は &#9312;、© は &copy; のように置き換えて書かないといけないものだと思いこんでいないでしょうか。 現代ではそれは誤解です。 UTF-8では特殊記号の文字参照は不要 そもそも環境依存文字とは、データを扱う機種・ソフトウェアなどの違い(文字コードの割り当ての違い)により表示に違いが出てしまう文字のことでした。 例えばShift_JISには © が含まれておらずそもそも保存できなかったり、 ① などの丸数字は含まれているものの、WindowsとMac OS(当時)の割り当ての違いにより正しく表示できなかったりしました。[1] しかし現在ではUnicodeによって文字コードは統一化されており、その問題はほとんど起きなくなっています。 近年では多くの場合 UTF-8 でファイルを記述すると思います。 HTMLファイルの文字エンコーディングが

                                「HTMLでは環境依存文字(①や©など)を文字参照にしなければいけない」という誤解と、本当に置換すべき文字
                              • Python でUTF-8, shift_jis, euc_jpなど日本語を使う方法

                                [Home] [Setting up Mac OS X] [Python]: [ファイルを読む] 日本語を使う Pythonで日本語を使う Python 2.4以降では、標準で日本語を扱うことができます。 PythonのソースコードをUTF-8で書くには 日本語を扱うPythonのスクリプトの中では、UTF-8の文字コードを使うのが 楽です。 Mac OS Xのターミナルで日本語を扱う場合は、 ここの「4. Terminalの設定を変える」の 指示に従ってください。 以下、ソースコードの簡単な例を示します。 #!/usr/bin/env python # -*- coding: utf-8 -*- import re jtext = u'子猫が隠れんぼをしています' print 'jtext has', len(jtext), 'Japanese characters.' if re.se

                                • Tyto Style

                                  Tyto Style(ティトスタイル)について Tyto Style(ティトスタイル)は、京都・大阪を中心に活動するSEOディレクター兼マークアップエンジニア、三嶋正人の個人事業サイトです。 これまで約15年間にわたり、さまざまなウェブサイトの制作や改善、運用上のアドバイス等を行いSEOに強いサイトを作るための試行錯誤を重ねてきました。 現在はこれまでに得た経験を活かし、フリーランスとしてウェブサイト制作やSEOを中心としたサイト運用のサポート・アドバイスなどを行っています。 現在運用されていたり、企画中のウェブサイトが、本当にあなたの目標に適うものになっているのか、検索エンジンに最適化されたものなのか、少しでも疑問をお持ちであれば、立ち止まって現状を見直してみることはとても重要です。 その一環として、ぜひ一度お悩みをご相談ください。 現状を分析した上で、最適な改善方法をご提案いたします。

                                    Tyto Style
                                  • “コロ助bot”のツイートはどうやって文字列を自動生成しているのか分析してみるも意味がわからず→中の人が真実を明かす「クレイジーは議論を生む」

                                    やる:免許証 DC インク 買う:ハブ 靴下 @potetisensei ツイッターに@korosk_botというのがいて、これ多分適当なバイナリファイルをshift-jisとして解釈した時の文字列のうち、最後がナリイ(C5D8B2)で終わるものをランダムでツイートしてるんだと思うんだけど、なんでそんなことを思いついたんだという気持ちになるし何のファイルから生成してるのか気になる 2018-11-19 16:11:34

                                      “コロ助bot”のツイートはどうやって文字列を自動生成しているのか分析してみるも意味がわからず→中の人が真実を明かす「クレイジーは議論を生む」
                                    • C#で高精度なテキストファイル文字コード自動判別(2014年版) - hnx8のブログ

                                      C#(.NET Framework)に限ったことではありませんが、汎用的にテキストファイルを扱うようなアプリケーションを作っていると、よく 特定の文字コードのファイルしか読み出せないのでは困る ⇒文字コードを自動判別し、テキストの内容を取り出したい 読み出したファイルと同じ文字コードでファイルを書き出したい ⇒読み出したファイルの文字コードを知りたい といった場面に出くわします。 ですが、C#(.NET Framework)標準のライブラリではそのような機能は提供されていないため、文字コードを判定するには、 自前で文字コード判定のロジックを実装する 出来合いの外部ライブラリ、Windows版NKF32.dll、ICU4Cなどを利用する IE用の文字コード判別ライブラリ(mlang.dll)を利用する ※COMコンポーネント呼び出し要 のいずれかの方法を取ることになります。 HNXgrepと

                                        C#で高精度なテキストファイル文字コード自動判別(2014年版) - hnx8のブログ
                                      • メインページ - GlyphWiki

                                        【お願い】使用言語登録のお願い(お知らせ) グリフウィキにようこそ! グリフウィキ(GlyphWiki)は、明朝体の漢字グリフ(漢字字形)を登録・管理し、皆で自由に共有することを目的としたウィキです。 一般的にフォントや個々の漢字グリフの管理は面倒ですが、グリフウィキでは簡単に漢字グリフをデザインすることができ、さらにウィキですので漢字グリフ1つ1つを独立して管理できます。また、グリフを集めてフォントを作り、即座に公開することができます。 グリフの管理は誰でも可能です。また、登録されているグリフは自由に使うことができます。自分が必要なグリフを必要なだけ登録し、既に登録されているデータの一部と合わせ、まとめてフォントにすることができます。現在1,000,000を超える量の漢字グリフが登録されています(別名同字形グリフを別カウントの場合)。 あなたの持っている外字データ・異体字データをグリフウ

                                          メインページ - GlyphWiki
                                        • ウェブマスターのための文字化け講座

                                          (序論)文字化けの発生メカニズム概論と解析方法 ネスケ4.Xで特定の文字(試・時・事・私など)が文字化けする場合 → document.writeで文字化けする漢字の規則性 → ネットスケープ4.Xのキャッシュ機構 → 2種類の解決方法 CGIで特定の文字(表・予・申・能・ソ・十など)が文字化けする → Shift_JISでCGIを作成する場合の注意点 → PHPで「表\示」「十\和田湖」「申\し込み」などと表示される場合 「(はしご高)」が使えない理由 → Windowsでは表示されるが、Macでは文字化けする文字 → Macでは表示されるが、Windowsでは文字化けする文字 → 機種依存文字チェック・プログラム(Flashフォームなど) 文字化けしないための工夫 → メタタグの指定は有効か? → 「美乳」で文字化けが直るって本当? フォントを指定したら文字化けした。 → フォントの指

                                          • Fonts supplied with Windows 7

                                            Microsoft Typography documentation Microsoft Typography group researches and develops font technologies and supports the development of OpenType fonts by independent type vendors. Microsoft Typography Develop fonts, find existing fonts, and license fonts from registered vendors.

                                              Fonts supplied with Windows 7
                                            • perl - use utf8; #って何だ? : 404 Blog Not Found

                                              2009年06月15日07:00 カテゴリLightweight Languages perl - use utf8; #って何だ? id:otsuneに建設予定フラグがたてられていたので。 冬通りに消え行く制服ガールは、夢物語にリアルを求めない。 - subtech Perl の utf8 関係が未だ全く理解できない。わからないことがわからないので整理 use utf8はいつフラグをたてるか use utf8 しててもフラグたたないことがある…… これは、以下の実例を見ていただくのが一番よいだろう。 #!/usr/bin/perl use strict; use warnings; use utf8 (); sub check_flag{ my $str = shift; print qq("$str" ), utf8::is_utf8($str) ? 'is' : 'IS NOT',

                                                perl - use utf8; #って何だ? : 404 Blog Not Found
                                              • グーグル、大急ぎでハンバーガー絵文字を修正へ - BBCニュース

                                                米グーグルのスンダル・ピチャイ最高経営責任者(CEO)は先月30日、週明けに出勤してきた従業員たちにある重大な目標を大急ぎで達成するよう指示したらしい。ハンバーガーの絵文字を修正せよ。これが使命だった。 ピチャイCEOの指示は、作家トーマス・ベクダル氏のツイートに反応してのものだった。ベクダル氏は、IT企業2社のハンバーガー絵文字が違うと、その相違点を指摘していた。 溶けたチーズが流れ出るようにチーズがらみのダジャレも飛び交うなか、この絵文字をめぐって、非常に「肉厚」な議論が繰り広げられた。ポイントはつまり、ハンバーガーにおけるチーズの適正な位置。チーズはどこにあるべきなのか。

                                                  グーグル、大急ぎでハンバーガー絵文字を修正へ - BBCニュース
                                                • 日本語と文字コード

                                                  コンピュータは主にアメリカで発達してきたため、未だにアルファベットや数字などの1バイト(7/8ビット)を基本単位として扱う前提で作られているものが中心です。そのなかで日本語のように多くの文字を必要とする言語は、1文字を表わすのに2バイト以上を要するため、いろいろな困難が伴います。特にインターネットを通じて様々な環境の情報を交換するにあたって、思わぬ問題に遭遇するケースが増えてきました。ここでは、こうしたことを考えるために必要な、日本語の文字コードに関する基本を整理しておきます。 JIS漢字コード(情報交換用符号化漢字集合) 区点コード JISコード(符号化方式) シフトJISコード EUCコード ASCIIとJISローマ字 Unicode 主要コード規格のまとめ 参考文献、リソース 文字化けしたメールの復元 | The Web KANZAKI ホームページ JIS漢字コード(情報交換用符号

                                                  • Webアプリケーション設計の第一歩は
ディレクトリの整理から / Encraft 1

                                                    2023/3/24、Encraft #1 フロントエンド×設計にて発表した資料です。

                                                      Webアプリケーション設計の第一歩は
ディレクトリの整理から / Encraft 1
                                                    • IBM Developer

                                                      IBM Developer is your one-stop location for getting hands-on training and learning in-demand skills on relevant technologies such as generative AI, data science, AI, and open source.

                                                        IBM Developer
                                                      • 文字化けしたメールの修復

                                                        インターネットで届いたメールは、メールソフトがMIMEに正しく対応していなかったり、JISコードのシーケンス切り替えができなかったりして文字化けしてしまうことがあります。こうした文字化けは、多くの場合、簡単な仕組みで復元することが可能です。 ※以下のサービスは別サーバーで提供します。 From, Subjectなどの読めないヘッダを修復 =?ISO-2022-JP?B?GyRCJD8hIxsoQg==?= のような件名など 文字化けしている本文の修復 $B$3$l$O(JJIS$B$NJ8$G$9!#(Jのような文字化け Unicode文字参照になっている本文の解読 &#12371;&#12435;...のような、 '&#' と ';' に数字が挟まれたコードが連続する本文 ツールで解読できない文字化けもあると思いますが、このページの作者に直接メールで依頼しないでください。残念ながら個別に

                                                        • 旧・Macの手書き説明書 - FC2 BLOG パスワード認証

                                                          ブログ パスワード認証 閲覧するには管理人が設定した パスワードの入力が必要です。 管理人からのメッセージ https://mac-tegaki.comへ移転中 閲覧パスワード Copyright © since 1999 FC2 inc. All Rights Reserved.

                                                          • Engadget | Technology News & Reviews

                                                            Research indicates that carbon dioxide removal plans will not be enough to meet Paris treaty goals

                                                              Engadget | Technology News & Reviews
                                                            • Perl5.8 の UNICODE 対応

                                                              perl は 5.8 から Unicode(utf-8) がサポートされました.5.6 でも Unicode に対応はしていましたが,ぜんぜん使い物にならず,ようやく 5.8 でまともに使えるようになったということです.ただせっかく使えるにもかか わらず perldoc などを見てもイマイチ使い方がわからないので,独自にまと めてみたのがこのページです. 誤った書き方や勘違いをしてい ることもあるので,形式的ですがこのページの内容は無保証です. 内容 文字コード変換 perlIO jperlからの移行 UTF-8フラグ 文字コード自動判別 Unicode Standard Unicode 正規化 その他 参考資料 文字コード変換 とりあえず perl5.8 で新しく組み込まれた機能を見るために,euc-jp から shift_jis への変換スクリプトをいくつか載せます. openを利用し

                                                              • JavaScript: 文字数を正確にカウントするには? - Qiita

                                                                この投稿ではJavaScriptで文字数をできるだけ正確にカウントする方法について取り上げます。 文字数とは? 要件で「文字数を表示してほしい」「○文字以上はバリデーションエラーにしたい」と文字数を考慮しないとならないことがあります。 そもそも文字数とは何でしょうか。 たとえば、アルファベットの「A」は1文字と数えられそうです。 次の絵文字は、何文字になるでしょうか? この絵文字はiOSであれば14.5の環境では、UI上では上のように1文字のように表示されます。しかし、それ以前のバージョンでは、同じ文字列データでも😵💫のように2文字で表示されます。なお、この絵文字は3つのコードポイントU+1F635 U+200D U+1F4ABからなります。この絵文字の「文字数」はいったい何文字として扱ったらよいのでしょうか。 以上のように、ひとことで文字数と言ってもデータと見た目と環境の3つのややこ

                                                                  JavaScript: 文字数を正確にカウントするには? - Qiita
                                                                • JavaScript でのブラウザ判別 - 「仕様の盲点」ではなく、「プロパティの有無」を使う方がマシ - 2009年2月 - Blog - EOF

                                                                  IE6, IE7 で tabindex 属性を JavaScript 側から設定する時の注意 これは完全にバグといえる仕様なのだが、IE6 と IE7 では JavaScript(IE だから本来は JScript)側から setAttribute などを使って tabindex 属性を設定してやる時、属性名を "tabIndex" にしてやらないと認識しないことを知った("I" がキャメルケースになっている)。WAI-ARIA(2008-08-06版 WD 邦訳)絡みで色々といじっていた時に発見。因みに IE8 RC1 では修正されている。 次の JavaScript コード断片は、IE で tabindex 属性を設定する時の方法を説明したものである。 // ターゲット要素 var elem = document.getElementById("test"); elem.setAttr

                                                                  • サロゲートペア入門

                                                                    はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日本語漢字の数が増えました。従来、12238字(Windows XP)だったのが13145字(Windows Vista)になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです(Windows XPまでは一部サポート)。 またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。 ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。 対象読者 Unicodeでデータ処理

                                                                      サロゲートペア入門
                                                                    • 「スマートフォンはまだ早い」 au、メール無料と“全方位端末”で春商戦へ

                                                                      「最需要期に向かってきっちりした端末を出していく」――KDDIの小野寺正社長は10月19日に開いた2009年秋冬、10年春モデルの狙いをこう述べた。 新モデルは13機種で、12Mピクセルカメラを搭載したハイエンド機や、薄型ワンセグ機、シニア・子ども用端末まで、幅広いラインアップ。スマートフォンはないものの、「ユーザーのカテゴリー別に訴求できる端末をそろえた」と小野寺社長は胸を張る。 基本使用料などの合計が最低月額1095円で、メールを送受信相手にかかわらず無料で利用できる「ガンガンメール」も投入し、「auはメールが無料」とPR。「端末と料金、サービスがそろった」と小野寺正社長は自信をみせる。 ハイエンドからシニア、子ども向けまで 新機種は、12Mピクセルカメラを搭載した「EXILIMケータイ CA003」「AQUOS SHOT SH003」といったフラッグシップ機、8Mカメラを搭載した「E

                                                                        「スマートフォンはまだ早い」 au、メール無料と“全方位端末”で春商戦へ
                                                                      • Engadget | Technology News & Reviews

                                                                        Pick up the 9th-gen iPad with two years of AppleCare+ for only $298

                                                                          Engadget | Technology News & Reviews
                                                                        • 中国人を悩ませるレアな名字の文字コード問題

                                                                          印刷する メールで送る テキスト HTML 電子書籍 PDF ダウンロード テキスト 電子書籍 PDF クリップした記事をMyページから読むことができます 中国では、2023年8月1日に強制力のある国家標準規格「GB 18030-2022」(信息技術中文編碼字符集)が施行される。中国で「強制」という言葉が出ると「また締め付けが強化される」と反射的に考えてしまうかもしれないが、これは文字コードの標準規格を新たに導入するという話だ。珍しい名字などに使われ、既存の文字コードに未登録の漢字に対応しようというものになる。 中国の面積は日本の国土の約25倍で、約14億人の人口を擁している。一部の地域限定で使われている漢字や、少数民族の固有名詞でのみ用いられている漢字もある。文字コードに含まれない漢字を使っている人は約6000万人もいるそうだ。例えば、山東省青島市郊外にシュイユー村という地元ではまあまあ

                                                                            中国人を悩ませるレアな名字の文字コード問題
                                                                          • おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diary

                                                                            2021/9/10 追記: 改めて更新された話を統合して整理して書き直しました. 以降はこちらを参考にしてください: ill-identified.hatenablog.com 2021/1/15 追記: RStudio 1.4 がリリースされたのでなるべくアップデートしましょう 2020/12/06 追記: Japan.R で今回の話の要約+新情報を『Mac でも Windows でも, PNG でも PDF でもRのグラフに好きなフォントで日本語を表示したい (2020年最終版)/Display-CJK-Font-in-Any-Gpraphic-Device-and-Platform-2020 - Speaker Deck』として発表した. ハイライトは「近々出るRStudio 1.4 があれば fontregisterer はほぼいらなくなる」 2020/10/31 追記: geom

                                                                              おまえはもうRのグラフの日本語表示に悩まない (各OS対応) - ill-identified diary
                                                                            • 三菱東京UFJ銀の一部障害、直接の原因は文字コードの設定誤り

                                                                              三菱東京UFJ銀行の一部キャッシュカードが、5月12日の午前7時から約5時間セブン銀行のATMで使えなくなった原因が分かった。三菱東京UFJ銀のシステムからセブン銀のシステムに送信する取引結果データの文字コードに誤りがあり、セブン銀のシステムが取引結果を正常に処理できなかった。約2万件の取引が影響を受けた。 取引ができなかったのは、取引対象が旧東京三菱銀の店舗の口座で、かつ通帳に未記入の明細が10件以上あるときに限られる。この条件を満たす場合、三菱東京UFJ銀のシステムは、通帳記帳を促す案内文を取引結果データに加えて、セブン銀に送信する。この案内文はカタカナだけを使用すると両行で取り決めていた。 一方、三菱東京UFJ銀は5月10日の夜9時から12日朝7時までシステムを臨時停止し、旧東京三菱銀ベースの勘定系システムに旧UFJ銀の機能を追加した新システムを稼働するための切り替え作業を実施した。

                                                                                三菱東京UFJ銀の一部障害、直接の原因は文字コードの設定誤り
                                                                              • 対策遅らせるHTMLエンコーディングの「神話」

                                                                                クロスサイト・スクリプティングという言葉は元々,WebアプリケーションのHTMLエンコード漏れなどを利用することによって第三者にJavaScriptを実行させる手法を指す。広義では,HTMLのエンコードによる画面改変などを含むこともある。 前回述べたように,クロスサイト・スクリプティングのぜい弱性はWebアプリケーションに見付かるぜい弱性の半分以上を占める。数年前から指摘されているにもかかわらず,一向になくならない。その理由として,クロスサイト・スクリプティング対策あるいはHTMLエンコード注1)に対する「神話」があり,正しい対策の普及を遅らせているように思う。その「神話」の数々について説明しよう。 注1)実体参照(entity reference)というのが正式だが,あまり普及していない用語なので,HTMLエンコードという用語を用いる 「すべからくHTMLエンコードすべし」が鉄則 HTM

                                                                                  対策遅らせるHTMLエンコーディングの「神話」
                                                                                • 黄色い絵文字の意図は「ありえない肌の色」 Unicodeコンソーシアム会長、マーク・デイビス博士に聞く

                                                                                    黄色い絵文字の意図は「ありえない肌の色」 Unicodeコンソーシアム会長、マーク・デイビス博士に聞く