I. UnicodeとJavaScript文字列の前提知識 I-I. Unicodeのエスケープシークエンスで文字列を表す "\uXXXX"形式の4桁の16進数で表す // シングルクォートとダブルクォートの差はない "\u3042"; // => "あ" '\u3042'; // => "あ" // 正規表現リテラルでも表現可能 /\u3042/.test('あ'); // => true
I. UnicodeとJavaScript文字列の前提知識 I-I. Unicodeのエスケープシークエンスで文字列を表す "\uXXXX"形式の4桁の16進数で表す // シングルクォートとダブルクォートの差はない "\u3042"; // => "あ" '\u3042'; // => "あ" // 正規表現リテラルでも表現可能 /\u3042/.test('あ'); // => true
UTF-8の文字コード表なのです。いつも検索して、よそ様のページを参照させていただいていたのですが、面倒なので自分で作りました。 perlのスクリプトでガーッと出したので、見栄えはアレですが、とりあえず。 1バイト文字 2バイト文字 3バイト文字 E2 9C 80 ~ Dingbats、昔からある記号、絵文字とか E3 80 80 ~ 全角ひらがな・カタカナ EF BC 80 ~ 全角英数字、半角カナ 4バイト文字 F0 9F 8C 80 ~ たぶん今どきの皆さんの言う絵文字 F0 9F 98 80 ~ 顔文字 更新履歴 (2018-05-10 追記) コード表を全体的に再出力しました。変更点は以下の通りです。 unicode追加面、4バイト文字の表もつくりました。 各文字ブロックにタイトルを付けました。英語タイトルはUnicode仕様書PDFへ直リンクしています。 表示されてないけど、ど
4月にMySQL 8.0のUnicodeと日本語対応についてManyi Luさんとディスカッションする会があって、かなりいろいろ話してとてもよい会だった。その後いろいろ考えて感じてる懸念を端的に書き記しておく。 デフォルトのcollationがutf8mb4_0900_ai_ciになった これに関して僕は強い懸念を持っている。MySQL 8.0以前において、ふつうのWebアプリケーションなどで日本語を扱う場合、実用上デフォルトのutf8mb4_general_ciかutf8mb4_binの2択であったと思う。デフォルトがutf8mb4_general_ciなので新しく作られるアプリケーションは通常は濁点半濁点が区別される状態で世に出てくることになる。けどMySQL 8.0.1のデフォルトのutf8mb4_0900_ai_ciは濁点半濁点を区別しないので、将来ユーザー名を登録するところでバイ
日媒分析指出� �� ,岸田正考虑脱离以政府为主导�����、执政党影响力偏弱的政高党低决策��� ,转向政府同执政党紧密合作的政高党高目标���。点击进入专题�����:小浪早读湖南二人的遭遇引发舆论愤慨�����,不少民众表示支持她俩状告澳大利亚政府 ��。 查看更多
問題 自分の環境:UTF-8 SSH接続先:EUC-JP とかよくありますね。 $ export LANG=eucJP とか $ export LANG=ja_JP.UTF-8 してあげてもいいんですが、わざわざやるのも面倒ですし、「ログイン先とこっちのどっちで設定するといいんだ?」みたいに悩みます。 解決法 cocotというツールを使います。 $ brew install cocot でインストール終わり。後は $ cocot -t UTF-8 -p EUC-JP ssh tarou@example.com とすると、手元のUTF-8環境に合わせて向こう側のEUC-JPをコンバートしてくれます。 参考 Ubuntu日本語フォーラム / GNOMEの文字コードを常にEUC-JPにする方法
重要: このページで配布している一部の zip ファイルについて、 サブディレクトリにあるべきファイルが欠落しているという 誤りがあったので、正しいものに置き換えました。 [2008/06/25] 概要 この文書で扱う事項は、 欧文 LaTeX2e / pLaTeX2e / upLaTeX2e、すなわち 「欧文の Unicode 処理をもたない TeX 処理系」の上での LaTeX において (つまり元から全てを Unicode で扱う Omega、LuaTeX、XeTeX ではない) 「コード値による入力」および「UTF-8 による直接入力」 によって 「欧文」および「和文」の Unicode 文字を出力する (もちろん欧文 LaTeX は欧文のみ) 統一したインタフェースの解説である。 ここでは、場合に応じて、 次のようなパッケージ・拡張機能を利用する。 bxbase パッケージ (B
\閉鎖予定のサイトも売れるかも?/ アクセスがないサイトもコンテンツ価値で売れる場合も… ドメインの有効期限を更新してサイト売却にトライしてみましょう
TeX が苦手とする処理 † TeX Forum や TeX Q & A などでしばしば話題になる処理のうち,TeX 本体では提供されず,ときとして TeX 自身は不得手とする処理について挙げます。 既製品があるものについては既製品も紹介していますが,それらを用いた場合の出力結果に不満がある場合には,ユーザ自身で対処することになります。 ここに挙げる処理を行うのが単なる「書き手の趣味」である場合には,無理をせずに書き手自身の腕で無難にできる範囲の処理で済ませるか,画像にしてしまう方が賢明である場合もあることでしょう。 複数行にわたる下線(あるいは波線・破線など) † まず,qa:32045 でコメントされている現実があることを認識してください。 その上で既製品にあたると,大石氏のサイトに下線類を作成するマクロについての比較を行った文書「下線に関するマクロ比較」(ただし,未完成)があり,その
ご利用に関する諸注意 本サービスは smkn (From kiki verb) によって、”現状のまま” 提供されるものとします。本サービスについては、明示黙示を問わず、商用品として通常そなえるべき品質をそなえているとの保証も、特定の目的に適合するとの保証を含め、何の保証もなされません。事由のいかんを問わず、損害発生の原因いかんを問わず、且つ、責任の根拠が契約であるか厳格責任であるか (過失その他) 不法行為であるかを問わず、smkn (From kiki verb) も寄与者も、仮にそのような損害が発生する可能性を知らされていたとしても、本サービスの使用から発生した直接損害、間接損害、偶発的な損害、特別損害、懲罰的損害または結果損害のいずれに対しても (代替品またはサービスの提供; 使用機会、データまたは利益の損失の補償; または、業務の中断に対する補償を含め) 責任をいっさい負いません
PHPとMySQLの勉強をするために、手持ちのPCでXAMPP環境をインストールするまではよかったが、MySQLで日本語が正しく表示できるようにするため手こずりました。 同じようにハマる人が出てこないよう、手順をまとめます。 ・XAMPP for Windows 1.6.4 ・MySQL 5.0.45(XAMPP for WindowsのWebページには5.0.51と書いてあるのだが・・・) ・WindowsXP HomeEdition SP2 ふつうにXAMMPのインストーラでデフォルト設定のままインストール。 この状態でMySQLを起動すると となり、みごとにdefault_charsetはlatin1になります。 これはMySQLのバイナリ作成時にこの設定になっていたのでしょうがないでしょう。 これをuft8にしていきます。
MySQLではまったこと MySQLの文字化け 今さら何いってんのコイツとかそこ言わない。 文字コードを確認するSQL文「SHOW VARIABLES LIKE ‘char%’;」 MySQL4.1以降はサーバとは別にクライアントの文字コードが設定されている。 クライアント、サーバ間で違う文字コードがセットされていると、一度ucs2変換を通る。 よって、クライアント、サーバ間で違う文字コードを指定することとなり文字化けが起こる可能性がある。 PHPはmy.cnfで[mysql]、[client]を設定しようがクライアントの文字コードはビルド時に指定されたキャラクタセット(通常latin1)。 my.cnfの設定 [mysql] default-character-set = utf8 [mysqld] default-character-set = utf8 mysqlクライアントからチェ
Ajax で文字化けする条件を調査してみた 【Blog Hackers Conference 2005 補足エントリー その2】 発表時間が全然足りなくて一言もしゃべれなかった「Ajax で日本語文字化け」ネタの調査結果をエントリーしておきます。 Safari ユーザのみなさんは Ajax なページを見るときに「文字化けすぎで見れん!」という経験を一回はされていると思います。例えば「WEBプログラミング NOW!: Googleサジェスト--Safariで文字化け」で述べられているように Google サジェストが化け化けになったりして、枕を涙で濡らす日々を過ごしていることと思われます(v1.3 では動作すらしません(泣))。この文字化けは、どうもデータを XML ではなくテキスト形式で受け取っているときに起こるようです。詳しい原因は「WEBプログラミング NOW!: Googleサジェス
ちょっと久々のJavaネタですが、 前から書き溜めていた、文字コードやエンコードについてのノウハウを書きます。 今回は、詳細な説明に入る前に、前提になる知識や用語について説明しておきます。 文字コードとエンコードって違うの? 新人くん「では、HTMLの文字コードはUTF-8でお願いします」 先輩社員「文字コードじゃなくてエンコーディングでしょ?」 新人くん「えっ。あぁ、はい、それで」 文字コードとエンコード(エンコーディング)を混同して使ったりすると、 ちょっと原理主義的な人に怒られたりするんですけど、 大まかに言えば、「文字コード」は文字に割り当てられた「数字」のことで、 「エンコード」は文字と数字をマッピングする「方式」のことだと捉えていれば、大きくは外れません。 ただ、「文字コード」という言葉は、「数字」「方式」の両方で使われるほか、 文字一覧を示す「Charset」という意味で使わ
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く