[B! 文字コード][JavaScript] raimon49のブックマーク

raimon49 id:raimon49

文字コードとJavaScriptに関するraimon49のブックマーク (30)

JSでDoSる/ Shibuya.XSS techtalk #11
Shibuya.XSS techtalk #11 の発表資料です。
raimon49 2019/05/17
仕様の改定やブラウザの歴史もまとめられている。Nodeで安全にサーバー書くのつらいよなぁ。

HTML

JavaScript

JSON

XSS

browser

node.js

performance

programming

study

文字コード
リンク
JavaScript における文字コードと「文字数」の数え方 | blog.jxck.io
Intro textarea などに入力された文字数を、 JS で数えたい場合がある。ここで .length を数えるだけではダメな理由は、文字コードや JS の内部表現の話を理解する必要がある。多言語や絵文字対応なども踏まえた上で、どう処理するべきなのか。それ自体は枯れた話題ではあるが、近年 ECMAScript に追加された機能などを交えて解説する。なお、文字コードの仕組みを詳解すること自体が目的では無いため、 BOM, UCS-2, Endian, 歴史的経緯など、この手の話題につき物な話の一部は省くこととする。 1 文字とは何か Unicode は全ての文字に ID を振ることを目的としている。例えば 😭 (loudly crying face) なら 0x1F62D だ。 1 つの文字に 1 つの ID が割り当てられているのだから、文字の数を数える場合は、この ID
raimon49 2019/04/17
Code Pointで扱う。

JavaScript

emoji

programming

文字コード

正規表現
リンク
Rebuild: 201: Backend Inside Frontend (kosamari)
Mariko Kosaka さんをゲストに迎えて、JavaScript コミュニティ、Chrome, HTTPS, 標準化、Unicode などについて話しました。 Show Notes OneSignal - Multi-platform Push Notification Service Jed Schmidt on Twitter: "headed to meet the legendary @miyagawa in a few" BrooklynJS John Resig - JavaScript Programming Khan Academy John Resig - search.cpan.org ECMAScript 5 Strict Mode, JSON, and More Chromium Blog: A secure web is here to stay Chrom
raimon49 2018/02/13
Chrome

JavaScript

OSS

SSL

performance

文字コード
リンク
事実上最後のJSON仕様「RFC 8259」と「ECMA-404 2nd Editon」公開。UTF-8エンコード必須に
RESTful APIのデータフォーマットなどで広く使われているJSON。IETFはJSON仕様「RFC 8259」を発表。従来の仕様をブラッシュアップしつつECMAの仕様との統一も実現した、事実上最後のJSON仕様になると見られる。 IETFからJSON（ジェイソン）の仕様を示した「RFC 8259」（The JavaScript Object Notation (JSON) Data Interchange Format）が公開されました。 IETFにおけるJSON仕様は、これまで「RFC 7159」が参照されていましたが、RFC 8259の公開によりRFC 7159は廃止（Obsolete）となりました。 RFC 8259は、多数の実装と十分な運用実績を積み重ねたインターネット標準「STD 90」としても参照されます。 ECMAとの統一を実現。事実上最後のJSON仕様になると見られる
raimon49 2017/12/20
JavaScript

JSON

guideline

文字コード

歴史
リンク
漢字にマッチする JavaScript の正規表現パターン: Days on the Moon
たまに漢字にマッチする正規表現パターンを書きたいときがあります。Perl の正規表現だと Unicode のスクリプト名を使って \p{Han} で漢字にマッチさせられるのですが、JavaScript ではそうはいきません。JavaScript の正規表現には以下のふたつの問題があります。 Unicode スクリプト名の指定 (\p{...}) に対応していない。そもそも Unicode の符号位置に対してマッチさせられない (UTF-16 における符号単位に対するマッチになる)。 BMP 外の文字にマッチさせたいときは、サロゲートペアの符号単位を記述する必要がある。これに関しては ECMAScript 2015 で導入された /u フラグで解決する見込み。とはいえ、解決不能な問題というわけでもないので、Perl の \p{Han} を JavaScript に移植してみましょう。\
raimon49 2016/01/04
JavaScript

Perl

programming

正規表現

漢字

文字コード
リンク
Open sourcing Twitter emoji for everyone
Earlier this year, we collaborated with our friends at @Iconfactory on a set of 872 beautiful emojis so Tweets containing emoji characters would look as sharp on the web as they do in mobile apps. Now we’re pleased to announce that these emoji are available as an open source library to the developer community at large. Since we’ve gotten many requests to use our emoji in various projects, as of to
raimon49 2014/11/07
おおー。

JavaScript

OSS

Twitter

emoji

文字コード
リンク
String.prototype.normalizeが実装された - JS.next
実装されたメソッド String.prototype.normalize(form = "NFC") form（初期値："NFC"）の形式で正規化した文字列を返す詳細複雑な文字は、一文字に見えても、文字コード上は複数の構成文字から成り立っている場合がある。例えば、『が』(濁点付き平仮名か)と、『か』(平仮名か) ＋『゛[U+3099]』(合成用濁点)は、同じ意味を持ち同じように見えるが、文字コードが異なるためそのままではプログラム上では異なる文字列として扱われてしまう。 ga_NFC = 'が' // 'が' ga_NFD = 'か\u3099' // 'が' escape(ga_NFC) // '%u304C' escape(ga_NFD) // '%u304B%u3099' ga_NFC.length // 1 ga_NFD.length // 2 ga_NFC == ga_
raimon49 2014/07/27
インターネッツの世界でコピペされ続けているzenhan関数を捨てる日が

JavaScript

programming

文字コード
リンク
Special and Math Symbols in HTML and JavaScript
Question: Can I display special or mathematical symbols as part of JavaScript output? Answer: You can include symbols in JavaScript strings and/or display symbols on your HTML pages using several representations: hexadecimal codes \xXX in JavaScript strings; e.g. degree (°) is \xB0 Unicode hex codes \uXXXX in JavaScript strings; e.g. euro sign (€) is \u20AC HTML entities; e.g. euro (€) is € a
raimon49 2014/07/23
HTML

JavaScript

文字コード
リンク
文字コードの脆弱性はこの3年間でどの程度対策されたか?
SecurityとValidationの奇妙な関係、あるいはDrupalはなぜValidationをしたがらないのかHiroshi Tokumaru
raimon49 2014/02/26
Unicodeエスケープ大事、やってないWeb APIたまに見る。

JavaScript

JSON

Security

browser

文字コード
リンク
Masato Kinugawa Security Blog: U+2028/2029とDOM based XSS
ECMAScriptの仕様では、0x0A/0x0D以外にU+2028/2029の文字も改行とすることが明記されています。これはあまり知られていないように思います。以下はアラートを出します。 <script> //[U+2028]alert(1) </script> 知られていないだけでなく、知っていたとしても、スクリプトで文字列を処理するときに、U+2028/2029まで考慮する開発者がどれだけいるのかという話です。実際、U+2028/2029を放り込むと文字列リテラル内にその文字が生のまま配置され、エラーが出るページは本当にたくさんあります。まあ、エラーがでるだけなら、大抵の場合大きな問題にはなりません。ところが、U+2028/2029によってXSSが引き起こされてしまう場合というのを最近実際に見ました。 Googleのサービスで見つけた2つのケースを取り上げたいと思います。ケ
raimon49 2013/09/18
ひぃ

Chrome

IE

JavaScript

Security

XSS

文字コード

正規表現
リンク
ブラウザのデコード機能を利用した Shift JIS などの読み込み : document
3月12 ブラウザのデコード機能を利用した Shift JIS などの読み込みはじめに JavaScript でバイナリから文字列を取り出したら Shift JIS だったなんてことよくありますよね。そういう文字列もさっと表示したいことがあります。読み込む方法はいくつかあるこれらの文字列を読み込む方法はいくつかあって、自分が把握してるだけでも以下のものがあります。 Shift JIS と UTF-16 の対応表をつくるぽりごんさんの文字コード変換ライブラリ Blob, File API を使って読み込む右京さんの javascriptのnative APIで任意の文字コードからutf8に変換 script, Data URL を使って変換 1, 2 の方法についてはそれぞれ解説や実装があるのですが、3 の方法については見当たらなかったので説明してみます。準備念のため 2 段
raimon49 2013/04/17
JavaScript

programming

文字コード
リンク
開いただけで自動的にスターがつく便利日記 - ぼくはまちちゃん！
こんにちはこんにちは！！招待された覚えがないのに、なぜかはてなブログを使えているHamachiya2です！こんにちは！新しいはてなブログではJavaScriptが自由に使わせてもらえるので、とりいそぎ新機能の活用ということで、開いただけで自動的にはてなスターがつく便利日記ができました。ついたスターの確認はこちら → http://s.hatena.ne.jp/mobile/entry?uri=http://hamachiya2.hatena blog.jp/entry/2011/11/07/183544
raimon49 2011/11/08
CSRF

Security

XSS

Blog

hatena

JavaScript

文字コード
リンク
Twitter時代の文字の数え方 | 配電盤
入力「×」のブラウザでは、「𠮷」が2文字とみなされるため、2文字目まで、つまり「𠮷野」までしか入力できません。 Mozillaの文書には、Unicode code pointsで数えると書いてあるので、そのうち改善されるのかもしれませんが、現時点ではTwitterのために「maxlength="140"」を使うことはできません。 pattern属性 Firefox 21とChrome 27、IE 10、Opera 12.15は、「pattern=".{0,3}"」（任意の文字からなる0から3文字）のような正規表現を使った検証にも対応していますが、やはり「𠮷野家」は4文字とみなされてしまいます。 JavaScript 追記：javascript – でBMP以外のUnicode文字をきちんと扱う（404 Blog Not Found） JavaScriptでは、文字列strの長さをst
raimon49 2011/06/18
Java

HTML5

MySQL

PHP

JavaScript

文字コード
リンク
Firefox 5 の後方互換性に関わる修正のまとめ
先日 Firefox 5 のベータ版が公開されました。Firefox 5 の正式版は 6/22 のリリースを予定しており、Firefox 4.0.1 のユーザは自動的に更新されます。 Firefox 4 以降では Rapid Release プロセスと呼ばれる新しいリリースプロセスに移行し、セキュリティと安定性の改善と共に、新機能や高速化を含めた新しいバージョンを 6 週間毎に公開します (Firefox 6 まではプロセス移行に伴い異なる間隔)。基本的には後方互換性が維持されるよう開発されていますが、最新 Web 標準への対応や、他のブラウザとの互換性確保のため、細部では後方互換性に関わる変更も含まれています。そこで、後方互換性に関わる Firefox 5 の主な変更点をまとめてみました。Beta 版で互換性テストをされる Web 開発者の皆様などの参考になれば幸いです。後方互換性
raimon49 2011/06/11
Firefox

JSON

HTML5

JavaScript

文字コード
リンク
Web開発者の皆様へ - Firefox5周りでの変更点について
dynamis (でゅなみす/レッサーパンダ) @dynamitter Web開発者の皆様へ。変数名にclass, enum, export, extends, import, superを使ってないか注意してください。Firefox 5ではstrict mode外でも予約語扱いになります http://bit.ly/lInGNP 2011-06-02 14:00:27
raimon49 2011/06/03
予約語class, enum, export, extends, import, superの追加, バックグラウンドに回ったタブではsetTimeout()のコールバックは1秒1回まで。

Firefox

HTML5

JavaScript

文字コード
リンク
はてなグループの終了日を2020年1月31日(金)に決定しました - はてなの告知
はてなグループの終了日を2020年1月31日(金)に決定しました以下のエントリの通り、今年末を目処にはてなグループを終了予定である旨をお知らせしておりました。 2019年末を目処に、はてなグループの提供を終了する予定です - はてなグループ日記このたび、正式に終了日を決定いたしましたので、以下の通りご確認ください。終了日: 2020年1月31日(金) エクスポート希望申請期限:2020年1月31日(金) 終了日以降は、はてなグループの閲覧および投稿は行えません。日記のエクスポートが必要な方は以下の記事にしたがって手続きをしてください。はてなグループに投稿された日記データのエクスポートについて - はてなグループ日記ご利用のみなさまにはご迷惑をおかけいたしますが、どうぞよろしくお願いいたします。 2020-06-25 追記はてなグループ日記のエクスポートデータは2020年2月28
raimon49 2010/06/10
binary

JavaScript

programming

文字コード
リンク
サロゲートペア入門
はじめに Windows VistaのJIS2004対応により、WindowsのUnicode環境で使用できる日本語漢字の数が増えました。従来、12238字（Windows XP）だったのが13145字（Windows Vista）になり、907字追加されることになりました。これによって、JIS第3水準、JIS第4水準の漢字がすべてサポートされることになったのです（Windows XPまでは一部サポート）。またWindows XPでも、パッチさえ当てれば、Windows Vistaと同じように追加907字を加えた13145字の漢字が使用できるようになりました。ところが、この追加された907字の中には「サロゲートペア」という特殊な文字が304字あり、これらは今までのUnicodeの文字とは扱いが少し違います。この点について解説していきたいと思います。対象読者 Unicodeでデータ処理
raimon49 2010/05/06
knowledge

JavaScript

Windows

文字コード
リンク
JavaScriptで全角英数と半角英数の相互変換 - Rewish@hatena
全角英数の文字コードから65248個前が半角英数の文字コード。半角英数の文字コードから65248個後が全角英数の文字コード。 // 半角にしたい str.replace(/[Ａ-Ｚａ-ｚ０-９]/g, function(s) { return String.fromCharCode(s.charCodeAt(0) - 65248); }); // 全角にしたい str.replace(/[A-Za-z0-9]/g, function(s) { return String.fromCharCode(s.charCodeAt(0) + 65248); }); 65248の部分は16進数で表される事が多い。 // 半角にしたい str.replace(/[Ａ-Ｚａ-ｚ０-９]/g, function(s) { return String.fromCharCode(s.charCodeAt(0)
raimon49 2010/04/28
文字コード　65248　0xFEE0

JavaScript

programming

文字コード
リンク
Unicodeエスケープ - sawatのブログ
付箋紙Greasemonkeyで、GM_setValueに登録した日本語の文字化け対策にencodeURIをつかったけど、encodeURIはURIをエンコードするための関数なのであんまり褒められた使い方ではないですね。しかも、encodeURIのようなURLエンコーディングは文字列をUTF-8にしてから、エンコード対象の各バイトを%xx形式*1で表現するので、日本語１文字をあらわすのにたいていの場合ASCII9文字が必要になって効率が悪いです。*2 なので、前述のような単に非ASCII文字をエスケープしたいだけのようなケースではUnicodeエスケープを使った方がよいです。Javaのpropertiesとかnative2asciiとかのやつです。 Unicodeエスケープは\uxxxx*3の形式であらわすので、たいていの日本語１文字はASCII6文字になって、URLエンコーディングに比べ
raimon49 2010/03/03
String.replaceのコールバックを利用した\uxxxx形式エスケープ

JavaScript

programming

文字コード
リンク
JavaScript用の携帯絵文字変換ライブラリを公開します - 遥かへのスピードランナー
FirefoxのMobileSimulatorアドオンで使用しているJavaScript用の携帯絵文字変換ライブラリを公開します。 ⇒ダウンロード携帯の絵文字をPCでも見れるように画像ファイルに変換してくれます。すでに過去のエントリでも書いていますが、PHPの携帯絵文字変換ライブラリMobilePictogramConverterをjavascript用に大幅に改変したものです。で、改変したわりには絵文字のバリエーションには一部しか対応していません（汗）それについてはFirefox MobileSimulatorアドオンの絵文字の取り扱いについてに記載したとおりです。たとえば、DoCoMoやAuのSJIS10進数値参照()のような記載方法には対応していません。これについては今後対応していく予定です。またPCでの絵文字表示に特化しているので、もともとのPHP版に
raimon49 2009/11/03
emoji

mobile

JavaScript

文字コード
リンク
1 2 次のページ