[B! encoding] scorelessdrawのブックマーク

デバッグより重要なもの : 404 Blog Not Found

2009年04月02日16:00 カテゴリCodeArt デバッグより重要なものこの話題、すっかり乗り遅れてしまった。 2009-03-22 - 未来のいつか/hyoshiokの日記プログラミング入門書では、デバッグについて、ほとんど議論されていないし、仮にふれられていても、おざなりな方法というか、かなり邪険にあつかわれていたりする。プログラマの多くの時間がデバッグについやされていたとしてもだ。あえていわせていただく。コードはデバッグできるだけはるかにましなのだ、と。printfを使うかどうかなんぞ、その問題と比べれば屁ですらないのだと。デバッグよりもはるかに重要なもの、それはデータ構造の選定。ここで一歩間違えると、バグが仕様化し、デバッグどころかバグにあわせてプログラムを書かねばならぬ羽目になる。その最も顕著な例が、Unicodeだろう。最初の設計を間違えたおかげで、最新のソ

scorelessdraw 2009/04/02

”すっかり乗り遅れてしまった”＞＞乗ろうとしてない

リンク

絵文字が開いてしまった「パンドラの箱」第1回--日本の携帯電話キャリアが選んだ道

Unicodeが携帯電話の絵文字を収録へ絵文字ってなに？そう聞かれても多くの人は、ああ、それはと答えられるはず。そう言えばちょっと前に『メールのハートマークにだまされるな！　8割の女性は「恋人以外にも使う」』（RBB NAVI）なんていうニュースもありました。携帯電話の個人普及率が9割を上回る（平成20年内閣府消費動向調査）この国において、絵文字はごくありふれたものになっている現実があります。 2008年の11月27日、Googleが携帯電話で使われる絵文字を国際的な文字コード規格、Unicodeに収録しようというプロジェクト進行中であることを発表しました。では、このニュースは何を意味するのでしょう。そして私たちに何をもたらすのでしょう。今回から3回に分けて考えてみようと思います。まず歴史を振り返ってみましょう。じつは絵文字を使ったのは携帯電話が最初というわけでありません。先行するもの

scorelessdraw 2009/02/28

リンク

「○x言語はもう終わり」というプログラマは終わり : 404 Blog Not Found

2009年02月19日22:30 カテゴリLightweight Languages 「○x言語はもう終わり」というプログラマは終わりこれ、 Perlはもう終り？ | | プログラマ2.0日報 | あすなろBLOG すでにJPAの中の人が完璧に論破しちゃっている FUDを広げるのは誰の得にもならないと思うんだ。 - D-6 [相変わらず根無し] のだけど、お呼びがかかったので蛇足しておくことにする。まずは各論から。 Perlはもう終り？ | | プログラマ2.0日報 | あすなろBLOG 言語仕様が汚い。厳格にはサブルーチンの「引数」という概念がないし、変数はすべてグローバルで特に宣言した場合だけローカルになる...というあたりの仕様は、そりゃインタプリタの実装は楽チンだろうけども、美意識（とミスしにくさ）には欠けるよね。汚いったって英語や日本語ほどじゃない。そして英語や日本語が汚い

scorelessdraw 2009/02/19

リンク

るびま

『るびま』は、Ruby に関する技術記事はもちろんのこと、Rubyist へのインタビューやエッセイ、その他をお届けするウェブ雑誌です。 Rubyist Magazine について『Rubyist Magazine』、略して『るびま』は、日本 Ruby の会の有志による Rubyist の Rubyist による、Rubyist とそうでない人のためのウェブ雑誌です。最新号 Rubyist Magazine 0058 号バックナンバー Rubyist Magazine 0058 号 RubyKaigi 2018 直前特集号 Rubyist Magazine 0057 号 RubyKaigi 2017 直前特集号 Rubyist Magazine 0056 号 Rubyist Magazine 0055 号 Rubyist Magazine 0054 号東京 Ruby 会議 11 直

scorelessdraw 2009/02/10

リンク

UTF-PNG (aka Unicolor) : 404 Blog Not Found

2007年03月11日03:00 カテゴリLightweight Languages UTF-PNG (aka Unicolor) たしかにこれは普通の奴らの上ですね。 404 Blog Not Found:シフトJISを残すべきか? - matzさんのコメント新しいUnicode符号化方式 http://nowsmartsoft.or.tv/nws/Japanese/new_utf.htm にはしびれました。本気で実装しているところがすばらしい。こちらでは、普通の奴らの下を目指してみました。名づけて、UTF-PNG。別名Unicolor Encoding. Perlによる実装は、です。エンコーダーは、デコーダーはです。コンパクトでしょ? Unicodeの全キャラクター一文字づつ載せると100万文字以上になりますが、それでもこれくらいに収まります。そう。何のことはない、Uni

scorelessdraw 2007/03/11

encoding

リンク

UTF-8 エンコーディングの危険性 - WebOS Goodies

基本的に、まともな国際化ライブラリを使っていれば、上記のような不正な文字コードはきちんと処理してくれるはずです。実際、 Opera, Firefox, IE ともに適切にエスケープしてくれました。また、 UCS に変換した後にエスケープ処理を行うことでも対処できるかもしれません。しかし、複数のモジュールで構成されるような規模の大きいアプリケーションでは、そのすべてが適切な処理を行っていると保証するのも、なかなか難しいかと思います。ここはやはり、すべての外部入力に含まれる不正なシーケンスを、水際で正規化するという処理を徹底するのが一番かと思います。例えば Ruby の場合、不正な UTF-8 コードを検出する最も簡単な方法は、 String#unpack を使って UCS へ変換してみることです（昨日の記事への kazutanaka さんからのはてぶコメントにて、 iconv でも同様なこ

scorelessdraw 2007/02/22

リンク

Vistaで化ける字，化けない字

11月30日に企業向けには出荷が始まったWindows Vista。そのVistaで，“文字化け”が起こるらしい。文字化けといっても，Webアクセス中にたまに見かける全く読めない文字の羅列になることはほとんどなく，その多くは似た文字が表示される程度である。ここでは，本来表示されるべき文字の形が少し違ったものが表示されるケースも“文字化け”として扱う。 Microsoftは，Windows 98日本語版の発売以来，Windows 2000，Windows Me，Windows XPまでCP932（本名はWindows Codepage 932，いわゆるMS漢字コード）とJIS X 0212をサポートしてきたが，最新のWindows VistaではJIS X 0213に乗り換えた。いや，乗り換えたというのは，ちょっと語弊がある。CP932とJIS X 0212に加えて，JIS X 0213もサ

scorelessdraw 2006/12/15

encoding

リンク

character-sets

Last Updated 2022-07-14 Available Formats XML HTML Plain text Registry included below Character Sets Registration Procedure(s) Expert Review Expert(s) Martin Dürst Reference [RFC2978] Note These are the official names for character sets that may be used in the Internet and may be referred to in Internet documentation. These names are expressed in ANSI_X3.4-1968 which is commonly called US-ASCII or

scorelessdraw 2006/12/03

IANA

encoding

リンク

シフトJIS / EUC-JPとUnicodeとの妥当な変換表: Netsphere Laboratories

2004.10.17 新規作成。2004.12.19 加筆。2005.04.02加筆。最近、コンピュータで扱う文字列の文字コードがUnicodeでなければならない場面が増えてきた。UnicodeとシフトJIS、EUC-JPを変換する機会が多い。この変換は変換表で行うが、変換表が実際的なものでなければ、文字化けが発生することになる。おかしな変換表は、これまでは、特にLinuxなどの上で動作するオープンソースソフトウェアで多く見られた。おそらく規格原理主義者が多かったためだろう。そもそも、規格どおりに変換表を作ると、実用的な変換表にはならない。しかし、最近ではまともな変換表を実装しているものも増えてきて、うまく選ぶだけでいいようになってきている。変換表の違いをまとめたページはよく見かけるが、実際にどのような条件を満たして変換するものを選べばいいか不明なので、まとめてみた。変換表に求めら

scorelessdraw 2006/06/28

encoding

リンク

Yahoo! JAPANのソース  は何か意味があるのでしょうか？

<html> <head> <meta http-equiv="Content-Type" content="text/html; charset=euc-jp">  <title>Yahoo! JAPAN</title> この  は何か意味があるのでしょうか？お願いします。

scorelessdraw 2006/05/30

リンク

Legacy Encoding Project

Legacy Encoding Project † オープンソースソフトウェアでのレガシーエンコーディング(シフトJIS、日本語EUC、7ビットJISコード)の文字コード変換で生じる問題の解決を目指すプロジェクトです。本プロジェクトはIPA (情報処理推進機構) の 2005年度下期オープンソースソフトウェア活用基盤整備事業で「オープンソースソフトウェアにおける統一したレガシーエンコーディングの変換機能の開発」として採択され支援を受けています。概要 IPA オープンソースソフトウェア活用基盤整備事業キャラクタセットの詳細 cp932 cp51932 eucJP-ms ISO-2022-JP-MS 各キャラクタセットの対応関係 ↑

scorelessdraw 2006/05/06

encoding

リンク

はてなブックマーク

タグ

関連タグで絞り込む (6)

encodingに関するscorelessdrawのブックマーク (11)

お知らせ

今週のはてなブックマーク数ランキング（2024年5月第1週）

月間はてなブックマーク数ランキング（2024年4月）

今週のはてなブックマーク数ランキング（2024年4月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス