タグ

encodingに関するdrillbitsのブックマーク (4)

  • GNU grep 2.18リリース: 10倍速くなったと思ったら今度は200倍遅くなっていた | はむかず!

    先日の記事 いまさらgrepが10倍高速化したのはなぜか が思わぬ閲覧数を稼いでしまい、トルコ語の知識を日に広めるのに大きな貢献をしたような気がしますが、みなさんいかがお過ごしでしょうか。 実は先日の記事を書いた時にはすでに2.18がリリースされてたのだが、今回は2.17のときと違って日の大手メディアが取り上げてなかったので、ついつい見落としていた。しかし実は2.18でも大きな変更が!! リリースノート抜粋: grep -i in a multibyte, non-UTF8 locale could be up to 200 times slower than in 2.16. [bug introduced in grep-2.17] なんということでしょう。-iオプションでUTF8のときは2.17で10倍速くなっていたのだが、それ以外のマルチバイトロケールのときは200倍遅くなって

  • いまさらgrepが10倍高速化したのはなぜか – はむかず!

    最近GNU grepコマンドの最新バージョンがリリースされ、速度が10倍になったとのアナウンスがあった。それを聞いて、なんであんな枯れた技術に10倍もの高速化の余地があったのだろうと不思議に思った人も多いだろう。 ニュース記事:grepコマンド最新版、”-i”で10倍の高速化 家のリリースノート:grep – News: grep-2.17 released [stable] 今回のリリースでは正確には、マルチバイトロケールで、-iオプション(–ignore-case、つまり大文字小文字を区別しないオプション)をオンにした時の速度が10倍くらいになったそうだ。 なぜそんなに速くなったのか?逆を言えば今までなぜそんなに遅かったのか? そもそも、多くの日人にとって「大文字小文字の区別」というと英語のアルファベットか、せいぜいフランス語とかドイツ語とかのアクサン記号・ウムラウトがついたものく

  • Javaで携帯Webアプリを作ろう:CHARSETとGAE/J

    2009年06月16日 CHARSETとGAE/J 竹内(stakeuchi)です。 昨日GAE/Jに対応したと思っていたら(0.1.1-SNAPSHOT) うっかり絵文字関連のインターフェースを確かめてなかったので #完璧に忘れていて。。。 慌ててWebApplicationのlibフォルダに突っ込んだら 普通に効いた。 mobyletの仕様として 文字コードがロード出来なかった場合、 docomoとauのデフォルト文字コードをUTF-8として解釈し、 絵文字の変換処理を行わないようにしていたので 絵文字を使わないモバイルサイトを構築する場合は mobylet-charsetが無くても問題無いようになっているのです。 なので「動作したー」と思って完璧に忘れていたのですが。。。 そもそも、何で文字コードのjar(mobylet-charset)を lib.extフォルダに突っ込んだり、-D

  • PHPの文字化けを本気で解決する - ぎじゅっやさん

  • 1