タグ

cpuとSIMDに関するmoritataのブックマーク (2)

  • HTTPパーサにおけるSSE4.2最適化の威力と注意点 - Cybozu Inside Out | サイボウズエンジニアのブログ

    こんにちは、サイボウズ・ラボの光成です。 PicoHTTPParserは@kazuhoさんたちが開発している高速なHTTPパーサです。 同じ作者によるHTTPサーバH2Oにも使われています。 11月4日の開発ブログによると、その時点でNode.jsなどに使われているhttp-parserの10倍程度の速度を誇るそうです(現在はhttp-parserも速度向上しその差は縮まりました。それでも4倍以上の差があるようです)。 該当ブログにはその高速化のためのノウハウが書かれていて大変興味深いです。ただIntel系CPUに搭載されているSIMD命令は用いられていませんでした。今回、@kazuhoさんと一緒に文字列処理専用のSSE4.2を用いることで1.7~1.9倍の高速化を達成しました(Improving Parser Performance using SSE Instructions (in

    HTTPパーサにおけるSSE4.2最適化の威力と注意点 - Cybozu Inside Out | サイボウズエンジニアのブログ
  • 条件分岐とcmovとmaxps

    3. 自己紹介 光成滋生(サイボウズ・ラボ) 姑息な最適化が大好き 以前はコーデック系の趣味仕事をやっていた 最近は仕事のために機械学習を勉強中 PRMLあんちょこ公開中(https://github.com/herumi/prml/) blog : http://homepage1.nifty.com/herumi/ mail : herumi@nifty.com twitter : @herumi 3 /24 5. プロファイル プロファイラ 関数組み込みタイプ プログラム自体に組み込まれる それ自体がプログラムに影響を与える 回数は正確 gprofやDevPartner, Vtune タイミング割り込みによる集計タイプ 割り込みでその瞬間のeipを取得し集計 プログラムに影響を(殆ど)与えない 回数は不正確,時間は概ね正確 CodeAnalys

    条件分岐とcmovとmaxps
  • 1