タグ

programmingとsseに関するbabydaemonsのブックマーク (2)

  • gccで simd mmx sse sse2

    20101118追記: Programming Labさんから移転のご連絡を受けましたのでリンク貼り替えました。 ついでにメンテも。リンク切れは可能な限り移転先(もしくはWeb Archive)を追いかけました。 PDFもWeb Archiveに収録されたりするのな。なんとなく意外。 gccもVer4くらいから自動ベクトル化に対応。コンパイルオプションとして-O2などと同時に-ftree-vectorizeをつける。 gcc-4.x での SIMD 命令サポート http://jr0bak.homelinux.net/~imai/pukiwiki/pukiwiki.php?Linux%2Fmisc%2Fgcc-4.x%20%A4%C7%A4%CE%20SIMD%20%B1%E9%BB%BB%A5%B5%A5%DD%A1%BC%A5%C8 GCCの機能拡張とベクトル演算 http://www

  • SSE.浮動小数点演算手動最適化は本当に効果的なのか - デー

    ちょっと試したので、結果をコピペ。 概要とたてまえ SSEは、x86のSIMD命令セットに含まれる浮動小数点演算の複数同時実行を行う命令セットです。単精度(float)で4つ、倍精度(double)で2つの演算を1命令で実行できるため、うまく使うと繰り返し同じ演算のパフォーマンスアップを期待できます。 Streaming SIMD Extensions - Wikipedia 画像処理や、確率の計算などでは浮動小数点数の計算を数百万回から回数とかいうレベルではなく3日間くらいの規模で行うことがあるので、 少しでも速くなると時間的にとてもうれしい! 計算をどこで妥協するかみたいな部分があるため速く計算を終わらせることでやれることの可能性が広がる! という思いがあります。 CUDAのほうが云々 CUDAは、NVIDIAのGPUが対応しているGPGPUの環境です。GPGPUというのは、グラフィッ

    SSE.浮動小数点演算手動最適化は本当に効果的なのか - デー
  • 1