ブックマーク / qiita.com/Pagliacci (1)

  • Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita

    背景 最近Ryzen 9 7950xを載せたPCを作ったのですが思ったより数値計算の速度が出なかったので、よく出てくる基的な演算性能を調べてみました。今回は巨大なベクトルの内積の計算速度を対象とします。なお筆者はHigh-performance computingの専門家ではないので以下には間違いが含まれているかもしれません。 測定対象 10億次元のベクトルの内積を倍精度で計算する以下のプログラムの計算速度を測ります。特にOpenMPを用いた並列化のよりどの程度速くなるかを主眼としています。 #include <vector> #include <iostream> #include <omp.h> #include <chrono> #include <ios> #include <iomanip> template<typename RealType> void vec_inner_

    Ryzen 9 7950XおよびApple M1 Maxの内積計算速度について - Qiita
    clworld
    clworld 2023/02/03
    M1はメモリがCPUに直付けされてるのでそりゃ帯域広い。メモリ帯域で律速してるのはベンチマークとしてはまずくてもうすこし複雑な計算をさせるべきな気がする。
  • 1