エントリーの編集
エントリーの編集は全ユーザーに共通の機能です。
必ずガイドラインを一読の上ご利用ください。
WriteCombineメモリアクセスを高速化する - CUDA Information Site
記事へのコメント0件
- 注目コメント
- 新着コメント
このエントリーにコメントしてみましょう。
注目コメント算出アルゴリズムの一部にLINEヤフー株式会社の「建設的コメント順位付けモデルAPI」を使用しています
- バナー広告なし
- ミュート機能あり
- ダークモード搭載
関連記事
WriteCombineメモリアクセスを高速化する - CUDA Information Site
cudaHostAllocで確保したWriteCombineメモリへのアクセスは、普通のメモリへのアクセスと比較するとかな... cudaHostAllocで確保したWriteCombineメモリへのアクセスは、普通のメモリへのアクセスと比較するとかなり遅いです。 条件にもよりますが、数十倍〜数百倍の速度差が発生することもあります。 #include <stdio.h> static inline unsigned int rdtsc() { unsigned int hi, lo; __asm__ __volatile__("rdtsc" :"=a"(lo), "=d"(hi)); (void)hi; return lo; } int main() { void *p, *dst; unsigned int begin, end; size_t size = 10*1024*1024; int nloop = 2; dst = malloc(size); cudaHostAlloc(&p, size, cudaHo