ここまで、データを並列に処理することでCPUに比べて優れた性能をGPUが示すことを紹介してきた。 GPUには他の並列処理があって、それはCPUでのタスク並列に似たもの。 GPUでのタスク処理は、CPUでのそれに比べて手間がかかる/自分で陽に記述してやる必要がある この章では、streamの基礎とそれによるタスク並列について学ぶ。 10.1 10章の目的 ページロックメモリについて学ぶ CUDA streamについて学ぶ CUDA streamをつかって、アプリを高速化する方法 10.2 ページロックされる、ホストメモリ ホストにメモリを確保するには、mallocとcudaHostAllocがある。違いは? mallocは標準な、pageable host memoryを割り当てる cudaHostAllocはページロックメモリ(pinned memoryとも)を割り当てる ページロックメモ