CUDA 커널 시간 측정1 CUDA Event를 이용한 커널(SAXPY) 실행시간 측정 호스트의 타이머 함수를 사용할 경우, cudaDeviceSynchronize( )와 같은 명시적인 배리어 함수를 사용해야한다. 이 경우 GPU 파이프라인이 stall되는 문제 등이 발생될 수 있다. 따라서 CUDA 런타임에서 제공하는 event API를 사용해서 커널의 실행 시간을 측정하는 방식을 이용하는 것이 좋다. CUDA 이벤트 데이터 타입인 cudaEvent_t 를 사용하는 다음의 함수들을 사용한다. __host__ cudaError_t cudaEventCreate( cudaEvent_t* event) __host__ __device__ cudaError_t cudaEventDestroy(cudaEvent_t* event) __host__ __device__ cudaError_t cudaEvent.. 2020. 3. 4. 이전 1 다음