for( int i = 0 ; i < SIZE ; i++ ){ a[i] = 1.0 ; }
cudaMemcpy(dev_a, a, SIZE * sizeof(float), cudaMemcpyHostToDevice ) ; cudaEventCreate( &start ) ; cudaEventCreate( &stop ) ; cudaEventRecord( start, 0 ) ;
sumOfSquares_gpu0<<
for(int i = 0 ; i < BLOCK_NUM ; i++ ){ sum += result[i] ; }
cudaEventRecord( stop, 0 ) ; cudaEventSynchronize( stop ) ;
cudaEventElapsedTime( &elapsedTime, start, stop ) ; printf( \ printf( \ cudaEventDestroy( start ) ; cudaEventDestroy( stop ) ; free( a ) ;
cudaFree( dev_a ) ;
cudaFree( dev_result ) ; return 0 ; }
16
百度搜索“77cn”或“免费范文网”即可找到本站免费阅读全部范文。收藏本站方便下次阅读,免费范文网,提供经典小说综合文库多核编程和并行运算期末复习(4)在线全文阅读。
相关推荐: