CUDA command Profiler
這里我不使用默認設(shè)置:
timestamp gpustarttimestamp gpuendtimestamp gridsize threadblocksize dynsmemperblock stasmemperblock regperthread memtransferdir memtransfersize memtransferhostmemtype streamid localblocksize
將上面的內(nèi)容添加到一個新的文本文件中。假設(shè)這個文件叫prof.cfg
假設(shè)你的程序是a.exe
用下面的命令啟動執(zhí)行
CUDA_PROFILE=1?CUDA_PROFILE_CONFIG=prof.cfg?./a.exe
此時會有一個文件產(chǎn)生在你的目錄下,打開看看吧。