摘 要:雖然Fortran常用來(lái)進(jìn)行科學(xué)計(jì)算,但是面對(duì)計(jì)算量大的程序仍然很耗時(shí)。通常人們用MPI進(jìn)行粗粒度的并行來(lái) 提高程序的運(yùn)行效率,近年來(lái)隨著GPU計(jì)算能力的提高,將程序進(jìn)行細(xì)粒度GPU并行化成為一種趨勢(shì)。文章基于NVIDIA公 司的CUDA框架,就Fortran程序向CUDA移植過(guò)程中的一些問(wèn)題進(jìn)行總結(jié),并給出了相應(yīng)的解決方案。