中國(guó)提出創(chuàng)新算法:NVIDIA GPU科學(xué)計(jì)算性能提升800倍
2月4日消息,據(jù)報(bào)道,中國(guó)的研究人員發(fā)明了一種創(chuàng)新的高性能算法,可以大幅提升NVIDIA消費(fèi)級(jí)GPU的科學(xué)計(jì)算性能,最高達(dá)驚人的800倍!
這一算法來(lái)自深圳北理莫斯科大學(xué)的團(tuán)隊(duì),該校由北京理工大學(xué)、莫斯科國(guó)立羅蒙諾索夫大學(xué)聯(lián)合創(chuàng)立。
新的算法增強(qiáng)了近場(chǎng)動(dòng)力學(xué)(Peridynamics)的計(jì)算效率,這是一種前沿的非局部理論,可以解決材料斷裂、損壞等復(fù)雜的物理問題,廣泛用于航空、工程、軍事等領(lǐng)域。
但是,近場(chǎng)動(dòng)力學(xué)的計(jì)算非常復(fù)雜,傳統(tǒng)模擬方法效率不夠高。
深圳北理莫斯科大學(xué)團(tuán)隊(duì)基于NVIDIA CUDA編程技術(shù),創(chuàng)建了新的PD-General框架,優(yōu)化了算法設(shè)計(jì)和內(nèi)存管理,充分利用了GPU的大規(guī)模并行計(jì)算能力。
在一塊普通的RTX 4070顯卡上,新的算法比傳統(tǒng)串行算法速度提升了驚人的800倍,對(duì)比新的OpenMP并行算法也提升了足足100倍。
在涉及上百萬(wàn)粒子的大規(guī)模模擬中,新算法完成4000步迭代所需的時(shí)間還不到5分鐘。
而在大規(guī)模2D單軸拉伸問題中,新算法只用不到2分鐘,就完成了695萬(wàn)次單精度迭代。
新算法擁有廣闊的應(yīng)用前景,包括但不限于:
- 航空與國(guó)防領(lǐng)域:改進(jìn)航空器結(jié)構(gòu)材料應(yīng)力與失效的模型。
- 工程與制造領(lǐng)域:提升建筑與工業(yè)材料測(cè)試的效率。
- 軍事研究:加快防御性材料的抗沖擊研究。
最為關(guān)鍵的是,這一算法不需要高性能的GPU芯片,不會(huì)受到美國(guó)制裁限制,只需普通的消費(fèi)級(jí)家用GPU就可以完成。
如果能遷移支持國(guó)產(chǎn)GPU硬件,那就更完美了!