中國(guó)提出創(chuàng)新算法：NVIDIA GPU科學(xué)計(jì)算性能提升800倍

時(shí)間：2025-02-05 11:18:27

關(guān)鍵字： NVIDIA AMD 顯卡

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀]2月4日消息，據(jù)報(bào)道，中國(guó)的研究人員發(fā)明了一種創(chuàng)新的高性能算法，可以大幅提升NVIDIA消費(fèi)級(jí)GPU的科學(xué)計(jì)算性能，最高達(dá)驚人的800倍!

2月4日消息，據(jù)報(bào)道，中國(guó)的研究人員發(fā)明了一種創(chuàng)新的高性能算法，可以大幅提升NVIDIA消費(fèi)級(jí)GPU的科學(xué)計(jì)算性能，最高達(dá)驚人的800倍!

這一算法來(lái)自深圳北理莫斯科大學(xué)的團(tuán)隊(duì)，該校由北京理工大學(xué)、莫斯科國(guó)立羅蒙諾索夫大學(xué)聯(lián)合創(chuàng)立。

新的算法增強(qiáng)了近場(chǎng)動(dòng)力學(xué)(Peridynamics)的計(jì)算效率，這是一種前沿的非局部理論，可以解決材料斷裂、損壞等復(fù)雜的物理問題，廣泛用于航空、工程、軍事等領(lǐng)域。

但是，近場(chǎng)動(dòng)力學(xué)的計(jì)算非常復(fù)雜，傳統(tǒng)模擬方法效率不夠高。

深圳北理莫斯科大學(xué)團(tuán)隊(duì)基于NVIDIA CUDA編程技術(shù)，創(chuàng)建了新的PD-General框架，優(yōu)化了算法設(shè)計(jì)和內(nèi)存管理，充分利用了GPU的大規(guī)模并行計(jì)算能力。

在一塊普通的RTX 4070顯卡上，新的算法比傳統(tǒng)串行算法速度提升了驚人的800倍，對(duì)比新的OpenMP并行算法也提升了足足100倍。

在涉及上百萬(wàn)粒子的大規(guī)模模擬中，新算法完成4000步迭代所需的時(shí)間還不到5分鐘。

而在大規(guī)模2D單軸拉伸問題中，新算法只用不到2分鐘，就完成了695萬(wàn)次單精度迭代。

新算法擁有廣闊的應(yīng)用前景，包括但不限于：

- 航空與國(guó)防領(lǐng)域：改進(jìn)航空器結(jié)構(gòu)材料應(yīng)力與失效的模型。

- 工程與制造領(lǐng)域：提升建筑與工業(yè)材料測(cè)試的效率。

- 軍事研究：加快防御性材料的抗沖擊研究。

最為關(guān)鍵的是，這一算法不需要高性能的GPU芯片，不會(huì)受到美國(guó)制裁限制，只需普通的消費(fèi)級(jí)家用GPU就可以完成。

如果能遷移支持國(guó)產(chǎn)GPU硬件，那就更完美了!

阿維塔、賽力斯已入股！華為引望可能成“中國(guó)博世”