中國超算芯片是怎樣一步步追上英特爾的?
2015年4月,美國商務(wù)部決定對中國四家國家超級計算機中心禁售至強PHI計算卡,當(dāng)時各種唱衰中國超算的聲音不絕于耳。即便天河2號在2015年國際超級計算機大會上蟬聯(lián)5連冠,但因使用美國Intel公司的CPU而飽受一些別有用心之人的詬病,不少人聲稱沒有美國的CPU,天河2號要完蛋了。
現(xiàn)實卻截然相反:
在ISC 2015發(fā)布會上,國防科大公布天河2A的升級方案,將采用國防科大自主研發(fā)的矩陣2000(GPDSP)替代至強PHI計算卡。矩陣2000采用40nm制程,擁有16核,主頻1G,雙精浮點2.4TFlops,功耗為200W。
新年伊始,從科技部公開的文章中透露出好消息——由上海高性能集成電路設(shè)計中心設(shè)計的國產(chǎn)眾核芯片已達到世界先進水平(美國情報部門對該芯片非常感興趣,因此筆者將其稱為國產(chǎn)眾核芯片)。該眾核芯片采用28nm制程,峰值雙精度浮點運算速度超過每秒3萬億次(3TFlops),完全追平了Intel第二代Xeon Phi(也是Intel最好的眾核芯片)——第二代至強PHI計算卡產(chǎn)品代號“Knights Landing”,采用了14nm工藝,雙精度浮點性能超過3TFlops,功耗250-300W。
1月22日,新華社報道了一則更為振奮人心的消息——中國計劃今年在天津啟動新一代百億億次(百億億次是1000P,天河2號為55P,若不是記者筆誤,就真心是黑科技了)超級計算機的研制規(guī)劃......與此同時,國防科大正在設(shè)計新一代飛騰芯片。
由此可見,美國商務(wù)部的禁售計算卡的行為根本沒有對中國超算發(fā)展起到多大制約作用。其實,在過去半個世紀的時間里,歷史已經(jīng)證明了毛澤東的那句話——“封鎖吧,封鎖十年八年,中國的問題就解決了”。凡是能買到的都很難做出來
在毛澤東時代,中國擁有自己的半導(dǎo)體工業(yè),掌握了從單晶制備、設(shè)備制造、集成電路制造的全過程技術(shù),中國制造的計算機也都有中國芯。
凡是買不到的都做出來了
中蘇論戰(zhàn)后,美蘇同時對中國進行技術(shù)封鎖,迫使中國走上獨立自主。
在美國和蘇聯(lián)共同技術(shù)封鎖下,哈軍工于1962年成功研發(fā)出晶體管,使中國比美國晚8年進入晶體管時代,中國第一臺全晶體管計算機441B-I于1964年誕生,相對于美國于第一臺全晶體管計算機RCA501晚了6年。1965年,中國研制出第一塊集成電路,比美國晚了5年進入集成電路時代。1972年,中國研制出大規(guī)模集成電路比美國晚4年實現(xiàn)了從中小集成電路發(fā)展到大規(guī)模集成電路的跨越。
1992年銀河2誕生。1993年,曙光1號誕生,曙光1號研制成功后3天,西方解除對中國高性能計算機出口限制。在堅定了自主發(fā)展超算的決心后,中國超算捷報頻傳——先后自主研發(fā)曙光1000、曙光2000、曙光3000、曙光4000、曙光5000、曙光6000、銀河3、銀河4、天河1號、天河2號、神威藍光等超算,并逐步形成了天河(國防科大)、神威、曙光(曙光公司)三大系列超算。
神威藍光
與此同時,國產(chǎn)超算的軟件系統(tǒng)和硬件系統(tǒng)的國產(chǎn)化也在穩(wěn)步推進——天河2號的硬件系統(tǒng)除了高速運算系統(tǒng)中采用了Intel的E5和至強PHI之外,高速互連通信網(wǎng)絡(luò)系統(tǒng)、存儲系統(tǒng)(I/O 管理結(jié)點和 I/O 存儲結(jié)點)、維護監(jiān)控系統(tǒng)、電源系統(tǒng)、冷卻系統(tǒng)和結(jié)構(gòu)組裝設(shè)計等基本實現(xiàn)國產(chǎn)化,在軟件系統(tǒng)方面,操作系統(tǒng)、編譯系統(tǒng)、并行程序開發(fā)環(huán)境、科學(xué)計算可視化系統(tǒng)大多實現(xiàn)國產(chǎn)化。而神威藍光超算則實現(xiàn)了除冷卻系統(tǒng)之外的軟件和硬件的全國產(chǎn)。
更為重要的是,這些超算并非像某些人說的為爭奪世界第一的虛名建設(shè),而是實實在在的用于彈道計算、核物理研究、氣候氣象、海洋環(huán)境、數(shù)值風(fēng)洞、碰撞仿真、生命科學(xué)、石油物探等科研領(lǐng)域。另外,國產(chǎn)超算/高性能計算機還廣泛用于工業(yè)生產(chǎn)、氣象預(yù)報和影視娛樂。
曙光公司的高性能計算機在中石油、中石化和中海油勘探計算機房內(nèi)隨處可見,這些高性能計算機為工程師提供高精度的采油區(qū)地下構(gòu)造和地質(zhì)信息。
“天河-酷卡”云計算渲染平臺使動畫渲染的制作周期由原來的4至6個月縮短到1天,平均每天同時為8部動漫影視作品提供渲染。《阿凡達》動漫渲染制作耗時1年多完成,如果用“天河二號”,則僅需1個月時間。
隨著霧霾現(xiàn)象越來越受人民關(guān)注,霧霾天氣預(yù)警預(yù)報已經(jīng)成為“天河一號”的又一項任務(wù)。國家超算天津中心已經(jīng)研發(fā)出霧霾自動化實時預(yù)警預(yù)報系統(tǒng),正以河北保定作為試點,對未來5天霧霾天實時預(yù)報,未來3年內(nèi)逐步建成全國性的霧霾預(yù)警預(yù)報系統(tǒng)。此外,天河超算還能回溯地球的氣候變遷,“天河一號”可以模擬2000年前的變化,“天河二號”則可以模擬到5000年前甚至更遠。
中科曙光與大氣物理所等單位共同研發(fā)“地球數(shù)值模擬裝置”原型機系統(tǒng),則填補了我國地球系統(tǒng)模式大數(shù)據(jù)實踐平臺的空白。
可以說,超級計算機為中國的國防、科研、工業(yè)、經(jīng)濟等諸多方面做出了巨大貢獻!
以史為鑒,技術(shù)封鎖其實是件好事,在信息技術(shù)領(lǐng)域,建國以來的這段歷史就可說明“凡是能買到的都很難做出來了,凡是買不到的都做出來了”。因為只要西方技術(shù)封鎖,國內(nèi)買辦和國外勢力就不可能用“市場換技術(shù)”、“造不如買、買不如租”的方式來扼殺自主技術(shù)。
那么,中國的人力物力財力將全部投入到自主技術(shù)的研發(fā)中,輔以中國全世界最齊全的工業(yè)部門和扎實的工業(yè)基礎(chǔ),加上中國龐大的市場和豐富的資源,就能做到“封鎖什么,解決什么”,所以從長期來看,技術(shù)封鎖是好事。
中美眾核芯片對比
在幾年前,當(dāng)Intel第一代至強PHI上市之時,國內(nèi)根本就沒有類似的產(chǎn)品,而龍芯、申威、飛騰準備用于超算的多核芯片也遠遠無法與Intel匹敵:
飛騰1500,16核,制程40nm,1.8G主頻,最大功耗65W,雙精浮點144G;
申威1600,16核,制程65nm,1.1G主頻,最大功耗70W,雙精浮點140G;
申威1610,16核,制程40nm,1.6G主頻,最大功耗50W,雙精浮點200G;
龍芯3B1000,8核,制程65nm ,1G主頻,最大功耗65W,雙精浮點128G;
龍芯3B1500,8核,制程32nm ,1.2G主頻,最大功耗40W,雙精浮點192G。
即便是成績最好的申威1610的理論雙精浮點峰值也只有200G,而Intel第一代至強PHI的理論雙精浮點峰值高達1T,是申威1610的5倍。正是因此,天河2號只能無奈的選擇Intel至強PHI作為其加速器。
光陰似箭,時過境遷,經(jīng)過數(shù)年的臥薪嘗膽,國內(nèi)IC設(shè)計單位的實力與日俱增,不僅能拿出至強PHI計算卡的替代產(chǎn)品,而且在性能上絲毫不落下風(fēng)。國防科大自主研發(fā)的矩陣2000理論雙精浮點峰值達2.4T,功耗為200W,理論雙精浮點峰值達到第二代至強PHI的80%,性能功耗比略優(yōu)于第二代至強PHI。
如果說矩陣2000是GSDSP,而非眾核加速器,在性能上也稍遜第二代至強PHI一籌,那么上海高性能集成電路設(shè)計中心設(shè)計的國產(chǎn)眾核芯片是對美國禁售至強PHI計算卡最有力的回擊,特別是在設(shè)計理念上,國產(chǎn)眾核加速器非常先進。
因采用異構(gòu)計算可以獲得更好的性能功耗比和峰值性能,目前中美正在建設(shè)的100P超算基本采用異構(gòu)計算,也就是一個計算節(jié)點由CPU+加速器組成,比如天河2A號一個計算節(jié)點由2個E5(將來可能會替換成國防科大自主研發(fā)的64核服務(wù)器芯片“火星”)和三個矩陣2000組成。加速器可以是K80這樣的GPGPU,也可以是矩陣2000這樣的GPDSP,還可以是Intel至強PHI、國產(chǎn)眾核芯片這樣的眾核加速器。
雖然異構(gòu)計算雖然有很多優(yōu)點,但也會帶來很多缺點,比如通用性不夠好,效率不夠高,編程比較麻煩,另外,天河2號和美國超算Stampede中的Intel至強PHI計算卡和E5是不共享內(nèi)存的,因而需要程序員顯式拷貝,進而造成性能損失。而國產(chǎn)眾核芯片通過設(shè)計理念的革新,很大程度減輕了上述方面的負面影響,在某些方面甚至徹底避免了性能損失。
因此,筆者認為,國產(chǎn)眾核芯雖然因采用28nm制程,使其在制程上遜色于第二代至強PHI的14nm。但憑借設(shè)計理念的先進性,相對于Intel第二代至強PHI會有一定優(yōu)勢。而雙精浮點運算峰值高達3T的性能指標,使其成為完全不遜色于Intel第二代至強PHI的存在。
在中國芯片制造水平不斷提升,并有望不斷縮短和美國芯片制造水平的情況下,如果Intel不能在超算芯片的設(shè)計理念上有革命性的改進,那么被國產(chǎn)眾核芯片的下一代產(chǎn)品超越只是時間問題。 中國光刻機突破世界上能制造光刻機的國家屈指可數(shù)
(美國的高端光刻機在哪呢?!所以,本質(zhì)上,美國的芯片制造業(yè)核心裝備是買來的。說白了,所謂的INTEL,用的核心設(shè)備是國外的,其無非就是一個搞組裝的加工作坊而已)
光刻機所涉及的產(chǎn)業(yè)鏈非常長、非常高端。目前世界上最大的光刻機生產(chǎn)商ASML是荷蘭公司,光刻機中的光學(xué)鏡組來自德國、干涉測量系統(tǒng)來自美國,其產(chǎn)品可以說是整個西方世界科技成果的總和。在這方面,中國要想取得獨立自主的發(fā)展,實際上是在以一己之力追趕所有發(fā)達國家數(shù)百年的積累,每一個單項的突破都意味著中國又追上了一步,這個過程將會是漫長而艱辛的。不過依托完整的產(chǎn)業(yè)鏈、龐大的工業(yè)產(chǎn)能和雄厚的人才基礎(chǔ),中國的IC產(chǎn)業(yè)最終實現(xiàn)全面超越是完全可以期待的。
2014年7月中芯國際與高通公司達成了28納米芯片代工協(xié)議,為中芯進入主流市場工藝技術(shù)打下了堅實基礎(chǔ)。2014年12月18日,中芯國際宣布成功制造28nm Qualcomm驍龍410處理器,藉此成為中國內(nèi)地第一家在最先進工藝節(jié)點上生產(chǎn)高性能、低功耗手機處理器的晶圓代工廠。
(對高通而言,與中芯合作除了可確保未來產(chǎn)能外,還可以改善與中國的政商關(guān)系,畢竟高通因壟斷被中國政府罰款60億元。隨著中國科技的進步,中國政府已經(jīng)將芯片產(chǎn)業(yè)列入國家重點支持的戰(zhàn)略產(chǎn)業(yè),好戲還在后頭)
上海2014年11月28日電 - 中微半導(dǎo)體設(shè)備有限公司(簡稱“中微”)宣布在本月初舉辦的第十六屆中國國際工業(yè)博覽會上榮獲金獎。這一獎項彰顯了中微十年來在先進技術(shù)自主創(chuàng)新方面取得的可喜成績。中微此次獲獎產(chǎn)品是其處于行業(yè)領(lǐng)先地位的去耦合等離子體介質(zhì)刻蝕機Primo AD-RIE®,該設(shè)備能夠滿足28到15納米及更先進工藝芯片制造的嚴苛要求。
能夠滿足28到15納米及更先進工藝芯片制造的嚴苛要求,嘿嘿。。。