所有IP自主研發(fā) 性能成倍增長!龍芯3A/B4000發(fā)布:下代追平AMD
12月24日,國產(chǎn)CPU廠商龍芯在北京正式發(fā)布自主研發(fā)的新一代通用處理器—;—;龍芯3A4000、龍芯3B4000,其中桌面版的龍芯3A在性能上提升一倍以上,多路服務(wù)器版可提升3倍性能。
與此同時,龍芯還宣布2019年其處理器累計出貨已達(dá)50萬顆。此外還透露,12nm工藝的下代CPU性能可達(dá)同期AMD水平。
在當(dāng)天的發(fā)布會上,聯(lián)想、中科曙光、方正、中國運載火箭技術(shù)研究院等也發(fā)布了基于龍芯新一代通用處理器的桌面計算機(jī)、筆記本、服務(wù)器、網(wǎng)絡(luò)安全設(shè)備、工業(yè)控制計算機(jī)等產(chǎn)品。
龍芯2019年出貨已達(dá)50萬顆
目前龍芯主要有三大系列產(chǎn)品:
龍芯1號:面向特定應(yīng)用需求的定制的“小CPU”系列,為32位低功耗、低成本處理器,主要針對低端嵌入式和專用應(yīng)用領(lǐng)域;
龍芯2號:面向工控和終端應(yīng)用的“中CPU”系列,主要為64位低功耗單核或雙核列處理器;
龍芯3號:面向桌面/服務(wù)器類應(yīng)用的“大CPU”系列,主要為為64位多核系列處理器。
據(jù)龍芯中科副總裁張戈介紹,目前龍芯在政企、安全、金融、能源等應(yīng)用場景均有廣泛應(yīng)用,2019年龍芯芯片出貨量已達(dá)到50萬顆以上,在國產(chǎn)化應(yīng)用市場份額領(lǐng)先。
雖然50萬片的出貨量看上去并不大,但是對于一款完全自主可控的國產(chǎn)CPU來說,已經(jīng)是非常不錯的成績了,也已經(jīng)是目前國產(chǎn)CPU廠商當(dāng)中出貨最大的了。
值得注意的是,在今年10月的第十四屆“中國芯”集成電路產(chǎn)業(yè)促進(jìn)大會在青島隆重舉辦。龍芯提報的龍芯3A/B3000處理器,憑借其優(yōu)秀的市場表現(xiàn),榮獲第十四屆“中國芯”“優(yōu)秀市場表現(xiàn)產(chǎn)品”稱號。
據(jù)介紹,龍芯3A/B3000系列累計出貨量已達(dá)30萬片以上,已應(yīng)用于政企辦公、網(wǎng)安、能源、交通、教育等多個領(lǐng)域,并得到了用戶的廣泛認(rèn)可,具備相當(dāng)?shù)氖袌龈偁幜Α?/strong>
龍芯3A/B4000系列發(fā)布,單核性能與ADM“挖掘機(jī)”相當(dāng)
相比上一代的龍芯3A/B3000系列來說,此次時隔近兩年才發(fā)布的龍芯3A/B4000系列,雖然采用的還是28nm FDSOI工藝,但是在性能上有了成倍的提升。
據(jù)介紹,龍芯3A4000/3B4000采用了龍芯最新研制的新一代高性能處理器內(nèi)核GS464V(上一代是GS464E),支持片內(nèi)互聯(lián)網(wǎng)總線、HT3.0系統(tǒng)總線、DDR4內(nèi)存總線,同時還支持UART、SPI等接口。主頻提升至1.5GHz-2.0GHz。
其中龍芯3A4000是針對桌面級的,核心數(shù)量可達(dá)4-8核,擁有雙DDR4-2400/2133內(nèi)存通道,雙HT3.0系統(tǒng)總線,效率提升一倍。而龍芯3B4000則是面向高性能計算的,核心數(shù)量可達(dá)16-32核。
在性能方面,龍芯3A4000系列的SPEC CPU2006定點和浮點單核分值均超過20分,達(dá)到了上一代產(chǎn)品的兩倍。
反映傳統(tǒng)桌面性能的SPEC INT2000的單核base測試分?jǐn)?shù)也從上一代的930分提高到了2090分,達(dá)到了與AMD 28nm最后產(chǎn)品“挖掘機(jī)”相當(dāng),高于14nm ARM處理器的水平。
龍芯3B4000支持4路直連,四路服務(wù)器性能是上一代的3B3000雙路服務(wù)器性能的4倍。此外,虛擬機(jī)效率也從上一代產(chǎn)品的88%提高到98%。
中科院計算技術(shù)研究所總工程師、龍芯中科總裁、首席科學(xué)家胡偉武博士表示,龍芯3A/B4000系列已經(jīng)基本完成了設(shè)計能力方面的補(bǔ)課,我們通過設(shè)計優(yōu)化實現(xiàn)了單核通用處理性能的提升。
在封裝和功耗方面,龍芯表示,龍芯3A4000的封裝尺寸比3A3000更小,尺寸為37.5mm*37.5mm,支持普通BGA、LGA和CBGA多種封裝形式,同時其桌面主板可支持四層板,典型功耗為30-40W。
值得一提的是,龍芯4000系列內(nèi)部的GS132E核心主要負(fù)責(zé)監(jiān)控主核運行,并進(jìn)行動態(tài)功耗管理。
在具體體驗方面,基于龍芯3A4000的筆記本工作時間比基于3A3000的筆記本提高了一倍以上。
不過,胡偉武也指出,龍芯3A4000的30-40W的典型功耗還是比較大,這主要是由于所采用的是工藝不夠先進(jìn)。所以,建議在科學(xué)計算環(huán)境下使用256位浮點向量時,適當(dāng)降低電壓和頻率。
所有模塊源代碼均為自主研發(fā)
需要指出的是,作為脫胎于中科院計算所的國產(chǎn)CPU廠商,龍芯CPU目前主要應(yīng)用領(lǐng)域也是在黨政辦公、航天、金融、能源等領(lǐng)域,因此對于CPU的自主可控及安全方面也有著更高的要求。
胡偉武強(qiáng)調(diào),龍芯芯片所有源代碼均為自主設(shè)計,所有模塊源代碼和各類全定制模塊均為自主研發(fā),除了廠家提供的標(biāo)準(zhǔn)單元庫和Memory Compiler(內(nèi)存編譯器)外,沒有任何第三方IP。
在CPU的安全方面,龍芯4000系列擁有強(qiáng)大的片內(nèi)安全機(jī)制。通過專門指令實現(xiàn)了對MD5、AES、SHA等加解密算法的支持;同時集成了專用的安全可信模塊,支持國密算法;支持“影子?!钡仍L問控制機(jī)制,對于操作系統(tǒng)函數(shù)調(diào)用、進(jìn)程切換、IO訪問可以有效監(jiān)督??梢杂行У姆婪洞饲皒86和Arm處理器爆出的Meltdown和Spectre漏洞。
操作系統(tǒng)及軟件生態(tài)建設(shè)
得益于PC市場數(shù)十年的積累,X86架構(gòu)的CPU的系統(tǒng)及軟件生態(tài)是最為豐富的。而Arm架構(gòu)的CPU也受益于Arm在移動市場的霸主地位,系統(tǒng)及軟件生態(tài)也是非常豐富。相比之下,對于既非X86也非Arm架構(gòu)的龍芯來說,在系統(tǒng)及軟件生態(tài)上則需要花費更多的精力去建設(shè)。
目前龍芯針對不同的應(yīng)用場景,已經(jīng)推出了適配不同操作系統(tǒng)的解決方案。比如,Loongnix是面向通用信息化系統(tǒng)的,基于通用Linux平臺進(jìn)行完善和優(yōu)化,為統(tǒng)一操作系統(tǒng)UOS龍芯版提供支撐。
LoongOS是面向高可靠實時終端的,基于Linux/RT-Linux構(gòu)建了簡潔高效的OS。
LoongWorks是面向?qū)崟r嵌入式應(yīng)用的,針對歷史應(yīng)用,基于VxWorks內(nèi)核,完善圖形和網(wǎng)絡(luò)等API。
值得注意的是,就在本月初,國產(chǎn)統(tǒng)一操作系統(tǒng)UOS(unity operating system)龍芯版正式發(fā)布,已適用龍芯3A3000系列、龍芯3B3000系列、3A4000系列、龍芯3B4000系列。
據(jù)介紹,在近半年的時間里,UOS開發(fā)團(tuán)隊與龍芯中科的系統(tǒng)軟件研發(fā)團(tuán)隊針對Linux內(nèi)核、BIOS固件、編譯器、瀏覽器、圖形驅(qū)動等多項基礎(chǔ)軟件共同解決了幾十項問題,確保UOS在龍芯平臺上功能完善、體驗流暢、質(zhì)量穩(wěn)定。
另外,為了提升兼容性,胡偉武表示,龍芯將進(jìn)一步統(tǒng)一系統(tǒng)架構(gòu),構(gòu)建標(biāo)準(zhǔn)規(guī)范體系,實現(xiàn)操作系統(tǒng)跨主板整機(jī)兼容和CPU代際兼容。
從龍芯3A4000開始,龍芯也將參考設(shè)計全面支持統(tǒng)一系統(tǒng)架構(gòu),開發(fā)支持ACPI主板、固件、內(nèi)核及OS的參考設(shè)計,以及基于ACPI/EC筆記本標(biāo)準(zhǔn)的解決方案。
下一代產(chǎn)品將實現(xiàn)“突破”
胡偉武表示,龍芯第一代產(chǎn)品算是“基本可用”,屬于“小學(xué)畢業(yè)”水平;第二代產(chǎn)品則提升到了“可用”的階段,屬于“中學(xué)畢業(yè)”水平;第三代產(chǎn)品已經(jīng)“好用”了,屬于“大學(xué)畢業(yè)”水準(zhǔn)了;下一代產(chǎn)品將要與國際芯片巨頭同臺競技。
“要想實現(xiàn)與國際芯片巨頭同臺競技,首先需要通過幾級階梯登上‘臺’去,龍芯現(xiàn)在就是在走最后一級階梯?!焙鷤ノ湔f到。
據(jù)胡偉武透露,龍芯的下一代產(chǎn)品,龍芯3A5000將采用12nm工藝,主頻將提高到2.5GHz,同時,其內(nèi)存控制器延遲/寬帶進(jìn)一步優(yōu)化,LLC增加一倍,實現(xiàn)操作系統(tǒng)級二進(jìn)制兼容。單核性能屆時將提高至30分左右,通用性能達(dá)到同期AMD的水平,計劃于2020年上半年流片。
龍芯3C5000將同樣采用12nm工藝,核心數(shù)會進(jìn)一步增加,支持4至16路服務(wù)器,計劃將于2020年下半年流片。