所有IP自主研發(fā) 性能成倍增長!龍芯3A/B4000發(fā)布:下代追平AMD
12月24日,國產CPU廠商龍芯在北京正式發(fā)布自主研發(fā)的新一代通用處理器—;—;龍芯3A4000、龍芯3B4000,其中桌面版的龍芯3A在性能上提升一倍以上,多路服務器版可提升3倍性能。
與此同時,龍芯還宣布2019年其處理器累計出貨已達50萬顆。此外還透露,12nm工藝的下代CPU性能可達同期AMD水平。
在當天的發(fā)布會上,聯(lián)想、中科曙光、方正、中國運載火箭技術研究院等也發(fā)布了基于龍芯新一代通用處理器的桌面計算機、筆記本、服務器、網絡安全設備、工業(yè)控制計算機等產品。
龍芯2019年出貨已達50萬顆
目前龍芯主要有三大系列產品:
龍芯1號:面向特定應用需求的定制的“小CPU”系列,為32位低功耗、低成本處理器,主要針對低端嵌入式和專用應用領域;
龍芯2號:面向工控和終端應用的“中CPU”系列,主要為64位低功耗單核或雙核列處理器;
龍芯3號:面向桌面/服務器類應用的“大CPU”系列,主要為為64位多核系列處理器。
據龍芯中科副總裁張戈介紹,目前龍芯在政企、安全、金融、能源等應用場景均有廣泛應用,2019年龍芯芯片出貨量已達到50萬顆以上,在國產化應用市場份額領先。
雖然50萬片的出貨量看上去并不大,但是對于一款完全自主可控的國產CPU來說,已經是非常不錯的成績了,也已經是目前國產CPU廠商當中出貨最大的了。
值得注意的是,在今年10月的第十四屆“中國芯”集成電路產業(yè)促進大會在青島隆重舉辦。龍芯提報的龍芯3A/B3000處理器,憑借其優(yōu)秀的市場表現(xiàn),榮獲第十四屆“中國芯”“優(yōu)秀市場表現(xiàn)產品”稱號。
據介紹,龍芯3A/B3000系列累計出貨量已達30萬片以上,已應用于政企辦公、網安、能源、交通、教育等多個領域,并得到了用戶的廣泛認可,具備相當?shù)氖袌龈偁幜Α?/strong>
龍芯3A/B4000系列發(fā)布,單核性能與ADM“挖掘機”相當
相比上一代的龍芯3A/B3000系列來說,此次時隔近兩年才發(fā)布的龍芯3A/B4000系列,雖然采用的還是28nm FDSOI工藝,但是在性能上有了成倍的提升。
據介紹,龍芯3A4000/3B4000采用了龍芯最新研制的新一代高性能處理器內核GS464V(上一代是GS464E),支持片內互聯(lián)網總線、HT3.0系統(tǒng)總線、DDR4內存總線,同時還支持UART、SPI等接口。主頻提升至1.5GHz-2.0GHz。
其中龍芯3A4000是針對桌面級的,核心數(shù)量可達4-8核,擁有雙DDR4-2400/2133內存通道,雙HT3.0系統(tǒng)總線,效率提升一倍。而龍芯3B4000則是面向高性能計算的,核心數(shù)量可達16-32核。
在性能方面,龍芯3A4000系列的SPEC CPU2006定點和浮點單核分值均超過20分,達到了上一代產品的兩倍。
反映傳統(tǒng)桌面性能的SPEC INT2000的單核base測試分數(shù)也從上一代的930分提高到了2090分,達到了與AMD 28nm最后產品“挖掘機”相當,高于14nm ARM處理器的水平。
龍芯3B4000支持4路直連,四路服務器性能是上一代的3B3000雙路服務器性能的4倍。此外,虛擬機效率也從上一代產品的88%提高到98%。
中科院計算技術研究所總工程師、龍芯中科總裁、首席科學家胡偉武博士表示,龍芯3A/B4000系列已經基本完成了設計能力方面的補課,我們通過設計優(yōu)化實現(xiàn)了單核通用處理性能的提升。
在封裝和功耗方面,龍芯表示,龍芯3A4000的封裝尺寸比3A3000更小,尺寸為37.5mm*37.5mm,支持普通BGA、LGA和CBGA多種封裝形式,同時其桌面主板可支持四層板,典型功耗為30-40W。
值得一提的是,龍芯4000系列內部的GS132E核心主要負責監(jiān)控主核運行,并進行動態(tài)功耗管理。
在具體體驗方面,基于龍芯3A4000的筆記本工作時間比基于3A3000的筆記本提高了一倍以上。
不過,胡偉武也指出,龍芯3A4000的30-40W的典型功耗還是比較大,這主要是由于所采用的是工藝不夠先進。所以,建議在科學計算環(huán)境下使用256位浮點向量時,適當降低電壓和頻率。
所有模塊源代碼均為自主研發(fā)
需要指出的是,作為脫胎于中科院計算所的國產CPU廠商,龍芯CPU目前主要應用領域也是在黨政辦公、航天、金融、能源等領域,因此對于CPU的自主可控及安全方面也有著更高的要求。
胡偉武強調,龍芯芯片所有源代碼均為自主設計,所有模塊源代碼和各類全定制模塊均為自主研發(fā),除了廠家提供的標準單元庫和Memory Compiler(內存編譯器)外,沒有任何第三方IP。
在CPU的安全方面,龍芯4000系列擁有強大的片內安全機制。通過專門指令實現(xiàn)了對MD5、AES、SHA等加解密算法的支持;同時集成了專用的安全可信模塊,支持國密算法;支持“影子棧”等訪問控制機制,對于操作系統(tǒng)函數(shù)調用、進程切換、IO訪問可以有效監(jiān)督??梢杂行У姆婪洞饲皒86和Arm處理器爆出的Meltdown和Spectre漏洞。
操作系統(tǒng)及軟件生態(tài)建設
得益于PC市場數(shù)十年的積累,X86架構的CPU的系統(tǒng)及軟件生態(tài)是最為豐富的。而Arm架構的CPU也受益于Arm在移動市場的霸主地位,系統(tǒng)及軟件生態(tài)也是非常豐富。相比之下,對于既非X86也非Arm架構的龍芯來說,在系統(tǒng)及軟件生態(tài)上則需要花費更多的精力去建設。
目前龍芯針對不同的應用場景,已經推出了適配不同操作系統(tǒng)的解決方案。比如,Loongnix是面向通用信息化系統(tǒng)的,基于通用Linux平臺進行完善和優(yōu)化,為統(tǒng)一操作系統(tǒng)UOS龍芯版提供支撐。
LoongOS是面向高可靠實時終端的,基于Linux/RT-Linux構建了簡潔高效的OS。
LoongWorks是面向實時嵌入式應用的,針對歷史應用,基于VxWorks內核,完善圖形和網絡等API。
值得注意的是,就在本月初,國產統(tǒng)一操作系統(tǒng)UOS(unity operating system)龍芯版正式發(fā)布,已適用龍芯3A3000系列、龍芯3B3000系列、3A4000系列、龍芯3B4000系列。
據介紹,在近半年的時間里,UOS開發(fā)團隊與龍芯中科的系統(tǒng)軟件研發(fā)團隊針對Linux內核、BIOS固件、編譯器、瀏覽器、圖形驅動等多項基礎軟件共同解決了幾十項問題,確保UOS在龍芯平臺上功能完善、體驗流暢、質量穩(wěn)定。
另外,為了提升兼容性,胡偉武表示,龍芯將進一步統(tǒng)一系統(tǒng)架構,構建標準規(guī)范體系,實現(xiàn)操作系統(tǒng)跨主板整機兼容和CPU代際兼容。
從龍芯3A4000開始,龍芯也將參考設計全面支持統(tǒng)一系統(tǒng)架構,開發(fā)支持ACPI主板、固件、內核及OS的參考設計,以及基于ACPI/EC筆記本標準的解決方案。
下一代產品將實現(xiàn)“突破”
胡偉武表示,龍芯第一代產品算是“基本可用”,屬于“小學畢業(yè)”水平;第二代產品則提升到了“可用”的階段,屬于“中學畢業(yè)”水平;第三代產品已經“好用”了,屬于“大學畢業(yè)”水準了;下一代產品將要與國際芯片巨頭同臺競技。
“要想實現(xiàn)與國際芯片巨頭同臺競技,首先需要通過幾級階梯登上‘臺’去,龍芯現(xiàn)在就是在走最后一級階梯。”胡偉武說到。
據胡偉武透露,龍芯的下一代產品,龍芯3A5000將采用12nm工藝,主頻將提高到2.5GHz,同時,其內存控制器延遲/寬帶進一步優(yōu)化,LLC增加一倍,實現(xiàn)操作系統(tǒng)級二進制兼容。單核性能屆時將提高至30分左右,通用性能達到同期AMD的水平,計劃于2020年上半年流片。
龍芯3C5000將同樣采用12nm工藝,核心數(shù)會進一步增加,支持4至16路服務器,計劃將于2020年下半年流片。