明芯會客室|專訪王惟林:投身國產(chǎn)芯片18年,每一天都在和時間賽跑
當國產(chǎn)芯片再次飛上風口,王惟林早已投身其中超過18年。
從中科院畢業(yè)后他, 一直在計算機芯片設(shè)計中拼搏,并先后組建了國產(chǎn)x86 CPU和芯片組研發(fā)團隊,如今作為兆芯的總工程師,指導著500人規(guī)模的研發(fā)團隊,先后負責了多顆CPU和x86-SOC芯片的自主設(shè)計研發(fā)和量產(chǎn)。
王惟林用“很難,真的很難”來形容從無到有的研發(fā)之路。他不僅要跟時間賽跑,用盡可能少的時間去追趕國際巨頭多年的積累, 用少得多的資源去實現(xiàn)技術(shù)上的突破,更需要和難以控制的外部因素較勁,比如彌漫整個行業(yè)的人才荒、成熟工程師的中途“跑路”,以及對國產(chǎn)芯片的質(zhì)疑等等。
“一點點前進,一點點改變現(xiàn)狀”,王惟林深知,差距無法一日彌合,但在中國芯片人的努力下,整個行業(yè)已經(jīng)以可感知的速度向前進步了。
王惟林,國家科技重大專項課題研發(fā)負責人,國產(chǎn)x86 CPU技術(shù)團隊負責人,上海兆芯集成電路有限公司總工程師
1
18年奮斗,從0到IC生態(tài)鏈完備
王惟林2019年的目標很明確,“完成下一代7nm驗證芯片的開發(fā),包括新工藝下的高速高功耗設(shè)計流程和最新規(guī)格的接口IP。”
盡管又是一場硬仗,但打過硬仗的王惟林有信心。
劍指國產(chǎn)處理器芯片的研發(fā)和量產(chǎn),兆芯雖然成立于2013年,但它的研發(fā)團隊卻要遠早于此,王惟林是重要的組建者。“兆芯這支研發(fā)團隊其實2001年就成立了,最早是在威盛電子做芯片組。在威盛時期,這支設(shè)計團隊就是芯片組核心的研發(fā)團隊,完成了很多美國和臺灣同事認為不可能做到的項目, 曾經(jīng)2次在半年內(nèi)完成了新型芯片組和手機芯片的研發(fā)流片任務。可以說,在進入處理器設(shè)計之前,我們已經(jīng)是國內(nèi)最好的設(shè)計團隊之一,有培養(yǎng)好的人才、有良好的設(shè)計流程、豐富的設(shè)計經(jīng)驗,”王惟林說,“到2010年,很多員工從芯片組研發(fā)的工作中分離出來,組建成了CPU研發(fā)團隊。到后來兆芯成立,這支全部由本土員工組成的國內(nèi)研發(fā)團隊也隨之被納入到兆芯的體系之下。”
所謂芯片組,是一組共同工作的集成電路“芯片”,它負責將計算機的核心——微處理器和機器的其他部分相連接,是發(fā)揮處理器性能,保證整機性能和系統(tǒng)可靠穩(wěn)定的重要部件。而CPU則是一臺計算機的運算核心和控制核心,每一臺電腦、每一部手機都由它控制,每年,我國從國外進口的CPU金額有550億到600億美元之多。
如今,CPU和芯片組,是兆芯的研發(fā)重點,有一只500人規(guī)模的軟硬件工程師團隊。王惟林仍然記得這支團隊在研發(fā)第一顆處理器芯片時的酸甜苦辣。
從0開始,消化吸收再創(chuàng)新。當年,兆芯引進了第一顆x86高性能處理器芯片,王惟林的團隊吸收了它的微架構(gòu),同時復現(xiàn)了完整的流程,“初步了解了高性能處理器完整的設(shè)計流程。”
在完成了第一顆高性能處理器芯片的消化之后,研發(fā)團隊開始對微架構(gòu)和設(shè)計方法進行重新設(shè)計,他們對內(nèi)核做了優(yōu)化,把頻率往上拉,把功耗往下降,同時把共享總線改成共享緩存來提高效率。這樣相較于第一代芯片的40nm兩核1.6GHz 60平方毫米,20瓦功耗,第二代處理器芯片在頻率和IPC(每時鐘周期指令數(shù))提高的同時,還把內(nèi)核增加了一倍,面積壓縮20平方毫米,功耗壓縮到十幾瓦。
最為重要的是,經(jīng)此一役,兆芯的處理器研發(fā)團隊徹底掌握了高性能處理芯片研發(fā)的精髓。
但教訓也有很多。“做完之后發(fā)現(xiàn)有些性能功耗和我們的預期的不太一樣。有些設(shè)計當時考慮的比較簡單,需要再次優(yōu)化。處理器需要在在選定工藝下,把握微架構(gòu),主頻,功耗的平衡,我們努力補上性能評估、功耗評估等設(shè)計流程缺失的環(huán)節(jié),現(xiàn)在終于把功耗和性能的誤差控制在了1%之內(nèi)。”
基于此前芯片的設(shè)計經(jīng)驗和教訓,重新設(shè)計的芯片——開先KX-5000系列處理器在2016年8月成功流片了。“開先KX-5000系列處理器在內(nèi)核流水線、分支預測、內(nèi)存帶寬、調(diào)度算法優(yōu)化和多核節(jié)點互連優(yōu)化的同時,IO、Memory性能改進了很多。整機性能達到了英特爾I3的標準,除了辦公, 很多桌面娛樂,游戲支持的也不錯”。
兆芯國產(chǎn)通用處理器性能顯著提升,應用體驗不斷改善
從最初到現(xiàn)在,兆芯CPU單核性能提高了2.5倍,整機性能提高了8倍多;芯片組則一直跟國際最新芯片保持同樣的性能和設(shè)計規(guī)格。在芯片生態(tài)方面,兆芯與工藝、操作系統(tǒng)、中間件、應用軟件、整機開發(fā)制造等環(huán)節(jié)的合作伙伴形成了一個完備的生態(tài)鏈。
2
銜枚疾進,呼吁破局IC產(chǎn)業(yè)「人才荒」
表面上,一切順利,但研發(fā)中的波折和困難,王惟林記憶猶新。
人力上一直處于緊繃的狀態(tài),一兩個人的去留甚至會影響到一個設(shè)計特性的開發(fā)進度。“工程師稍微有些變化,就有可能放棄或者降低一些設(shè)計規(guī)格,”王惟林說,“第六代產(chǎn)品開先KX-6000的一些優(yōu)化本在開先KX-5000的時候就準備做進去,但因為當時負責的工程師離職,只好收縮戰(zhàn)線。”
有處理器領(lǐng)域的權(quán)威人士曾說95年以后的論文不用看,因為架構(gòu)講得都差不多了。在傳統(tǒng)的高性能處理器領(lǐng)域,這個說法確實比較貼近事實。但是國內(nèi),甚至很多國外的設(shè)計公司在面向高性能處理器芯片的研發(fā)中,設(shè)計技術(shù)和方法依然十分生澀。“這就好比,我們知道過河要搭橋,但不知道如何搭個好的橋, 甚至我們猜到了很多方法, 但由于時間和成本很難去試一試,”王惟林說“方法和流程,如同材料學和飛機發(fā)動機一樣,需要大量的試錯和基礎(chǔ)預研。”
我們要確保每一顆芯片成功。Intel、AMD研制一款芯片,大概需要5年以上的時間,甚至很多技術(shù)很早就開始預研了,而且各方面成本投入非常大,積累深厚。“我們一直處于趕路的狀態(tài),很多現(xiàn)實壓力讓你沒有時間去看清楚、看細致,也沒辦法進行試錯,找出某些關(guān)鍵問題的更優(yōu)解。”
而從2.0GHz到3.0GHz,到更高頻率,隨著處理器主頻的上升,芯片設(shè)計也出現(xiàn)新的課題。“我們只能在短時間內(nèi)盡力做好, 同時在一步一步往前趕,一點點改變這個現(xiàn)狀,一次到位很難,”王惟林說。
與此同時,可能是出于宣傳的需要或是工程師的個人偏好,注重單點性能而罔顧整體性能、穩(wěn)定性、可靠性的風氣,一度也把芯片設(shè)計帶到了歧路上。“處理器要量產(chǎn)一定要保證可靠性、穩(wěn)定性和兼容性。這個控制不住,肯定會出問題。所以,我們在做的產(chǎn)品, 最重要的是在保證用戶性能需球的同時,要確保用戶使用起來穩(wěn)定兼容,設(shè)計上要處理好這些, 比如功耗,信號的完整性,電源平面的抖動等。”
人才荒,則是整個行業(yè)的面臨的共通困難。
王惟林每年都會去大學招聘,“以前去某中部地區(qū)著名大學招聘,每年都能招來十幾人。大概從前兩年開始,我每年只能招來幾個”,王惟林很納悶,回過頭去問這些專業(yè)的情況,才發(fā)現(xiàn)很多研究方向都改為軟件了。
集成電路設(shè)計行業(yè)是人才、資金和技術(shù)密集型的行業(yè),高性能處理器更是其中尖端復雜的代表,兆芯的研發(fā)人員大部分都是碩士、博士畢業(yè),研究方向偏硬件,投入時間和經(jīng)濟回報上的不對稱,讓越來越多的優(yōu)秀人才流出。“小朋友也要養(yǎng)家糊口,”王惟林理解這些壓力。
雖然現(xiàn)實艱難,但是王惟林也注意到,政府在提供更好的支持。在北京,政府做出了IC產(chǎn)業(yè)北設(shè)計、南制造的產(chǎn)業(yè)規(guī)劃,北邊的中關(guān)村集成電路產(chǎn)業(yè)園,集合了海思、展訊等企業(yè),南邊則有亦莊。“這很像美國硅谷,一個園區(qū)集聚了產(chǎn)業(yè)鏈上下游的企業(yè),”王惟林說。
值得關(guān)注的是,北邊的中關(guān)村集成電路產(chǎn)業(yè)園去年還落成了中關(guān)村集成電路科技館,面向公眾、在校學生、業(yè)內(nèi)人士開放,意在提升IC產(chǎn)業(yè)的社會影響力,讓更多年輕人接觸IC、了解IC、投身IC,從根子上提升年輕人對這一生澀產(chǎn)業(yè)的認知和興趣。
改變在發(fā)生,王惟林也期待和呼吁政府等部門,在人才培養(yǎng)、人才引進、戶口、住房等問題上,讓IC企業(yè)得到持續(xù)的支持,多方位破局困擾行業(yè)發(fā)展的「人才荒」難題。
3
國產(chǎn)芯片關(guān)鍵是要能響應國家的使命召喚
一個“奇怪”的現(xiàn)象是,國產(chǎn)芯片喊了很多年,也時有成果發(fā)布,但是普通人的手機和電腦上,仍然是進口芯片一統(tǒng)江湖。國產(chǎn)芯片去哪兒了?
也正是這樣的情況,形成了大眾對國產(chǎn)芯片的直觀印象:砸了很多錢,但不爭氣。
“可以理解。愛之彌深、恨之彌深,大概是這樣一種態(tài)度。”對于公眾對國產(chǎn)芯片的質(zhì)疑,王惟林認為有幾個原因:一是整個國產(chǎn)芯片行業(yè)的發(fā)展水平與國際相比,確實還比較初級;二是在產(chǎn)業(yè)的初期,很多芯片為了獲取經(jīng)費拼命宣傳,只強調(diào)一些不實用的單點指標,整體的處理性能還非常差,同時不注重穩(wěn)定性和可靠性,宣傳效果和實際可用性落差大。
但在經(jīng)過近20年發(fā)展之后,國產(chǎn)芯片設(shè)計水平在摸爬滾打中取得的顯著進步也應該被看到。國產(chǎn)高性能處理器在很多領(lǐng)域是可以勝任需求的。在民政系統(tǒng)的婚姻登記系統(tǒng)、在上海銀行的柜面業(yè)務中,兆芯CPU驅(qū)動的整機都已投入使用。
兆芯平臺整機已經(jīng)獲得廣泛的行業(yè)應用和認可
“兆芯ZX-C CPU完全可以支持WPS\OFFICE這些辦公軟件,支持打印機、掃描機這樣的掃描裝置,兆芯最新的處理器性能也足以支持當下的熱門游戲,比如讓吃雞,使命召喚流暢地跑起來,這些應用都沒問題”王惟林介紹。
現(xiàn)在,擺在國產(chǎn)處理器面前的還有一個重要的“路線爭論”:我們知道,處理器只是硬件,需要配合整機、操作系統(tǒng)、中間件,應用軟件一起才能發(fā)揮作用,這也反映出了生態(tài)的重要性。那么到底是從頭開始原創(chuàng)自建生態(tài)?還是融入已有生態(tài),基于此開發(fā)自己的產(chǎn)品?兆芯走的是第二條路線。“我們的長期目標是要建設(shè)自己的生態(tài),那么短期呢?芯片關(guān)系著信息產(chǎn)業(yè)的發(fā)展,國產(chǎn)高性能處理器仍然是行業(yè)的追趕者,想要更加快速的趕上來,站在巨人的肩膀上是一種投入產(chǎn)出比更高的途徑。另外,在國際主流生態(tài)幾乎占據(jù)壟斷地位的現(xiàn)實下,一旦再度發(fā)生影響產(chǎn)業(yè)安全的情況,從頭做起的薄弱生態(tài)如何能彌補產(chǎn)業(yè)的空白,這對產(chǎn)業(yè)安全是格外嚴峻的考驗。在擁有更大市場,更多話語權(quán)之后,我們的長期目標——建立自己的產(chǎn)業(yè)標準和產(chǎn)業(yè)生態(tài),這個工作就會容易一些了。”
而隨著摩爾定律遇到瓶頸,新成果迭出,王惟林也在關(guān)注量子芯片、神經(jīng)網(wǎng)絡芯片等新興技術(shù)。
“我們現(xiàn)在還是典型的馮·諾依曼架構(gòu),存儲和計算分離。一個指令出來,去memory抓取,memory沒有就去硬盤里找,非常漫長。但人的大腦不是這樣,每一個神經(jīng)元都是存儲和計算在一起。”王惟林和他的團隊兩年前就在探討國際最前沿的科研趨勢,“未來,可能會走到這一步,但現(xiàn)在,我們要認認真真做好每一個細節(jié)”。