通過Rambus提供的IP產(chǎn)品、開發(fā)工具套件,以及全面系統(tǒng)級集成支持,減少了客戶設計實現(xiàn)的難度,大幅縮短了開發(fā)時間。
近年來,隨著人工智能應用(人工智能和機器學習,即AI/ML)的興盛,對算力與內存帶寬的要求又推到了一個新層次,據(jù)統(tǒng)計,從2012年到2019年,人工智能訓練集增長了30萬倍,每3.43個月翻一番,支持這一發(fā)展速度需要的遠不止摩爾定律所能實現(xiàn)的改進,這需要從架構開始,做算法、硬件和軟件的共同優(yōu)化,才能不斷提升系統(tǒng)性能以滿足人工智能訓練的需求。內存帶寬對系統(tǒng)整體算力的影響至關重要,業(yè)界為了拓展內存帶寬絞盡腦汁,在高帶寬數(shù)據(jù)通信、數(shù)據(jù)靠近計算和寸內計算等多個方向持續(xù)研究,志在減少數(shù)據(jù)在存取環(huán)節(jié)消耗的時間,打破“存儲墻”。
其中,高帶寬數(shù)據(jù)通信是目前進展最迅速且商業(yè)化最成功的方向之一。近日,在存儲接口技術上有30多年技術積累的硅知識產(chǎn)權(Silicon IP)和芯片提供商Rambus——從公司名可以看出該公司與存儲接口技術的聯(lián)系,即英文隨機存儲器RAM和總線Bus的組合——舉行線上新品發(fā)布會,宣布推出新一代高帶寬存儲產(chǎn)品解決方案HBM2E,Rambus將HBM2E的性能正式提高到4.0 Gbps。

Rambus HBM2E 4Gbps 發(fā)送端眼圖
高帶寬內存( High Bandwidth Memory )是一種立體(3維或2.5維)堆疊存儲方案。該概念最早由AMD在2008年引入,以解決PC系統(tǒng)對存儲容量提升導致的功耗和尺寸不斷增加的問題,通過與韓國海力士等公司合作,由海力士在2013年生產(chǎn)了第一批HBM存儲器,該技術也于當年10月被標準組織JEDEC(電子元件工業(yè)聯(lián)合會,Joint Electron Device Engineering Council)接受為標準JESD235。
此后HBM技術發(fā)展不斷向前推進,2016年JEDEC通過HBM2標準JESD235a,在2018年末,JEDEC宣布對HBM2規(guī)范更新至HBM2E,以提升帶寬和容量。當傳輸速率上升到每管腳3.6Gbps時,HBM2E可以實現(xiàn)每堆棧461GB/s的內存帶寬。此外,HBM2E支持12個DRAM的堆棧,內存容量高達每堆疊24 GB。
Rambus IP核產(chǎn)品營銷高級總監(jiān) Frank Ferro表示:在人工智能訓練領域,廠商對帶寬的需求已經(jīng)超過1TB每秒,Rambus的HBM2E正是瞄準人工智能訓練市場。籍此HBM2E發(fā)布,Rambus將會為人工智能/機器學習的客戶提供更加完整的解決方案,幫助客戶進一步地提高帶寬,滿足客戶在帶寬上的需求。

Rambus IP核產(chǎn)品營銷高級總監(jiān) Frank Ferro
據(jù)Frank Ferro介紹,HBM2E的開發(fā)過程,也得益于生態(tài)伙伴的相互配合與協(xié)作。例如SK海力士,SK海力士推出的第一代HBM2E產(chǎn)品數(shù)據(jù)傳輸速率達到3.6Gbps,在Rambus和SK海力士的通力合作下,雙方又將HBM2E內存的速率提升到了4.0Gbps。在開發(fā)HBM2E產(chǎn)品過程中,Rambus還與世芯電子(Alchip)合作,以解決硅中介層(interposer)和封裝的挑戰(zhàn),而封裝的具體實現(xiàn)則是由臺積電來完成,利用2.5D CoWoS(Chip on Wafer on Substrate)技術,臺積電為Rambus產(chǎn)品打造了封裝的完整解決方案。
Rambus在HBM上優(yōu)勢體現(xiàn)在方案完整與經(jīng)驗豐富上。Rambus提供完全集成而且經(jīng)過驗證的PHY(物理層)以及內存控制器IP解決方案,在物理層面實現(xiàn)完整的集成互連,除了內存子系統(tǒng)之外,Rambus提供的PHY也經(jīng)過了硬核化處理,集成了輸入輸出(IO)與去耦(Decap)電路,也完備了時序收斂工作,Rambus還提供包括內插板和封裝參考設計在內的系統(tǒng)級設計支持,利用Lab Station(實驗站開發(fā)環(huán)境),用戶可以實現(xiàn)PHY與DRAM互連的調試。通過Rambus提供的IP產(chǎn)品、開發(fā)工具套件,以及全面系統(tǒng)級集成支持,減少了客戶設計實現(xiàn)的難度,大幅縮短了開發(fā)時間。在競爭激烈的市場中,越短的上市時間,越接近成功。
高帶寬存儲技術對信號完整性要求很高,F(xiàn)rank Ferro表示,自創(chuàng)立開始,Rambus就以擅長信號完整性處理著稱,30多年來更是積累起很多獨家竅門(Know-how)。在整個HBM與中介層互連的過程中,至少包括上千條不同的數(shù)據(jù)鏈路,這些鏈路有不少是跑在Gbps級別速率。要確保系統(tǒng)信號完整性,就需要從多個層面著手。首先,必須要確保所有鏈路之間留出足夠的物理空間,并對關鍵路徑做完整的信號完整驗證。其次,中介層材料選擇對信號完整性影響極大,尤需慎重。“我們必須要考慮材料的厚度,以及電磁輻射相關的物理參數(shù),在所有方向上都要去做信號完整性分析和仿真,這些分析和仿真結合Rambus歷史數(shù)據(jù)庫,就可以實現(xiàn)極佳的系統(tǒng)信號完整性?!?
而且,自2017年起,Rambus就已經(jīng)推出了HBM的解決方案,是市場上最早提供HBM解決方案廠商之一。到2020年10月,Rambus已經(jīng)又有第三代PHY和第二代內存控制器,在全球范圍有50過個成功項目案例。除了在臺積電7納米工藝上開發(fā)了HBM2E,Rambus也與其他晶圓代工廠有廣泛合作,在格芯(Global Foundries)采用14納米與12納米制程生產(chǎn)HBM2,速率達到2.0Gbps,Rambus還在配合格芯用12納米制程開發(fā)HBM2E產(chǎn)品;在三星,Rambus正在就HBM2E在14及11納米制程上實現(xiàn)進行合作。Frank Ferro對Rambus的項目經(jīng)驗非常自信:“基于我們非常豐富的產(chǎn)品線,Rambus與所有主流晶圓廠商都有合作,也支持所有主流制程和工藝節(jié)點?!?
面向人工智能訓練領域的中國新興芯片公司燧原科技就采用了Rambus的HBM2E解決方案。Rambus可靠的HBM2內存子系統(tǒng)IP提供了AI芯片所需的超高帶寬性能,非常適合燧原科技的云AI培訓需求。作為該接口IP的補充,Rambus還提供硅中介層和封裝參考設計,并支持信號和電源完整性 (SI/PI)分析。

Rambus大中華區(qū)總經(jīng)理Raymond Su
Rambus大中華區(qū)總經(jīng)理Raymond Su表示,Rambus已經(jīng)注意到中國市場在全球人工智能發(fā)展方面走在相對前沿位置,中國市場對于Rambus全球市場至關重要,Rambus中國團隊會致力于在中國不斷地擴大和深化和中國客戶的合作關系聯(lián)盟。Rambus的產(chǎn)品主要聚焦于基礎架構許可、硅IP授權以及內存緩沖芯片業(yè)務,經(jīng)過30多年積累,Rambus已經(jīng)先后取得過2900多項專利和應用授權。
“Rambus將會為中國市場帶來最新和最先進的技術,緊密地和中國云廠商、OEM和ODM合作,推動內存產(chǎn)業(yè)生態(tài)系統(tǒng)建設。我們我們會和廣大的中國客戶一起攜手努力,緊密協(xié)作,扎根中國、深耕中國!” Raymond Su最后強調。