美光:多核CPU給DRAM帶來麻煩 力推堆疊式芯片
多核心CPU令人厭惡。DRAM的運(yùn)行遭遇帶寬難題。隨著CPU性能的不斷提升,新的問題在于將有更多計(jì)算核心嘗試訪問服務(wù)器內(nèi)存,而帶寬將進(jìn)一步吃緊。解決方案之一在于將DRAM在邏輯層之上按層堆疊,從而使所構(gòu)成的混合內(nèi)存立方體(簡稱HMC)擁有更高的訪問速度——美光如今已經(jīng)實(shí)現(xiàn)了這一構(gòu)想。
美光選擇本屆丹佛超級計(jì)算大會(huì)作為舞臺(tái),向全世界隆重公布了其專為千萬億次超級計(jì)算機(jī)所開發(fā)的HMC芯片。其它目標(biāo)應(yīng)用還包括數(shù)據(jù)包處理、數(shù)據(jù)包緩沖或存儲(chǔ)以及處理器加速——總之任何在內(nèi)存帶寬限制方面受到束縛的應(yīng)用都能從中獲得提升。
在這次展會(huì)上,富士通展示了一塊來自搭載HMC芯片的未來超級計(jì)算機(jī)原型機(jī)的電路板。美光也參與其中,并著力創(chuàng)建一套生態(tài)系統(tǒng)、旨在吸引更多廠商關(guān)注并使用HMC芯片。
一塊DRAM芯片結(jié)合了訪問流程所必需的內(nèi)存與邏輯功能。如果大家將DRAM芯片層彼此堆疊,那么邏輯電路也將出現(xiàn)重復(fù)。HMC給出的方案是將邏輯電路從各芯片當(dāng)中去除,轉(zhuǎn)而使用一個(gè)位于芯片底部的基礎(chǔ)邏輯層,從而為HMC當(dāng)中每一個(gè)DRAM層提供相應(yīng)功能。
HMC的方案展示:利用硅通孔作為貫穿各層的通道。
美光的HMC方案當(dāng)中擁有四到八個(gè)內(nèi)存層。該公司在一篇博文中表示:“每個(gè)內(nèi)存層都擁有數(shù)百萬個(gè)處于定義組(倉庫)中的內(nèi)存單元,并配備復(fù)雜的支持邏輯(倉庫控制器)、旨在全方位控制內(nèi)存單元并提供面向內(nèi)部通交叉交換機(jī)制的接口……HMC擁有16套彼此獨(dú)立運(yùn)作的倉庫體系,目的在于讓每個(gè)體系實(shí)現(xiàn)穩(wěn)定的10GB/s(即80Gb/s)真實(shí)內(nèi)存帶寬。邏輯層還支持外部接口、交叉交換、內(nèi)存調(diào)度器、內(nèi)置自測試(簡稱BIST)、邊帶信道以及眾多可靠性、可用性及可服務(wù)性(簡稱RAS)功能。”
邏輯層通過貫穿整套結(jié)構(gòu)的通道實(shí)現(xiàn)與各DRAM層的連通或者對話,也就是所謂硅通孔(簡稱TSV)機(jī)制。這給制造工藝設(shè)計(jì)師帶來了不少難題,因?yàn)橛糜谶B接底層與三層之間的硅通孔長度與用于連接底層與四層之間的硅通孔長度幾乎沒什么差別??刂浦圃炀瘸闪水a(chǎn)品成功的必要前提,因?yàn)橐坏┻B通的層數(shù)出現(xiàn)偏差、整個(gè)多層模板就會(huì)徹底報(bào)廢,由此帶來的損失要遠(yuǎn)高于單層DRAM晶圓。
這些硅通孔技術(shù)必須完美地與自身經(jīng)過的DRAM層相絕緣——這又是另一個(gè)制造層面的難題。
第三點(diǎn):DRAM層在硅通孔貫穿位置不能存在內(nèi)存單元。而層數(shù)越多,我們所需要的硅通孔數(shù)量也越多,這就讓芯片層設(shè)計(jì)師的工作變得愈發(fā)復(fù)雜。
其實(shí)所謂“立方體”只是一種夸張的形容;真正的邏輯與內(nèi)存層其實(shí)很薄、并不能構(gòu)成立方結(jié)構(gòu)。
HMC擁有高速CPU連接,而硅通孔則使訪問進(jìn)行“大規(guī)模并行”時(shí)代。正如美光在一份16頁的演示說明中所表述:
HMC設(shè)備中的DRAM非常獨(dú)特,其設(shè)計(jì)目的在于支持十六個(gè)獨(dú)立的自支持倉庫。每套倉庫提供10Gb/s穩(wěn)定內(nèi)存帶寬,因此立方體的整體帶寬可達(dá)到160GB/s。在每套倉庫當(dāng)中,各DRAM層都擁有兩個(gè)儲(chǔ)庫,相當(dāng)于2GB設(shè)備中總計(jì)包含128個(gè)儲(chǔ)庫、4GB設(shè)備中總計(jì)包含256個(gè)儲(chǔ)庫。這給系統(tǒng)性能帶來了巨大影響——與以鎖步方式運(yùn)行儲(chǔ)庫的常規(guī)內(nèi)存相比,新方案擁有更低的查詢延遲以及更出色的數(shù)據(jù)響應(yīng)可用性。
美光公司還表示,其HCM的160GB/s帶寬相當(dāng)于DDR2模塊的15倍,功耗則比現(xiàn)有技術(shù)低出達(dá)70%。它所占據(jù)的空間也比RDIMM低出約九成。
目前HMC聯(lián)盟共有八位主要開發(fā)成員,它們分別是:Altera、ARM、IBM、SK海力士、美光、Open-Silicon、三星以及Xilinix。HMC 1.0規(guī)格目前已經(jīng)制定并正式公布,且擁有超過一百家企業(yè)計(jì)劃采用這套方案。
這些企業(yè)能夠利用HMC作為“近內(nèi)存”,即將其安裝在處理器附近;或者作為“遠(yuǎn)內(nèi)存”,即使用向外擴(kuò)展HMC模塊以實(shí)現(xiàn)更高的能源效率。
美光目前已經(jīng)開始對其2GB HMC芯片進(jìn)行取樣;4GB芯片則將于明年年初開始取樣;2GB與4GB HMC設(shè)備的批量生產(chǎn)將于明年年末正式開始。