一文通解基于VLT技術(shù)的新型DRAM內(nèi)存單元
OFweek電子工程網(wǎng)訊 垂直分層閘流體(Vertical Layered Thyristor;VLT),是Kilopass研發(fā)出的新型內(nèi)存單元,能夠顯著降低動態(tài)隨機存取內(nèi)存(DRAM)的成本和復雜性。這是一種靜態(tài)的內(nèi)存單元,無需刷新操作;兼容于現(xiàn)有晶圓廠的制造設備,也無需任何新的材料或工藝。
相較于一般的DRAM,VLT內(nèi)存數(shù)組能節(jié)約高達45%的成本;這是因為它具有更小的VLT內(nèi)存單元,以及驅(qū)動更長行與列的能力,使其得以大幅提升內(nèi)存數(shù)組效率。然而,想要發(fā)揮VLT的優(yōu)勢,就必須在依據(jù)產(chǎn)業(yè)標準發(fā)展的成熟DRAM市場展開設計與制造,才能確保兼容于不同供應商的內(nèi)存產(chǎn)品。
目前,基于VLT技術(shù)的內(nèi)存已經(jīng)具備與現(xiàn)有“第四代低功耗雙倍數(shù)據(jù)速率”(LPDDR4)規(guī)格完全兼容的能力。VLT內(nèi)存組(bank)可以模擬傳統(tǒng)DRAM的bank,并兼容于其頻率;在設計VLT電路時,設計者可以選擇連接標準DDR控制器,或是成本較低的簡化版控制器。如果使用標準控制器,由于不需要刷新,VLT內(nèi)存將會忽略刷新序列。系統(tǒng)的其他部份則會將VLT DRAM視為通用DRAM,因而無需任何改變。
傳統(tǒng)DRAM內(nèi)存單元
為了顯示如何使用VLT內(nèi)存單元構(gòu)造LPDDR4內(nèi)存,首先回顧一下傳統(tǒng)DRAM以及LPDDR4的工作方式。熟悉DRAM者或許對其有所了解,但實際運用上還是有些微差異,在此先定義一些準則與術(shù)語以便于理解。
DRAM作業(yè)的許多方面取決于其電容儲存單元。首先,電容的漏電特性導致了刷新的必要性;其次,儲存單元的基本作業(yè)方式之一是讀取,它會影響如何組織內(nèi)存的其他方面。
圖1顯示電容儲存單元的原理圖,左右圖分別代表了讀取1和讀取0時。電路透過“電荷分配”(charge sharing)偵測內(nèi)存位值。位線(bitline)首先被預充電到一個在0和1之間的電壓值,然后透過打開讀數(shù)晶體管來選擇一個內(nèi)存單元,使電荷可以在位線與內(nèi)存單元間流動。如果位線電壓高于內(nèi)存單元,那么負電荷就會從內(nèi)存單元流出到位在線;而如果位線的電壓低于內(nèi)存,那么負電荷就會從位線流進內(nèi)存單元。
圖1:傳統(tǒng)電容式DRAM內(nèi)存單元的電荷分配原理 (圖中綠色箭頭所示為電流,與負電荷流動的方向相反)
這種電荷轉(zhuǎn)移改變了位在線的電壓,透過感測與鎖存得到最終讀取數(shù)值。然而,在儲存電容中失去或取得的電荷,改變了節(jié)點上原有的電荷,這意味著讀取的過程是破壞性的。因此,在每一次讀取之后,都必須透過回寫操作恢復內(nèi)存單元中的電荷。
LPDDR4
LPDDR4標準是第四代雙倍數(shù)據(jù)速率(DDR) DRAM的低功耗版本標準,透過整體架構(gòu)定義了個別內(nèi)存芯片的高層級結(jié)構(gòu),以及如何安排雙列直插式內(nèi)存模塊(DIMM)。
分析DRAM的方式一般有兩種:理論上,剖析其實體細節(jié);實際上,則著眼于其芯片數(shù)組特性。本文首先探討第一種邏輯觀點,因為所有的實體布局都必須分解為相同的邏輯結(jié)構(gòu),因而能夠從中了解傳統(tǒng)DRAM和LVT途徑如何實現(xiàn)邏輯功能。
LPDDR4內(nèi)存芯片擁有8Gb的儲存容量,通常由兩個4Gb的獨立通道共同組成。每信道擁有8個內(nèi)存組,每一內(nèi)存組包括32K儲存頁(page),每頁有16K位,而使內(nèi)存組的總?cè)萘窟_到512Mb。
圖2:典型的DRAM架構(gòu)和層級
一個完整的LPDDR4內(nèi)存芯片包括兩個高層級單元:內(nèi)存數(shù)組和DDR接口。有些部份的操作會影響到內(nèi)存數(shù)組;另一部份則會影響接口。DDR接口可以同時與內(nèi)存數(shù)組以及外部系統(tǒng)進行通訊。
圖3:LPDDR4的邏輯組織架構(gòu),圖中將儲存數(shù)組和DDR接口分開。(箭頭代表一次讀取操作以及回寫)
圖3說明了這種關(guān)系,即DDR緩存器作為外部系統(tǒng)和內(nèi)存數(shù)組之間的主接口。而在讀取數(shù)據(jù)時,數(shù)組數(shù)據(jù)會先被加載DDR緩存器中;進行寫入作業(yè)時,所需的數(shù)據(jù)會先從外部寫入緩存器中。
由于讀取傳統(tǒng)DRAM數(shù)組內(nèi)容可能破壞原有數(shù)據(jù),每一次讀取后都必須進行回寫作業(yè),以恢復原有值。在進行讀取后,DDR緩存器的內(nèi)容被復制到“隱藏緩存器”(Shadow Register)中。當外部系統(tǒng)讀取DDR緩存器中的數(shù)據(jù)時,隱藏緩存器負責將數(shù)據(jù)回寫到所選頁,以恢復原有數(shù)值。同樣地,當寫入數(shù)據(jù)時,DDR緩存器的數(shù)據(jù)會被傳輸?shù)诫[藏緩存器中等待寫入;而在執(zhí)行寫入作業(yè)時,DDR緩存器就可以加載新的數(shù)據(jù)。
讀取內(nèi)存分頁數(shù)據(jù)涉及一連串的活動,類似于兩個巢式的軟件DO回路(Do loop)。每一分頁內(nèi)存被分成由許多256字節(jié)成、成批(burst)讀取的內(nèi)存群組,因此,一組16K位分頁就有64個burst內(nèi)存群組,依序讀取完整的內(nèi)存頁,這類似于外部DO回路。
圖4:內(nèi)存分頁由分批依序讀取的內(nèi)存群組構(gòu)成;每一批burst群組均依據(jù)16個連續(xù)的16位傳送到I/O。
每個突發(fā)傳輸組被加載256位的DDR緩存器中,該緩存器被分為16個16位字,并依序讀取其內(nèi)容,為每一個頻率邊緣提供每一個16位字。這種操作方式則如同內(nèi)部DO回路。
每一行的地址(RAS)負責選擇分頁。同時,每一列的地址(CAS)選擇突發(fā)傳輸組,并設置從DDR緩存器中開始讀取的字符,因而不必從DDR緩存器的左側(cè)開始讀取。
值得注意的是,在隱藏緩存器執(zhí)行回寫、讀取或?qū)懭隓DR緩存器中原先加載數(shù)據(jù)的同時,DDR緩存器已經(jīng)開始從儲存數(shù)組中讀取數(shù)據(jù)或從外部加載所寫數(shù)據(jù)了。[!--empirenews.page--]
LPDDR的運作
LPDDR4功能本質(zhì)上包含四項基本操作:啟動、讀取、寫入和預充電。這些操作的其他變異形式,如突發(fā)讀取/寫入和自動預充電等,可能構(gòu)成一個更長的指令列表,但并不至于帶來新的技術(shù)挑戰(zhàn)。此外,它還添加了刷新、訓練和模式緩存器作業(yè)等維護性指令,以因應復雜的操作命令。
這些基本的操作簡要介紹如下: 啟動: 在內(nèi)存數(shù)組中選擇特定字符線(wordline),即可“開啟”一個分頁。該分頁上的內(nèi)容將會被感測到并進行鎖存,然后保持開啟以用于在讀取作業(yè)時進行回寫,或在“讀取-修改-寫入”作業(yè)時被再次寫入。 讀?。? 開啟讀取數(shù)據(jù)序列,每個burst內(nèi)存群組的數(shù)據(jù)會從感測放大鎖存中被加載到DDR緩存器中。緊接著DDR緩存器開始依序讀取,每次讀取一個16bit字。同時,芯片透過隱藏緩存器在仍保持開啟狀態(tài)的分頁上進行回寫。 寫入: 數(shù)據(jù)被加載DDR緩存器,每次一個16位字。數(shù)據(jù)隨后被轉(zhuǎn)移到隱藏緩存器中,待分頁開啟時寫入數(shù)據(jù)。當進行寫入時,DDR緩存器可依需要同時加載新的256位數(shù)據(jù),等待下一次寫入。 預充電: 在最后一個burst內(nèi)存群組被讀取或?qū)懭牒?,?nèi)存數(shù)組必須為下一次操作做好準備。在寫入情況下,必須等待一個寫入恢復延遲,以確保最后的burst群組可在繼續(xù)其他操作前被成功寫入。這時,開啟的分頁已被關(guān)閉,使位線能夠自由浮動,并重新充電回到先前提到的VDD/2電位。
值得注意的是,只有啟動操作才涉及內(nèi)存數(shù)組感測;讀取操作只涉及在鎖存感測數(shù)據(jù)與DDR緩存器之間傳輸數(shù)據(jù),以及讀取DDR緩存器的數(shù)值。
根據(jù)所需的操作序列不同,有些DDR的時序可能極其復雜。但如果相鄰讀取操作發(fā)生在不同內(nèi)存組的數(shù)據(jù)之間,則可大幅簡化時序。因為在從下一個內(nèi)存組中讀取數(shù)據(jù)之前,不必在原有的內(nèi)存組中等待回寫和預充電。時序控制最困難的是來自同一內(nèi)存組的連續(xù)讀寫。
實現(xiàn)內(nèi)存數(shù)組:MAT
理論上,盡管一個內(nèi)存組的邏輯容量可能達到32K行與16K列,但以現(xiàn)有技術(shù)而言,現(xiàn)實上并不可能制造出這樣的內(nèi)存數(shù)組。這是因為:
? 驅(qū)動器在選擇分頁時的驅(qū)動能力有限;在性能符合規(guī)格要求的前提下,只有一定數(shù)量的選定晶體管可以被驅(qū)動。
? 感測放大只能支持有限數(shù)量的儲存單元。如果儲存單元的數(shù)量太多,由于電荷分配造成電壓變化減小,而被噪聲淹沒。
因此,為了確保內(nèi)存芯片可靠且易于制造,每一種內(nèi)存應用都存在不同程度的實體尺寸限制。達到這種上限的內(nèi)存數(shù)組被稱作“內(nèi)存數(shù)組片”(memory array tile;MAT)。每個MAT都是功能齊全的數(shù)組,本身包含字符線和位線的譯碼以及感測放大器。
以一種采用2x-nm工藝節(jié)點的一般DRAM MAT為例,其位線和字符線的規(guī)模分別達到1,024條和620條。字符線的數(shù)量并不是2的整數(shù)次方,這帶來了一些解碼方面的挑戰(zhàn)。該芯片或許只用了最后的幾個MAT,但這是一個可以忽略的芯片建置細節(jié)。
透過打造一個16×53大小的MAT數(shù)組,可為具有這一尺寸的內(nèi)存組實現(xiàn)總共848個MAT。一個完整分頁整合一行MAT的內(nèi)存單元:當開啟一個分頁時,同時啟動同一行有MAT內(nèi)存單元上相應的字符線。
圖5:傳統(tǒng)DRAM的實體布局
在了解了這些背景知識后,接下來將討論全新的Kilopass內(nèi)存單元,以及它如何打造與此相同的儲存組。
VLT內(nèi)存單元
Kilopasss的全新內(nèi)存單元基于一種垂直分布的閘流體(也被稱為半導體控制整流器,或SCR)。這種采取pnpn結(jié)構(gòu)的堆棧建構(gòu)于一個p-阱上,可帶走來自底部n型層的任何空洞。
圖6:VLT內(nèi)存單元:帶有寫入輔助的PMOS晶體管的閘流體
在淺溝槽隔離(STI)結(jié)構(gòu)中植入一個埋入式字符線,使底部的n層連接到一個字符。埋入式字符線與外部銅金屬M1層字符線透過具有較大電阻的金屬鎢實現(xiàn)連接,因而可以制造比傳統(tǒng)DRAM更長的字符線。
由于感測機制并非采用電荷分配,使感測放大器可承受更長的位線。因此,這種技術(shù)可以支持高達2Kbit寬、4Kbit深或總共8M位的MAT——遠大于傳統(tǒng)的DRAM MAT。采用更少片較大型MAT拼接成的內(nèi)存芯片較采用多片小尺寸MAT的花費更低,因而可使VLT內(nèi)存的數(shù)組效率達到77%,相形之下,同樣采用2x-nm節(jié)點的傳統(tǒng)DRAM效率只有64%。
以VLT內(nèi)存單元打造LPDDR4內(nèi)存
MAT容量增大后,LPDDR4內(nèi)存組就可以用更少的MAT組成。單純按照位數(shù)計算,基于VLT技術(shù)的內(nèi)存組將包含64個MAT,相形之下,傳統(tǒng)DRAM的內(nèi)存組需要配置848個更小的MAT。不過,接下來的問題就是如何最有效配置這些MAT。
一種配置方式是每個MAT都帶有512個支持4K位線的感測放大器,這意味著每個感測放大器都有多任務器用于在8條位線中進行選擇。其中,多任務器的選擇基于CAS地址;進一步針對圖3的內(nèi)存數(shù)組進行修改后,新的原理圖如下:
圖7:為VLT內(nèi)存添加位線多任務器
因此,對于每個被選定的分頁,每個MAT中只有八分之一的位線會被選擇,這與普通DRAM實現(xiàn)方式中所有位線都被選中的情況不同。但在傳統(tǒng)DRAM中并不可能實現(xiàn)這種更高效率的感測放大器使用方式,因為所有的位線都必須被讀取,以實現(xiàn)回寫的目的。由于VLT讀取并不是破壞性的,因而無需回寫操作,且多個內(nèi)存單元可共享感測放大器。
另一個問題是如何在一個MAT實體數(shù)組中配置這些MAT。基于VLT MAT的靈活性,實體上配置這些MAT可以不必與邏輯上的配置完全吻合。只要妥善安排各總線的路徑,任何形式的配置都是可能的。舉例來說,一個內(nèi)存組可被配置為4×16個MAT數(shù)組,同時傳輸理論上與傳統(tǒng)LPDDR4相同的數(shù)據(jù)。[!--empirenews.page--]
圖8說明傳統(tǒng)DRAM和VLT技術(shù)在內(nèi)存分頁選擇上有什么不同:傳統(tǒng)DRAM選擇一行中的所有MAT,而VLT則從中選擇了一個4×8的MAT區(qū)塊。
圖8:內(nèi)存分頁選擇,其中被選定的MAT是紅色的。傳統(tǒng)DRAM透過行來選擇分頁,而VLT DRAM則以單元區(qū)塊選擇分頁。
由VLT制造的LPDDR4,在外部操作上與傳統(tǒng)LPDDR4完全相同。內(nèi)部操作可能有所差異,例如不必再回寫和預充電,但這并不會影響DDR控制器;如果滿足了VLT的時序要求,其內(nèi)存的邏輯組織方式與傳統(tǒng)DDR完全一致。
免除刷新
VLT內(nèi)存單元最明顯的優(yōu)點之一就是不需要刷新。不過,刷新已經(jīng)成為DRAM作業(yè)的一部份了;無論內(nèi)存處于閑置狀態(tài)或是被接通,都必須進行刷新操作,以避免數(shù)據(jù)丟失。
完整的DDR控制器狀態(tài)機說明了刷新對于運作的影響,如圖9所示,所有紅色的狀態(tài)都與刷新或者基于刷新的分支相關(guān);而使用了VLT技術(shù),這些狀態(tài)都是冗余的,而且能夠被消除。
圖9:傳統(tǒng)DRAM建置的LPDDR4狀態(tài)原理圖,與刷新有關(guān)的狀態(tài)以及與基于刷新的有關(guān)分支狀態(tài)都被標注為紅色,標注為灰色的狀態(tài)則與接口相關(guān)。
圖10則是一種簡化的狀態(tài)機,其中與刷新有關(guān)的狀態(tài)都已經(jīng)移除了。在設計基于VLT的內(nèi)存時,設計者可以選擇現(xiàn)有的DDR控制器,因應那些不需要的狀態(tài)加以調(diào)整;也可以設計優(yōu)化的DDR控制器,省去所有與刷新相關(guān)的電路——這種方法將占用更小的芯片面積,以及降低功耗。無論選擇哪一種控制器,都不會影響其他系統(tǒng)與內(nèi)存芯片的互動。
圖10:移除與刷新相關(guān)狀態(tài)后的LPDDR4狀態(tài)原理圖
結(jié)語
VLT內(nèi)存單元可以打造一種比普通DRAM內(nèi)存單元成本更少、功耗更低的內(nèi)存,目前VLT內(nèi)存芯片已能與現(xiàn)有的LPDDR4內(nèi)存完全兼容了。透過適當設計架構(gòu)、命令以及時序,VLT內(nèi)存芯片就能與傳統(tǒng)內(nèi)存芯片無差別地應用在實際系統(tǒng)上。
基于VLT的內(nèi)存數(shù)組采用一個可在內(nèi)部作業(yè)處理差異的接口,使其得以與標準的LPDDR4控制器配合使用。換句話說,設計一款免刷新的LPDDR4控制器,使其仍具備完整的控制器功能以支持外部接口,并確?,F(xiàn)有驅(qū)動器都能繼續(xù)正常作業(yè),而只是在內(nèi)部忽略與刷新有關(guān)的操作,將有助于大幅節(jié)省成本,以及降低功耗。