以Talus Vortex和Talus Vortex FX解決32/28納米IC實(shí)現(xiàn)問題
前言
目前的高端ASIC/ASSP/SoC器件開發(fā)商可考慮分為三大類:主流、早期采用者和技術(shù)領(lǐng)導(dǎo)者。在寫這篇文章的時(shí)候,主流開發(fā)商正致力于65納米技術(shù)節(jié)點(diǎn)設(shè)計(jì),早期采用者開發(fā)商正專注于45/40納米節(jié)點(diǎn)設(shè)計(jì),而技術(shù)領(lǐng)導(dǎo)者開發(fā)商正力求超越32/28納米及更小尺寸節(jié)點(diǎn)設(shè)計(jì)。隨著技術(shù)采用開發(fā)步伐的日益加快,下一代的早期采用者過渡到32/28納米節(jié)點(diǎn)的時(shí)間將不會(huì)很久,而他們的主流開發(fā)商同行也將緊隨其后。
進(jìn)行32/28納米節(jié)點(diǎn)設(shè)計(jì)時(shí)會(huì)遇到許許多多的問題,包括:低功耗設(shè)計(jì)、串?dāng)_效應(yīng)、工藝變異及操作模式和角點(diǎn)數(shù)量的顯著增加。本文首先會(huì)為您呈現(xiàn)微捷碼Talus® Vortex 1.2物理實(shí)現(xiàn)流程的高層次視圖,接著將介紹32/28納米節(jié)點(diǎn)設(shè)計(jì)所包含的一些問題并描述Talus Vortex 1.2是如何解決的這些問題。
除了上述技術(shù)問題以外,32/28納米節(jié)點(diǎn)日益提高的設(shè)計(jì)規(guī)模和復(fù)雜性還造成了工程資源(在不擴(kuò)大團(tuán)隊(duì)規(guī)模的前提下取得更大成果,同時(shí)還保持甚至縮短現(xiàn)有時(shí)間表)、硬件資源(無須增加內(nèi)存或購買全新設(shè)備,利用現(xiàn)有設(shè)備和服務(wù)器處理更大型設(shè)計(jì))、滿足日益緊張的開發(fā)時(shí)間表等方面相關(guān)問題的增加。為了解決這些問題,本文還將描述通過Talus Vortex FX創(chuàng)新性的Distributed Smart Sync™(分布式智能同步)技術(shù), Talus Vortex顯著地提高了其容量和性能。Talus Vortex FX 提供了首款且唯一一款分布式布局布線解決方案。
Talus Vortex 1.2物理實(shí)現(xiàn)流程介紹
圖1所展示的是標(biāo)準(zhǔn)Talus Vortex 1.2物理流程的高層次視圖。從圖中,您不難觀察到它先假設(shè)了芯片級(jí)網(wǎng)表的存在,此網(wǎng)表可能已通過微捷碼或第三方的設(shè)計(jì)輸入和綜合工具而生成。
在完成初始單元布局之后,第三步是綜合時(shí)鐘樹, 將其添加到設(shè)計(jì)中。多數(shù)時(shí)鐘樹綜合工具并非執(zhí)行真正的多模多角(MMMC)時(shí)鐘樹實(shí)現(xiàn),而是將時(shí)序環(huán)境分為best-case(最佳情況)和worst- case(最差情況)角點(diǎn)。但這種做法過于的悲觀,會(huì)導(dǎo)致性能一直處于“毫無起色”的狀態(tài)。在32/28納米節(jié)點(diǎn),實(shí)現(xiàn)真正的MMMC時(shí)鐘樹勢(shì)在必行(另見后文32/28納米主題中“MMMC問題”部分)。 因此Talus 1.2的時(shí)鐘樹綜合部署了完整的MMMC分析,以平均10%的延遲性改善和10% 的面積縮小實(shí)現(xiàn)了更為先進(jìn)的魯棒性時(shí)鐘系統(tǒng),如圖2所示
在多開關(guān)閾值晶體管情況下,非關(guān)鍵時(shí)序路徑上的單元可由漏電量較低、功耗較少、開關(guān)速度較慢的高開關(guān)閾值(high-Vt)晶體管來組成;而關(guān)鍵時(shí)序路徑上的單元?jiǎng)t可由漏電量較高、功耗較多、開關(guān)速度顯著加快的低開關(guān)閾值(low-Vt)晶體管來組成。
多電源多電壓(MSMV)所包括的芯片可分為不同區(qū)域(有時(shí)稱為“電壓島”或“電壓域),不同區(qū)域擁有不同的供電電壓。分配到較高電壓島的功能塊將擁有較高性能和較高功耗;而分配到較低電壓島的功能塊則將擁有較低性能和較低功耗。
動(dòng)態(tài)電壓與頻率縮放(DVFS)技術(shù)的使用是通過改變一個(gè)或多個(gè)功能塊的相關(guān)電壓或頻率來優(yōu)化性能與功耗間折衷權(quán)衡。例如:1.0V的額定電壓在功能塊活動(dòng)率低時(shí)可降至0.8V以降低功耗,或在需要時(shí)它也可以提至1.2V以提高性能。同樣地,額定時(shí)鐘頻率可在功能塊活動(dòng)率相對(duì)低時(shí)減至一半,或它也可增強(qiáng)一倍以滿足短時(shí)間爆發(fā)的高性能需求。
顧名思義,電源關(guān)斷(PSO)系指切斷選定的目前不在使用中的功能塊的電源。盡管這項(xiàng)技術(shù)在省電方面效果非常好,但它需要考慮到的問題真的很多,如:為避免造成電流浪涌,要按特殊順序給相關(guān)功能塊的供電和關(guān)電。
Talus Vortex 1.2提供了一款完整的集成化低功耗解決方案,包括一種自動(dòng)化低功耗綜合方法,可與跨多電壓和頻率區(qū)域的并行分析與優(yōu)化功能結(jié)合使用。 Talus 1.2不僅不會(huì)對(duì)所使用的不同晶體管開關(guān)閾值的數(shù)量進(jìn)行限制,同時(shí)還支持無限的電壓、頻率和電源切斷區(qū)域。此外,Talus 1.2完全支持通用功率格式(CPF)和統(tǒng)一功率格式(UPF)。這兩種格式讓設(shè)計(jì)團(tuán)隊(duì)能夠先從功耗角度出發(fā)把握設(shè)計(jì)意圖,然后再推動(dòng)下游規(guī)劃、實(shí)現(xiàn)和驗(yàn)證策略(見側(cè)邊欄)。
時(shí)鐘頻率的持續(xù)提高與供電電壓的日益降低意味著對(duì)串?dāng)_型延時(shí)變化、功能失效等信號(hào)完整性(SI) 效應(yīng)的敏感度在不斷提高。在32/28納米節(jié)點(diǎn),由于更近的相鄰軌道、橫截面(32/28納米節(jié)點(diǎn)的軌道的高度可能大于其寬度,如圖4 所示,它增大了相鄰軌道耦合電容)以及金屬化的軌道和通孔的電阻的提高(相對(duì)而言),因此這些效應(yīng)也進(jìn)一步增強(qiáng)。
對(duì)于以180納米及更高技術(shù)節(jié)點(diǎn)制造的硅芯片來說,所需的只是解決些少量晶圓間變異,即源自不同晶圓的晶粒在時(shí)序(性能)、功耗等特征方面的差異。這種差異可能是由于從一家代工廠到另一家代工廠的制程變異和儀器及操作環(huán)境微小差異所造成,如:爐溫、摻雜程度、蝕刻濃度、用以形成晶圓的光刻掩膜等等。
在較高技術(shù)節(jié)點(diǎn)時(shí),所有晶粒間工藝變異(同一晶圓上各晶粒間差異)和晶粒內(nèi)工藝變異(同一晶粒上各區(qū)域間差異)相對(duì)來說并沒那么重要。(晶粒間變異也被稱之為“全局”、“芯片到芯片”、“晶粒到晶粒”變異。)例如:如果一個(gè)芯片的核心電壓為2.5V,那么在多數(shù)情況下會(huì)假設(shè)整個(gè)晶粒擁有一致和穩(wěn)定的 2.5V電壓; 同樣的也會(huì)假設(shè)整個(gè)晶粒上擁有統(tǒng)一的芯片溫度。
隨著尺寸越來越小的新技術(shù)節(jié)點(diǎn)浮出水面,晶粒間與晶粒內(nèi)工藝變異變得日益重要。這些變異中有些是系統(tǒng)變異,這意味著它會(huì)隨著單元級(jí)電路功能而改變。例如:晶圓片中心附近所制造的芯片與朝向晶圓片邊緣所制造的芯片相比,其相關(guān)的某些參數(shù)可能會(huì)有所不同;在這種情況下,可以預(yù)測(cè)所有參數(shù)都將受到類似影響;而一些參數(shù)還會(huì)在隨機(jī)變異的情況下獨(dú)立地波動(dòng),據(jù)說這可能是基于區(qū)域的變異(相對(duì)于基于距離的變異)。
32/28納米多模多角(MMMC)問題
除了前文主題中所提及的制造工藝的變異以外,我們還必須解決芯片使用的環(huán)境條件(如:電壓和溫度)存在的潛在變異問題。所有這些變異均可歸入PVT(工藝、電壓和溫度)項(xiàng)目范圍。
對(duì)于以更早期技術(shù)節(jié)點(diǎn)所創(chuàng)建的器件來說,晶粒間與晶粒內(nèi)PVT差異可以忽略不計(jì)。先做假設(shè),然后基于整個(gè)芯片表面具有一致的工藝變異這一事實(shí)、基于整個(gè)晶粒上具有穩(wěn)定的核心電壓和溫度等環(huán)境條件這一事實(shí)來簡(jiǎn)化工作是有可能的?;谶@些假設(shè),通過采用一系列bese-case條件(最高允許電壓、最低允許溫度等),確定每條路徑bese-case(最小)延時(shí)會(huì)相對(duì)容易;同樣的,通過采用一系列worst-case條件(最低允許電壓、最高允許溫度等),確定每條路徑worst-case(最大)延時(shí)也會(huì)相對(duì)容易。
目前工具的問題在于:實(shí)現(xiàn)期間 ,芯片必須可在MMMC前景下進(jìn)行優(yōu)化 。許多現(xiàn)有系統(tǒng)通過先考量已假設(shè)的worst-case情景、然后對(duì)別的條件進(jìn)行優(yōu)化的方式來著手處理優(yōu)化問題。遺憾的是,這可能導(dǎo)致過度悲觀主義,造成次優(yōu)性能。甚至更糟的是,如果這些關(guān)于哪些是worst-case情景的假設(shè)是錯(cuò)誤的,那么結(jié)果可能是得到完全不管用的芯片。 Talus 1.2內(nèi)置有自帶MMMC處理功能,這意味著優(yōu)化過程不會(huì)漏掉任何情景。此外,Talus 1.2的高速度和大容量還意味著,它能夠考慮到的不只是較小子集的實(shí)現(xiàn)情景,而是這款工具需要處理的整個(gè)系列的簽核情景。因此,Talus 1.2可提供更好的性能和更短的實(shí)現(xiàn)周期。
以 Distributed Smart Sync技術(shù)增強(qiáng)Talus Vortex的性能
前文所提及的物理實(shí)現(xiàn)流程每個(gè)步驟都是屬于計(jì)算密集型問題。而且為了解決伴隨技術(shù)節(jié)點(diǎn)而增加的復(fù)雜性,每個(gè)節(jié)點(diǎn)必須執(zhí)行的計(jì)算量也在提高。此外,當(dāng)器件中所集成的功能越來越多時(shí), 設(shè)計(jì)的規(guī)模和復(fù)雜性會(huì)隨著每個(gè)節(jié)點(diǎn)而提高,物理實(shí)現(xiàn)相關(guān)的計(jì)算需求也會(huì)相應(yīng)增加。
再有一個(gè)因素就是:功能模塊的尺寸(為實(shí)現(xiàn)模塊功能所需的單元數(shù)量)也會(huì)隨著每項(xiàng)功能中包裝進(jìn)越來越多特性而不斷增加。一些物理實(shí)現(xiàn)團(tuán)隊(duì)偏愛層次化方案,而另外一些團(tuán)隊(duì)則更喜歡使用“扁平化”方案,因?yàn)樗麄兏杏X在使用層次化方案時(shí)放棄了太多東西。
如果工具具有處理更大型電路模塊的能力,那么生產(chǎn)率就可得到即時(shí)的提升。例如:定義和微調(diào)層次化模塊間約束是極為耗時(shí)的資源密集型工作。如果這些工具具有處理更大型電路模塊的能力,那么就不需要定義子模塊間約束,因?yàn)椴粫?huì)有任何子模塊存在。這會(huì)大大提高生產(chǎn)率。
問題在于:多數(shù)布局布線解決方案都局限于只能處理幾百萬個(gè)單元。這常迫使物理實(shí)現(xiàn)工程師由于工具的局限性而不得不人工將電路模塊進(jìn)行分割。而這也對(duì)工程師生產(chǎn)率造成了影響。.
除非通過某些方式進(jìn)行增強(qiáng),不然的話即便目前最先進(jìn)的Talus 1.2布局布線解決方案的實(shí)際容量也只在200萬到500萬個(gè)單元之間,所提供的生產(chǎn)率為每天100-150萬單元。結(jié)果會(huì)造成一種由容量驅(qū)動(dòng)的生產(chǎn)率差距。為了處理32/28納米節(jié)點(diǎn)設(shè)計(jì),實(shí)現(xiàn)包括1000萬以上個(gè)單元的扁平電路模塊是必不可少的,如圖7所示(另見側(cè)邊欄)。