系統(tǒng)設(shè)計人員是時候必須關(guān)注硅片IP了
隨著芯片系統(tǒng)跨入“下一個大事記”市場,例如,自動駕駛汽車和物聯(lián)網(wǎng)(IoT),SoC設(shè)計人員面臨新一類需求——例如,環(huán)境、生命周期、可靠性和安全,相對于他們在消費類或者通信應(yīng)用上的經(jīng)驗而言,這完全是陌生的。這些需求相應(yīng)的也改變了SoC開發(fā)人員評估并集成知識產(chǎn)權(quán)(IP)的方式。與以往相比,開發(fā)人員要考慮某些自始至終都不會出現(xiàn)在SoC數(shù)據(jù)資料中的問題,其IP決定直接影響了客戶——系統(tǒng)開發(fā)人員的成功與否。本月設(shè)計和重用IP/SoC大會上的論文點明了一些這類隱藏的問題。
圖 1.很多投入都對SoC實現(xiàn)長工作壽命有貢獻(xiàn)。
汽車:必須一直保持良好工作
小客車和其他車輛的系統(tǒng)體系結(jié)構(gòu)已經(jīng)出現(xiàn)了根本性的變化。當(dāng)今汽車的結(jié)構(gòu)圖顯示了車輛中集合了數(shù)百個單一功能微控制器單元(MCU),每一個連接至自己的本地傳感器和致動器,通過混亂的工業(yè)標(biāo)準(zhǔn)網(wǎng)絡(luò)和專用總線以及點對點鏈路與車輛的其他部分連接起來。在這種混亂的環(huán)境中,沒有一個處理器能夠清楚的獲悉車輛完整的狀態(tài)。這非常不利于冗余或者故障恢復(fù)。對汽車制造商更直接的影響是——這一方法成本極高,要使用大量的電纜。
未來將有所不同。OmniPhy CTO Claude Gauthier說:“從寶馬和捷豹等高檔汽車開始,體系結(jié)構(gòu)向單一以太網(wǎng)骨干網(wǎng)發(fā)展。開始時是基于100 Mb IEEE 802.3 bw或者1 Gb 802.3 bp:運行在一條雙絞線上的工業(yè)/汽車標(biāo)準(zhǔn)。”
這種變化將終結(jié)很多這類小MCU。相反,我們將看到融合了傳感器數(shù)據(jù)和控制致動器的混合信號SoC,即能夠進(jìn)行本地處理,又有中央電子控制單元的支持。系統(tǒng)的核心將是異構(gòu)多核SoC,這類似于服務(wù)器中的CPU芯片。
這些SoC并不代表新的體系結(jié)構(gòu)挑戰(zhàn)。但是對于以前沒有從事過汽車行業(yè)的SoC設(shè)計團(tuán)隊而言,為汽車開發(fā)這些芯片卻是一項新工作:因為他們完全沉浸于以前由汽車級小MCU以及混合信號元器件主導(dǎo)的領(lǐng)域中。
Gauthier提醒說:“這是完全不同的市場。鑒定時間非常長,而規(guī)范的變化非???。標(biāo)準(zhǔn)仍然有很大的不確定性。”
在很長的鑒定過程中出現(xiàn)的很多問題將導(dǎo)致SoC設(shè)計團(tuán)隊及其IP供應(yīng)商不斷進(jìn)行爭論。很顯然,會有新功能,例如802.3 bw以太網(wǎng)接口。而且還將有新溫度范圍、新可靠性要求,以及AEC Q100等新質(zhì)量規(guī)章制度。
Q100是圍繞已知IC故障模式而設(shè)計的一組壓力測試,旨在估算汽車行業(yè)所要求的擴(kuò)展產(chǎn)品生命周期芯片故障率。很多這類測試集中在封裝故障模式上。但是某些研究表明,SoC開發(fā)人員直接面對管芯老化問題。
這方面的特殊測試包括檢查電子遷移、時間相關(guān)介質(zhì)擊穿、熱載流子注入、負(fù)偏置溫度不穩(wěn)定,以及應(yīng)變遷移等。要通過這些測試,就要求SoC代工線獲得工藝變化的Q100認(rèn)證。而且還要求IP供應(yīng)商確保其Q100認(rèn)證的工藝設(shè)計也能夠通過測試。無信息娛樂汽車對于SoC是一類新出現(xiàn)的市場,即使是硬件成熟的IP內(nèi)核也從未在Q100認(rèn)證工藝開發(fā)的硅片上通過Q100檢查。
AEC Q100用于確定SoC中可能出現(xiàn)的硬件故障。而汽車設(shè)計人員對另一類可靠性問題越來越感興趣:設(shè)計錯誤。ISO 26262等功能安全標(biāo)準(zhǔn)強(qiáng)制要求使用經(jīng)過形式驗證或者現(xiàn)場成熟可靠的元器件和軟件。相應(yīng)的,汽車SoC用戶日益關(guān)心SoC設(shè)計人員怎樣進(jìn)行他們的設(shè)計驗證工作。這種好奇心帶來了一個非常尷尬的問題。
問題來自SoC設(shè)計團(tuán)隊怎樣驗證他們所使用的IP。這有一點進(jìn)退兩難。
一方面,設(shè)計人員可能希望,而汽車客戶會要求盡可能的全面覆蓋進(jìn)行驗證。另一方面,對SoC設(shè)計進(jìn)行全面仿真又不太可能。第三方IP模塊不一定能夠獲得足夠的驗證結(jié)果,或者足夠的信息將其包含在全芯片仿真中。集成過程會帶來模塊級看不到的問題。但是當(dāng)仿真模型必須足夠快以便執(zhí)行代碼時,全集成的SoC可能會太大而無法進(jìn)行仿真,特別是在軟件集成過程中。
所有這些問題都會影響對基于FPGA的仿真的興趣。原理上,一個團(tuán)隊可以把所需的I/O放到FPGA電路板上,裝入SoC邏輯設(shè)計,以近乎實時的速度運行驗證——從功能到周期精確。
但是在一篇警示性的論文中,Atos工程師Huy-Nam Nguyen提醒說,F(xiàn)PGA原型開發(fā)有其自己的難題。Nguyen重點提到了兩個特殊問題。首先,與仿真器相比,F(xiàn)PGA原型開發(fā)的可控性和可觀察性有限。Nguyen說,相應(yīng)的明智的方法是考慮在驗證的某些特殊階段設(shè)計原型。即使這樣,從提出測試到理解結(jié)果這一過程也會非常長。
第二個問題更基本。把IP導(dǎo)入到FPGA中,至少需要來自IP開發(fā)人員的主動幫助。通常,這一導(dǎo)出過程本身就是一種設(shè)計,需要來自SoC設(shè)計的資源,從結(jié)構(gòu)上甚至是功能上都會占用最初的IP。有時候,也很難把IP置入到FPGA中。
Nguyen引用了SoC設(shè)計中第三方PCI Express® (PCIe®)內(nèi)核最近的一個例子。內(nèi)核是Gen3 x16實現(xiàn)。但是當(dāng)轉(zhuǎn)譯到FPGA可編程架構(gòu)中時,其空間和速度只能容納一個Gen1 x1內(nèi)核。Nguyen說,使用這一版本會改變設(shè)計中的全部數(shù)據(jù)流。因此,團(tuán)隊決定使用FPGA中固有的硬核PCIe,根本不驗證IP供應(yīng)商的內(nèi)核設(shè)計。因此,SoC團(tuán)隊交付給系統(tǒng)設(shè)計人員的芯片中,至少一個主要的IP內(nèi)核從未在設(shè)計中進(jìn)行過驗證。
測試是另一個問題。正如Silabtech CEO Sujoy Chakravarty所述,“汽車行業(yè)對全覆蓋設(shè)計用于測試的要求到了近乎瘋狂的程度。” IP供應(yīng)商感覺到非常好的一個測試設(shè)計很有可能會被汽車客戶的系統(tǒng)設(shè)計檢查拒絕掉。
這些點提示了重要的警告。您的SoC供應(yīng)商即使使用了硅片成熟的IP,芯片即使經(jīng)過了全面的驗證,仍然可能無法滿足關(guān)鍵汽車應(yīng)用的需求。這是軍事承包商多年以來所面臨的難題,他們嘗試在軍用級系統(tǒng)中采用商用貨架元器件。對于當(dāng)今很多的系統(tǒng)設(shè)計團(tuán)隊,當(dāng)他們試圖把自己的專長應(yīng)用到突然感興趣的汽車市場上時,可能給他們帶來的是令人尷尬的驚喜。
到IoT上去
雖然大部分IoT應(yīng)用不會需要汽車行業(yè)那樣的可靠性和安全標(biāo)準(zhǔn),但I(xiàn)oT會有自己的IP問題。其中很多涉及到IoT必須處理的嚴(yán)格的能耗限制。
圖 2.在IoT邊緣,SoC需要新一類模塊。
越靠近IoT外側(cè)邊緣,越難以獲得能源。墻插電源讓位于微小電池,電池讓位于能源收集裝置。必須要節(jié)能。要考慮低電壓工作,甚至是在0.5-0.4V接近閾值的范圍內(nèi),此時,電路設(shè)計的基本規(guī)則已經(jīng)出現(xiàn)了變化。設(shè)計人員要求實現(xiàn)較長的靜態(tài)時間,期間功耗接近零,周期性的出現(xiàn)微小的活動突發(fā),因此,占空比被拉開了。所有這些策略都會影響SoC開發(fā)人員的IP決定。
與追求汽車級可靠性相似,對低電壓工作的要求也是從代工線開始的,采用新的多種超低電壓工藝和庫。在大會上,設(shè)計工程全球代工線總監(jiān)Gerd Teepe介紹了使用全耗盡絕緣體硅薄膜(FDSoI) 22 nm工藝可調(diào)體偏置技術(shù)來實現(xiàn)0.4 V工作,而且盡量不損失性能。在文章中,Teepe介紹說,22 nm FDSoI器件采用0.4 V供電,功耗只是標(biāo)準(zhǔn)電壓芯片的8%。
工作在這一范圍的FDSoI芯片要求不僅有較大的體偏置,而且還有新的單元庫。在另一篇文章中,這些變化的影響更加清晰,TSMC技術(shù)經(jīng)理Marco Vrouwe介紹了他的團(tuán)隊采用新的16 nm緊湊FinFET (ffc)工藝實現(xiàn)0.4 V工作。Vrouwe說,幾種因素共同起作用。一個是電壓非常靠近閾值,放大了供電電壓變化和工藝變化的影響。另一個是,在這一范圍內(nèi),工藝變化的分布是不對稱的,要求修改時序工具中的算法。
最后,Vrouwe說,需要對TSMC的16 ffc庫進(jìn)行優(yōu)先級分類。某些單元在0.4 V以下時工作的很好。而有些則需要重新設(shè)計,以承受更大的變化。而還有一些單元不能再減小了,因此從低電壓庫中去掉它們。
對于SoC開發(fā)人員,新庫和工藝角帶來了明顯的問題。他們在新環(huán)境中只是使用現(xiàn)有的軟核IP,希望實際能夠綜合到0.4 V的工作電路中? 或者,他們繼續(xù)堅持在新工藝和電壓上進(jìn)行硅片驗證? 芯片開發(fā)人員做出的選擇會對系統(tǒng)設(shè)計人員產(chǎn)生很大的影響。
對節(jié)能的要求也影響了IP集成。例如,如果一個模塊要工作在低電壓下,那么,它會對電源軌的IR壓降非常敏感,有可能產(chǎn)生基底耦合。一般的IP驗證不會發(fā)現(xiàn)這里的問題。據(jù)Silabtech的Chakravarty,IP模塊外部的其他決定也會導(dǎo)致出現(xiàn)故障,特別是硬核IP。如果模塊是電源選通——正如低占空比設(shè)計中的,電源軌上的開關(guān)晶體管能夠與現(xiàn)有IP一起工作嗎? I/O引腳復(fù)用又會如何?
還會要求有全新一類的IP。Olivier Thomas是CEA-LETI的Silicon Impulse公司的項目主管,介紹了他的團(tuán)隊為IoT邊緣遇到的特殊問題而提供的IP。
為應(yīng)對工藝變化越來越大的影響,Silicon Impulse公司開發(fā)了體偏置控制模塊。這種IP監(jiān)視工藝變化、工作電壓、管芯溫度,在某些情況下還有芯片工作期間的時序松弛,動態(tài)調(diào)整電壓和頻率。還有檢測單元、高能耗模塊,在極低占空比突發(fā)情況下能夠高效工作的處理器。Thomas說:“我們的目的是讓功耗在等待周期時降到皮瓦量級,在檢測工作期間降到微瓦量級。”
這些新一類IP是很多IoT端點都需要的。但它們最初還不是很成熟。SoC供應(yīng)商怎樣處理所產(chǎn)生的不確定性會影響IoT系統(tǒng)的性能和可靠性——通常,應(yīng)用專家裝配的系統(tǒng)并不知道芯片設(shè)計人員的選擇。
新一類挑戰(zhàn)
復(fù)雜SoC進(jìn)入輔助駕駛和自動駕駛汽車市場導(dǎo)致在擴(kuò)展溫度范圍、長期可靠性和功能安全上產(chǎn)生了新需求。IoT邊緣要求新的工作電壓、新模式,以及強(qiáng)大的新節(jié)能功能。
所有這些需求都要求SoC設(shè)計人員考慮他們之前并不重視的IP選擇——這些選擇涉及到IP模塊的參數(shù)和側(cè)面通道特性,而不是邏輯功能或者時序。芯片設(shè)計人員的決定會影響SoC所在系統(tǒng)的質(zhì)量,甚至是能否接受SoC。系統(tǒng)設(shè)計人員是時候參與IP決定了。