價(jià)值20萬美金的航天CPU,使用的還是98年的架構(gòu)?
近期全球掀起一陣火星熱。美國太空總署(NASA)毅力號(hào)成功登陸火星,并公布火星照片后,更引起全球矚目。不過如此先進(jìn)的太空探測(cè)任務(wù)背后,毅力號(hào)使用的卻是20多年前技術(shù)的處理器,經(jīng)過產(chǎn)品任務(wù)強(qiáng)化與優(yōu)化后,成為本次任務(wù)成功的重要推手。
首先毅力號(hào)火星探測(cè)器搭載的機(jī)智號(hào)火星直升機(jī),它使用的是民用、消費(fèi)級(jí)芯片組高通驍龍 801處理器。這款處理器發(fā)布時(shí)間是2014年,與當(dāng)前高通驍龍888處理器相比已經(jīng)非常落后。然而毅力號(hào)使用的更是1998年生產(chǎn)的PowerPC 750處理器,那為什么毅力號(hào)會(huì)選用20多年前技術(shù)的處理器呢?
外媒報(bào)道,毅力號(hào)搭載的處理器型號(hào)為PowerPC 750 處理器,與1998年蘋果出品的iMac G3 電腦同款,對(duì)比蘋果最近推出的M1 ARM 架構(gòu)處理器擁有最高主頻3.2GHz,晶體管數(shù)量達(dá)160 億個(gè),PowerPC 750 處理器最高主頻速度僅233MHz,且晶體管數(shù)量也只有600 萬個(gè),但單價(jià)仍高達(dá)20 萬美元(約130萬元)。
報(bào)道解釋,毅力號(hào)的PowerPC 750 處理器單價(jià)會(huì)如此昂貴,,并非因?yàn)樾阅艹瑥?qiáng)大,而是必須應(yīng)對(duì)未知的太空環(huán)境,因此對(duì)處理器進(jìn)行抗輻射、耐寒冷功能等強(qiáng)化,美國航空航天局花費(fèi)20萬美元由BAE系統(tǒng)公司進(jìn)行定制生產(chǎn)。
此處理器雖然架構(gòu)依舊,但結(jié)構(gòu)強(qiáng)化與優(yōu)化,導(dǎo)致價(jià)格昂貴,也非量產(chǎn)型處理器。它是由BAE Systems使用0.25或0.15um工藝制造的,管芯面積為130mm2。CPU本身可以承受200,000至1,000,000 Rads,溫度范圍為?55至125°C。
報(bào)道進(jìn)一步指出,NASA 之所以選擇舊架構(gòu)處理器的原因,在于舊架構(gòu)處理器運(yùn)作可靠度更成熟。因毅力號(hào)火星探測(cè)器較特殊,需要長(zhǎng)時(shí)間穩(wěn)定運(yùn)行,因此執(zhí)行主頻速度成其次,且毅力號(hào)一般運(yùn)作并不需要太強(qiáng)大的運(yùn)算能力。故就需求來說,舊架構(gòu)PowerPC 750 處理器完全可以勝任。
而機(jī)智號(hào)火星直升機(jī)使用的驍龍?zhí)幚砥鞒杀鞠鄬?duì)來說比較低,因?yàn)樵撝鄙龣C(jī)只會(huì)進(jìn)行簡(jiǎn)單的任務(wù)不參與重要任務(wù)。再加上保暖系統(tǒng)后機(jī)智號(hào)可以讓處理器保持在特定的溫度中,這樣不必花費(fèi)太多錢進(jìn)行定制又不至于太容易損壞。
實(shí)際上,航天級(jí)的芯片價(jià)格一直是非常嚇人的。 美國Xilinx有一款宇航級(jí)FPGA,號(hào)稱具有10級(jí)抗輻射性能,屬于全球最機(jī)密的芯片之一。江湖傳言,這顆芯片的價(jià)格超過500萬元。
以下榜單芯片,堪稱芯片極品中的王中王;當(dāng)然,由于筆者水平和眼界所限,榜單僅供參考,不過價(jià)格基本靠譜哦!
1、XQR5VFX130-1CF1752V
品牌:XILINX 封裝:BGA 用途:宇航級(jí)/抗輻射 外形尺寸:裸片mm價(jià)格:》120萬 說明:原廠的價(jià)格為3-4萬美元,有供應(yīng)商報(bào)價(jià)400萬人民幣,但是據(jù)說都沒有辦法供貨。
2、XQR4VSX55-10CF1140V
品牌:XILINX 封裝:CLCC 用途:宇航級(jí)/抗輻射 價(jià)格:》50萬 說明:原廠的價(jià)格為2.5萬美元左右,現(xiàn)在的市場(chǎng)價(jià)格基本上翻了3-10倍左右,有人愿意出130萬以上的買價(jià),可見芯片的不菲價(jià)值。
3、XQR2V6000-4CF1144H
品牌:XILINX 封裝:BGA 類型:宇航級(jí)/抗輻射 價(jià)格:》80萬 說明:原廠的價(jià)格為2-3萬美元,中國渠道市場(chǎng)報(bào)價(jià)大約在100萬人民幣左右,據(jù)說中國只有一個(gè)孤品了。
4、AT697F-KG-E
品牌:Atme l封裝:MQFP256 用途:宇航級(jí)/抗輻射 性能:86MIPS(Dhrystone的2.1) 消耗功率:1W在100MHz 價(jià)格:》60萬 單元架構(gòu):SPARCV8高性能低功耗的32位體系結(jié)構(gòu) 說明:原廠報(bào)價(jià)在2-3萬美元,市場(chǎng)報(bào)價(jià)在50-70萬元之間。
5、TSC695F
品牌:Atmel 封裝:MQFP256 類型:宇航級(jí)CPU 外形尺寸:裸模 核心功耗:1.0W典型值 價(jià)格:》45萬 單元架構(gòu):SPARCV7高性能RISC架構(gòu)整數(shù)單元 性能:20MIPS/5MFLOPS(雙精度),在系統(tǒng)時(shí)鐘為25MHz 質(zhì)量等級(jí):ESCC與9512/003和QML-Q或V帶5962-00540 說明:原廠報(bào)價(jià)在2萬美元左右,市場(chǎng)報(bào)價(jià)在6-8萬美元。
宇航級(jí)芯片是航天航空電子裝備的心臟,宇航級(jí)芯片必須具備抗輻照特性,其身價(jià)往往是我們生活中常見的消費(fèi)級(jí)芯片的數(shù)十倍,甚至成百上千倍。那么,與消費(fèi)級(jí)芯片相比,這些昂貴的宇航級(jí)芯片在設(shè)計(jì)階段有什么特別之處呢?知乎用戶@Forever snow 作出了詳細(xì)的解答 。
1.宇航級(jí)芯片所處的空間環(huán)境
在航天器運(yùn)行的空間環(huán)境中,存在著大量的高能粒子和宇宙射線。這些粒子和射線會(huì)穿透航天器屏蔽層,與元器件的材料相互作用產(chǎn)生輻射效應(yīng),引起器件性能退化或功能異常,影響航天器的在軌安全。引起器件輻射效應(yīng)的主要空間輻射源包括地球輻射帶、銀河宇宙射線、太陽宇宙線和人工輻射。
其中,對(duì)芯片工作影響最為嚴(yán)重的輻射效應(yīng)當(dāng)屬“單粒子效應(yīng)”。
據(jù)數(shù)據(jù)統(tǒng)計(jì),從 1971 年到 1986 年間,國外發(fā)射的 39 顆同步衛(wèi)星共發(fā)生了 1589 次故障,有 1129 次故障與空間輻射有關(guān),且其中的 621 次故障是由于單粒子效應(yīng)導(dǎo)致的。這些統(tǒng)計(jì)數(shù)據(jù)說明了航天應(yīng)用中電子器件的主要故障來自于空間輻射,而單粒子效應(yīng)導(dǎo)致的故障在其中占較大比重。
這些故障中,部分是永久性不可逆的,如發(fā)生單粒子鎖定導(dǎo)致芯片內(nèi)部局部短路從而產(chǎn)生大電流燒毀器件。針對(duì)此類錯(cuò)誤可以應(yīng)用一些特定工藝或器件庫來避免。而太空中大部分錯(cuò)誤是由于半導(dǎo)體器件的邏輯狀態(tài)跳變而導(dǎo)致的可恢復(fù)的錯(cuò)誤,如單粒子翻轉(zhuǎn)導(dǎo)致存儲(chǔ)器存儲(chǔ)內(nèi)容錯(cuò)誤。
單粒子翻轉(zhuǎn)(Single-Event Upsets,SEU)指的是元器件受輻照影響引起電位狀態(tài)的跳變,“0”變成“1”,或者“1”變成“0”,但一般不會(huì)造成器件的物理性損傷。正因?yàn)椤皢瘟W臃D(zhuǎn)”頻繁出現(xiàn),因此在芯片設(shè)計(jì)階段需要重點(diǎn)關(guān)注。這也是這篇文章的重點(diǎn)。
2.在芯片設(shè)計(jì)階段如何防護(hù)“單粒子翻轉(zhuǎn)”
(1) 選擇合適的工藝制程
在航天領(lǐng)域,并不是工藝制程越小越好。通常來講,工藝制程越小,抗輻照能力越差。因此,為了確??煽啃裕话銜?huì)選擇較大線寬的制程,比如0.18um、90nm、65nm等,而不會(huì)一味追求摩爾定律的前沿制程。
(2)加固標(biāo)準(zhǔn)單元工藝庫
標(biāo)準(zhǔn)單元工藝庫是數(shù)字芯片的基石。如果把數(shù)字芯片看做一個(gè)建筑,標(biāo)準(zhǔn)單元工藝庫就是構(gòu)成建筑的磚塊。標(biāo)準(zhǔn)單元工藝庫包括反相器、與門、寄存器、選擇器、全加器等多種基本單元,每一個(gè)標(biāo)準(zhǔn)單元對(duì)應(yīng)著多個(gè)不同尺寸(W/L)、不同驅(qū)動(dòng)能力的單元電路,基于這些基本單元即可構(gòu)成復(fù)雜的數(shù)字芯片。
鑒于數(shù)字芯片的超大規(guī)模,已經(jīng)很難通過全定制電路結(jié)構(gòu)的方式來設(shè)計(jì),而直接對(duì)商用工藝庫進(jìn)行加固則是設(shè)計(jì)成本最低的選擇。在制造廠商提供的標(biāo)準(zhǔn)單元庫基礎(chǔ)上結(jié)合抗輻照加固措施,使設(shè)計(jì)出來的輸入輸出單元庫具有抗輻照能力。加固之后的工藝庫需要晶圓廠流片驗(yàn)證。
(3)設(shè)計(jì)冗余化
在抗輻照加固方法中,三模冗余(TMR)是最具有代表的容錯(cuò)機(jī)制。同一時(shí)間三個(gè)功能相同的模塊分別執(zhí)行一樣的操作,鑒于單粒子翻轉(zhuǎn)瞬時(shí)僅能打翻1路,“三選二”的投票器將會(huì)選出其余兩路的正確結(jié)果,增強(qiáng)電路系統(tǒng)的可靠性。三模冗余最顯著優(yōu)點(diǎn)是糾錯(cuò)能力強(qiáng),且設(shè)計(jì)簡(jiǎn)單,大大提高電路可靠性;但缺點(diǎn)也是顯而易見,會(huì)將電路增大3倍以上。TMR的方法較為靈活,可根據(jù)性能需求在寄存器級(jí)、電路級(jí)、模塊級(jí)等任意層次設(shè)計(jì)TMR,部分EDA工具也可自動(dòng)插入。
錯(cuò)誤檢測(cè)與糾正電路(Error Detection And Correction,EDAC)也是一種簡(jiǎn)單高效的防護(hù)單粒子翻轉(zhuǎn)的電路設(shè)計(jì)方法。EDAC 主要依據(jù)檢錯(cuò)、糾錯(cuò)的原理,通過轉(zhuǎn)換電路將寫入的數(shù)據(jù)生成校驗(yàn)碼并保存,當(dāng)讀出時(shí)靠對(duì)校驗(yàn)碼進(jìn)行判定,若只有一位出錯(cuò)系統(tǒng)則自動(dòng)糾正并將正確的數(shù)據(jù)輸出,同時(shí)還會(huì)進(jìn)行數(shù)據(jù)的回寫從而覆蓋原來出錯(cuò)的數(shù)據(jù)。EDAC盡管糾錯(cuò)能力強(qiáng)大,但是需要糾錯(cuò)、譯碼電路,因此結(jié)構(gòu)較為復(fù)雜,不適宜用于高性能的數(shù)據(jù)通道中
EDAC也可用于糾正多bit出錯(cuò)的情況,但是糾錯(cuò)電路會(huì)更加復(fù)雜。
權(quán)衡TMR和EDAC的優(yōu)缺點(diǎn),通常會(huì)在邏輯電路設(shè)計(jì)中使用TMR,在存儲(chǔ)器讀寫電路中使用EDAC。
(4)模塊獨(dú)立化
單粒子翻轉(zhuǎn)頻繁出現(xiàn),必須考慮到翻轉(zhuǎn)發(fā)生之后不影響芯片的整體功能。因此,在架構(gòu)設(shè)計(jì)中需要盡可能確保模塊之間保持較強(qiáng)的獨(dú)立性,盡可能具備獨(dú)立的復(fù)位功能,使得在單粒子打翻信號(hào)值之后,一方面出錯(cuò)電路能夠盡快通過復(fù)位信號(hào)恢復(fù)正常;另一方面,確保其他正常工作的模塊不受影響。此外,還需增加異常檢測(cè)電路,發(fā)現(xiàn)異常即可對(duì)電路進(jìn)行復(fù)位。
雖然上述方法可以很好地防護(hù)單粒子翻轉(zhuǎn)效應(yīng),但是也給邏輯綜合、布局布線帶來很多困擾,在芯片物理實(shí)現(xiàn)過程中需要小心謹(jǐn)慎應(yīng)對(duì)。除上述方法外,還可引入Muller C單元、雙互鎖存儲(chǔ)單元結(jié)構(gòu)(DICE)對(duì)晶體管級(jí)電路進(jìn)行防護(hù),也可在版圖階段使用環(huán)形柵替換條形柵。
為何毅力號(hào)繼續(xù)使用主頻僅有233MHz的PowerPC 750處理器?網(wǎng)友認(rèn)為233MHz已經(jīng)足夠飛行控制部分,這也是最重要的部分。而多媒體、通信肯定用的高端cpu,多系統(tǒng)備份。復(fù)雜度越高可靠性是下降的,航天器主要考慮的還是可靠性問題,芯片性能并非第一位,輻射是航天級(jí)芯片需要面臨的最重要問題。那么,你認(rèn)為如何呢?
▍航天器中的宇航級(jí)芯片設(shè)計(jì)有什么特別之處?
▍總結(jié)
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問題,請(qǐng)聯(lián)系我們,謝謝!