宇宙射線對汽車電子系統(tǒng)的損傷分析
設(shè)想一下:如果你驅(qū)車以每小時75英里的速度在高速公路上疾馳,一邊駕駛著2006才購買的新車,一邊欣賞著Steve Miller的Greatest Hits樂曲。突然間,引擎管理系統(tǒng)或穩(wěn)定控制系統(tǒng)失效。
如果出現(xiàn)這一幕,您不僅僅可能會遭遇嚴重或可能是致命的車禍,而且車廠也可能被毀譽一旦,假設(shè)類似情況不止你一個的話。
隨著汽車從純機械設(shè)備向現(xiàn)代高度集成的線控駕駛汽車電子系統(tǒng)發(fā)展,設(shè)計工程現(xiàn)在面臨越來越多的挑戰(zhàn)。它們必須持續(xù)把復(fù)雜的電子設(shè)備添加到每一個后續(xù)車型年,與此同時,仍然要維持高標(biāo)準(zhǔn)的品質(zhì)和可靠性,并滿足嚴格的低成本和大批量生產(chǎn)的要求。
傳統(tǒng)上,這些開發(fā)商一直采用微控制器(MCU)、ASIC和碩大的線束來實現(xiàn)和控制這些系統(tǒng)并擴展每一代汽車的性能。目前,這些技術(shù)已經(jīng)逼近了它們的極限,并因復(fù)雜性呈指數(shù)增長而引發(fā)了對可靠性問題的關(guān)注。為了解決這些問題,許多設(shè)計工程師正在轉(zhuǎn)向采用FPGA作為下一代汽車電子設(shè)計的靈活和低成本的解決方案。
太空射線引發(fā)的故障
為了確保現(xiàn)代汽車中各種系統(tǒng)的功能運轉(zhuǎn)正常,必須對元器件提出可靠性數(shù)據(jù)的要求。雖然人們掌握元器件可靠性的大部分原理,但是,在選擇可編程邏輯器件如FPGA的過程中,要把一些獨特的問題納入應(yīng)該考慮的因素。
明確地說,技術(shù)決策人要預(yù)見到將影響可編程邏輯系統(tǒng)的故障源。雖然來自太空(宇宙射線)的中子轟擊的概念聽起來就像蹦出Star Trek的插曲,中子導(dǎo)致的錯誤現(xiàn)實上對許多類型的電子設(shè)備都有危害。
中子導(dǎo)致的固件錯誤(firm error)已經(jīng)從一件麻煩事變?yōu)橹卮髥栴}。例如,如果中子導(dǎo)致基于SRAM(基于靜態(tài))的FPGA的(以下簡稱:SRAM FPGA)配置單元被擾亂,就可能導(dǎo)致功能喪失。如果出現(xiàn)這種情況,它就可能造成主系統(tǒng)失常。展望未來,這種問題將更為嚴重,因為將來的深亞微米制造工藝將持續(xù)為基于FPGA的汽車電子系統(tǒng)的設(shè)計工程師帶來實實在在的挑戰(zhàn)。
在集成電路內(nèi)部由中子造成的單事件擾亂(SEU)可能在各種類型非易失性存儲單元中都會出現(xiàn)。上述SRAM FPGA采用內(nèi)部存儲單元來保持FPGA的配置狀態(tài)或(個性)。這些存儲器單元面對更為嚴重的可靠性威脅。當(dāng)內(nèi)容被改變的時候,它被稱為“軟錯誤”,因為是數(shù)據(jù)錯誤,而功能不受影響。雖然該器件可以采用校正數(shù)據(jù)成功地重新寫入,對SRAM數(shù)據(jù)和寄存器可以分別采用EDAC(錯誤檢測和校正)或TMR(隧道磁阻)。軟錯誤可能導(dǎo)致數(shù)據(jù)丟失或“系統(tǒng)出現(xiàn)意外故障”。
如果SRAM FPGA配置存儲器單元受到破壞,那就稱為“固件錯誤”,因為這些錯誤不易檢測或校正并且本質(zhì)上不是瞬時現(xiàn)象。一旦在FPGA中出現(xiàn)固件錯誤,必須采用初始配置對該器件進行重新載入。在一些情況下,必須重新上電以清除故障,然后,重新配置。
這些配置單元中,只要有一個遭遇中子導(dǎo)致的SEU,后果都是嚴重的。如果配置為被擾亂并改變狀態(tài),它可能會改變整個器件的功能,導(dǎo)致重大數(shù)據(jù)崩潰或向系統(tǒng)中的其它電路發(fā)送虛假的信號。在極端情況下,如果固件錯誤長期未被檢測到其存在,那么,就能變成“硬故障(hard errors)”并對器件本身或包含該器件的系統(tǒng)造成破壞。這類問題的常見例子是:中子導(dǎo)致的穩(wěn)故障把信號導(dǎo)向錯誤的路徑,從而造成短路。
對于采用SRAM FPGA的、執(zhí)行重要任務(wù)的汽車電子應(yīng)用系統(tǒng),中子導(dǎo)致的錯誤有著重要的影響?,F(xiàn)有的檢測技術(shù),每隔一定間隔讀回FPGA的配置,對防止系統(tǒng)內(nèi)的錯誤毫無幫助。
此外,能夠檢測受破壞配置的讀回電路本身就易于遭受SEU或破壞。進一步說,在檢查汽車系統(tǒng)抗中子導(dǎo)致的錯誤中,隨著易受影響的FPGA技術(shù)的廣泛應(yīng)用,人們要求把創(chuàng)新的質(zhì)量認證體系添加到AEC-Q100標(biāo)準(zhǔn)之中,以補充JEDEC標(biāo)準(zhǔn) 89的不足。當(dāng)前檢測和校正FPGA固件錯誤的方案增加了系統(tǒng)設(shè)計的額外復(fù)雜性,并增加了電路板的大小和物料的成本,從而增加了發(fā)現(xiàn)中子導(dǎo)致的錯誤的“成本”。
中子導(dǎo)致的固件錯誤可能對整個系統(tǒng)按時間計算的故障(FIT)率影響很大。由于難以檢測和幾乎不可能診斷,軟和穩(wěn)故障可能引發(fā)維護和服務(wù)問題,從而有可能造成擔(dān)保費用攀升。在三種主流FPGA技術(shù)