高可靠并行星載計算機軟件容錯技術(shù)研究
引言
星載計算機的研究方向是高性能、重量輕和體積小并具 有低功耗和信息自主容錯功能,這種高可靠的計算機軟件容錯 技術(shù)方向的研究。本文針對星載計算機軟件容錯技術(shù)與系統(tǒng)的 可靠性的關(guān)鍵技術(shù)做簡單的概括。
1傳統(tǒng)的計算機軟件容錯技術(shù)
傳統(tǒng)的計算機軟件容錯技術(shù)需要具有多樣性的冗余解決 計算機軟件本身發(fā)生的故障問題,技術(shù)的核心是完成某功能 而可能的多種方法,這些方法如果同時能夠?qū)崿F(xiàn),對實現(xiàn)的 這些功能開始同樣的輸入,輸出時使用表決的機制進(jìn)行判斷, 輸出的正確性或者是可以接受的結(jié)果,這就能達(dá)成容錯的根 本目的。
多樣性的技術(shù),多版本的支持一般來說會采用比較簡單 的方法,但同時,也會為軟件系統(tǒng)增加負(fù)載,負(fù)載會使任務(wù)響 應(yīng)速度變慢,花費很大的代價解決故障,最后得出的容錯效 果卻并不理想,尤其對高可靠并行星載計算機系統(tǒng),并不能 提出更好的環(huán)境適應(yīng)性。
2星載計算機概述
星載計算機具有重量輕、造價低、研制時間短和體積小 靈活發(fā)射的優(yōu)點。同時,由于星載計算機的體積和重量都有 嚴(yán)格的數(shù)據(jù)要求,星載計算機系統(tǒng)就需要具有強大的集成功 能。由于并行星載計算機的運行空間的特殊性,宇宙空間具 有一定的輻射問題,使星載計算機系統(tǒng)發(fā)生故障,發(fā)生故障后, 如果不能及時修復(fù),會損壞元器件,使星載計算機系統(tǒng)發(fā)生 癱瘓。
要克服宇宙空間的惡劣環(huán)境,提高星載計算機使用的高 可靠性,要注意三個方面的問題。第一、星載計算機多采用抗 輻射元器件;第二、星載計算機可進(jìn)行外置的屏蔽措施;第 三、星載計算機注意應(yīng)用容錯技術(shù)實現(xiàn)對系統(tǒng)的改善。其中 第一和第二點實現(xiàn)起來造價高,并不符合星載計算機“快、省、 好”的基本原則。而應(yīng)用第三種方法,既可以解決星載計算 機在惡劣環(huán)境下容易出故障的問題,又可以使星載計算機軟件 的應(yīng)用系統(tǒng)提高使用的高可靠性。星載計算機的系統(tǒng)靈活性 高,應(yīng)用冗余的計算機結(jié)構(gòu)容錯技術(shù)使星載計算機實現(xiàn)穩(wěn)定 可靠的運行。下面為大家介紹一種星載計算機軟件容錯技術(shù), 分析其高可靠性。
3建立星載計算機的高可靠性
星載計算機 CPU-A 由 CPU-a、b、c、d 組成。CPU-a、b、 c加電同時運行,三者輸出結(jié)果應(yīng)該一致,如果不一致就要轉(zhuǎn) 入程序進(jìn)行診斷工作,CPU的哪里出現(xiàn)故障,切除該組件繼 續(xù)運行,再次檢查重構(gòu),三組變成兩組時繼續(xù)運行,如果輸 出結(jié)果仍然不一致,系統(tǒng)不能有效判斷,則將b組與c組也 進(jìn)行切除處理,啟用備用d組,由此系統(tǒng)結(jié)構(gòu)可以得出結(jié)論,a、 b、c三組中,只要有兩組正常工作,星載計算機CPU-A就可 以保持正常的工作,所以要構(gòu)成三選二的系統(tǒng),而d組則與其 它a、b、c三組形成了備份系統(tǒng),保持d組正常狀態(tài),星載計 算機CPU-A就可以保證正常的工作狀態(tài)。d組作為冗余的部 分與a、b、c三組之間形成并行的結(jié)構(gòu),圖1所示為星載計算 機CPU-A的可靠性示意圖。
星載計算機軟件系統(tǒng)CPU-A組與CPU-B組共同工作,互為冗余的備份。當(dāng)CPU-B組出現(xiàn)故障時,CPU-A組就可 以替代CPU-B組工作,同樣的在CPU-A組發(fā)生故障的時 候,CPU-B也可以替代CPU-A進(jìn)行正常的工作。CPU-A組與 CPU-B組是并行相聯(lián)的結(jié)構(gòu)??偩€SSB適配器看起來發(fā)生故 障單點,由于內(nèi)部存在的冗余系統(tǒng),所以具有十分強大的可靠 性,可以將整體與其它部件的構(gòu)成看成是串聯(lián)的結(jié)構(gòu)。
計算CPU-A是由CPU-a、b、c三組構(gòu)成的三選二軟件 系統(tǒng),通過三選二的軟件系統(tǒng)進(jìn)行計算,為了方便計算,可 以設(shè)定CPU-a、b、c、d相同的可靠度,Ra=Rb=Rc=R質(zhì)Ri,通 過公式的計算可以得出Rs=3Rt2-2Rt3, CPU-d組與其它三組具 有并聯(lián)關(guān)系。即:
而系統(tǒng)具有的可靠性可以根據(jù)以下公式推算:
4星載計算機軟件的容錯方法
目前,我國星載計算機的容錯方法有硬件冗余、EHW等。 所謂硬件冗余:例如備用替換與三模冗余等,都是采用靜態(tài) 冗余實現(xiàn)的容錯方法,多為顯式的冗余。我國對星空探測的 智能技術(shù)水平取得飛速的發(fā)展,星載計算機的設(shè)計對航天器 智能與環(huán)境適應(yīng)性都提出了更高的要求,提出新的智能容錯 技術(shù),EHW就是可進(jìn)化的硬件容錯技術(shù)。EHW容錯技術(shù)作 為一種新興的智能動態(tài)容錯方法,利用進(jìn)化的算法進(jìn)行搜索, 實現(xiàn)基本思想的利用,滿足計算機電路的預(yù)期功能進(jìn)行可編 程器件配置。
EHW的容錯技術(shù)是可以實現(xiàn)在線、實時的硬件改變進(jìn)行 故障屏蔽工作,而且還具有十分強大的自主性與環(huán)境適應(yīng)能力, 可以保持長期的無人操作情況下在復(fù)雜的星空環(huán)境進(jìn)行星載 計算機軟件容錯操作。世界各國的研究機構(gòu)都在做EHW的 容錯方法研究,以英國和日本的研究更早,研究更深入。而 美國已把EHW容錯方法設(shè)為重點的研究項目應(yīng)用在航天技術(shù) 領(lǐng)域。目前EHW容錯技術(shù)的研究工作只是處于初級階段,但 每年國際都有EHW的國際學(xué)術(shù)會議進(jìn)行廣泛的交流,我國空 間技術(shù)研究所等多家單位也在對EHW進(jìn)行進(jìn)一步的研究。
5高可靠并行星載計算機軟件容錯技術(shù)結(jié)構(gòu)
EHW容錯技術(shù)應(yīng)用的進(jìn)化算法作為群體算法,使EHW 容錯技術(shù)的結(jié)構(gòu)原理也同為群體并行結(jié)構(gòu)。圖2所示就是容 錯并行進(jìn)化的結(jié)構(gòu)框圖。
圖2中,每個可編程的器件都可以實現(xiàn)星載計算機多個 可編程器件的進(jìn)化使用,進(jìn)化的結(jié)果是配置在一個器件上的 使用,保證一臺計算機的工作,而編程器的進(jìn)化有具體的計 算方法。
計算單元做為初期的種群,而種群的大小可以設(shè)定為N。 將種群中每條染色體進(jìn)行編碼工作,映射在可編程的器件上得 現(xiàn)配置的數(shù)據(jù)結(jié)論,將N條配置的數(shù)據(jù)下載于N個可編程器 件里。運算單元會產(chǎn)生M路的激勵信號,將信號輸入到可編 程器件中,通過電路讀取進(jìn)行評價,如果評價值能夠滿足電 路的應(yīng)用,進(jìn)化就可以順利完成,如果不能滿足電路就要轉(zhuǎn)入 下一個步驟。這個步驟即為下一代種群的結(jié)構(gòu),實現(xiàn)EHW容 錯群體概念,這是一種十分高效的并行星載計算機容錯方法, 但這種結(jié)構(gòu)僅可以作為EHW容錯技術(shù)原理結(jié)構(gòu)存在,實際的 應(yīng)用還是要體現(xiàn)在冗余度過大和硬利實際利用率過低等問題 產(chǎn)生的成本太高,計算機硬件復(fù)雜造成的不實用。
并行結(jié)構(gòu)的冗余度要比傳統(tǒng)的多模冗余大,與傳統(tǒng)多模 冗余容錯比較,并不具有太大的優(yōu)勢,使并行結(jié)構(gòu)的實用性不 強。
通過上面的分析可以得出結(jié)論,容錯技術(shù)大大提高了我 國星載計算機軟件容錯技術(shù)的可靠度,規(guī)定時間內(nèi),可靠度 能夠達(dá)到設(shè)計要求,由此證明,容錯技術(shù)是保證提高星載計 算機軟件高可靠度重要途徑
6結(jié)語
本文通過介紹高可靠并行星載計算機軟件容錯技術(shù),提 出了星載計算機的高可靠度并行等特點,又提出了星載計算機 的容錯方法,通過EHW容錯方法的并行結(jié)構(gòu)分析,提高了星 載計算機軟件容錯技術(shù)可靠度的實行,是適用星載計算機容 錯設(shè)計的結(jié)論。
20211121_619a059529558__高可靠并行星載計算機軟件容錯技術(shù)研究