單片機(jī)應(yīng)用系統(tǒng)的可靠性設(shè)計(jì)
掃描二維碼
隨時(shí)隨地手機(jī)看文章
隨著單片機(jī)在國防、金融、工業(yè)控制等重要領(lǐng)域應(yīng)用越來越廣泛,單片機(jī)應(yīng)用系統(tǒng)的可靠性越來越成為人們關(guān)注的一個(gè)重要課題。單片機(jī)應(yīng)用系統(tǒng)的可靠性是由多種因素決定的,大體分為硬件系統(tǒng)可靠性設(shè)計(jì)和軟件系統(tǒng)可靠性設(shè)計(jì)。
一、硬件系統(tǒng)可靠性設(shè)計(jì)
(1)選優(yōu)設(shè)計(jì)
在系統(tǒng)硬件設(shè)計(jì)和加工時(shí),應(yīng)該選用質(zhì)量好的接插件,設(shè)計(jì)好工藝結(jié)構(gòu);選用合格的元器件,進(jìn)行嚴(yán)格的測試、篩選和老化;設(shè)計(jì)時(shí)技術(shù)參數(shù)(如負(fù)載)要留有一定的余量或降額使用元器件;提高印制板和組裝的質(zhì)量。
(2)冗余與容錯(cuò)設(shè)計(jì)
保證單片機(jī)應(yīng)用系統(tǒng)100%無故障是不可能的。容錯(cuò)是指當(dāng)系統(tǒng)的某個(gè)部件發(fā)生故障時(shí),系統(tǒng)仍能完全正常地工作,即給系統(tǒng)增加容忍故障的能力。為使系統(tǒng)具有容錯(cuò)能力,必須在系統(tǒng)中增加適當(dāng)?shù)娜哂鄦卧?,以保證當(dāng)某個(gè)部件發(fā)生故障時(shí)能由冗余部件接替其工作,原部件修復(fù)后再恢復(fù)出錯(cuò)前的狀態(tài)。硬件冗余設(shè)計(jì)可以在元件級(jí)、子系統(tǒng)或系統(tǒng)級(jí)上進(jìn)行。例如,在系統(tǒng)級(jí)上采用雙機(jī)系統(tǒng),兩套系統(tǒng)互為備用。
(3)采用硬件抗干擾措施
來自供電系統(tǒng)以及通過導(dǎo)線傳輸、電磁耦合等產(chǎn)生的電磁干擾信號(hào),是單片機(jī)系統(tǒng)工作不穩(wěn)定的重要因素,在系統(tǒng)硬件設(shè)計(jì)時(shí)必須采取有效的干擾抑制措施。單片機(jī)應(yīng)用系統(tǒng)中還常使用系統(tǒng)監(jiān)視電路檢測系統(tǒng)發(fā)生的錯(cuò)誤或故障,自動(dòng)報(bào)警或使系統(tǒng)自動(dòng)恢復(fù)正常工作狀態(tài)。如采用電源故障監(jiān)視、看門狗定時(shí)器等采用89C51單片機(jī)和X25045組成的看門狗電路,X25045硬件連接圖如圖所示。X25045芯片內(nèi)包含有一個(gè)看門狗定時(shí)器,可通過軟件預(yù)置系統(tǒng)的監(jiān)控時(shí)間。在看門狗定時(shí)器預(yù)置的時(shí)間內(nèi)若沒有總線活動(dòng),則X25045將從RESET輸出一個(gè)高電平信號(hào),經(jīng)過微分電路C2、R3輸出一個(gè)正脈沖,使CPU復(fù)位。如圖1所示電路中,CPU的復(fù)位信號(hào)共有3個(gè):上電復(fù)位(C1、R2),人工復(fù)位(S、R1、R2)和Watchdog復(fù)位(C2、R3),通過或門綜合后加到RESET端。C2、R3的時(shí)間常數(shù)不必太大,有數(shù)百微秒即可,因?yàn)檫@時(shí)CPU的振蕩器已經(jīng)在工作。
看門狗電路的定時(shí)時(shí)間長短可由具體應(yīng)用程序的循環(huán)周期決定,通常比系統(tǒng)正常工作時(shí)最大循環(huán)周期的時(shí)間略長即可。編程時(shí),可在軟件的合適地方加一條喂狗指令,使看門狗的定時(shí)時(shí)間永遠(yuǎn)達(dá)不到預(yù)置時(shí)間,系統(tǒng)就不會(huì)復(fù)位而正常工作。當(dāng)系統(tǒng)跑飛,用軟件陷阱等別的方法無法捕捉回程序時(shí),則看門狗定時(shí)時(shí)間很快增長到預(yù)置時(shí)間,迫使系統(tǒng)復(fù)位。需要注意的是,在程序正常運(yùn)行的時(shí)候,應(yīng)該在適當(dāng)?shù)牡胤郊右粭l喂狗指令,使系統(tǒng)正常運(yùn)行時(shí)的定時(shí)時(shí)間達(dá)不到預(yù)置時(shí)間。系統(tǒng)就不會(huì)復(fù)位。
二、軟件可靠性設(shè)計(jì)
單片機(jī)應(yīng)用系統(tǒng)的軟件和硬件是緊密相關(guān)的。要使整個(gè)系統(tǒng)具有較高的可靠性,除了在盡可能提高硬件可靠性的前提下,軟件的可靠性設(shè)計(jì)也是必不可少的,必須從設(shè)計(jì)、測試及長期使用等方面來解決軟件可靠性。單片機(jī)系統(tǒng)的抗干擾能力是系統(tǒng)可靠性的重要指標(biāo)。由于51單片機(jī)的指令系統(tǒng)是復(fù)雜指令集結(jié)構(gòu),致使其抗干擾性能較低,尤其用在工業(yè)控制的場合,如果不增加額外的抗干擾措施,甚至無法正常工作。單片機(jī)軟件抗干擾設(shè)計(jì)的主要目的就是及時(shí)發(fā)現(xiàn)“跑飛”的程序,并及時(shí)地將程序拉入正常軌道,主要方法有:指令冗余、軟件“陷阱”、軟件“看門狗”等等。
(1)指令冗余
CPU取指令過程是先取操作碼,再取操作數(shù)。在程序的關(guān)鍵地方人為的插入一些單字節(jié)指令,或?qū)⒂行巫止?jié)指令重寫稱為指令冗余,通常是在雙字節(jié)指令和三字節(jié)指令后插入兩個(gè)字節(jié)以上的NOP指令。這樣即使跑飛程序飛到雙字節(jié)指令和三字節(jié)指令操作數(shù)上。由于窄操作指令NOP的存在,避免了后面的指令被錯(cuò)誤地執(zhí)行,為程序納入正軌做好準(zhǔn)備。此外,對系統(tǒng)流向起重要作用的指令,如RET、RETI、LCALI.、LJMP,JC等,可以在這些指令之后插入兩條NOP指令,可將跑飛程序納入正軌,以確保這些重要指令的執(zhí)行。指令冗余只能使CPU不再將操作數(shù)當(dāng)作操作碼錯(cuò)誤地執(zhí)行,卻不能主動(dòng)地將程序的錯(cuò)誤執(zhí)行方向扭轉(zhuǎn)過來,要想糾止程序的錯(cuò)誤執(zhí)行方向,就需要下面的技術(shù)。
(2)設(shè)計(jì)軟件“陷阱”
通常在程序存儲(chǔ)器中未使用的EPROM空間填入窄操作指令NOP,最后再填入一條跳轉(zhuǎn)指令,跳轉(zhuǎn)到跑飛處理程序,或者直接填入指令LJMP 0000H,當(dāng)跑飛程序落到此區(qū)域。即可在執(zhí)行一段空操作后轉(zhuǎn)入正軌。如果未使用的EPROM空間比較大,可以均勻地填入幾條空操作指令和跳轉(zhuǎn)指令,這種幾條空操作指令加一條跳轉(zhuǎn)指令的結(jié)構(gòu)我們稱之為“軟件陷阱”.
軟件陷阱的一般結(jié)構(gòu)為:
NOP
NOP
LJMP FLY
FLY為跑飛處理子程序,如果程序正常執(zhí)行,軟件陷阱部分是永遠(yuǎn)也執(zhí)行不到的,只有在程序跑飛到陷阱里,軟件陷阱會(huì)立刻將程序跳轉(zhuǎn)到正常軌道。即使程序沒有跑飛到陷阱里,也可以在程序執(zhí)行一段錯(cuò)誤操作后遇到一個(gè)軟件陷阱,從而轉(zhuǎn)入正軌。除了程序存儲(chǔ)器的空白區(qū)域,程序的數(shù)據(jù)表結(jié)尾也應(yīng)該設(shè)置軟件陷阱,如果數(shù)據(jù)表比較大,應(yīng)該在數(shù)據(jù)表的中間也設(shè)置軟件陷阱,以保證程序跑飛到數(shù)據(jù)區(qū)能及時(shí)轉(zhuǎn)入正軌。另外,如果程序存儲(chǔ)器的空間足夠大的話,可以在每兩個(gè)子程序中間設(shè) 置一個(gè)軟件陷阱。當(dāng)使用的中斷因干擾而開放時(shí),在對應(yīng)的中斷服務(wù)程序中設(shè)置軟件陷阱,能及時(shí)捕獲錯(cuò)誤的中斷。軟件陷阱的數(shù)量要根據(jù)實(shí)際受到干擾的情況和程序存儲(chǔ)器的容量來確定,如果太少不能進(jìn)行有效的跑飛攔截,如果太多又會(huì)占用大量的程序存儲(chǔ)器空間。
(3)軟件“看門狗”技術(shù)
跑飛的程序在執(zhí)行一些錯(cuò)誤操作之后。
經(jīng)常會(huì)進(jìn)入“死循環(huán)”,也就足常說的“死機(jī)”.通常采用“軟件看門狗”技術(shù)使程序脫離“死循環(huán)”,軟件“看門狗”技術(shù)的原理是通過不斷檢測程序循環(huán)運(yùn)行時(shí)間,若發(fā)現(xiàn)程序循環(huán)時(shí)間超過最大循環(huán)運(yùn)行時(shí)間,則認(rèn)為系統(tǒng)陷入“死循環(huán)”,需要進(jìn)行出錯(cuò)處理。在實(shí)際應(yīng)用中,通常用定時(shí)中斷服務(wù)程序定時(shí)地檢查主程序的運(yùn)行情況。例如,在RAM區(qū)選擇一個(gè)字節(jié)作為軟件看門狗寄存器,主程序每循環(huán)一次將該寄存器加l,定時(shí)器TO的中斷服務(wù)程序每中斷一次將該寄存器減l并檢查一次,如果程序執(zhí)行正常??撮T狗寄存器不會(huì)改變或改變不大,如果看門狗寄存器發(fā)生了改變或改變很大,則說明系統(tǒng)陷入“死循環(huán)”.需要進(jìn)行出錯(cuò)處理。在工業(yè)應(yīng)用中,嚴(yán)重的干擾有時(shí)會(huì)破壞中斷方式控制字,關(guān)閉中斷,造成看門狗失效,這時(shí)可以采用環(huán)形中斷監(jiān)視系統(tǒng)。用定時(shí)器TO監(jiān)視定時(shí)器Tl,用定時(shí)器Tl監(jiān)視豐程序,主程序監(jiān)視定時(shí)器T0.
采用這種環(huán)形結(jié)構(gòu)的軟件“看門狗”具有良好的抗干擾性能,大大提高了系統(tǒng)可靠性。對于需經(jīng)常使用Tl定時(shí)器進(jìn)行串口通訊的測控系統(tǒng),則定時(shí)器Tl不能進(jìn)行中斷,可改由串口中斷進(jìn)行監(jiān)控。當(dāng)然,對主程序最大循環(huán)周期、定時(shí)器T0和Tl定時(shí)周期應(yīng)于全盤合理考慮。軟件“看門狗”技術(shù)需要使用定時(shí)器,而在大多數(shù)的控制程序中,定時(shí)器都是緊俏的資源。這就使“軟件看門狗”技術(shù)的實(shí)際應(yīng)用受到了限制,我們可以采取一些技巧性的處理,將軟件“看門狗”程序與其它定時(shí)程序復(fù)用同一個(gè)定時(shí)器,這樣既完成定時(shí)功能又完成軟件“看門狗”的功能。
(4)檢查RAM區(qū)標(biāo)志數(shù)據(jù)及時(shí)發(fā)現(xiàn)嚴(yán)重干擾
這種方法是在RAM區(qū)中選擇幾個(gè)固定單元,在初始化程序中將其設(shè)置成固定的數(shù)據(jù),只要程序正常運(yùn)行,這些單元的內(nèi)容是不會(huì)改變的。如果因?yàn)槌绦?ldquo;跑飛”或其它干擾導(dǎo)致這些RAM單元中的任何單元的數(shù)據(jù)發(fā)生了變化,說明單片機(jī)系統(tǒng)已經(jīng)受到了嚴(yán)重的干擾,不能可靠地運(yùn)行下去了。我們可以在程序執(zhí)行的過程中適時(shí)地檢查這些RAM單元的內(nèi)容,一旦發(fā)現(xiàn)有數(shù)據(jù)改變,立刻執(zhí)行LJMP 0000 H語句,強(qiáng)制單片機(jī)復(fù)位。
(5)刷新輸出端口
排除嚴(yán)重干擾,當(dāng)單片機(jī)系統(tǒng)受到嚴(yán)重干擾時(shí),輸出端口的狀態(tài)也可能因干擾而改變,在程序的執(zhí)行過程中適時(shí)地根據(jù)相關(guān)程序模塊的運(yùn)算結(jié)果刷新輸出端口,可以排除干擾對輸出端口狀態(tài)的影響,使錯(cuò)誤的輸出狀態(tài)及時(shí)得到糾正。
(6)進(jìn)行多次輸入采樣
避免嚴(yán)重干擾,強(qiáng)烈的干擾會(huì)影響單片機(jī)的輸入信號(hào),造成輸入信號(hào)瞬間采樣的誤差或誤讀,要避免干擾的影響,通常采取重復(fù)采樣,加權(quán)平均的方法。
三、結(jié)束語
單片機(jī)系統(tǒng)運(yùn)行的可靠性會(huì)不確定因素的干擾。提高單片機(jī)應(yīng)用系統(tǒng)的可靠性要從軟硬件入手。提高系統(tǒng)的自身防御行為,以上所提到幾種提高可靠性的方法,都不是單獨(dú)使用的,只有根據(jù)實(shí)際情況將這些方法有效地結(jié)合起來,才能達(dá)到最佳抗干擾效果,使我們的單片機(jī)系統(tǒng)穩(wěn)定可靠地工作。