單片機應(yīng)用系統(tǒng)的可靠性設(shè)計
隨著單片機在國防、金融、工業(yè)控制等重要領(lǐng)域應(yīng)用越來越廣泛,單片機應(yīng)用系統(tǒng)的可靠性越來越成為人們關(guān)注的一個重要課題。單片機應(yīng)用系統(tǒng)的可靠性是由多種因素決定的,大體分為硬件系統(tǒng)可靠性設(shè)計和軟件系統(tǒng)可靠性設(shè)計。
一、硬件系統(tǒng)可靠性設(shè)計
(1)選優(yōu)設(shè)計
在系統(tǒng)硬件設(shè)計和加工時,應(yīng)該選用質(zhì)量好的接插件,設(shè)計好工藝結(jié)構(gòu);選用合格的元器件,進行嚴(yán)格的測試、篩選和老化;設(shè)計時技術(shù)參數(shù)(如負(fù)載)要留有一定的余量或降額使用元器件;提高印制板和組裝的質(zhì)量。
(2)冗余與容錯設(shè)計
保證單片機應(yīng)用系統(tǒng)100%無故障是不可能的。容錯是指當(dāng)系統(tǒng)的某個部件發(fā)生故障時,系統(tǒng)仍能完全正常地工作,即給系統(tǒng)增加容忍故障的能力。為使系統(tǒng)具有容錯能力,必須在系統(tǒng)中增加適當(dāng)?shù)娜哂鄦卧?,以保證當(dāng)某個部件發(fā)生故障時能由冗余部件接替其工作,原部件修復(fù)后再恢復(fù)出錯前的狀態(tài)。硬件冗余設(shè)計可以在元件級、子系統(tǒng)或系統(tǒng)級上進行。例如,在系統(tǒng)級上采用雙機系統(tǒng),兩套系統(tǒng)互為備用。
(3)采用硬件抗干擾措施
來自供電系統(tǒng)以及通過導(dǎo)線傳輸、電磁耦合等產(chǎn)生的電磁干擾信號,是單片機系統(tǒng)工作不穩(wěn)定的重要因素,在系統(tǒng)硬件設(shè)計時必須采取有效的干擾抑制措施。單片機應(yīng)用系統(tǒng)中還常使用系統(tǒng)監(jiān)視電路檢測系統(tǒng)發(fā)生的錯誤或故障,自動報警或使系統(tǒng)自動恢復(fù)正常工作狀態(tài)。如采用電源故障監(jiān)視、看門狗定時器等采用89C51單片機和X25045組成的看門狗電路,X25045硬件連接圖如圖所示。X25045芯片內(nèi)包含有一個看門狗定時器,可通過軟件預(yù)置系統(tǒng)的監(jiān)控時間。在看門狗定時器預(yù)置的時間內(nèi)若沒有總線活動,則X25045將從RESET輸出一個高電平信號,經(jīng)過微分電路C2、R3輸出一個正脈沖,使CPU復(fù)位。如圖1所示電路中,CPU的復(fù)位信號共有3個:上電復(fù)位(C1、R2),人工復(fù)位(S、R1、R2)和Watchdog復(fù)位(C2、R3),通過或門綜合后加到RESET端。C2、R3的時間常數(shù)不必太大,有數(shù)百微秒即可,因為這時CPU的振蕩器已經(jīng)在工作。
看門狗電路的定時時間長短可由具體應(yīng)用程序的循環(huán)周期決定,通常比系統(tǒng)正常工作時最大循環(huán)周期的時間略長即可。編程時,可在軟件的合適地方加一條喂狗指令,使看門狗的定時時間永遠(yuǎn)達(dá)不到預(yù)置時間,系統(tǒng)就不會復(fù)位而正常工作。當(dāng)系統(tǒng)跑飛,用軟件陷阱等別的方法無法捕捉回程序時,則看門狗定時時間很快增長到預(yù)置時間,迫使系統(tǒng)復(fù)位。需要注意的是,在程序正常運行的時候,應(yīng)該在適當(dāng)?shù)牡胤郊右粭l喂狗指令,使系統(tǒng)正常運行時的定時時間達(dá)不到預(yù)置時間。系統(tǒng)就不會復(fù)位。
二、軟件可靠性設(shè)計
單片機應(yīng)用系統(tǒng)的軟件和硬件是緊密相關(guān)的。要使整個系統(tǒng)具有較高的可靠性,除了在盡可能提高硬件可靠性的前提下,軟件的可靠性設(shè)計也是必不可少的,必須從設(shè)計、測試及長期使用等方面來解決軟件可靠性。單片機系統(tǒng)的抗干擾能力是系統(tǒng)可靠性的重要指標(biāo)。由于51單片機的指令系統(tǒng)是復(fù)雜指令集結(jié)構(gòu),致使其抗干擾性能較低,尤其用在工業(yè)控制的場合,如果不增加額外的抗干擾措施,甚至無法正常工作。單片機軟件抗干擾設(shè)計的主要目的就是及時發(fā)現(xiàn)“跑飛”的程序,并及時地將程序拉入正常軌道,主要方法有:指令冗余、軟件“陷阱”、軟件“看門狗”等等。
(1)指令冗余
CPU取指令過程是先取操作碼,再取操作數(shù)。在程序的關(guān)鍵地方人為的插入一些單字節(jié)指令,或?qū)⒂行巫止?jié)指令重寫稱為指令冗余,通常是在雙字節(jié)指令和三字節(jié)指令后插入兩個字節(jié)以上的NOP指令。這樣即使跑飛程序飛到雙字節(jié)指令和三字節(jié)指令操作數(shù)上。由于窄操作指令NOP的存在,避免了后面的指令被錯誤地執(zhí)行,為程序納入正軌做好準(zhǔn)備。此外,對系統(tǒng)流向起重要作用的指令,如RET、RETI、LCALI.、LJMP,JC等,可以在這些指令之后插入兩條NOP指令,可將跑飛程序納入正軌,以確保這些重要指令的執(zhí)行。指令冗余只能使CPU不再將操作數(shù)當(dāng)作操作碼錯誤地執(zhí)行,卻不能主動地將程序的錯誤執(zhí)行方向扭轉(zhuǎn)過來,要想糾止程序的錯誤執(zhí)行方向,就需要下面的技術(shù)。[!--empirenews.page--]
(2)設(shè)計軟件“陷阱”
通常在程序存儲器中未使用的EPROM空間填入窄操作指令NOP,最后再填入一條跳轉(zhuǎn)指令,跳轉(zhuǎn)到跑飛處理程序,或者直接填入指令LJMP 0000H,當(dāng)跑飛程序落到此區(qū)域。即可在執(zhí)行一段空操作后轉(zhuǎn)入正軌。如果未使用的EPROM空間比較大,可以均勻地填入幾條空操作指令和跳轉(zhuǎn)指令,這種幾條空操作指令加一條跳轉(zhuǎn)指令的結(jié)構(gòu)我們稱之為“軟件陷阱”.
軟件陷阱的一般結(jié)構(gòu)為:
NOP
NOP
LJMP FLY
FLY為跑飛處理子程序,如果程序正常執(zhí)行,軟件陷阱部分是永遠(yuǎn)也執(zhí)行不到的,只有在程序跑飛到陷阱里,軟件陷阱會立刻將程序跳轉(zhuǎn)到正常軌道。即使程序沒有跑飛到陷阱里,也可以在程序執(zhí)行一段錯誤操作后遇到一個軟件陷阱,從而轉(zhuǎn)入正軌。除了程序存儲器的空白區(qū)域,程序的數(shù)據(jù)表結(jié)尾也應(yīng)該設(shè)置軟件陷阱,如果數(shù)據(jù)表比較大,應(yīng)該在數(shù)據(jù)表的中間也設(shè)置軟件陷阱,以保證程序跑飛到數(shù)據(jù)區(qū)能及時轉(zhuǎn)入正軌。另外,如果程序存儲器的空間足夠大的話,可以在每兩個子程序中間設(shè) 置一個軟件陷阱。當(dāng)使用的中斷因干擾而開放時,在對應(yīng)的中斷服務(wù)程序中設(shè)置軟件陷阱,能及時捕獲錯誤的中斷。軟件陷阱的數(shù)量要根據(jù)實際受到干擾的情況和程序存儲器的容量來確定,如果太少不能進行有效的跑飛攔截,如果太多又會占用大量的程序存儲器空間。
(3)軟件“看門狗”技術(shù)
跑飛的程序在執(zhí)行一些錯誤操作之后。
經(jīng)常會進入“死循環(huán)”,也就足常說的“死機”.通常采用“軟件看門狗”技術(shù)使程序脫離“死循環(huán)”,軟件“看門狗”技術(shù)的原理是通過不斷檢測程序循環(huán)運行時間,若發(fā)現(xiàn)程序循環(huán)時間超過最大循環(huán)運行時間,則認(rèn)為系統(tǒng)陷入“死循環(huán)”,需要進行出錯處理。在實際應(yīng)用中,通常用定時中斷服務(wù)程序定時地檢查主程序的運行情況。例如,在RAM區(qū)選擇一個字節(jié)作為軟件看門狗寄存器,主程序每循環(huán)一次將該寄存器加l,定時器TO的中斷服務(wù)程序每中斷一次將該寄存器減l并檢查一次,如果程序執(zhí)行正常??撮T狗寄存器不會改變或改變不大,如果看門狗寄存器發(fā)生了改變或改變很大,則說明系統(tǒng)陷入“死循環(huán)”.需要進行出錯處理。在工業(yè)應(yīng)用中,嚴(yán)重的干擾有時會破壞中斷方式控制字,關(guān)閉中斷,造成看門狗失效,這時可以采用環(huán)形中斷監(jiān)視系統(tǒng)。用定時器TO監(jiān)視定時器Tl,用定時器Tl監(jiān)視豐程序,主程序監(jiān)視定時器T0.
采用這種環(huán)形結(jié)構(gòu)的軟件“看門狗”具有良好的抗干擾性能,大大提高了系統(tǒng)可靠性。對于需經(jīng)常使用Tl定時器進行串口通訊的測控系統(tǒng),則定時器Tl不能進行中斷,可改由串口中斷進行監(jiān)控。當(dāng)然,對主程序最大循環(huán)周期、定時器T0和Tl定時周期應(yīng)于全盤合理考慮。軟件“看門狗”技術(shù)需要使用定時器,而在大多數(shù)的控制程序中,定時器都是緊俏的資源。這就使“軟件看門狗”技術(shù)的實際應(yīng)用受到了限制,我們可以采取一些技巧性的處理,將軟件“看門狗”程序與其它定時程序復(fù)用同一個定時器,這樣既完成定時功能又完成軟件“看門狗”的功能。
(4)檢查RAM區(qū)標(biāo)志數(shù)據(jù)及時發(fā)現(xiàn)嚴(yán)重干擾
這種方法是在RAM區(qū)中選擇幾個固定單元,在初始化程序中將其設(shè)置成固定的數(shù)據(jù),只要程序正常運行,這些單元的內(nèi)容是不會改變的。如果因為程序“跑飛”或其它干擾導(dǎo)致這些RAM單元中的任何單元的數(shù)據(jù)發(fā)生了變化,說明單片機系統(tǒng)已經(jīng)受到了嚴(yán)重的干擾,不能可靠地運行下去了。我們可以在程序執(zhí)行的過程中適時地檢查這些RAM單元的內(nèi)容,一旦發(fā)現(xiàn)有數(shù)據(jù)改變,立刻執(zhí)行LJMP 0000 H語句,強制單片機復(fù)位。
(5)刷新輸出端口
排除嚴(yán)重干擾,當(dāng)單片機系統(tǒng)受到嚴(yán)重干擾時,輸出端口的狀態(tài)也可能因干擾而改變,在程序的執(zhí)行過程中適時地根據(jù)相關(guān)程序模塊的運算結(jié)果刷新輸出端口,可以排除干擾對輸出端口狀態(tài)的影響,使錯誤的輸出狀態(tài)及時得到糾正。
(6)進行多次輸入采樣
避免嚴(yán)重干擾,強烈的干擾會影響單片機的輸入信號,造成輸入信號瞬間采樣的誤差或誤讀,要避免干擾的影響,通常采取重復(fù)采樣,加權(quán)平均的方法。
三、結(jié)束語
單片機系統(tǒng)運行的可靠性會不確定因素的干擾。提高單片機應(yīng)用系統(tǒng)的可靠性要從軟硬件入手。提高系統(tǒng)的自身防御行為,以上所提到幾種提高可靠性的方法,都不是單獨使用的,只有根據(jù)實際情況將這些方法有效地結(jié)合起來,才能達(dá)到最佳抗干擾效果,使我們的單片機系統(tǒng)穩(wěn)定可靠地工作。