什么是程序“跑飛”?都由哪些原因引起的
一、程序“跑飛”
前面幾項(xiàng)抗干擾措施都是針對(duì)I/O通道而言的。若干擾信號(hào)還未作用到CPU本身,則CPU還能正確地執(zhí)行各種抗干擾程序;若干擾信號(hào)已經(jīng)通過某種途徑作用到CPU上,則CPU就不能按正常狀態(tài)執(zhí)行程序,從而引起混亂,這就是通常所說的程序“跑飛”。程序“跑飛”后使其恢復(fù)正常最簡(jiǎn)單的方法是讓CPU復(fù)位,讓程序從頭開始重新運(yùn)行。這種方法雖然簡(jiǎn)單,但需要人的參與,而且復(fù)位不及時(shí)。人工復(fù)位一般是在整個(gè)系統(tǒng)已經(jīng)癱瘓,無計(jì)可施的情況下才不得已而為之的。因此在進(jìn)行軟件設(shè)計(jì)時(shí)就要考慮到萬一程序“跑
第9章單片機(jī)系統(tǒng)的抗干擾技術(shù)165
飛”,應(yīng)讓其能夠自動(dòng)恢復(fù)到正常狀態(tài)下運(yùn)行。
二、指令冗余
程序“跑飛”后往往將一些操作數(shù)當(dāng)作指令碼來執(zhí)行,從而引起整個(gè)程序的混亂。采用“指令冗余”是使“跑飛”的程序恢復(fù)正常的一種措施。所謂“指令冗余”,就是在一些關(guān)鍵的地方人為地插入一些單字節(jié)的空操作指令NOP。當(dāng)程序“跑飛”到某條單字節(jié)指令上時(shí),就不會(huì)發(fā)生將操作數(shù)當(dāng)成指令來執(zhí)行的錯(cuò)誤。對(duì)于MCS 51單片機(jī)來說,所有的指令都不會(huì)超過3個(gè)字節(jié),因此在某條指令前面插入兩條NOP指令,則該條指令就不會(huì)被前面沖下來的失控程序拆散,而會(huì)得到正確的執(zhí)行,從而使程序重新納入軌道。通常是在一些對(duì)程序的流向起關(guān)鍵作用的指令前插入兩條NOP指令,這些指令有RET、RETI、ACALL、LCALL、SJMP、AJMP、JZ、JNZ、JC、JNC、JB、JNB、JBC、CJNZ、DJNZ等。在某些對(duì)系統(tǒng)工作狀態(tài)至關(guān)重要的指令(如SETBEA之類)前也可插入兩條NOP指令,以保證被正確執(zhí)行。值得注意的是,在一個(gè)程序中“指令冗余”不能過多,否則會(huì)降低程序的執(zhí)行效率。
三、軟件陷阱
采用“指令冗余”,使“跑飛”的程序恢復(fù)正常是有條件的,首先“跑飛”程序必須落到程序區(qū),其次必須執(zhí)行到所設(shè)置的冗余指令。如果“跑飛”的程序落到非程序區(qū)(如EPROM中未用完的空間或某些數(shù)據(jù)表格區(qū)等),或在執(zhí)行到冗余指令前已經(jīng)形成一個(gè)死循環(huán),則“指令冗余”措施就不能使“跑飛”的程序恢復(fù)正常了。這時(shí)可采用另一個(gè)抗干擾措施,即“軟件陷阱”。“軟件陷阱”是一條引導(dǎo)指令,強(qiáng)行將捕獲的程序引向一個(gè)指定的地址,在那里有一段專門處理錯(cuò)誤的程序。假設(shè)這段處理錯(cuò)誤的程序入口地址為ERR,則下面三條指令即組成一個(gè)“軟件陷阱”:
NOP
NOP
LJMP ERR
“軟件陷阱”一般安排在下列四種地方。
1.未使用的中斷向量區(qū)
MCS 51單片機(jī)的中斷向量區(qū)為0003H~002FH,如果系統(tǒng)程序未使用完全部中斷向量區(qū),則可在剩余的中斷向量區(qū)安排“軟件陷阱”,以便能捕捉到錯(cuò)誤的中斷。如某系統(tǒng)使用了兩個(gè)外部中斷INT0、INT1和一個(gè)定時(shí)器溢出中斷T0,它們的中斷服務(wù)子程序入口地址分別為FUINT0、FUINT1和FUT0,即可按下面的方式來設(shè)置中斷向量區(qū):
2.未使用的大片EPROM空間
程序一般都不會(huì)占用EPROM芯片的全部空間,對(duì)于剩余未編程的EPROM空間,一般都維持原狀,即其內(nèi)容為0FFH。0FFH對(duì)于MCS 51單片機(jī)的指令系統(tǒng)來說是一條單字節(jié)的指令:MOV R7,A。如果程序“跑飛”到這一區(qū)域,則將順利向后執(zhí)行,不再跳躍(除非又受到新的干擾)。因此在這段區(qū)域內(nèi)每隔一段地址設(shè)一個(gè)陷阱,就一定能捕捉到“跑飛”的程序。
3.表格
有兩種表格:一類是數(shù)據(jù)表格,供MOVCA,@A+PC指令或MOVCA,@A+DPTR指令使用,其內(nèi)容完全不是指令。另一類是散轉(zhuǎn)表格,供JMP@A+DPTR指令使用,其內(nèi)容為一系列的3字節(jié)指令LJMP或2字節(jié)指令A(yù)JMP。由于表格的內(nèi)容與檢索值有一一對(duì)應(yīng)的關(guān)系,在表格中間安排陷阱會(huì)破壞其連續(xù)性和對(duì)應(yīng)關(guān)系,因此只能在表格的最后安排陷阱。如果表格區(qū)較長,則安排在最后的陷阱不能保證一定能捕捉“跑飛”來的程序,有可能在中途再次“跑飛”,這時(shí)只能指望別處的陷阱或冗余指令來捕捉。
4.程序區(qū)
程序區(qū)是由一系列的指令構(gòu)成的,不能在這些指令中間任意安排陷阱,否則會(huì)破壞正常的程序流程。但是,在這些指令中間常常有一些斷點(diǎn),正常的程序執(zhí)行到斷點(diǎn)處就不再往下執(zhí)行了,這類指令有LJMP、SJMP、AJMP、RET、RETI,這時(shí)PC的值應(yīng)發(fā)生正常跳變。如果在這些地方設(shè)置陷阱就有可能捕捉到“跑飛”的程序。例如,對(duì)一個(gè)累加器A的內(nèi)容的正、負(fù)和零的情況進(jìn)行三分支的程序,軟件陷阱安排如下:
由于軟件陷阱都安排在正常程序執(zhí)行不到的地方,故不會(huì)影響程序的執(zhí)行效率。在EPROM容量允許的條件下,這種軟件陷阱多一些為好。
四、WATCHDOG
如果“跑飛”的程序落到一個(gè)臨時(shí)構(gòu)成的死循環(huán)中,冗余指令和軟件陷阱都將無能為力,這時(shí)可采取WATCHDOG(俗稱“看門狗”)措施。
WATCHDOG有如下特性:
(1)本身能獨(dú)立工作,基本上不依賴于CPU。CPU只在一個(gè)固定的時(shí)間間隔內(nèi)與之打一次交道,表明整個(gè)系統(tǒng)“目前尚屬正?!薄?
(2)當(dāng)CPU落入死循環(huán)后,能及時(shí)發(fā)現(xiàn)并使整個(gè)系統(tǒng)復(fù)位。
在8096系列單片機(jī)和增強(qiáng)型8051系列單片機(jī)中,已將該系統(tǒng)做入芯片里,使用起來很方便。而在普通型8051系列單片機(jī)系統(tǒng)中,必須由用戶自己建立。如果要達(dá)到WATCHDOG的真正目標(biāo),該系統(tǒng)必須包含一定的硬件電路,它完全獨(dú)立于CPU之外。如果為了簡(jiǎn)化電路,也可采用純軟件的WATCHDOG系統(tǒng)。
WATCHDOG硬件電路為一獨(dú)立于CPU之外的單穩(wěn)部件,可用單穩(wěn)電路構(gòu)成,也可用自帶脈沖源的計(jì)數(shù)器構(gòu)成。CPU正常工作時(shí)每隔一段時(shí)間就輸出一個(gè)脈沖,將單穩(wěn)系統(tǒng)觸發(fā)到暫穩(wěn)態(tài),當(dāng)暫穩(wěn)態(tài)的持續(xù)時(shí)間設(shè)計(jì)得比CPU的觸發(fā)周期長時(shí),單穩(wěn)態(tài)系統(tǒng)就不能回到穩(wěn)態(tài)。當(dāng)CPU陷入死循環(huán)后,再也不去觸發(fā)單穩(wěn)系統(tǒng)了,單穩(wěn)系統(tǒng)便可順利返回穩(wěn)態(tài),利用它返回穩(wěn)態(tài)時(shí)輸出的信號(hào)作為復(fù)位信號(hào),便可使CPU退出死循環(huán)。
圖9.12所示為采用硬件電路組成的WATCHDOG。十六進(jìn)制計(jì)數(shù)器對(duì)振蕩電路發(fā)出的脈沖計(jì)數(shù),當(dāng)計(jì)到第8個(gè)脈沖時(shí)Q端變成高電平。單片機(jī)執(zhí)行一個(gè)從P1.7輸出清零脈沖的固定程序,只要每一次清零脈沖的時(shí)間間隔小于8個(gè)振蕩脈沖周期,計(jì)數(shù)器就總計(jì)不到8,QD端就一直保持低電平。如果CPU受到干擾使程序“跑飛”,就無法執(zhí)行這個(gè)發(fā)出清零脈沖的固定程序,計(jì)數(shù)器就會(huì)計(jì)數(shù)到8,使QD端變成高電平,經(jīng)微分電路C2、R3輸出一個(gè)正脈沖到單片機(jī)8031的RESET端,使CPU復(fù)位。此電路中還包括:上電復(fù)位(C1、R1)和人工復(fù)位(KA,R1,R2)兩部分。
圖9.12硬件WATCHDOG電路
也可以用軟件程序來形成WATCHDOG。例如,可以采用8031的定時(shí)器T0來形成WATCHDOG。將T0的溢出中斷設(shè)為高優(yōu)先級(jí)中斷,其它中斷均設(shè)置為低優(yōu)先級(jí)中斷,若采用6 MHz的時(shí)鐘,則可用以下程序使T0定時(shí)約10ms來形成軟件WATCHDOG:
軟件WATCHDOG啟動(dòng)后系統(tǒng)工作程序必須每隔小于10 ms的時(shí)間執(zhí)行一次MOV TH0,#0E0H指令,重新設(shè)置T0的計(jì)數(shù)初值。如果程序跑飛后執(zhí)行不到這條指令,則在10ms之后即會(huì)產(chǎn)生一次T0溢出中斷,在T0的中斷向量區(qū)安放一條轉(zhuǎn)移到出錯(cuò)處理程序的指令LJMPERR,由出錯(cuò)處理程序來處理各種善后工作。采用軟件WATCHDOG有一個(gè)弱點(diǎn),就是如果“跑飛”的程序使某些操作數(shù)變成了修改T0功能的指令,則執(zhí)行指令后軟件WATCHDOG就會(huì)失效,因此軟件WATCHDOG的可靠性不如硬件高。