一種新的單片機“看門狗”電路軟件設(shè)計方法
隨著MCS-51系列單片機的發(fā)展,其芯片價格在不斷下降,但同時也帶來了單片機芯片的抗干擾問題,該問題可能導(dǎo)致一些智能型儀器儀表單片機工業(yè)控制系統(tǒng)發(fā)生“死機”。筆者通過近幾年的設(shè)計實踐及不斷試驗,總結(jié)了一套可靠的“看門狗”硬件電路及軟件設(shè)計方法。由于一些專業(yè)期刊曾經(jīng)刊登過許多關(guān)于“看門狗” 硬件電路構(gòu)成的文章,同時也詳細(xì)的關(guān)于“看門狗”電路非正常失效故障原因的分析及針對性軟件設(shè)計技巧[1],本文給出了一個采用MAX706和89C52 構(gòu)成的“看門狗”硬件電路,并且從新的角度說明了如何確保“看門狗”電路的正常工作,同時給出了它的軟件設(shè)計方法。
1 “看門狗”硬件電路簡述
現(xiàn)以MAX706監(jiān)控電路為例(見圖1)來說明“看門狗”硬件電路的工作過程,我們知道,MAX706是一種性能優(yōu)良的低功耗CMOS監(jiān)控電路芯片,其內(nèi)部電路由上電復(fù)位、可重觸發(fā)“看門狗”定時器及電壓比較器等組成[2]。MAX706只要在1.6秒時間內(nèi)檢測到WCI引腳有高低電平跳變信號,則“看門狗”定時器清零并重新開始計時;若超出1.6秒后,WCI引腳仍無高低電平跳變信號,則“看門狗”定時器溢出,WDO引腳輸出低電平,進而觸發(fā)MR手動復(fù)位引腳,使MAC706復(fù)位,從而使“看門狗”定時器清零并重新開始計時,WDO引腳輸出高電平,MAX706的RST復(fù)位輸出引腳輸出大約200毫秒寬度的低電平脈沖,使單片機控制系統(tǒng)可靠復(fù)位,重新投入正常運行。
2 “看門狗”電路軟件設(shè)計方法
以往的“看門狗”電路復(fù)位指令(即“喂狗”)一般總是插入在主程序中,而且“喂狗”指令一般是脈沖式,可以連續(xù)用兩條取反指令(如CPL P1.0)。這是因為一般情況下,程序跑飛或者陷入“死循環(huán)”時,中斷功能可能不受影響,CPU仍能象正常運行時一樣響應(yīng)和執(zhí)行中斷子程序。這時如果中斷子程序中插有“喂狗”指令,則“看門狗”定時器始終處于正常無溢出狀態(tài),無法對已經(jīng)混亂的微機系統(tǒng)重新啟動以投入正常運轉(zhuǎn)狀態(tài)。
在主程序中適當(dāng)插入“喂狗”指令,大多數(shù)場合的單片機系統(tǒng)都能夠比較可靠地工作。但是有一種特殊情況,即中斷響應(yīng)功能已經(jīng)失效,而主程序仍然能夠正常運行,這時“看門狗”電路對恢復(fù)單片機系統(tǒng)正常工作時無能為力的。例如:當(dāng)程序正在執(zhí)行中斷子程序時,系統(tǒng)突然受到強烈干擾,程序跑飛,而且PC指針剛好落在主程序的指令字節(jié)上,堆棧也不溢出,使主程序能夠繼續(xù)正常運行。這時“看門狗”的“喂狗”動作正常,而中斷再也不法響應(yīng)了。這時因為在MCS-51的中斷系統(tǒng)中有兩個不可尋址的優(yōu)先級狀態(tài)觸發(fā)器,分別指標(biāo)兩級中斷響應(yīng)狀態(tài)。當(dāng)CPU響應(yīng)中斷時,首先置位相應(yīng)的優(yōu)先級狀態(tài)觸發(fā)器(該觸發(fā)器能指出CPU正在處理的中斷優(yōu)先級別),這時會屏蔽掉同級別的所有中斷申請,直到執(zhí)行RETI指令時,才由CPU硬件清零該優(yōu)先級狀態(tài)觸發(fā)器,從而使以后的中斷請求能被正常地響應(yīng)[3]。如果響應(yīng)中斷后而不執(zhí)行RETI指令,那么同級別中斷申請就不會被響應(yīng)了。
當(dāng)然,象上述這種情況是比較少見的。大多數(shù)情況下,程序跑飛后都會使PC指針越出有效程序區(qū),造成“死機”。這時“看門狗”就起作用了。在大多數(shù)系統(tǒng)中,中斷子程序執(zhí)行的時間占總運行時間的百分比都非常小,而在執(zhí)行中斷程序時,PC指針跑飛越過RETI指令,而主程序又能正常運行的機會就更少。但是如果中斷子程序處理數(shù)據(jù)比較復(fù)雜或帶有一些函數(shù)運算的功能時,則出現(xiàn)這種系統(tǒng)失常的情況就有可能發(fā)生了。以前,在筆者設(shè)計的智能流量計中就曾經(jīng)出現(xiàn)過這種現(xiàn)象:鍵盤顯示操作都正常,看起來不象“死機”,但是在設(shè)定參數(shù)時,數(shù)據(jù)位該內(nèi)爍的不閃爍,總流量不會累計上去,顯然是T0定時中斷系統(tǒng)失效,而主程序仍然在運行,因為“喂狗”指令插在主程序中。那么,針對這種情形,有沒有徹底解決的方法呢?“喂狗”指令直接插在中斷子程序中是不合適的,而單獨插在主程序中又顯然是不夠的。筆者通過仔細(xì)推敲后,將“喂狗”指令分解開來,取反指令變成置位和清零兩種指令(即SETB P1.0和CLR P1.0),將置位指令插在主程序中,而將清零指令插在T0中斷子程序中,這樣將兩者聯(lián)系起來,缺一不可,無論主程序運行失效,還是T0中斷請求失效,都不能完成完整的“喂狗”指令,造成“看門狗”動作,從而確保了系統(tǒng)安全可靠地工作。
具體做法如下:
ORG 0000H
LJMP START
ORG 000BH
LJMP INTT0
……
ORG 0030H
START:MOV SP,#30H
……
MAIN:NOP
NOP
SETB P1.0
NOP
NOP
SETB EA
NOP
SETB ET0
……
LJMP MAIN
……
INTT0:NOP
NOP
CLR P1.0
NOP
NOP
……
RETI
這樣,在整個用戶程序中只唯一的一對指令(SETB P1.0及CLR P1.0)能使“看門狗”定時器復(fù)位。也就是說不會有任何“非法”的指令能使“看門狗”定時器誤復(fù)位,致使系統(tǒng)已經(jīng)“死機”而“看門狗”失效。當(dāng)然,對對沒有中斷的用戶系統(tǒng),只需將清零指令(CLR P1.0)也插在主程序中就可以了;對于有多種中斷的用戶系統(tǒng),如果沒有中斷嵌套,則清零指令(CLR P1.0)可以插在任一個中斷子程序中,而在主程序中適當(dāng)加入一些有關(guān)中斷的冗余指令(如SETB ET0等),以免因有關(guān)中斷的特殊功能寄存器數(shù)據(jù)受到干擾時導(dǎo)致中斷功能失效;對于有二級中斷嵌套的用戶系統(tǒng),清零指令(CLR P1.0)可以插在中斷種數(shù)比較多的那一級中的任一個中斷子程序中,插有“喂狗”指令的那一級中斷系統(tǒng)將會受到“看門狗”的保護,而另一級中斷系統(tǒng)如果失效,“看門狗”是“無動于衷”的,這時只能盡量減少這種中斷子程序的執(zhí)行時間以減少受到干擾的可能性。如果二級中斷嵌套系統(tǒng)者受到“看門狗”的保護,就必需設(shè)計一個非常復(fù)雜的“看門狗”電路,其“喂狗”指令要由三部分來保證各個部分都能正常工作,需要說明的是,如果主程序運行一次的時間(包括可能被中斷的時間)超過1.6秒,則要適當(dāng)再插入一條SETB P1.0指令,而T0中斷時間間隔是不能超過1.6秒的。
另外,為了消除可能的“喂狗”誤動作,建議對所應(yīng)用的用戶程序進行徹底仔細(xì)的檢查,以防程序錯亂時生成多余的SETB P1.0(指令碼 D290H)或者CLR P1.0(指令碼 C290H)指令。利用通用編程軟件(如EDIT)的查找功能可搜索用戶程序在LST文件中的“90”字符串,就能方便地找到所有可能的非法“SETB P1.0或CLR P1.0”指令,然后用NOP指令將其分離開來就可以了。如
ROM地址 指令碼 源程序
……
0306 C2 MOV A,#0C2H
0308 901000 MOV DPTR,#1000H
……
B4D290 CJNE A,#0D2H,STEP1
……
0401 B4D290 CJNE A,#0D2H,STEP1
0494 00 STEP1:NOP
……
可以修改為
……
0306 74C2 MOV A,#0C2H
0308 00 NOP
0309 901000 MOV DPTR,#1000H
……
0402 B4D291 CJNE A,#0D2H,STEP1
0405 00 NOP
……
0496 00 STEP1:NOP
……
其它情況下可以靈活處理,以使其消除以上兩種可以出錯的組合即可。
通過采取以上幾種措施,對于沒有二級中斷嵌套的用戶系統(tǒng),能夠絕對安全地受到監(jiān)控而不會“死機”;對于有二級中斷嵌套的用戶系統(tǒng),也可大大提高其可靠性。當(dāng)然,一個單片機系統(tǒng)能夠準(zhǔn)確可靠地運行,除了不“死機”,還需保護數(shù)據(jù)免受干擾,這屬于軟件容錯、數(shù)據(jù)冗余、系統(tǒng)重入等范疇,這里不作介紹。