一種新的單片機(jī)“看門狗”電路軟件設(shè)計(jì)方法
掃描二維碼
隨時(shí)隨地手機(jī)看文章
隨著MCS-51系列單片機(jī)的發(fā)展,其芯片價(jià)格在不斷下降,但同時(shí)也帶來了單片機(jī)芯片的抗干擾問題,該問題可能導(dǎo)致一些智能型儀器儀表單片機(jī)工業(yè)控制系統(tǒng)發(fā)生“死機(jī)”。筆者通過近幾年的設(shè)計(jì)實(shí)踐及不斷試驗(yàn),總結(jié)了一套可靠的“看門狗”硬件電路及軟件設(shè)計(jì)方法。由于一些專業(yè)期刊曾經(jīng)刊登過許多關(guān)于“看門狗” 硬件電路構(gòu)成的文章,同時(shí)也詳細(xì)的關(guān)于“看門狗”電路非正常失效故障原因的分析及針對(duì)性軟件設(shè)計(jì)技巧[1],本文給出了一個(gè)采用MAX706和89C52 構(gòu)成的“看門狗”硬件電路,并且從新的角度說明了如何確保“看門狗”電路的正常工作,同時(shí)給出了它的軟件設(shè)計(jì)方法。
1 “看門狗”硬件電路簡(jiǎn)述
現(xiàn)以MAX706監(jiān)控電路為例(見圖1)來說明“看門狗”硬件電路的工作過程,我們知道,MAX706是一種性能優(yōu)良的低功耗CMOS監(jiān)控電路芯片,其內(nèi)部電路由上電復(fù)位、可重觸發(fā)“看門狗”定時(shí)器及電壓比較器等組成[2]。MAX706只要在1.6秒時(shí)間內(nèi)檢測(cè)到WCI引腳有高低電平跳變信號(hào),則“看門狗”定時(shí)器清零并重新開始計(jì)時(shí);若超出1.6秒后,WCI引腳仍無高低電平跳變信號(hào),則“看門狗”定時(shí)器溢出,WDO引腳輸出低電平,進(jìn)而觸發(fā)MR手動(dòng)復(fù)位引腳,使MAC706復(fù)位,從而使“看門狗”定時(shí)器清零并重新開始計(jì)時(shí),WDO引腳輸出高電平,MAX706的RST復(fù)位輸出引腳輸出大約200毫秒寬度的低電平脈沖,使單片機(jī)控制系統(tǒng)可靠復(fù)位,重新投入正常運(yùn)行。
2 “看門狗”電路軟件設(shè)計(jì)方法
以往的“看門狗”電路復(fù)位指令(即“喂狗”)一般總是插入在主程序中,而且“喂狗”指令一般是脈沖式,可以連續(xù)用兩條取反指令(如CPL P1.0)。這是因?yàn)橐话闱闆r下,程序跑飛或者陷入“死循環(huán)”時(shí),中斷功能可能不受影響,CPU仍能象正常運(yùn)行時(shí)一樣響應(yīng)和執(zhí)行中斷子程序。這時(shí)如果中斷子程序中插有“喂狗”指令,則“看門狗”定時(shí)器始終處于正常無溢出狀態(tài),無法對(duì)已經(jīng)混亂的微機(jī)系統(tǒng)重新啟動(dòng)以投入正常運(yùn)轉(zhuǎn)狀態(tài)。
在主程序中適當(dāng)插入“喂狗”指令,大多數(shù)場(chǎng)合的單片機(jī)系統(tǒng)都能夠比較可靠地工作。但是有一種特殊情況,即中斷響應(yīng)功能已經(jīng)失效,而主程序仍然能夠正常運(yùn)行,這時(shí)“看門狗”電路對(duì)恢復(fù)單片機(jī)系統(tǒng)正常工作時(shí)無能為力的。例如:當(dāng)程序正在執(zhí)行中斷子程序時(shí),系統(tǒng)突然受到強(qiáng)烈干擾,程序跑飛,而且PC指針剛好落在主程序的指令字節(jié)上,堆棧也不溢出,使主程序能夠繼續(xù)正常運(yùn)行。這時(shí)“看門狗”的“喂狗”動(dòng)作正常,而中斷再也不法響應(yīng)了。這時(shí)因?yàn)樵贛CS-51的中斷系統(tǒng)中有兩個(gè)不可尋址的優(yōu)先級(jí)狀態(tài)觸發(fā)器,分別指標(biāo)兩級(jí)中斷響應(yīng)狀態(tài)。當(dāng)CPU響應(yīng)中斷時(shí),首先置位相應(yīng)的優(yōu)先級(jí)狀態(tài)觸發(fā)器(該觸發(fā)器能指出CPU正在處理的中斷優(yōu)先級(jí)別),這時(shí)會(huì)屏蔽掉同級(jí)別的所有中斷申請(qǐng),直到執(zhí)行RETI指令時(shí),才由CPU硬件清零該優(yōu)先級(jí)狀態(tài)觸發(fā)器,從而使以后的中斷請(qǐng)求能被正常地響應(yīng)[3]。如果響應(yīng)中斷后而不執(zhí)行RETI指令,那么同級(jí)別中斷申請(qǐng)就不會(huì)被響應(yīng)了。
當(dāng)然,象上述這種情況是比較少見的。大多數(shù)情況下,程序跑飛后都會(huì)使PC指針越出有效程序區(qū),造成“死機(jī)”。這時(shí)“看門狗”就起作用了。在大多數(shù)系統(tǒng)中,中斷子程序執(zhí)行的時(shí)間占總運(yùn)行時(shí)間的百分比都非常小,而在執(zhí)行中斷程序時(shí),PC指針跑飛越過RETI指令,而主程序又能正常運(yùn)行的機(jī)會(huì)就更少。但是如果中斷子程序處理數(shù)據(jù)比較復(fù)雜或帶有一些函數(shù)運(yùn)算的功能時(shí),則出現(xiàn)這種系統(tǒng)失常的情況就有可能發(fā)生了。以前,在筆者設(shè)計(jì)的智能流量計(jì)中就曾經(jīng)出現(xiàn)過這種現(xiàn)象:鍵盤顯示操作都正常,看起來不象“死機(jī)”,但是在設(shè)定參數(shù)時(shí),數(shù)據(jù)位該內(nèi)爍的不閃爍,總流量不會(huì)累計(jì)上去,顯然是T0定時(shí)中斷系統(tǒng)失效,而主程序仍然在運(yùn)行,因?yàn)?ldquo;喂狗”指令插在主程序中。那么,針對(duì)這種情形,有沒有徹底解決的方法呢?“喂狗”指令直接插在中斷子程序中是不合適的,而單獨(dú)插在主程序中又顯然是不夠的。筆者通過仔細(xì)推敲后,將“喂狗”指令分解開來,取反指令變成置位和清零兩種指令(即SETB P1.0和CLR P1.0),將置位指令插在主程序中,而將清零指令插在T0中斷子程序中,這樣將兩者聯(lián)系起來,缺一不可,無論主程序運(yùn)行失效,還是T0中斷請(qǐng)求失效,都不能完成完整的“喂狗”指令,造成“看門狗”動(dòng)作,從而確保了系統(tǒng)安全可靠地工作。
具體做法如下:
ORG 0000H
LJMP START
ORG 000BH
LJMP INTT0
……
ORG 0030H
START:MOV SP,#30H
……
MAIN:NOP
NOP
SETB P1.0
NOP
NOP
SETB EA
NOP
SETB ET0
……
LJMP MAIN
……
INTT0:NOP
NOP
CLR P1.0
NOP
NOP
……
RETI
這樣,在整個(gè)用戶程序中只唯一的一對(duì)指令(SETB P1.0及CLR P1.0)能使“看門狗”定時(shí)器復(fù)位。也就是說不會(huì)有任何“非法”的指令能使“看門狗”定時(shí)器誤復(fù)位,致使系統(tǒng)已經(jīng)“死機(jī)”而“看門狗”失效。當(dāng)然,對(duì)對(duì)沒有中斷的用戶系統(tǒng),只需將清零指令(CLR P1.0)也插在主程序中就可以了;對(duì)于有多種中斷的用戶系統(tǒng),如果沒有中斷嵌套,則清零指令(CLR P1.0)可以插在任一個(gè)中斷子程序中,而在主程序中適當(dāng)加入一些有關(guān)中斷的冗余指令(如SETB ET0等),以免因有關(guān)中斷的特殊功能寄存器數(shù)據(jù)受到干擾時(shí)導(dǎo)致中斷功能失效;對(duì)于有二級(jí)中斷嵌套的用戶系統(tǒng),清零指令(CLR P1.0)可以插在中斷種數(shù)比較多的那一級(jí)中的任一個(gè)中斷子程序中,插有“喂狗”指令的那一級(jí)中斷系統(tǒng)將會(huì)受到“看門狗”的保護(hù),而另一級(jí)中斷系統(tǒng)如果失效,“看門狗”是“無動(dòng)于衷”的,這時(shí)只能盡量減少這種中斷子程序的執(zhí)行時(shí)間以減少受到干擾的可能性。如果二級(jí)中斷嵌套系統(tǒng)者受到“看門狗”的保護(hù),就必需設(shè)計(jì)一個(gè)非常復(fù)雜的“看門狗”電路,其“喂狗”指令要由三部分來保證各個(gè)部分都能正常工作,需要說明的是,如果主程序運(yùn)行一次的時(shí)間(包括可能被中斷的時(shí)間)超過1.6秒,則要適當(dāng)再插入一條SETB P1.0指令,而T0中斷時(shí)間間隔是不能超過1.6秒的。
另外,為了消除可能的“喂狗”誤動(dòng)作,建議對(duì)所應(yīng)用的用戶程序進(jìn)行徹底仔細(xì)的檢查,以防程序錯(cuò)亂時(shí)生成多余的SETB P1.0(指令碼 D290H)或者CLR P1.0(指令碼 C290H)指令。利用通用編程軟件(如EDIT)的查找功能可搜索用戶程序在LST文件中的“90”字符串,就能方便地找到所有可能的非法“SETB P1.0或CLR P1.0”指令,然后用NOP指令將其分離開來就可以了。如
ROM地址 指令碼 源程序
……
0306 C2 MOV A,#0C2H
0308 901000 MOV DPTR,#1000H
……
B4D290 CJNE A,#0D2H,STEP1
……
0401 B4D290 CJNE A,#0D2H,STEP1
0494 00 STEP1:NOP
……
可以修改為
……
0306 74C2 MOV A,#0C2H
0308 00 NOP
0309 901000 MOV DPTR,#1000H
……
0402 B4D291 CJNE A,#0D2H,STEP1
0405 00 NOP
……
0496 00 STEP1:NOP
……
其它情況下可以靈活處理,以使其消除以上兩種可以出錯(cuò)的組合即可。
通過采取以上幾種措施,對(duì)于沒有二級(jí)中斷嵌套的用戶系統(tǒng),能夠絕對(duì)安全地受到監(jiān)控而不會(huì)“死機(jī)”;對(duì)于有二級(jí)中斷嵌套的用戶系統(tǒng),也可大大提高其可靠性。當(dāng)然,一個(gè)單片機(jī)系統(tǒng)能夠準(zhǔn)確可靠地運(yùn)行,除了不“死機(jī)”,還需保護(hù)數(shù)據(jù)免受干擾,這屬于軟件容錯(cuò)、數(shù)據(jù)冗余、系統(tǒng)重入等范疇,這里不作介紹。