應(yīng)用在工業(yè)測控領(lǐng)域的單片機(jī)系統(tǒng)解析方案
近年來單片機(jī)系統(tǒng)在工業(yè)測控領(lǐng)域的應(yīng)用越來越廣泛,而對于環(huán)境惡劣的工業(yè)現(xiàn)場,這種新型的微控制器的可靠性、安全性就成為了一個大問題。在實驗室運(yùn)行正常的程序到了工業(yè)現(xiàn)場卻不能運(yùn)行,或者出現(xiàn)運(yùn)行不穩(wěn)定經(jīng)常死機(jī)等。在這里主要討論一下如何通過軟件技術(shù)來增強(qiáng)系統(tǒng)的穩(wěn)定運(yùn)行。
當(dāng)系統(tǒng)的CPU部位受到干擾信號的作用時,將使系統(tǒng)失控。最典型的故障是破壞程序計數(shù)器PC的狀態(tài)值。導(dǎo)致程序在地址空間內(nèi)"亂飛",或者陷入死循環(huán)。對這種情況的處理主要有這么幾種方法:
1、指令冗余技術(shù);
2、軟件陷阱技術(shù);
3、看門狗技術(shù)。
下面 以MCS-51單片機(jī)來做說明。
指令冗余技術(shù)
指令由操作碼和操作數(shù)組成,操作碼指明CPU要完成什么樣的操作,而操作數(shù)是操作碼的對象。單字節(jié)指令只有操作碼,隱含操作數(shù);雙字節(jié)指令,第一個字節(jié)是操作碼,第二個字節(jié)是操作數(shù);三字節(jié)指令第一個字節(jié)是操作碼,后二個字節(jié)是操作數(shù)。CPU在取指令的時候是先取操作碼再取操作數(shù),如何判斷是操作碼還是操作數(shù)就是通過取指令的順序。而取指令的順序完全由指令計數(shù)器PC來控制,因此,一旦PC受干擾出現(xiàn)錯誤程序便會脫離正常軌道,出現(xiàn)"亂飛",這樣就會出現(xiàn)把操作數(shù)當(dāng)作操作碼,或者把操作碼當(dāng)作操作數(shù)的情況。但只要PC指針落在單字節(jié)指令上程序就可納入正軌,所以為了快速將程序納入正軌,應(yīng)該多用單字節(jié)指令,并在關(guān)鍵的地方人為插入一些單字節(jié)指令NOP,或?qū)⒂行У膯巫止?jié)指令重寫,這就稱之為指令冗余。
常用的方法就是在一些雙字節(jié)、三字節(jié)指令后面插入兩個單字節(jié)指令NOP,或在一些對程序的流向起決定作用的指令前面插入兩條NOP指令。還可對一些重要的指令進(jìn)行重復(fù)放置。
但采用指令冗余技術(shù)將程序納入正軌的條件是:亂飛的PC必須指向程序運(yùn)行區(qū)。
軟件陷阱技術(shù)
當(dāng)亂飛的程序進(jìn)入非程序區(qū)的時候,就可設(shè)定軟件陷阱對亂飛的程序進(jìn)行攔截從而將程序引向一個固定的位置。這樣就可將捕獲的程序重新納入正軌。
軟件陷阱主要就是把程序重新引入它的復(fù)位入口處,也就是說在適當(dāng)?shù)牡胤皆O(shè)置這樣的指令:
NOP
NOP
LJMP 0000H
軟件陷阱主要安排在這樣一些區(qū)域:未使用的中斷區(qū)、未使用的EPROM空間及非EPROM空間、程序運(yùn)行區(qū)及中斷服務(wù)程序區(qū)。主要來看前三種:
1、未使用的中斷區(qū)
如果對于未使用的中斷因干擾而開放的話, 可以這樣寫中斷服務(wù)程序:
NOP
NOP
POP D1 ;將原來的錯誤斷點(diǎn)彈出
POP D2 ;將原來的錯誤斷點(diǎn)彈出
PUSH 00H
PUSH 00H;將斷點(diǎn)地址重寫為 0000H
RETI
2 .未使用的EPROM區(qū)
假設(shè)用了一片2764,但并沒有用完整個存儲區(qū)。這時候就可在未用的區(qū)域里填充上020000數(shù)據(jù),這樣當(dāng)程序飛入其中時就會很快的走入正軌。這條指令其實是"LJMP 0000H"的機(jī)器碼。
3 .非EPROM空間
單片機(jī)系統(tǒng)的程序空間是64K,正常情況下 所使用的EPROM不會占用所有的空間,假設(shè) 現(xiàn)在的EPROM占用16K的空間,那么剩下的48K空間就被閑置不用了。當(dāng)亂飛的PC落入這些空間時,讀入的數(shù)據(jù)將為FFH,這是 :MOV R7,A 指令的機(jī)器碼,將修改R7的內(nèi)容。因此,當(dāng)程序亂飛入非EPROM芯片區(qū)后,不僅無法導(dǎo)入正規(guī),而且破壞了R7的內(nèi)容。
當(dāng)CPU讀程序存儲器的時候,伴隨著會產(chǎn)生一個PSEN信號, 就可利用這個信號,再加上一個非EPROM區(qū)的地址譯碼信號,構(gòu)成一個選通信號來起動一個空閑的中斷,再用軟件陷井的方法從中斷程序中把程序?qū)胝?guī)。
也可通過硬件的方法用一個緩沖器直接給數(shù)據(jù)線寫一個值,其原理與上述方法相同。
軟件看門狗技術(shù)
看門狗的作用就是防止程序發(fā)生死循環(huán),或者說程序跑飛。硬件看門狗是利用了一個定時器,來監(jiān)控主程序的運(yùn)行,也就是說在主程序的運(yùn)行過程中, 要在定時時間到之前對定時器進(jìn)行復(fù)位,如果出現(xiàn)死循環(huán),或者說PC指針不能回來。那么定時時間到后就會使單片機(jī)復(fù)位。
軟件看門狗技術(shù)的原理和這差不多,只不過是用軟件的方法實現(xiàn), 還是以51系列來講,在51單片機(jī)中有兩個定時器, 可以用這兩個定時器來對主程序的運(yùn)行進(jìn)行監(jiān)控。對T0設(shè)定一定的定時時間,當(dāng)產(chǎn)生定時中斷的時候?qū)σ粋€變量進(jìn)行賦值,而這個變量在主程序運(yùn)行的開始已經(jīng)有了一個初值,要設(shè)定的定時值要小于主程序的運(yùn)行時間,這樣在主程序的尾部對變量的值進(jìn)行判斷,如果值發(fā)生了預(yù)期的變化,就說明T0中斷正常,如果沒有發(fā)生變化則使程序復(fù)位。
T1 用來監(jiān)控主程序的運(yùn)行, 給T1設(shè)定一定的定時時間,在主程序中對其進(jìn)行復(fù)位,如果不能在一定的時間里對其進(jìn)行復(fù)位,T1 的定時中斷就會使單片機(jī)復(fù)位。在這里T1的定時時間要設(shè)的大于主程序的運(yùn)行時間,給主程序留有一定的裕量。而T1的中斷正常與否 再由T0定時中斷子程序來監(jiān)視。這樣就夠成了一個循環(huán),T0監(jiān)視T1,T1監(jiān)視主程序,主程序又來監(jiān)視T0,從而保證系統(tǒng)的穩(wěn)定運(yùn)行。