在硬件系統(tǒng)出廠前要進(jìn)行產(chǎn)品測試;在嵌入式系統(tǒng)工作之前,一般也要進(jìn)行自檢,其中ROM和RAM檢測必不可少,可是有不少人對于測試目的、原因和方法存在錯誤理解。
為什么要測試ROM和RAM,怎么測試呢?普遍的看法是:由于擔(dān)心ROM和RAM芯片損壞,在出廠和使用前應(yīng)該校驗這兩種芯片的好壞。測試RAM的方法是寫讀各個內(nèi)存單元,檢查是否能夠正確寫入;測試ROM的方法是累加各存儲單元數(shù)值并與校驗和比較。這種認(rèn)識不能說錯,但有些膚淺,照此編出的測試程序不完備。一般來說,ROM和RAM芯片本身不大會被損壞,用到次品的概率也比較小,真正出問題的,大都是其他硬件部分,因此,測試ROM和RAM往往是醉翁之意不在酒。
ROM測試
測試ROM的真正目的是保證程序完整性。
嵌入式軟件和啟動代碼存放在ROM里,不能保證長期穩(wěn)定可靠,因為硬件注定是不可靠的。以flash ROM為例,它會由于以下兩種主要原因?qū)е鲁绦驌]發(fā):
1。受到輻射。本身工作在輻射環(huán)境里/運輸過程中受到輻射(如過海關(guān)時被X光機檢查)。
2。長時間存放導(dǎo)致存儲失效,某些0、1位自行翻轉(zhuǎn)。
無論如何,在硬件上存放的程序都是不可靠的。如果完全不能運行,那到也不會造成太大的損失。怕就怕程序可以運行,但某些關(guān)鍵數(shù)據(jù)/關(guān)鍵代碼段被破壞,引發(fā)致命錯誤。為此,必須在程序正常工作前,在軟件層面上保證所運行的程序100%沒有被破壞,保證現(xiàn)在要運行的程序就是當(dāng)初寫入的。
保證程序完整性的方法很多,例如對全部程序進(jìn)行CRC校驗(-16和-32)/累加和校驗(移位累加),只要能在數(shù)學(xué)上確保出錯概率極低,工程上就可以認(rèn)為程序完整。
程序完整性測試通過,捎帶著也就證明了ROM沒有被損壞。即測試ROM是否損壞只是測試的副產(chǎn)品,不是主要目的。
RAM測試
測試RAM的真正目的是保證硬件系統(tǒng)的可靠性。
RAM真的是太不容易壞了,我至今還沒有看見過一起因為RAM損壞導(dǎo)致的系統(tǒng)不正?,F(xiàn)象。不過大部分問題卻可以通過RAM測試反映出來。仔細(xì)想想,當(dāng)硬件被生產(chǎn)出來/被插到背板上究竟會發(fā)生什么錯誤呢!是不是感到自己做的板子出問題的可能性更大!請考慮如下幾點:
1。生產(chǎn)工藝不過關(guān),過孔打歪了,與臨近信號線距離不滿足線規(guī)甚至打在了線上。
2。由于搭錫引起的信號線粘連。
3。虛焊/漏焊引起的接觸不良。
4。不按規(guī)程操作,把手印兒印在了高頻線上。
5。板子臟了也不吹,覆蓋了一層灰塵(內(nèi)含金屬微粒)。
......
這些現(xiàn)象比較有趣,試舉幾例:
1。地址線A0和A1粘連。讀出XXX00、XXX01、XXX10三個字節(jié)的數(shù)據(jù)完全一樣。
2。數(shù)據(jù)線D0和D1粘連。D0和D1只要有一個為0,那么兩條線都為0。
3。接觸不良。時好時壞。
4。器件表面處理不干凈,有助焊劑殘留。低速訪問正常,大負(fù)荷高速訪問頻繁死機。
總之,我們做的板子在生產(chǎn)中和使用中都會有出錯機會,所以出廠前必須測試,使用前必須自檢。(當(dāng)然如果你做的不是實際產(chǎn)品而是實驗室樣品的話,可以簡化步驟。)
如何測試RAM呢?寫一個數(shù)然后讀出來判斷顯然測不出所有問題,單個測試數(shù)據(jù)不易覆蓋全部測試內(nèi)容,更不用說定位錯誤原因了(RAM壞、地址/數(shù)據(jù)線粘連、接觸不良)。好的測試應(yīng)盡可能測出粘連、RAM壞、單板高頻特性。
我總結(jié)的方法是這樣的:(如測試一個FFH字節(jié)的RAM)
首先,測試地址線,
1。'0'滑動,隨機選擇一個數(shù)如55、AA之類,依次寫到FEH、FDH、FBH、F7H、EFH、DFH、BFH、7FH地址單元里去,把地址寫成二進(jìn)制數(shù),可以看到比特0在地址總線上從低到高滑動,謂之'0'滑動。目的是測試這些地址線在依次變0時是否穩(wěn)定正常。當(dāng)每一根線由1變0,會產(chǎn)生下沖,如果下沖控制不好,在高頻時會引起錯誤。單板上地址線不一定一樣長,下沖也就不會完全一樣,因此,每一根線都單獨測一下下沖性能。
2。'1'滑動,隨機選擇一個數(shù)如55、AA之類,依次寫到1H、2H、4H、8H、10H、20H、40H、80H地址單元里去,把地址寫成二進(jìn)制數(shù),可以看到比特1在地址總線上從低到高滑動,謂之'1'滑動。,目的是測試這些地址線在依次變1時是否穩(wěn)定正常。當(dāng)每一根線由0變1,會產(chǎn)生上沖,如果上沖控制不好,在高頻時會引起錯誤。單板上地址線不一定一樣長,上沖也就不會完全一樣,因此,每一根線都單獨測一下上沖性能。上沖和下沖是不同的指標(biāo),要分別測一下。
3。"全0變?nèi)?",隨機選擇一個數(shù)如55、AA之類,寫到FFH單元,再寫到00H單元,然后寫到FFH單元。把地址寫成二進(jìn)制數(shù),可以看到地址線從全'0'變到全'1'。由信號處理理論知,在電壓階躍跳變時包含無限寬頻譜,其中高頻部分對外產(chǎn)生輻射,這些輻射信號是干擾源,對臨近線路產(chǎn)生較大影響。地址線一般集束布線,同時跳變會引起最大干擾。地址線從全'0'變到全'1',干擾、上沖、扇出電流影響最大。
4。"全1變?nèi)?",緊接上一步,隨機選擇一個數(shù)如55、AA之類,寫到00H單元。把地址寫成二進(jìn)制數(shù),可以看到地址線從全'1'變到全'0',產(chǎn)生最大下沖干擾。
5。"粘連測試"。依次向不同地址單元寫入不同數(shù)據(jù)并讀出判斷,如:1、2、3、4......此步驟捎帶測試了RAM好壞。注意,千萬別用相同數(shù)據(jù)測試,否則測不出粘連。
6??蛇x"全0全1連續(xù)高速變化"。目的是模擬最惡劣情況(大扇出電流、強干擾、上/下沖)。
然后,測試數(shù)據(jù)線,(原理與測試地址線相同,1、2兩步順帶測試了數(shù)據(jù)線粘連)
1。'0'滑動,向某一固定地址依次寫入FEH、FDH、FBH、F7H、EFH、DFH、BFH、7FH并讀出判斷。
2。'1'滑動,向某一固定地址依次寫入1H、2H、4H、8H、10H、20H、40H、80H并讀出判斷。
3。"全0變?nèi)?",所有單元置1(先清零再置1并讀出判斷)。
4。"全1變?nèi)?",所有單元清零(清零并讀出判斷)。
5??蛇x"全0全1連續(xù)高速變化"。向某一單元高速交替寫入若干全'0'和全'1',最后以全'0'結(jié)束。
至此,RAM測試完畢,同時全部存儲單元清零。
對于出廠檢測程序,有較大發(fā)揮余地,如可以加入錯誤定位代碼,自動指出錯誤原因和錯誤位置。
每一塊單板的高頻特性都會因為生產(chǎn)工藝誤差(制板、材料、焊接、組裝等)和使用情況而各不相同。同一塊板子的高頻特性在不同情況下表現(xiàn)也不相同。
綜上所述,除了測試RAM好壞,大部分代碼測的是單板硬件可靠性。
如果不關(guān)心高頻特性,用原來的測試方法就差不多了(如果測試數(shù)據(jù)沒選好,可能測不出數(shù)據(jù)線粘連),但應(yīng)該認(rèn)識到,測試RAM的主要對象不是RAM本身的好壞,而是連接RAM的單板硬件和線路。
以上是我實際工作經(jīng)驗的一些總結(jié),寫出來與大家交流,如有不對之處懇請指正!
源程序(偽代碼)
//TEST ROM
TestROM()
{//用移位累加和校驗
sum=0;
for(i=0;i
sum=sum>>1;
}
if(sum==CHECKSUM) printf("ROM test OK!
");
else printf("ROM test ERROR!
");
}
//TEST RAM
TestRAM()
{
//地址線測試
'0'滑動;
'1'滑動;
"全0變?nèi)?";
"全1變?nèi)?";
"粘連測試";
可選"全0全1連續(xù)高速變化";
//數(shù)據(jù)線測試
'0'滑動;
'1'滑動;
"全0變?nèi)?";
"全1變?nèi)?";
可選"全0全1連續(xù)高速變化"
}
參加討論。。