μC/OS-Il在TMS320VC33上的可靠應用
目前,μC/0S-II已經被成功移植到多種微處理器 上,其中也包括TMS320VC33。在μC/0S-II的網站上可以免費下載相關處理器的移植代碼,這些代碼可以作為 μC/OS-II應用中一個非常好的起點。筆者在應用這些 移植代碼時遇到了一些問題,因此如何使移植更加可靠、 高效,仍然是一個值得深入探討的話題。網上 TMS320VC33的移植代碼已經完成了基本的移植工作, 本文不對移植的詳細過程進行贅述,而只就移植及應用過程中的一些關鍵步驟和涉及到代碼可靠性的問題進行討論。 1 宏OS_ENTER_CRITlCAL和OS_EXIT_ CRITICAL 在μC/OS_ II中,0S_ENTER_CRITICAL和OS_ EXIT_CRITIcAL 這兩個宏分別實現(xiàn)關中斷和開中斷的功能。TMS320VC33的全局中斷控制在ST寄存器的 GIE位(第13位),GIE=1時全局允許中斷,GIE=O時全局禁止中斷。這兩個宏最簡單直接的實現(xiàn)是使用與或指令修改GIE位,即“andn 2000H,st”和“0r 2000H,st”,網 上的移植代碼就是采用了這種方式。但這不是一個非??煽康姆椒ǎ蚴荰MS320VC33的流水線執(zhí)行結構。為了提高代碼的執(zhí)行效率,TMS320VC33采取了四級流水線執(zhí)行結構,指令的執(zhí)行分為取指令、指令解碼、讀操作數(shù)和指令執(zhí)行四個階段,每個階段都是并行執(zhí)行的。在理想情況下(即不存在流水線沖突和等待周期),每個機器周期內都有四條不同的指令分別位于取指、解碼、讀和執(zhí)行階段。這時每條指令都以單機器周期執(zhí)行,DSP達到其最大標稱的指令吞吐量。當產生中斷請求并且允許中斷時,DSP不會立即執(zhí)行中斷服務程序,而是要先禁止中斷、獲取中斷向量、保存返回地址,然后再跳轉至中斷服務程序。而以上各步都是與流水線操作同步的,在流水線結構中,DSP對中斷響應步驟如表1所列。
表1中,proga+l是單周期取指指令。如果prog a+l 是多周期取指指令(例如取指時含有等待狀態(tài)),中斷響應會延遲到prog a+l執(zhí)行以后。由表1可知,DSP對中斷 的響應是在取指邊界而不是指令的執(zhí)行邊界。假設prog a一2是關中斷指令“andn 2000H,st”,那么prog a一1、 prog a甚至prog a+l仍然是可中斷的,必須等到prog a +l執(zhí)行完畢后才能完全禁止中斷。同樣在開中斷時,緊鄰開中斷指令的后三條指令是不響應中斷的。現(xiàn)在考慮下面的情況:系統(tǒng)通過OS_ENTER_CRITICAL宏禁止中斷時,同時發(fā)生了中斷請求,并且緊鄰的三條指令是訪問全局變量的指令。此時,由于流水線結構的執(zhí)行特點, DSP還是會響應中斷,如果相應的中斷服務程序也訪問了同樣的全局變量,這樣就可能破壞數(shù)據的一致性,造成系統(tǒng)的崩潰。為了防止這種情況,必須在改變系統(tǒng)中斷狀態(tài)時能夠消除流水線操作帶來的影響。為可靠實現(xiàn)OS_ ENTER_CRlTICAL和OS_EXIT_CRITICAL宏,在修改 ST寄存器之前加一條指令“RPTS O”。因為在RPTS指 令執(zhí)行過程中會自動禁止中斷,并且停止流水線操作,只有RPTS指令的下一條指令執(zhí)行完畢后,DSP才會重新打開流水線。這樣就保證了改變DSP中斷狀態(tài)時不會響應中斷,也不會執(zhí)行其他指令。上述宏的可靠實現(xiàn)為:
需要說明的是,利用trap指令的實現(xiàn)方式也是可靠的,但trap和rets/reti會兩次清除流水線,因而會對性能稍微有點影響。OS_ENTER_CRITICAL宏的另外兩種實現(xiàn)方法首先要保存DSP的中斷狀態(tài),然后再改變中斷狀態(tài)。相應的,OS_EXIT_CRlTICAL 宏可直接從前面保存的狀態(tài)進行恢復。由于流水線操作的影響,要正確保存ST寄存器的狀態(tài),直接的存儲或壓棧指令是不行的,需要一些附加的保護性代碼,本文就不再深入討論了。 2 OSRdyGrp和OSRdyTbl 在筆者的應用系統(tǒng)中,除了定時器1中斷外,還使用 了外部中斷2、DMA中斷和串口接收中斷,把這些中斷全 部打開后,會出現(xiàn)一個非常奇怪的現(xiàn)象。系統(tǒng)剛開始運行 時一切正常,一段時間后,與idle task不在同一個優(yōu)先級 組的所有任務再也不執(zhí)行了。但從程序上看,這些任務應 該處于就緒狀態(tài),除非就緒任務的優(yōu)先級與idle task處于 同一個組,否則系統(tǒng)永遠都在執(zhí)行idle task。通過檢查 OSRdyTbl發(fā)現(xiàn),這些不被調度的任務的確處于就緒狀 態(tài),但在OSRdyGrp中卻沒有設置相應的標志.如果在 OSRdyTbl表中任務是就緒的,與該任務優(yōu)先級組相對應 的OSRdyGrp中的標志卻是0,那么任務調度時這些就緒 的任務是不會被調度的。在μC/OS-II中,OSRdyGrp與 OSRdyTbl的值都是同時修改的,并且還采用了臨界區(qū)保 護,為什么還會出現(xiàn)OSRdyGrp與OSRdyTbl狀態(tài)不一致 的現(xiàn)象呢?通過對匯編代碼的仔細分析,發(fā)現(xiàn)問題出現(xiàn)在 函數(shù)OSTimeTick中,編譯器產生了高效但不可靠的代 碼。筆者使用的開發(fā)平臺是Code Composer V4.1,代碼 生成工具版本為5.11。此版本的代碼生成工具產生的 OSTimeTick函數(shù)的匯編代碼如下:
OSTimeTick函數(shù)的while循環(huán)結構從第5行開始至第23行結束。修改OSRdyGrp的語句是第8行,可以看出對OSRdyGrp的修改沒有保存至相應的內存單元,而是保存在寄存器r0中,對OSRdyTbl的修改卻直接保存到了內存單元(第14行)。位于循環(huán)體外的第4行語句將 OSRdyGrp賦值給10,第24行將r0的內容保存至OSRdyGrp。編譯器利用寄存器優(yōu)化了對OSRdyGrp的訪問,循環(huán)結構中 OSRdyGrp值的每次改變都保存在寄存器中,只是在循環(huán)開始和結束時訪問了兩次內存,編譯器這樣的處理顯然是高效的.如果不優(yōu)化,語句 “OSRdyGrp|=ptcb->OSTCBBitY”必須以讀-改-寫的方式實現(xiàn),OSRdyGrp值的每次改變需要訪問兩次內存,而一般情況下對內存的訪問是耗時的.應盡量避免。由上述代碼容易看出,這樣的優(yōu)化使得對OSRdyGrp的訪問位于臨界區(qū)以外,因而引入了不安全因素。因為在時鐘節(jié)拍中斷服務程序OSTicklSR中允許嵌套中斷,所以第19行以后的語句是可中斷的。如果在20"23行之間發(fā)生了中斷,并且相應的中斷服務程序改變了 OSRdyGrp,那么第24行的賦值可能使OSRdyrp獲得一個錯誤的結果,造成 OSRdy(jrp與C)SRdyrTbl的不一致。第4行的賦值語句同樣是危險的,如果有中斷發(fā)生,rO中暫存的值不一定是當前正確的 OSRdyGrp。奇怪的是,無論采用何種編譯優(yōu)化選項,編譯器對OSRdyGrp的處理都是一樣的,即使禁止優(yōu)化也沒有用。在函數(shù) 0S_TaskStat中對于OSStatRdy 的處理,無論采用何種編譯優(yōu)化選項都不會對OSStatRdy 進行寄存器優(yōu)化。知道原因后,對這一問題的處理是非常簡單的,只要在OSRdyGrp聲明時加上volatile修飾符(位于文件uCOS_II.H中) 就可以禁止編譯器對OSRdyGrp 進行寄存器優(yōu)化。給OSRdyGrp加上volatile修飾符后的編譯結果為:[!--empirenews.page--]
與上面的第7、8行對比可以看出,對OSRdyGrp的每次修改都訪問了內存單元,并且是在臨界區(qū)內進行的。 3 中斷處理程序 因為任務的切換是以中斷方式進行的,如果某個中斷向量的處理程序可能引起任務切換或者允許嵌套中斷,該中斷處理程序必須嚴格按照μC/OS_II要求的步驟進行。其中涉及到全部寄存器的保存與恢復、特定的μC/OS_II 函數(shù)調用、任務切換的處理等。雖然Code Composer支持 C語言的中斷處理函數(shù),但是C函數(shù)的中斷處理程序不能產生正確的堆棧結構,所以最好不要直接用C語言處理中斷而是使用匯編語言。惟一的例外是中斷處理不涉及 μC/0S_II函數(shù)調用,并且禁止中斷嵌套,這時使用C語言會比較方便。時鐘節(jié)拍中斷服務程序OSTicklSR為中斷服務程序的編寫提供了一個很好的范例。OSTicklSR 采用匯編語言實現(xiàn)了寄存器的保存與恢復,以及μC/OS_H 函數(shù)調用,真正的中斷處理在C函數(shù)CSTimeTick中。用戶的中斷處理程序完全可以采用和OSTicklSR相同的匯編語言框架,然后用C函數(shù)完成實際的處理。需要說明的是,如果允許中斷嵌套,開中斷指令必須要放在OSin_ tEnter函數(shù)調用之后。如果在OSintEnter之前開中斷,嵌套的中斷服務程序不會知道自己是否是嵌套執(zhí)行的,因而可能會執(zhí)行任務切換。這樣外層中斷的堆棧將處于一個不確定的狀態(tài),引起系統(tǒng)的崩潰。關于這一點,網上移植代碼的處理是不正確的。 結語 μC/0S-II是一個非常適合TMS320VC33的實時系統(tǒng)。因為μC/OS_II自身的內存占用非常小,對于一般的系統(tǒng)而言,DSP的片上RAM就可以容納全部的操作系統(tǒng)和應用程序代碼。試驗表明,經過正確移植后,系統(tǒng)具備非常高的可靠性。