Small RTOS51中的一個(gè)典型問題及其解決方法
small rtos5l是一款專門為80c5l系列單片機(jī)設(shè)計(jì)的實(shí)時(shí)操作系統(tǒng)(實(shí)際上應(yīng)該稱其為實(shí)時(shí)內(nèi)核),大部分代碼用c語言編寫,易于移植,十分適合于資源緊張的8位機(jī)。同時(shí),它也是學(xué)習(xí)嵌入式操作系統(tǒng)原理極好的入門材料。本人就是在學(xué)習(xí)完smallrtos5l的基礎(chǔ)上進(jìn)一步學(xué)習(xí)了著名的uc/0s-ii,受益頗多。 1 問題描述 在將smau rtos51應(yīng)用于實(shí)驗(yàn)室某項(xiàng)目時(shí),發(fā)現(xiàn)了一個(gè)奇怪的問題。簡單說來,就是一個(gè)以無條件方式申請(qǐng)消息的任務(wù)竟然在沒有取到消息的情況下,以指示“等待超時(shí)”的代碼返回了。 在這里,首先解釋一下任務(wù)申請(qǐng)消息的兩種方式:無條件方式和超時(shí)方式。所謂五條件方式是指任務(wù)申請(qǐng)消息時(shí),如果暫時(shí)沒有消息可取,則任務(wù)將一直等待消息,直至取到為止;而超時(shí)方式是指任務(wù)等待消息是有時(shí)間限制的,超過所設(shè)定的最大時(shí)間,即便沒有取到消息,函數(shù)也可以正常返回,只是返回值不是消息,而是“超時(shí)代碼”(此方式可以防止任務(wù)因取不到消息而被永久性掛起)??梢姡绻蝿?wù)以無條件方式申請(qǐng)消息,那么函數(shù)若能夠返回,則說明任務(wù)一定是取到消息了,而返回值又怎么可能是“等待超
時(shí)”呢?經(jīng)過仔細(xì)分析smallrts5l的源代碼,找到了問題產(chǎn)生的根源。 假定有任務(wù)idx以超時(shí)方式調(diào)用osqpend()函數(shù)申請(qǐng)消息。osqpend()函數(shù)首先會(huì)把idx放到此消息隊(duì)列的等待任務(wù)表中,然后再去判斷隊(duì)列中是否有消息。最佳情況是隊(duì)列中確實(shí)有消息,則osqpend()再把idx從此消息隊(duì)列的等待任務(wù)表中刪除,接著osqpend()返回,任務(wù)取到消息。 此刻,假定消息隊(duì)列中設(shè)有消息。那么,osqpend()就會(huì)調(diào)用osclearsigna1(osrunningtaskid())和os-sched()這兩個(gè)系統(tǒng)函數(shù),迫使idx進(jìn)入休眠態(tài),同時(shí)調(diào)度器調(diào)度下一個(gè)最高優(yōu)先級(jí)的就緒任務(wù)來運(yùn)行。假定任務(wù)idy被選中,且idy在運(yùn)行中通過調(diào)用osqintpost()函數(shù)向此消息隊(duì)列發(fā)送了一則消息。則osintpost()將把所有等待這個(gè)消息隊(duì)列的任務(wù)中優(yōu)先級(jí)最高的那個(gè)任務(wù)喚醒,并且把它從該消息隊(duì)列的等待任務(wù)表中刪除,假定它就是idx?! ‘?dāng)任務(wù)idy進(jìn)入休眠態(tài)后,操作系統(tǒng)才會(huì)調(diào)度idx來運(yùn)行。于是idx從上次被強(qiáng)迫休眠的地方開始運(yùn)行,即從osqpend()函數(shù)中緊接著ossched()的那條指令開始執(zhí)行。具體來說,osqpend()將首先查看idx是否滿足超時(shí)條件(用來判斷任務(wù)是因?yàn)榈却瑫r(shí)被喚醒的還是因?yàn)榇_實(shí)取到消息而被喚醒的),若超時(shí)時(shí)限尚未到達(dá),osqpend()再接著檢查消息隊(duì)列中是否已經(jīng)有了消息。根據(jù)上面的假定,可以知道任務(wù)idx確實(shí)是因?yàn)槿〉较⒍粏拘训?。于是,osqpend()把idx從此消息隊(duì)列的等待任務(wù)表中刪除,osqpend()正常返回。這樣,任務(wù)idx取到消息,接著運(yùn)行。 以上都沒有什么問題,但是,有一種情況被忽略了,而正是這種情況的出現(xiàn)導(dǎo)致了任務(wù)idx被長時(shí)間掛起,就算隊(duì)列中有消息存在,idx也無法被喚醒,只能等到其超時(shí)為止。 為討論方便,不妨仍按上述假定情況來分析。當(dāng)任務(wù)idx被喚醒且idy進(jìn)入休眠狀態(tài)后,系統(tǒng)必將調(diào)度下一個(gè)優(yōu)先級(jí)最高的就緒任務(wù)來運(yùn)行。在前面,認(rèn)為這個(gè)任務(wù)就是idx,然而此時(shí),假定它是另一個(gè)比idx優(yōu)先級(jí)更高的任務(wù)idz(因?yàn)橛锌赡苁侵袛喟裪dz喚醒的,所以中斷退出時(shí),操作系統(tǒng)強(qiáng)制idy進(jìn)入休眠態(tài),轉(zhuǎn)而調(diào)度idz運(yùn)行)。非常巧合的是,idz在運(yùn)行的過程中向同一個(gè)消息隊(duì)列也申請(qǐng)了消息。由于之前idy已經(jīng)向消息隊(duì)列發(fā)送過一條消息,則idz將正常取到此條消息。于是,消息隊(duì)列中的消息數(shù)減為o(buf[0]==0)。在任務(wù)idz進(jìn)入休 眠后,任務(wù)idx被操作系統(tǒng)調(diào)入cpu運(yùn)行。同樣,函數(shù)osqpend()首先查看idx是否等待超時(shí)。如果沒有超時(shí)再檢查消息隊(duì)列中是否存在消息。注意到先前已經(jīng)假定消息被任務(wù)idz給取走了,所以檢查的結(jié)果當(dāng)然是隊(duì)列中不存在消息。idx就只好再次進(jìn)入休眠,函數(shù)ossched()調(diào)度別的任務(wù)運(yùn)行。 于是問題出現(xiàn)了。idx是因?yàn)闀簳r(shí)取不到消息而被掛起的,但此時(shí)這個(gè)消息隊(duì)列的等待任務(wù)表中已經(jīng)投有idx的蹤影了,它之前就已被那個(gè)發(fā)送消息的idy在osqintpost()函數(shù)中給刪除了。 結(jié)果,即使后面有任務(wù)再次向隊(duì)列中發(fā)送消息,idx也取不到了,因?yàn)橄l(fā)送函數(shù)osqintpost()已經(jīng)無法從消息隊(duì)列的等待任務(wù)表中找到idx了,它將被長時(shí)間掛起,直至超時(shí)。也就是說,任務(wù)idx明明可以取到消息的,卻取不到,最后只能以指示其等待超時(shí)的代碼返回。 這還是一種相對(duì)來說不太嚴(yán)重的錯(cuò)誤,無非就是任務(wù)沒取到消息,以超時(shí)返回而已.如果任務(wù)idx以無條件方式申請(qǐng)消息,而又恰恰發(fā)生了上面的情況,會(huì)有什么樣的后果呢?由于osqpend()函數(shù)自身的特性,所謂五條件等待就是把超時(shí)時(shí)間設(shè)為0。結(jié)果任務(wù)idx被喚醒后,osqpend()必然會(huì)檢測(cè)到其已超時(shí),然后又會(huì)檢測(cè)到隊(duì)列中沒有消息,所以就必然以“超時(shí)代碼”返回。結(jié)果就發(fā)生了文章開頭所說的一幕;一個(gè)必須在取到消息后才能返回的任務(wù),居然在沒有取到消息的情況下以指示其等待超