嵌入式Linux實時化技術(shù)
引言
Linux支持PowerPC、MIPS、ARM、DSP等多種嵌入式處理器,逐漸被用于多種關(guān)鍵性場合。其中實時多媒體處理、工業(yè)控制、汽車電子等特定應用對Linux提出了強實時性需求。Linux提供了一些實時擴展,但需要進行實時性改造。本文針對嵌入式Linux實時化技術(shù)中的一些關(guān)鍵問題進行了討論,如Linux內(nèi)核時延,實時化主流技術(shù)方案及其評價等。
Linux內(nèi)核時延
主流Linux雖然部分滿足POSIX 1003.1b實時擴展標準,但還不完全是一個實時操作系統(tǒng),主要表現(xiàn)為:
● 任務調(diào)度與內(nèi)核搶占
2.6版本內(nèi)核添加了許多搶占點,使進程執(zhí)行在內(nèi)核代碼時也可被搶占。為支持內(nèi)核代碼可搶占,在2.6版內(nèi)核中通過采用禁用中斷的自旋鎖來保護臨界區(qū)。但此時如果有低優(yōu)先級進程在臨界區(qū)中執(zhí)行,高優(yōu)先級進程即使不訪問低優(yōu)先級所保護的臨界區(qū),也必須等待低優(yōu)先級進程退出臨界區(qū)。
● 中斷延遲
在主流Linux內(nèi)核設計中,中斷可以搶占最高優(yōu)先級的任務,使高優(yōu)先級任務被阻塞的最長時間不確定。而且,由于內(nèi)核為保護臨界區(qū)需要關(guān)閉中斷,更加增長了高優(yōu)先級任務阻塞時間。
● 時鐘精度
Linux通過硬件時鐘編程來產(chǎn)生毫秒級周期性時鐘中斷進行內(nèi)核時間管理,無法滿足實時系統(tǒng)較高精度的調(diào)度要求。內(nèi)核定時器精度同樣也受限于時鐘中斷,無法滿足實時系統(tǒng)的高精度定時需求。
● 其他延遲
此外,Linux內(nèi)核其他子系統(tǒng)也存在多種延遲。比如為了增強內(nèi)核性能和減少內(nèi)存消耗,Linux僅在需要時裝載程序地址空間相應的內(nèi)存頁。當被存取內(nèi)容(如代碼)不在RAM中則內(nèi)存管理單元(MMU)將產(chǎn)生頁表錯誤(Page-Fault)觸發(fā)頁面裝載,造成實時進程響應時間不確定。
Linux實時化技術(shù)發(fā)展
主流Linux內(nèi)核1.x、2.2.x和2.4.x版本的Linux內(nèi)核無搶占支持,直到2.6版本的Linux內(nèi)核才支持可搶占內(nèi)核,支持臨界區(qū)外的內(nèi)核搶占和可搶占的大內(nèi)核鎖。在此基礎上,Linux采用了下列兩類實時化技術(shù)。
● 雙內(nèi)核方式
Linux內(nèi)核實時化雙內(nèi)核方式以RTLinux、RTAI和Xenomai等為典型代表。其中RTLinux實現(xiàn)了一個微內(nèi)核實時操作系統(tǒng)支持底層任務管理、中斷服務例程、底層任務通信隊列等。普通Linux作為實時操作系統(tǒng)的最低優(yōu)先級任務,Linux下的任務通過FIFO命名管道和實時任務進行通信,如圖1所示。
當Linux要關(guān)閉中斷時,實時微內(nèi)核會截取并記錄這個請求,通過軟件來模擬中斷控制器,而沒有真正關(guān)閉硬件中斷,避免了由于關(guān)中斷所造成的響應延遲。RT-Linux將系統(tǒng)實時時鐘設置為單次觸發(fā)模式,提供微秒級的時鐘精度。RTAI類似RTLinux的實現(xiàn)方式,不同之處在于它修改了體系結(jié)構(gòu)相關(guān)代碼,形成一個實時硬件抽象層(RTHAL),使其實時任務能在任何時刻中斷普通Linux任務,兩者之間通過非阻塞隊列進行通訊。RTAI將直接修改Linux內(nèi)核的代碼減至最少,具有更好的可移植性。Xenomai以RTAI為基礎,也稱RTAI /Fusion。采用了Adeos微內(nèi)核替代RTAI的硬件抽象層。其特色還在于模仿了傳統(tǒng)RTOS的API接口,推動傳統(tǒng)RTOS應用在GNU/Linux下的移植。類似還有基于Fiasco微內(nèi)核的L4Linux等開源項目。
● 內(nèi)核補丁方式
雙內(nèi)核實時方案下,實時任務需要按照微內(nèi)核實時操作系統(tǒng)提供的另外一套API進行設計。而內(nèi)核補丁方式則不改變Linux的API,原有應用程序可在實時化后的操作系統(tǒng)上運行,典型的有早期研究性的Kurt-Linux和Red-Linux,商業(yè)版本的MontaVista、TimeSys 和Wind River Linux,以及現(xiàn)階段Ingo Monlnar等人開發(fā)的實時搶占補丁內(nèi)核等[3]。
Kurt-Linux是第一個基于普通Linux的實時操作系統(tǒng)。通過正常態(tài)、實時態(tài)和混合態(tài)進行實時和非實時任務的劃分。RED-Linux通過任務多種屬性和調(diào)度程序,可以實現(xiàn)多種調(diào)度算法。采用軟件模擬中斷管理,并在內(nèi)核插入了許多搶占點,提高了系統(tǒng)調(diào)度精度。
MontaVista Linux在低延遲補丁以及可搶占內(nèi)核補丁基礎上[4],通過開發(fā)內(nèi)核O(1)實時調(diào)度程序并對可搶占內(nèi)核進行了改進和測試,Linux 2.4內(nèi)核時代,MontaVista Linux 作為商業(yè)成熟產(chǎn)品在實時性上有較強的優(yōu)勢。TimeSys Linux通過內(nèi)核模塊的方式也提供了高精度時鐘、優(yōu)先級繼承mutex等支持。
2.6版本的主流內(nèi)核吸收了以上技術(shù),支持CONFIG_PREEMPT_NONE,CONFIG_PREEMPT_VOLUNTARY和CONFIG_PREEMPT等多種配置選項。分別適合于計算型任務系統(tǒng),桌面用戶系統(tǒng)和毫秒級延遲嵌入式系統(tǒng)。2005年,針對2.6內(nèi)核MontaVista推出了實時Linux計劃,推進了Linux內(nèi)核實時化進程。隨后Ingo Molnar發(fā)布了新的實時搶占補丁,并逐漸成為Linux內(nèi)核實時主流技術(shù),也為包括MontaVista Linux,Wind River Linux采用和補充,本文后續(xù)內(nèi)容要涉及實時搶占補丁。[!--empirenews.page--]
Linux實時化技術(shù)及評價
2.6版本Linux內(nèi)核實時性能有一定增強,雙內(nèi)核方式的Linux實時化技術(shù)也在不斷發(fā)展中。原來由FSMLab維護的RTLinux,其版權(quán)在2007年2月被Wind River購買,RTAI支持x386等體系結(jié)構(gòu),但由于其代碼較難維護、bug較難調(diào)試等原因,許多開發(fā)者加入了Xenomai項目。Xenomai支持最新2.6版 Linux,相比之下代碼相對穩(wěn)定和可維護,開發(fā)模式較活躍。
內(nèi)核補丁方式的Linux實時化技術(shù)在2.6版內(nèi)核基礎上做了大量改進,使得內(nèi)核中除了中斷關(guān)閉和IRQ線程分派、調(diào)度和上下文切換之外的絕大部分代碼都可以被搶占,不可搶占的自旋鎖保護臨界區(qū)從一千多個減少到幾十個,使得內(nèi)核實時性得到極大的提高,獲得社區(qū)廣泛支持并逐漸成為Linux實時化主流技術(shù)。
Linux內(nèi)核實時化改進
實時搶占內(nèi)核補丁針對Linux各種延遲進行了實時化改進,主要包括了幾個方面的技術(shù)。
● 實時搶占內(nèi)核
為了實現(xiàn)內(nèi)核完全可搶占,實時內(nèi)核臨界區(qū)用高性能優(yōu)先級繼承mutex替換原來自旋鎖(spin-lock)來進行保護,使得在臨界區(qū)內(nèi)的執(zhí)行也可被搶占。只有當線程想訪問一個其他線程正在訪問的臨界區(qū)時,才被調(diào)度至睡眠,直到所保護的臨界區(qū)被釋放時被喚醒。
在實時搶占內(nèi)核中通過優(yōu)先級繼承機制(PI)在線程被一個低優(yōu)先級線程所持有的資源阻塞時,低優(yōu)先級線程通過繼承被阻塞線程優(yōu)先級,盡快執(zhí)行并釋放所持資源而不被其他線程所搶占。
● 新型鎖機制帶來內(nèi)核性能提升
實時搶占補丁替換了大內(nèi)核鎖(BKL),將BKL從spin lock改成是mutex,持有BKL的線程也可以被搶占,減少了內(nèi)核調(diào)度延遲。此外,實時搶占補丁通過mutex替代semaphore,避免了不必要的時間負載。實時搶占補丁實現(xiàn)了可搶占的RCU(Read- Copy Update)鎖和串行化讀寫鎖,保證了執(zhí)行可預測性,提高了性能。
● 中斷線程化
實時搶占補丁通過內(nèi)核線程來實現(xiàn)一些硬件中斷和軟件中斷的服務程序。體系結(jié)構(gòu)相關(guān)處理代碼設置IRQ狀態(tài)、檢查線程化的中斷是否使能,并喚醒相關(guān)線程。在中斷線程被調(diào)度執(zhí)行后,進行中斷服務處理。在實時搶占內(nèi)核中,用戶線程優(yōu)先級可以高于設備中斷服務線程。實時任務無需等待設備驅(qū)動處理程序執(zhí)行,減小了實時搶占延遲。
● 時鐘系統(tǒng)改進
實時搶占內(nèi)核的時鐘系統(tǒng)重新進行了設計,實現(xiàn)了高精度定時器。時鐘精度不再依賴jiffies,使POSIX定時器和nanosleep精度由具體硬件所能提供的精度決定,使得gettimeofday能夠提供實時系統(tǒng)所需的精確時間值。
● 其他改進
Linux在用戶層支持性能良好的futex,實現(xiàn)原理類似于內(nèi)核優(yōu)先級繼承mutex,僅在產(chǎn)生競態(tài)時進入內(nèi)核,提高了應用程序性能。此外,實時搶占補丁內(nèi)核還提供mutex死鎖檢測、延遲跟蹤與測量、中斷關(guān)閉跟蹤與延遲測量、搶占延遲測量等內(nèi)核調(diào)試與診斷、內(nèi)核性能測量與調(diào)優(yōu)等工具、實時Trace支持( Ftrace)等支持。
現(xiàn)階段實時化技術(shù)在各體系結(jié)構(gòu)上逐漸得到了支持,如表1所示。
實時搶占內(nèi)核延遲
現(xiàn)階段,實時搶占補丁技術(shù)仍處于完善過程中,其表現(xiàn)在以下幾點不足。
● 中斷延遲
即使不發(fā)生中斷線程搶占,實時搶占內(nèi)核相對原來中斷服務機制額外增加一對上下文切換時間,用于喚醒中斷服務線程執(zhí)行和進入睡眠狀態(tài)。此外,內(nèi)核中還存在少量用raw_spinlock鎖禁用中斷來保護的臨界區(qū),需要計算這些鎖造成的中斷延遲。
● 任務搶占延遲
內(nèi)核搶占延遲主要是由于在內(nèi)核中使用各種鎖機制用于控制任務和中斷對臨界區(qū)的訪問所造成的,特別是實時搶占內(nèi)核中為了避免優(yōu)先級逆轉(zhuǎn)增加的鎖機制帶來了額外時間負載。
● 內(nèi)核模塊其他延遲
在實時搶占補丁中,內(nèi)存管理模塊還需減少頁表錯誤引起的延遲,降低mlockall內(nèi)存鎖存造成的性能降級影響。實時搶占內(nèi)核中高精度定時器的使用導致了額外定時器管理時間負載。此外,內(nèi)核中一些驅(qū)動程序需要針對實時應用進行優(yōu)化來提高實時響應。軟浮點處理和軟浮點內(nèi)核仿真需要和實時搶占補丁兼容,能耗管理子系統(tǒng)還需要具備實時系統(tǒng)感知能力。
實時搶占內(nèi)核性能測試
本文在Intel Pentium M 1.7GHz處理器上進行了測試。測試環(huán)境包括:Linux內(nèi)核2.6.25.8最小配置;patch-2.6.25.8-rt7實時補丁;libc 2.5+和busybox-1.10.0構(gòu)建initrdfs方式的根文件系統(tǒng)。
● 中斷延遲
采用實時搶占補丁支持的內(nèi)核中斷延遲測量工具測量中斷關(guān)閉(IRQ OFF)時間。在100%負載情況下,十萬采樣點中,最大值在31ms左右,絕大多數(shù)在1ms左右。
● 任務搶占延遲
內(nèi)核搶占關(guān)閉時間采用實時搶占補丁所支持的內(nèi)核搶占關(guān)閉測量工具測量。實時搶占內(nèi)核和普通Linux內(nèi)核情況比較如表2所示。
實時應用中周期性任務需要能在確定的時間內(nèi)得到執(zhí)行。實時搶占內(nèi)核和普通內(nèi)核下的周期性任務延遲對比中可以看出實時搶占內(nèi)核提供了實時任務的精確執(zhí)行,如圖2所示。