摘要:覆蓋測試是驗證軟件功能結(jié)構(gòu)正確性以及查找問題的非常重要的方法和手段,它要借助一定的工具才能取得較好的效果,滿足軟件在質(zhì)量和時間上的雙重要求(純粹的人工測試工作量大、不方便、周期長)。如何利用好這方面比較成熟的工具,對其機理的研究及適應性改造是很重要。本文著重描述這類工具的工作機理,以及對嵌入式軟件測試的特殊要求,并以對自主知識產(chǎn)權(quán)嵌入式操作系統(tǒng)的測試為例進行說明。 關(guān)鍵詞:嵌入式操作系統(tǒng) 覆蓋測試 軟件測試工具 1 概述 軟件測試是很廣的概念。從其貫穿軟件生命周期全過程來看,測試可分為模塊測試、集成測試、系統(tǒng)測試等階段。測試還可分為靜態(tài)檢查和動態(tài)運行測試兩大類。在動態(tài)運行測試中,又可有基于程序結(jié)構(gòu)的白盒測試(或稱為覆蓋測試)和基于功能的黑盒測試。測試不僅關(guān)注程序的功能,還有性有測試、強度測試等等。 要達到比較好的測試效果,除了要有周全的測試計劃、
可控的測試過程、測試人員豐富的經(jīng)驗外,還需要借助一些行之有效的輔助工具,尤其在當今軟件規(guī)模日益龐大、測試工作量成倍增加的情況下。對應上述的測試分類情況,測試工具可劃分為:支持對程序源代碼進行靜態(tài)規(guī)則檢查和質(zhì)量評估的靜態(tài)分析工具、支持對程序單元進行動態(tài)覆蓋測試的工具、對軟件系統(tǒng)的整體運行性能進行測試的工具。另外,還有一些特殊用途的或?qū)S霉ぞ?,如協(xié)議測試儀、內(nèi)存檢測工具等。這些工具都有較為成熟的商業(yè)化產(chǎn)品,也可通過自行開發(fā)的方式獲得。 本文具體討論了對一類特殊的系統(tǒng)軟件——嵌入式實時操作系統(tǒng)——進行覆蓋測試的情況。內(nèi)容涉及對這類軟件特性的研究、測試的難點和特點、對現(xiàn)有測試工具的適應性改造和測試實例說明。 2 軟件覆蓋測試 覆蓋是一種白盒測試方法,測試人員必須擁有程序的規(guī)格說明和程序清單,以程序的內(nèi)部結(jié)構(gòu)為基礎(chǔ),來設(shè)計測試案例。其基本準則是則測試案例來盡可能多地覆蓋程序的內(nèi)部邏輯結(jié)構(gòu),發(fā)現(xiàn)其中的錯誤和問題。所以,覆蓋測試一般應用在軟件測試的早期,即單元測試階段。 覆蓋的幾種方法或策略如表1所列。 表1 幾種典型的覆蓋策略 覆蓋策略定 義 語句覆蓋在制定測試案例時,使程序中的每個語句都至少執(zhí)行1次。其缺點是不能發(fā)現(xiàn)某些邏輯錯誤 判定覆蓋執(zhí)行足夠的測試案例,使得程序中每個判定都獲得一次“真”值和“假”值,或者說使每一個分支都至少通過1次 條件覆蓋執(zhí)行足夠的測試案例,使得判定中的每個條件獲得各種可能的結(jié)果 判定/條件覆蓋執(zhí)行足夠的測試案例,使得判定中的每個條件取得各種可能的值,并使得每個判定取得各種可能的結(jié)果 條件組合覆蓋執(zhí)行足夠的測試案例,使得每個判定中的條件的各種組合都至少出現(xiàn)1次。其特點是覆蓋較充分,滿足條件組合覆蓋的測試案例也一定滿足判定覆蓋、條件覆蓋和判定/條件覆蓋。從以上簡要介紹可看出,這幾種覆蓋策略的嚴格程序有如下趨勢:
其它一些覆蓋策略還包括:修改的條件/判斷覆蓋(通常簡稱為MCDC)、路徑覆蓋、函數(shù)覆蓋、調(diào)用覆蓋、線性代碼順序和跳轉(zhuǎn)覆蓋、數(shù)據(jù)流覆蓋、目標代碼分支覆蓋、循環(huán)覆蓋、關(guān)系操作符覆蓋等。隨著軟件規(guī)模的增長,實現(xiàn)全面的覆蓋所需的測試案例的數(shù)目也越來越龐大,因此根據(jù)被測軟件對象的特點選擇適當?shù)母采w策略是非常重要的;同時,要確定合理測試目標,達到100%的覆蓋往往要付出很大的代價,應該同形式化評審等方法結(jié)合,以發(fā)現(xiàn)更多的軟件故障。 3 覆蓋測試工具 要取得較好的覆蓋測試效果,需要借助一定的工具軟件。這些工具軟件一般具備如下的功能特點,可彌補人為測試的缺陷: ①分析軟件內(nèi)部結(jié)構(gòu),幫助制定覆蓋策略及設(shè)計測試案例; ②與適當?shù)木幾g器結(jié)合,對被測軟件實施自動插裝,以便在其運行過程中生成覆蓋信息并收集這些信息; ③根據(jù)搜集的覆蓋信息計算覆蓋率,幫助測試人員找到未被覆蓋的軟件部位,以改進測試案例提高覆蓋率。 在利用工具進行動態(tài)覆蓋測試時,需要3個要素:測試用例、插裝過的被測代碼、搜集覆蓋信息并進行分析的工具本身。代碼插裝由工具自動完成,通過執(zhí)行測試用例,再由工具搜集覆蓋信息并進行分析,就可以看到覆蓋率指標了。圖1展示實現(xiàn)覆蓋測試的基本過程。
4 嵌入式軟件的覆蓋測試原理 嵌入式軟件的開發(fā)與通用軟件很大的不同點在于,需要采用交叉開發(fā)的方式:開發(fā)工具運行在軟硬件配置豐富的宿主機上,而嵌入式應用程序運行在軟硬件資源相對缺乏的目標機上。對于這類軟件的測試也存在著同樣的問題:測試工具運行在宿主機上,測試所需要的信息在目標機上產(chǎn)生,并通過一定的物理/邏輯連接傳輸?shù)娇s主機上,由測試工具接收。因此,嵌入式軟件測試的一個重要問題是建立宿主機與目標機之間的物理/邏輯連接,解決數(shù)據(jù)信息的傳輸問題。 嵌入式軟件覆蓋測試的基本原理如圖2所示。 在目標機方,插裝過的被測應用程序?qū)⒏采w信息發(fā)送到消息隊列中,一個專門的任務(wù)負責在適當?shù)臅r候?qū)⑦@些信息發(fā)送到宿主機方??s主機方有專門的模塊負責接收覆蓋信息。并交給分析工具分析和在線動態(tài)顯示覆蓋率的增長情況。 支持嵌入式軟件覆蓋測試的工具應解決如下2方面的關(guān)鍵問題: *與嵌入式操作系統(tǒng)的結(jié)合
覆蓋測試工具與嵌入式操作系統(tǒng)的結(jié)合體現(xiàn)在3方面。首先,在目標機方,應用任務(wù)與專門負責收集/上傳覆蓋信息的任務(wù)是通過消息隊列來傳遞數(shù)據(jù)的,該消息隊列可使用嵌入式操作系統(tǒng)的相應機制實現(xiàn)。其次,這個專門任務(wù)也可以被看作一個特殊的應用任務(wù),也必須有嵌入式操作系統(tǒng)的支持,因為任務(wù)管理是后者的基本功能之一。最后,目標機與宿主機之間的通信可以采用串口或以太網(wǎng)方式,對串口的驅(qū)動或網(wǎng)絡(luò)協(xié)議均可使用嵌入式操作系統(tǒng)的相應程序組件。 *與其它嵌入式交叉開發(fā)工具的關(guān)系 嵌入式應用程序的開發(fā)通常采用交叉開發(fā)方式,幾乎所有的開發(fā)工具均要解決3部分的問題:宿主機部分的功能、目標機部分的功能、宿主機與目標機的連接問題。其中,宿主機與目標機的連接是個瓶頸,如果不同的工具要使用同一物理線路實現(xiàn)數(shù)據(jù)傳輸,則要解決對該物理線路(或者說硬件端口)的正確共享。比如在圖3所示的環(huán)境中,宿主機方的各種工具通過統(tǒng)一的接口——目標服務(wù)器(target server)實現(xiàn)對通信線路的訪問,目標機方的調(diào)試代理(debug agent)則是各種信息(調(diào)試信息、覆蓋信息、時間信息、對象信息等)的收集與傳遞的核心。 5 Logiscope在嵌入式操作系統(tǒng)DeltaCORE測試中的應用 Logiscope是Verilog公司的CASE產(chǎn)品,對軟件的編碼、測試、維護提供多方面的服務(wù),并且支持嵌入式軟件的覆蓋測試。 5.1 測試前的準備 測試前的準備即為支持對DeltaCORE的測試所做的移植工作。 目前,Logiscope已經(jīng)為一些成熟的商用嵌入式操作系統(tǒng)提供了支持,比如pSOS。DeltaCORE是我國自主開發(fā)的嵌入式強實時操作系統(tǒng)內(nèi)核,為了利用Logiscope實現(xiàn)對DeltaCORE的應用程序乃至DeltaCORE本身的測試,我們主要解決了第4節(jié)中描述的第1個關(guān)鍵問題。
為了支持嵌入式程序的測試,Logiscope提供了運行在目標機方的程序代碼(或稱為目標機端的支持庫),里面包含了: *1個用來收集和發(fā)送覆蓋信息的主循環(huán)線程,該線程即是嵌入式應用中的特殊任務(wù); *實現(xiàn)具體數(shù)據(jù)傳輸?shù)暮瘮?shù),包括對串口或網(wǎng)絡(luò)的驅(qū)動,它們將被上述線程調(diào)用; *插裝函數(shù)的實現(xiàn),這些函數(shù)被被測代碼調(diào)用,向緩沖中放入覆蓋消息塊; *對緩沖信息隊列的管理; *初始化代碼。 例如,當被測程序運行進入到一條if(……)語句時,整個過程如圖4所示。 為了支持對DeltaCORE的測試,將與這些機制相關(guān)的代碼進行移植,包括以下幾方面: *將收集和發(fā)送覆蓋信息的主循環(huán)線程作為在目標機端運行的應用程序中的特殊任務(wù); *對串口的驅(qū)動采用LambdaTOOL BSP(板級支持包)中的串口驅(qū)動代替,對網(wǎng)絡(luò)的驅(qū)動,用DeltaCORE的配套組件DeltaNET中的驅(qū)動程序?qū)崿F(xiàn); *利用DeltaCORE的信箱機制實現(xiàn)消息隊列的創(chuàng)建和管理,插裝代碼向這些信箱發(fā)送覆蓋消息塊; *在DetaCORE應用程序的根任務(wù)中調(diào)用Logiscope的初始化函數(shù),達到創(chuàng)建特殊任務(wù)信箱的目的。 開發(fā)DeltaCORE應用程序時,我們使用了其配套開發(fā)工具LambdaTOOL。由于所使用的工具版本沒有實現(xiàn)目標服務(wù)器(target server)的調(diào)試方式,因此對物理端口的使用采用的獨占方式,即調(diào)試工具不能與其它工具共享同一端口。我們可以用網(wǎng)絡(luò)試上載并啟動目標應用程序,而通過串口傳送覆蓋信息。 5.2 對DeltaCORE的覆蓋測試過程及結(jié)果 對于函數(shù)內(nèi)部,Logiscope支持的覆蓋策略有: *指令塊IBs(Instruction Blocks) *判斷到判斷的路徑DDPs(Decision-to-Decision Paths) *MCDC(Modified Condition/Decision) 在項目層次上支持的覆蓋策略是: *過程到過程路徑PPP(Procedure-to-Procedure Path) 在DeltaCORE的測試中,我們采用了較為常用的覆蓋策略——判斷到判斷的路徑,其含義是:DDP是一個指令序列,它的起點是函數(shù)或判斷(if,while,……)的入口點,它的出口是下一個函數(shù)或判斷的退出點,之間不能再有判斷,比如在圖5中包含了5個DDPs: 測試的具體過程是: ①利用插裝分析器對DeltaCORE的源代碼進行插裝,并生成插裝信息文件。 ②將移植后的Logiscope目標機端程序與插裝后的內(nèi)核源代碼一同編譯鏈接成庫,以替代原來的內(nèi)核庫,供應用程序使用。 ③編寫測試案例,從實現(xiàn)應用的角度使用DeltaCORE的各種系統(tǒng)功能調(diào)用,力求遍歷內(nèi)核函數(shù)所有的判定分支,并將這些案例編譯成可執(zhí)行程序。
④在宿主機端啟動覆蓋信息收集和分析程序,用LambdaTOOL的調(diào)試器下載并啟動應用程序。DeltaCORE的覆蓋信息被傳遞到宿主機上,分析程序動態(tài)顯示覆蓋率的增長情況,并將這些信息記錄在一個文件中。 ⑤應用程序執(zhí)行完畢后,啟動Logiscope的事后分析工具,將覆蓋信息記錄文件與插裝信息文件(在源代碼插裝在生成的附屬文件)進行比較,幫助測試人員清晰地了解每個被測函數(shù)內(nèi)部的路徑覆蓋情況,借此可為測試案例的改進提供幫助。 ⑥測試人員修改測試案例,并重新進行整個測試過程;各項測試的結(jié)果可以疊加,覆蓋率將得到增長。 經(jīng)過2個多月的時間,我們對DeltaCORE 1.1版本79個文件共計115個函數(shù)進行了覆蓋測試,覆蓋率已經(jīng)達到了70.55%。編寫測試用例89個,主要的60個API函數(shù)均已獲得較高的覆蓋,覆蓋率達100%的約占51.3%。 6 小結(jié) 我們借助Logiscope工具對嵌入式實時操作系統(tǒng)DeltaCORE進行了覆蓋測試,達到了較好的覆蓋率;發(fā)現(xiàn)并處理了一些缺陷,提高了軟件的質(zhì)量和可靠性,但同時也存在不足之處: ①測試應好好規(guī)劃,包括測試順序的選擇、測試案例的設(shè)計、測試文檔的管理等等。 ②由于該測試手段依賴于操作系統(tǒng)的有關(guān)機制,而被測對象又是操作系統(tǒng)本身,因此與這些機制有關(guān)的部分代碼未被插裝和測試,否則就會出錯。比如,操作系統(tǒng)的初始化函數(shù)os_init,在這個函數(shù)運行完畢之前,操作系統(tǒng)的相應機制尚未建立起來,因此對它進行插裝就會造成問題,不能正確地得到覆蓋信息。又比如,出于效率方面的考慮,與系統(tǒng)時鐘相關(guān)的部分函數(shù)未被插裝,因為在程序運行過程中,時鐘是最頻繁產(chǎn)生的一種外部事件,如果插裝,就會產(chǎn)生大量的覆蓋信息,會對信息緩存、傳遞、收集和處理造成壓力。另外,所用的工具不支持對匯編函數(shù)的插裝和測試。綜合上述各種原因,DeltaCORE 1.1的總體覆蓋率還顯得比較低,需要采用其它的方法來提高它。對于非操作系統(tǒng)組件及應用的測試,由于不存在操作系統(tǒng)本身的問題,因此可望達到較高的覆蓋率。 ③該方法不能用于時間性能測試。因此它屬于純軟件的測試方式,大量數(shù)據(jù)信息的產(chǎn)生、傳遞與收集對被測程序的干擾大,只能做白盒性的功能結(jié)構(gòu)驗證。如果做性能測試,應采用某些軟硬結(jié)合方式的工具,比如CodeTEST。 對嵌入式軟件產(chǎn)品的測試是多方面的,除覆蓋測試外,還有時間性能測試、內(nèi)存使用測試與分析等,也是我們研究的重要課題。