MCU軟件基準(zhǔn)測試實用技巧:編譯器優(yōu)化能力評測指引
在MCU開發(fā)和應(yīng)用中,工程師都需要進(jìn)行MCU的能力測試,通用的做法是用Benchmark(基準(zhǔn))程序來測試。然而,在做基準(zhǔn)測試時,編譯器的優(yōu)化能力也在測試結(jié)果中有較為明顯的影響,同一套硬件平臺,選用不同的編譯器和不同的優(yōu)化選項,可能得出的結(jié)果相差較大。
為了最大程度釋放MCU的性能,在基準(zhǔn)測試中取得最理想的結(jié)果,往往需要工程師不僅對自身的硬件比較了解,更需要深入了解編譯器的優(yōu)化原理,并靈活應(yīng)用,才能在基準(zhǔn)測試中發(fā)揮出MCU的全部性能。IAR Systems作為全球知名的嵌入式工具廠商,其編譯器在優(yōu)化能力上有獨特的優(yōu)勢,MCU配合IAR的編譯器往往能夠得出較好的基準(zhǔn)測試結(jié)果。
本文以已在MCU領(lǐng)域內(nèi)廣泛使用的IAR Embedded Workbench開發(fā)工具套件為例,來分享MCU軟件基準(zhǔn)測試應(yīng)該注意的項目和以下技巧,從而幫助讀者能夠去生成業(yè)內(nèi)最高效和最完備的代碼。利用以下項目和設(shè)置,工程師可以精準(zhǔn)調(diào)整優(yōu)化等級,最大限度地進(jìn)行測試和提升所開發(fā)和應(yīng)用代碼的性能。
選擇代碼尺寸還是執(zhí)行速度
利用IAR Embedded Workbench等開發(fā)工具套件,工程師可以對整個工程范圍或?qū)蝹€文件設(shè)定優(yōu)化級別和類型。在源代碼中,甚至可以對單個函數(shù)使用 #pragma optimize 指令來完成此操作。
優(yōu)化的目的是減少代碼尺寸和提高執(zhí)行速度。如果只能滿足其中一個目標(biāo),編譯器會根據(jù)用戶指定的設(shè)置進(jìn)行優(yōu)先處理。因此,在實際的軟件基準(zhǔn)測試中,工程師可以嘗試各種設(shè)置來獲得最佳效果。舉個例子,由于函數(shù)內(nèi)聯(lián)更側(cè)重于執(zhí)行速度的優(yōu)化,相較于采用通用代碼尺寸優(yōu)化設(shè)置,采用函數(shù)內(nèi)聯(lián)與通用代碼執(zhí)行速度優(yōu)化設(shè)置將獲得更小的程序代碼。
選擇小型內(nèi)存模型
為了能夠充分地發(fā)揮MCU器件的性能和減少應(yīng)用中的問題,軟件開發(fā)必須充分考慮MCU器件的內(nèi)存等資源限制,因此需要為目標(biāo)器件和項目選擇盡可能小的內(nèi)存模型。小型內(nèi)存模型的優(yōu)點包括:
更小尺寸的地址
更小尺寸的指令
更小尺寸的指針
效率更高
代碼更少
諸如IAR Embedded Workbench這樣的成熟的開發(fā)工具套件也集成了相關(guān)評估功能,可以對內(nèi)存模型進(jìn)行多方面評估,從而幫助工程師去測試軟件的規(guī)模和優(yōu)化設(shè)計。
選擇合適的運行時庫
默認(rèn)情況下,運行時庫是以最高代碼尺寸優(yōu)化級別進(jìn)行編譯的。如果您想要對速度進(jìn)行優(yōu)化,請考慮重新編譯生成這些庫??梢酝ㄟ^配置選項來設(shè)置某些標(biāo)準(zhǔn)庫功能(如語言環(huán)境、文件描述符和多字節(jié))最適合的級別。
根據(jù)具體需求,在庫選項中選擇 scanf 輸入和 printf 的格式。默認(rèn)選項并非最小格式。
使用正確的數(shù)據(jù)類型
數(shù)據(jù)類型與代碼尺寸或者執(zhí)行速度息息相關(guān),因此需要利用開發(fā)工具來對數(shù)據(jù)類型進(jìn)行觀察和分析,以便找到適合硬件資源的類型。在IAR Embedded Workbench開發(fā)工具套件中,開發(fā)人員可以從以下幾個方面著手進(jìn)行測試和優(yōu)化:
選擇最適合您應(yīng)用程序的的數(shù)據(jù)類型尺寸
盡量使用無符號字符型,這樣就能執(zhí)行位操作而不是算術(shù)操作
檢查目標(biāo)特定選項
檢查能提高性能的目標(biāo)特定選項,這在日常的MCU設(shè)計和應(yīng)用開發(fā)中往往需要工程師具有相當(dāng)?shù)慕?jīng)驗,但是通過使用諸如IAR Embedded Workbench這類成熟的開發(fā)工具套件則可以快速而完善地完成必要的性能檢查:
高效的尋址模式——可實現(xiàn)高效的內(nèi)存訪問
使用特定的寄存器來處理常量/變量——代碼在寄存器上的操作效率比在內(nèi)存上更高
偶對齊函數(shù)入口——偶對齊指令可以提高速度
字節(jié)對齊對象——更小的存儲空間需求,但可能生成更大的代碼尺寸
使用基準(zhǔn)測試相關(guān)代碼
所有的MCU開發(fā)工具都應(yīng)該提供基準(zhǔn)測試相關(guān)代碼,但是成熟的通用開發(fā)工具的代碼庫都是這些提供商在相關(guān)領(lǐng)域經(jīng)驗的濃縮,因此更為全面和高效。其中的重要經(jīng)驗包括:
嵌入式系統(tǒng)的基準(zhǔn)測試應(yīng)該針對嵌入式程序的特點來設(shè)計。
實際的應(yīng)用程序通常也適用于基準(zhǔn)測試,但需要確保代碼的可執(zhí)行性。鏈接器會刪除未引用的代碼和變量,但并非所有的鏈接器都具備這種功能。
確保測試代碼不受測試工具(測試相關(guān)函數(shù))的影響。以下示例其實是對 printf() (測試相關(guān)函數(shù))進(jìn)行了基準(zhǔn)測試。
比較鏈接后生成的代碼。一款編譯器可能會采用內(nèi)聯(lián)代碼,而另一款編譯器可能會調(diào)用庫。
充分了解用于執(zhí)行基準(zhǔn)測試的應(yīng)用代碼!
總結(jié)
通過使用諸如IAR Embedded Workbench這類成熟的開發(fā)工具套件,發(fā)揮其在幾十年全球性應(yīng)用中行匯聚和迭代出的知識,MCU設(shè)計和應(yīng)用開發(fā)工程師可以快速完成上述這些必要的性能測試,同時也可以進(jìn)一步有針對性地發(fā)揮MCU的性能,從而實現(xiàn)目標(biāo)器件最優(yōu)化的、軟硬件合一的功能。