發(fā)揮ARM Cortex-M3和M4微控制器最大作用的要訣
引言
許多嵌入式開發(fā)人員對ARM Cortex處理器架構(gòu)頗為熟悉,但很少有人能夠?qū)@種流行架構(gòu)了如指掌,從而可以充分發(fā)揮它獨特的特性和性能。新型ARM Cortex-M4處理器尤為如此,它擁有引以為豪的增強架構(gòu)、天生的數(shù)字信號處理(DSP)能力和可選的浮點加速器,使精于此道的程序設(shè)計人員或硬件工程師可以充分發(fā)揮它的優(yōu)勢。本文接下來將就Cortex-M3/M4微控制器(MCU)的一些更有趣的(但經(jīng)常遭到忽視的)特性展開詳細(xì)的論述。
大部分采用Cortex-M3/M4 MCU的目標(biāo)應(yīng)用是便攜式的,并且供電電源來自電池或能源收集系統(tǒng),因此我們所探討的大部分概念涉及如何減少系統(tǒng)整體能耗的技術(shù)。然而,在許多情況下,這些節(jié)能技術(shù)也是處理器應(yīng)用設(shè)計的有力工具,可提供:
●更符合成本效益的解決方案
●更大的升級和采用新特性的設(shè)計冗余
●有助于產(chǎn)品在激烈競爭市場上脫穎而出的性能和特性
ARM Cortex基本介紹
就像Advanced RISC Machines(ARM)公司在20世紀(jì)80年代所推出的第一代16位處理器內(nèi)核一樣,ARM Cortex系列以哈佛式RISC架構(gòu)為基礎(chǔ),采用適度的硅封裝工藝獲得更高性能,以及代碼和內(nèi)存效率。該架構(gòu)在過去十年間大有進展,擴展出了三種不同的子系列,以滿足特定應(yīng)用的需求:
●A型系列處理器針對高效能開放應(yīng)用平臺而優(yōu)化設(shè)計。
●R型系列處理器注重提升實時應(yīng)用的性能和可靠度。
●M型系列處理器特別為采用嵌入式MCU的應(yīng)用而設(shè)計,其性能必須在能源效率和降低解決方案成本之間加以平衡。適用于Cortex M系列的常見應(yīng)用包括智能電表、人機接口設(shè)備、汽車與工業(yè)控制系統(tǒng)、白色家電、消費電子產(chǎn)品和醫(yī)療器材等。
Cortex-M3對比Cortex-M4
Cortex-M3架構(gòu)背后的指導(dǎo)思路是設(shè)計一種既要滿足應(yīng)用的成本效益又要提供高性能計算和控制1的處理器。類似的應(yīng)用包括汽車車身系統(tǒng)、工業(yè)控制系統(tǒng)和無線網(wǎng)絡(luò)/傳感器產(chǎn)品等。M3系列為32位的ARM處理器架構(gòu)引進了多項重要特性,包括:
●不可屏蔽式中斷
●高度確定性、嵌套、向量式中斷
●原子位操作
●可選的存儲保護(MPU)
除了絕佳的計算性能,Cortex-M3處理器先進的中斷結(jié)構(gòu)還能確保系統(tǒng)迅速響應(yīng)真實世界的事件,同時仍然提供極低的動態(tài)與靜態(tài)功耗2.
圖1:Cortex-M3與M4處理器內(nèi)核的比較。
Cortex-M3和M4處理器共享許多相同的設(shè)計要素,包括先進的片內(nèi)調(diào)試特性,以及執(zhí)行完整ARM指令集或ARM指令子集(用于THUMB2處理器)的能力。Cortex-M4處理器的指令集具有增強的高效DSP特性庫,包括擴展的單周期16/32位乘法累加器(MAC)、雙16位MAC指令、優(yōu)化的8/16位SIMD運算及飽和運算指令??傮w來說,M3與M4最顯著的差別在于,M4具有可選的單精度(IEEE-754)浮點單元(FPU)。
多項秘訣造就巧妙解決方案
嵌入式設(shè)計的成敗經(jīng)常取決于如何在系統(tǒng)性能、能耗和解決方案成本之間找到適當(dāng)?shù)钠胶?。許多情況下,開發(fā)人員可以采用Cortex-M處理器上的獨特特性來優(yōu)化產(chǎn)品成本或能源需求,同時維持、甚至提升它的性能。例如,Cortex-M內(nèi)核天生的串行I/O能力能夠用于節(jié)省能源、簡化開發(fā)、釋放外設(shè)以用于其它應(yīng)用任務(wù)。
除了傳統(tǒng)的串行調(diào)試(Serial Wire Debug)功能之外,基于ARM Cortex-M的MCU還可以通過它的單引腳串行監(jiān)視器輸出(Serial Wire Viewer Output,SWO)3提供指令跟蹤接口,如圖2所示。這個接口可以直接把“printf格式的”調(diào)試信息傳遞給應(yīng)用代碼。SWO允許調(diào)試信息直接在任何標(biāo)準(zhǔn)的IDE中瀏覽。此外,這些信息也可以用獨立的SWO監(jiān)視器(例如,Segger的J-Link SWO Viewer軟件4,或是Silicon Labs的energyAware Commander 4)進行瀏覽。由于SWO輸出內(nèi)建于內(nèi)核硬件本身,因此它是Cortex-M內(nèi)核與生俱來的優(yōu)點。SWO不占用MCU的任何UART接口,這些接口它們可能早已被分配給了應(yīng)用。
圖2:專用ARM Cortex SWO接口節(jié)省I/O引腳并加速調(diào)試。
基于SWO的調(diào)試還有一個重要的優(yōu)勢在于,它讓微控制器在進入最低的休眠模式時,保持調(diào)試連接有效,而在大多數(shù)情況下,傳統(tǒng)的調(diào)試連接這時是不能正常工作的。SWO的指令追蹤還可以用于跟蹤程序計數(shù)器,以幫忙IDE統(tǒng)計出程序各項功能所占用的時間。這些統(tǒng)計數(shù)字能夠與電流測量結(jié)合起來,幫助開發(fā)人員對設(shè)計功耗進行微調(diào)。
基于Cortex-M的微控制器供應(yīng)商正在開始重新認(rèn)識這項優(yōu)點,而且有些廠商已經(jīng)為了這個目的而把功耗模式和電流測量硬件納入到本身的開發(fā)平臺。例如,Silicon Labs的EFM32 Gecko MCU入門級和開發(fā)級工具包都包含功耗測量輸出,并可搭配energyAware Profiler工具6中的程序代碼追蹤功能。圖3顯示了如何讓設(shè)計人員精確定位到哪個程序功能塊最耗費能源,并且能夠快速調(diào)試其它與能源有關(guān)的問題。
圖3:軟硬件工具精確定位耗能最大的功能,無需示波器和萬用表,快速排除問題。
智能休眠節(jié)省每一微瓦
ARM Cortex-M處理器的Sleep-on-Exit(中斷完成時直接進入休眠)是另一項“一箭雙雕”的功能,可同時節(jié)省CPU周期和能耗。這點在由中斷所驅(qū)動的應(yīng)用中格外有用,因為處理器的大部分時間不是在執(zhí)行中斷處理,就是在中斷事件之間休眠。在進入中斷服務(wù)例程(ISR)時,MCU必須花費好幾個指令周期把當(dāng)前線程狀態(tài)入棧,然后在退出中斷處理返回時恢復(fù)原有線程狀態(tài),即“出棧”。當(dāng)應(yīng)用需要處理器在退出ISR后直接進入休眠狀態(tài)時,傳統(tǒng)MCU仍然必須恢復(fù)原先存儲的狀態(tài)信息,然后線程代碼才能讓MCU進入休眠狀態(tài)。同樣地,當(dāng)下次的中斷喚醒MCU時,它的狀態(tài)必須再次入棧。
而當(dāng)使能ARM Cortex-M微控制器上的Sleep-on-Exit功能后,MCU就會在中斷處理完成后直接進入休眠狀態(tài),而不用先返回到原有線程上(見圖4)。這會使處理器仍然保持在中斷狀態(tài),因為消除了喚醒再入棧過程,因而節(jié)省下許多寶貴的機器周期。消除入棧出棧過程既節(jié)省了時間也節(jié)省了能耗,否則電能就會被不必要的指令周期白白消耗,也包括哪些傳統(tǒng)MCU在休眠和喚醒之間管理堆棧的代碼。而且,當(dāng)處理器被中止調(diào)試請求(Halt Debug Request)喚醒時,出棧過程將會自動進行。
圖4:ARM Cortex-M的Sleep-on-Exit功能通過避免不必要的代碼執(zhí)行和減少出棧入棧操作降低功耗。(引自:《The Definitive Guide to the ARM Cortex-M31》)
ARM Cortex-M4運行更快、休眠功耗更低
像許多MCU一樣,Cortex-M3/4處理器通常能夠采用高時鐘速率的方法在中斷驅(qū)動的應(yīng)用中節(jié)省能耗。如果處理器大部分時間處于休眠狀態(tài),這種看似違背直覺但普遍采用的節(jié)能策略就會很好,因為運行時間減少所節(jié)省的能耗遠(yuǎn)遠(yuǎn)大于稍高的操作電流。簡單來說,多花10%的電可以省掉20%的時間,總體來說是節(jié)能了。
這種技術(shù)可以應(yīng)用在任何Cortex-M系列的處理器上,而涉及密集運算任務(wù)的應(yīng)用也能從Cortex-M4處理器的額外能力中受益。它的單周期DSP指令和可選的浮點加速器能大大減少諸如數(shù)字信號處理、過濾、分析或波形合成等功能所需要的執(zhí)行周期數(shù)。
一些應(yīng)用僅僅需要DSP處理能力。例如,有些安全系統(tǒng)采用一種以聲學(xué)分析來感測玻璃破損的裝置。玻璃破損時會發(fā)出一連串獨特的聲音和振動,并且在玻璃特有的固有頻率時達(dá)到最大,在這個例子中是13kHz。大多數(shù)采用傳感器接口的系統(tǒng)只有在所監(jiān)測的頻率被監(jiān)測到時,才喚醒處理器。但是當(dāng)設(shè)計中使用帶DSP功能的Cortex-M4時就能額外節(jié)能,因為它在執(zhí)行實際的玻璃破損分析時比軟件解決方案更快。
甚至,這些使用基于M4微控制器的應(yīng)用可以更加節(jié)能,因為MCU中所包含的高級休眠模式和自治外設(shè)可以在CPU休眠時執(zhí)行許多日程任務(wù)。例如,以Cortex-M4為內(nèi)核的Wonder Gecko MCU7具有五種不同的低功耗模式,包括20nA的關(guān)機狀態(tài)和950nA的深度休眠模式(實時時鐘有效、RAM和寄存器內(nèi)容保持、使能掉電檢測)。
上面提及的節(jié)能特性也能帶來其它優(yōu)勢。例如,在超音波/聲學(xué)水表之類的應(yīng)用中,它們必須在小電池供電下運行多年,需要MCU盡可能長的保持在休眠狀態(tài)。除了有助于減少MCU喚醒時間之外,Cortex-4 DSP和浮點算術(shù)指令也能使用成熟的濾波功能從廉價聲學(xué)傳感器輸出中獲得所需的信息,從而避免采用昂貴的超聲波流量傳感器。在這個應(yīng)用實例中,Wonder Gecko MCU的外設(shè)還能夠作為模擬狀態(tài)機提供額外的能量節(jié)省,它僅僅在需要時才喚醒Cortex-M4處理器。
結(jié)論
雖然并不完備,但這些林林總總的秘訣與妙方應(yīng)該能讓各位產(chǎn)生好的思路,可以在下一次設(shè)計中充分利用Cortex-M系列中一些較不為人知的特性所帶來的好處。為了發(fā)揮ARM Cortex-M系列的這些和其它重要功能,可參考本文末段的參考資料,它們提供了所需的更多細(xì)節(jié)。
此外,如何通過選擇搭配有合適I/O、加速器和其它先進外設(shè)的ARM MCU來改善設(shè)計性能、功耗和解決方案成本,來自Silicon Labs的EFM32 Gecko和Wonder Gecko MCU系列產(chǎn)品提供了極佳范例。