發(fā)揮ARM Cortex-M3和M4微控制器最大作用的要訣

時(shí)間：2014-01-23 14:13:06

關(guān)鍵字： ARM 微控制器 CORTEX-M3 MCU

手機(jī)看文章

掃描二維碼
隨時(shí)隨地手機(jī)看文章

[導(dǎo)讀] 引言許多嵌入式開(kāi)發(fā)人員對(duì)ARM Cortex處理器架構(gòu)頗為熟悉，但很少有人能夠?qū)@種流行架構(gòu)了如指掌，從而可以充分發(fā)揮它獨(dú)特的特性和性能。新型ARM Cortex-M4處理器尤為如此，它擁有引以為豪的增強(qiáng)架構(gòu)、天生的數(shù)字信

引言

許多嵌入式開(kāi)發(fā)人員對(duì)ARM Cortex處理器架構(gòu)頗為熟悉，但很少有人能夠?qū)@種流行架構(gòu)了如指掌，從而可以充分發(fā)揮它獨(dú)特的特性和性能。新型ARM Cortex-M4處理器尤為如此，它擁有引以為豪的增強(qiáng)架構(gòu)、天生的數(shù)字信號(hào)處理(DSP)能力和可選的浮點(diǎn)加速器，使精于此道的程序設(shè)計(jì)人員或硬件工程師可以充分發(fā)揮它的優(yōu)勢(shì)。本文接下來(lái)將就Cortex-M3/M4微控制器(MCU)的一些更有趣的(但經(jīng)常遭到忽視的)特性展開(kāi)詳細(xì)的論述。

大部分采用Cortex-M3/M4 MCU的目標(biāo)應(yīng)用是便攜式的，并且供電電源來(lái)自電池或能源收集系統(tǒng)，因此我們所探討的大部分概念涉及如何減少系統(tǒng)整體能耗的技術(shù)。然而，在許多情況下，這些節(jié)能技術(shù)也是處理器應(yīng)用設(shè)計(jì)的有力工具，可提供：

●更符合成本效益的解決方案

●更大的升級(jí)和采用新特性的設(shè)計(jì)冗余

●有助于產(chǎn)品在激烈競(jìng)爭(zhēng)市場(chǎng)上脫穎而出的性能和特性

ARM Cortex基本介紹

就像Advanced RISC Machines(ARM)公司在20世紀(jì)80年代所推出的第一代16位處理器內(nèi)核一樣，ARM Cortex系列以哈佛式RISC架構(gòu)為基礎(chǔ)，采用適度的硅封裝工藝獲得更高性能，以及代碼和內(nèi)存效率。該架構(gòu)在過(guò)去十年間大有進(jìn)展，擴(kuò)展出了三種不同的子系列，以滿足特定應(yīng)用的需求：

●A型系列處理器針對(duì)高效能開(kāi)放應(yīng)用平臺(tái)而優(yōu)化設(shè)計(jì)。

●R型系列處理器注重提升實(shí)時(shí)應(yīng)用的性能和可靠度。

●M型系列處理器特別為采用嵌入式MCU的應(yīng)用而設(shè)計(jì)，其性能必須在能源效率和降低解決方案成本之間加以平衡。適用于Cortex M系列的常見(jiàn)應(yīng)用包括智能電表、人機(jī)接口設(shè)備、汽車與工業(yè)控制系統(tǒng)、白色家電、消費(fèi)電子產(chǎn)品和醫(yī)療器材等。

Cortex-M3對(duì)比Cortex-M4

Cortex-M3架構(gòu)背后的指導(dǎo)思路是設(shè)計(jì)一種既要滿足應(yīng)用的成本效益又要提供高性能計(jì)算和控制1的處理器。類似的應(yīng)用包括汽車車身系統(tǒng)、工業(yè)控制系統(tǒng)和無(wú)線網(wǎng)絡(luò)/傳感器產(chǎn)品等。M3系列為32位的ARM處理器架構(gòu)引進(jìn)了多項(xiàng)重要特性，包括：

●不可屏蔽式中斷

●高度確定性、嵌套、向量式中斷

●原子位操作

●可選的存儲(chǔ)保護(hù)(MPU)

除了絕佳的計(jì)算性能，Cortex-M3處理器先進(jìn)的中斷結(jié)構(gòu)還能確保系統(tǒng)迅速響應(yīng)真實(shí)世界的事件，同時(shí)仍然提供極低的動(dòng)態(tài)與靜態(tài)功耗2.

圖1：Cortex-M3與M4處理器內(nèi)核的比較。

Cortex-M3和M4處理器共享許多相同的設(shè)計(jì)要素，包括先進(jìn)的片內(nèi)調(diào)試特性，以及執(zhí)行完整ARM指令集或ARM指令子集(用于THUMB2處理器)的能力。Cortex-M4處理器的指令集具有增強(qiáng)的高效DSP特性庫(kù)，包括擴(kuò)展的單周期16/32位乘法累加器(MAC)、雙16位MAC指令、優(yōu)化的8/16位SIMD運(yùn)算及飽和運(yùn)算指令。總體來(lái)說(shuō)，M3與M4最顯著的差別在于，M4具有可選的單精度(IEEE-754)浮點(diǎn)單元(FPU)。

多項(xiàng)秘訣造就巧妙解決方案

嵌入式設(shè)計(jì)的成敗經(jīng)常取決于如何在系統(tǒng)性能、能耗和解決方案成本之間找到適當(dāng)?shù)钠胶?。許多情況下，開(kāi)發(fā)人員可以采用Cortex-M處理器上的獨(dú)特特性來(lái)優(yōu)化產(chǎn)品成本或能源需求，同時(shí)維持、甚至提升它的性能。例如，Cortex-M內(nèi)核天生的串行I/O能力能夠用于節(jié)省能源、簡(jiǎn)化開(kāi)發(fā)、釋放外設(shè)以用于其它應(yīng)用任務(wù)。

除了傳統(tǒng)的串行調(diào)試(Serial Wire Debug)功能之外，基于ARM Cortex-M的MCU還可以通過(guò)它的單引腳串行監(jiān)視器輸出(Serial Wire Viewer Output，SWO)3提供指令跟蹤接口，如圖2所示。這個(gè)接口可以直接把“printf格式的”調(diào)試信息傳遞給應(yīng)用代碼。SWO允許調(diào)試信息直接在任何標(biāo)準(zhǔn)的IDE中瀏覽。此外，這些信息也可以用獨(dú)立的SWO監(jiān)視器(例如，Segger的J-Link SWO Viewer軟件4，或是Silicon Labs的energyAware Commander 4)進(jìn)行瀏覽。由于SWO輸出內(nèi)建于內(nèi)核硬件本身，因此它是Cortex-M內(nèi)核與生俱來(lái)的優(yōu)點(diǎn)。SWO不占用MCU的任何UART接口，這些接口它們可能早已被分配給了應(yīng)用。

圖2：專用ARM Cortex SWO接口節(jié)省I/O引腳并加速調(diào)試。

基于SWO的調(diào)試還有一個(gè)重要的優(yōu)勢(shì)在于，它讓微控制器在進(jìn)入最低的休眠模式時(shí)，保持調(diào)試連接有效，而在大多數(shù)情況下，傳統(tǒng)的調(diào)試連接這時(shí)是不能正常工作的。SWO的指令追蹤還可以用于跟蹤程序計(jì)數(shù)器，以幫忙IDE統(tǒng)計(jì)出程序各項(xiàng)功能所占用的時(shí)間。這些統(tǒng)計(jì)數(shù)字能夠與電流測(cè)量結(jié)合起來(lái)，幫助開(kāi)發(fā)人員對(duì)設(shè)計(jì)功耗進(jìn)行微調(diào)。

基于Cortex-M的微控制器供應(yīng)商正在開(kāi)始重新認(rèn)識(shí)這項(xiàng)優(yōu)點(diǎn)，而且有些廠商已經(jīng)為了這個(gè)目的而把功耗模式和電流測(cè)量硬件納入到本身的開(kāi)發(fā)平臺(tái)。例如，Silicon Labs的EFM32 Gecko MCU入門級(jí)和開(kāi)發(fā)級(jí)工具包都包含功耗測(cè)量輸出，并可搭配energyAware Profiler工具6中的程序代碼追蹤功能。圖3顯示了如何讓設(shè)計(jì)人員精確定位到哪個(gè)程序功能塊最耗費(fèi)能源，并且能夠快速調(diào)試其它與能源有關(guān)的問(wèn)題。

圖3：軟硬件工具精確定位耗能最大的功能，無(wú)需示波器和萬(wàn)用表，快速排除問(wèn)題。

智能休眠節(jié)省每一微瓦

ARM Cortex-M處理器的Sleep-on-Exit(中斷完成時(shí)直接進(jìn)入休眠)是另一項(xiàng)“一箭雙雕”的功能，可同時(shí)節(jié)省CPU周期和能耗。這點(diǎn)在由中斷所驅(qū)動(dòng)的應(yīng)用中格外有用，因?yàn)樘幚砥鞯拇蟛糠謺r(shí)間不是在執(zhí)行中斷處理，就是在中斷事件之間休眠。在進(jìn)入中斷服務(wù)例程(ISR)時(shí)，MCU必須花費(fèi)好幾個(gè)指令周期把當(dāng)前線程狀態(tài)入棧，然后在退出中斷處理返回時(shí)恢復(fù)原有線程狀態(tài)，即“出棧”。當(dāng)應(yīng)用需要處理器在退出ISR后直接進(jìn)入休眠狀態(tài)時(shí)，傳統(tǒng)MCU仍然必須恢復(fù)原先存儲(chǔ)的狀態(tài)信息，然后線程代碼才能讓MCU進(jìn)入休眠狀態(tài)。同樣地，當(dāng)下次的中斷喚醒MCU時(shí)，它的狀態(tài)必須再次入棧。

而當(dāng)使能ARM Cortex-M微控制器上的Sleep-on-Exit功能后，MCU就會(huì)在中斷處理完成后直接進(jìn)入休眠狀態(tài)，而不用先返回到原有線程上(見(jiàn)圖4)。這會(huì)使處理器仍然保持在中斷狀態(tài)，因?yàn)橄藛拘言偃霔＿^(guò)程，因而節(jié)省下許多寶貴的機(jī)器周期。消除入棧出棧過(guò)程既節(jié)省了時(shí)間也節(jié)省了能耗，否則電能就會(huì)被不必要的指令周期白白消耗，也包括哪些傳統(tǒng)MCU在休眠和喚醒之間管理堆棧的代碼。而且，當(dāng)處理器被中止調(diào)試請(qǐng)求(Halt Debug Request)喚醒時(shí)，出棧過(guò)程將會(huì)自動(dòng)進(jìn)行。

圖4：ARM Cortex-M的Sleep-on-Exit功能通過(guò)避免不必要的代碼執(zhí)行和減少出棧入棧操作降低功耗。(引自：《The Definitive Guide to the ARM Cortex-M31》)

ARM Cortex-M4運(yùn)行更快、休眠功耗更低

像許多MCU一樣，Cortex-M3/4處理器通常能夠采用高時(shí)鐘速率的方法在中斷驅(qū)動(dòng)的應(yīng)用中節(jié)省能耗。如果處理器大部分時(shí)間處于休眠狀態(tài)，這種看似違背直覺(jué)但普遍采用的節(jié)能策略就會(huì)很好，因?yàn)檫\(yùn)行時(shí)間減少所節(jié)省的能耗遠(yuǎn)遠(yuǎn)大于稍高的操作電流。簡(jiǎn)單來(lái)說(shuō)，多花10%的電可以省掉20%的時(shí)間，總體來(lái)說(shuō)是節(jié)能了。

這種技術(shù)可以應(yīng)用在任何Cortex-M系列的處理器上，而涉及密集運(yùn)算任務(wù)的應(yīng)用也能從Cortex-M4處理器的額外能力中受益。它的單周期DSP指令和可選的浮點(diǎn)加速器能大大減少諸如數(shù)字信號(hào)處理、過(guò)濾、分析或波形合成等功能所需要的執(zhí)行周期數(shù)。

一些應(yīng)用僅僅需要DSP處理能力。例如，有些安全系統(tǒng)采用一種以聲學(xué)分析來(lái)感測(cè)玻璃破損的裝置。玻璃破損時(shí)會(huì)發(fā)出一連串獨(dú)特的聲音和振動(dòng)，并且在玻璃特有的固有頻率時(shí)達(dá)到最大，在這個(gè)例子中是13kHz。大多數(shù)采用傳感器接口的系統(tǒng)只有在所監(jiān)測(cè)的頻率被監(jiān)測(cè)到時(shí)，才喚醒處理器。但是當(dāng)設(shè)計(jì)中使用帶DSP功能的Cortex-M4時(shí)就能額外節(jié)能，因?yàn)樗趫?zhí)行實(shí)際的玻璃破損分析時(shí)比軟件解決方案更快。

甚至，這些使用基于M4微控制器的應(yīng)用可以更加節(jié)能，因?yàn)镸CU中所包含的高級(jí)休眠模式和自治外設(shè)可以在CPU休眠時(shí)執(zhí)行許多日程任務(wù)。例如，以Cortex-M4為內(nèi)核的Wonder Gecko MCU7具有五種不同的低功耗模式，包括20nA的關(guān)機(jī)狀態(tài)和950nA的深度休眠模式(實(shí)時(shí)時(shí)鐘有效、RAM和寄存器內(nèi)容保持、使能掉電檢測(cè))。

上面提及的節(jié)能特性也能帶來(lái)其它優(yōu)勢(shì)。例如，在超音波/聲學(xué)水表之類的應(yīng)用中，它們必須在小電池供電下運(yùn)行多年，需要MCU盡可能長(zhǎng)的保持在休眠狀態(tài)。除了有助于減少M(fèi)CU喚醒時(shí)間之外，Cortex-4 DSP和浮點(diǎn)算術(shù)指令也能使用成熟的濾波功能從廉價(jià)聲學(xué)傳感器輸出中獲得所需的信息，從而避免采用昂貴的超聲波流量傳感器。在這個(gè)應(yīng)用實(shí)例中，Wonder Gecko MCU的外設(shè)還能夠作為模擬狀態(tài)機(jī)提供額外的能量節(jié)省，它僅僅在需要時(shí)才喚醒Cortex-M4處理器。

結(jié)論

雖然并不完備，但這些林林總總的秘訣與妙方應(yīng)該能讓各位產(chǎn)生好的思路，可以在下一次設(shè)計(jì)中充分利用Cortex-M系列中一些較不為人知的特性所帶來(lái)的好處。為了發(fā)揮ARM Cortex-M系列的這些和其它重要功能，可參考本文末段的參考資料，它們提供了所需的更多細(xì)節(jié)。

此外，如何通過(guò)選擇搭配有合適I/O、加速器和其它先進(jìn)外設(shè)的ARM MCU來(lái)改善設(shè)計(jì)性能、功耗和解決方案成本，來(lái)自Silicon Labs的EFM32 Gecko和Wonder Gecko MCU系列產(chǎn)品提供了極佳范例。