讓下一代智能互聯(lián)嵌入式應用開發(fā)更簡化
Cortex-M處理器家族是一系列具有擴展性,兼容性,節(jié)能和易于使用的處理器,旨在幫助開發(fā)人員滿足未來智能互聯(lián)嵌入式應用的需要。2010年推出的Cortex-M4是建立在Cortex-M3的基礎上并加入了一系列專門為數(shù)字信號處理定制的指令集擴展,并搭配可選的性能可達1.25 DMIPS/ MHz的單精度浮點單元。自推出以來,有10家以上的半導體廠商推出了基于Cortex-M4的通用MCU產(chǎn)品,以及非常廣泛的基于Cortex-M4的sensor hub產(chǎn)品。
在過去的幾年里,對支持互聯(lián)的嵌入式系統(tǒng)的功能特性和處理能力的需求變得更加苛刻。即使是最簡單的系統(tǒng),也預期支持多種連接方式,圖形用戶界面,人機界面,語音識別或其他自然的交互方式。處理器需要變得更加強大,并能提供更多的本地處理能力。在汽車行業(yè)和工業(yè)自動化中應用的微控制器需要支持更高的處理能力和CPU性能提升,對計算精度和短時間內(nèi)處理大量數(shù)據(jù)的要求在迅速提高。這些未來系統(tǒng)的要求包括:以較低的成本提供更多的功能,增加連接性,更好的代碼重復利用,以及提高能效。正是著眼于這樣的未來需求,ARM和合作伙伴一起設計了當前Cortex-M家族中性能最強的ARM Cortex-M7處理器。
近觀Cortex-M7
Cortex-M7能夠應對最嚴格的應用環(huán)境,并克服了以前基于Cortex-M處理器的解決方案所面臨的問題,性能達到了上一代Cortex-M4的兩倍,大約為5 CoreMark/ MHz。Cortex-M7是專為各種嵌入式應用,包括微控制器,汽車控制器,工業(yè)控制系統(tǒng)和無線通信控制器(例如無線網(wǎng)絡)設計的。對于那些熟悉Cortex-M系列CPU的嵌入式應用開發(fā)者來說,Cortex-M7基于Cortex-M架構(gòu),從架構(gòu)上兼容從Cortex-M0以來的所有產(chǎn)品(圖1)。
圖1
ARM Cortex-M7處理器特性
Cortex-M7包含六階段的超標量流水線,并和緊耦合內(nèi)存、高速緩存和大內(nèi)存支持選項集成在一起以提供整數(shù)、浮點和DSP處理能力并保證確定性的行為。Cortex-M7先進的流水線能提供相對于Cortex-M4更高的性能,允許在每個時鐘周期執(zhí)行兩條指令。
Cortex-M7開發(fā)的一大重點是相對于之前的Cortex-M系列處理器提高IPC(instructions-per-clock)效率。Cortex -M7是Cortex-M家族中第一個提高最高64KB指令和數(shù)據(jù)緩存選項的處理器,高速緩存能提供對更大的存儲器系統(tǒng)的有效操作(外存通常比處理器慢很多)。此外還添加了緊耦合內(nèi)存接口,集成ECC支持。對內(nèi)存的快速訪問使得高速中斷處理和實時應用處理成為可能。這樣的集成使得工程師們可以在內(nèi)部緩存中執(zhí)行大部分代碼,以減少對外部存儲器讀寫訪問,從而降低功耗。
Cortex-M7也提供了對每個內(nèi)部緩存單元增加ECC支持的選項,以提高系統(tǒng)的可靠性。對于給定解決方案,如果某個內(nèi)存位置的單個比特值被破壞,該數(shù)據(jù)可被校正和恢復。除了ECC,存儲器系統(tǒng)也可以通過可選的存儲器保護單元(MPU)設定8或16個區(qū)域為受保護區(qū)域以增強系統(tǒng)可靠性。
為了支持提高了的CPU處理能力,內(nèi)存系統(tǒng)也從32位AXI總線改進為64位AXI總線,64位AXI比32位AXI提供了更大的帶寬,并支持多個outstanding transfer以最大化系統(tǒng)性能。為了易于集成在先前的Cortex-M設計中使用的傳統(tǒng)外圍設備,還有一個可選的低延遲AHB外設總線接口。為了允許靈活的中斷管理和低中斷延遲,集成嵌套矢量中斷控制器(NVIC)用1到240個中斷,以及3至8位可編程優(yōu)先級寄存器實現(xiàn)與處理器的緊密集成。此外,還有ETM支持,專為CoreSight(ARM支持全系統(tǒng)調(diào)試和跟蹤的架構(gòu))設計。
Cortex-M7包含的雙精度支持可選項,進一步擴大了Cortex-M家族的浮點能力。如果FPU存在時,還支持整數(shù)和浮點指令的并發(fā)。鑒于存在大量基于Cortex-M7的MCU應用,它還具有完全的強大的調(diào)試功能,以及可選的全指令和數(shù)據(jù)跟蹤支持。對已經(jīng)使用了Cortex-M4處理器的設備,在應用對性能的要求提高時,前述特性使得Cortex-M7成為一種極具吸引力的解決方案。
遷移設計到Cortex-M7
鑒于大多數(shù)嵌入式工程師和開發(fā)人員都熟悉Cortex-M4,讓我們來看看Cortex-M7帶來的一些軟件開發(fā)的優(yōu)點。從開發(fā)者的角度來看,在Cortex-M7支持所有的Cortex-M4處理器指令,并使用相同的中斷模型來處理異常。在大多數(shù)情況下,針對Cortex-M4處理器編寫的程序代碼應該可以在Cortex-M7處理器上沒有任何問題地運行。但是,在有些情況下可能需要做一些改動,軟件開發(fā)人員必須了解這些改動以減少把應用程序從Cortex-M4遷移到Cortex-M7所需的時間。
為了獲得Cortex-M7處理器的最佳性能,一些C編譯器和運行時庫已經(jīng)進行了優(yōu)化和更新(圖2)。此外,由于相當多的Cortex-M7相對于Cortex-M4在調(diào)試系統(tǒng)上的變化,軟件開發(fā)者必須更新他們的工具鏈,以在基于Cortex-M7的微控制器產(chǎn)品上調(diào)試應用程序。在某些情況下,調(diào)試適配器上的固件可能還需要更新。因此,強烈建議更新到最新的開發(fā)工具鏈。
圖2
相對于Cortex-M4的2倍性能改進
通常情況下,把軟件從Cortex-M4遷移到Cortex-M7處理器時,需要完成以下改動:
l 更新CMSIS- CORE頭文件為Cortex-M7對應的頭文件。對應Cortex-M7處理器的CMSIS-CORE頭文件包含在CMSIS 4.2之后的版本中。最新的CMSIS可以從www.arm.com/cmsis獲得。
l 更新CMSIS-DSP庫為Cortex-M7定制版本。Cortex-M7定制版本為Cortex-M7處理器的流水線行為進行了優(yōu)化,因此可以提供更高的性能。
l 進行緩存配置的新API包含在CMSIS-CORE頭文件中。如果正在使用的Cortex-M7裝置經(jīng)由AXI接口從慢速存儲器(例如Flash)執(zhí)行程序,應該啟用高速緩存以獲得更好的性能。
此外,所有的代碼應該被重編譯以允許編譯器針對Cortex-M7處理器流水線更好地優(yōu)化指令序列。在某些情況下,可能在運行時需要額外的緩存維護操作。例如,在處理器和外設DMA控制器共享一塊帶緩存的內(nèi)存時,必須進行適當?shù)木彺婢S護操作以保證內(nèi)存一致性。
a) 如果被Cortex-M7處理器更新過的內(nèi)存需要被另一個外設通過總線訪問,需要先清緩存(clean cache)以保證外設看到最新的數(shù)據(jù)。
b) 如果內(nèi)存被外設通過總線更新,在Cortex-M7處理器訪問該內(nèi)存前,需要先做一個緩存無效(cache invalidate),這樣在讀取該位置的內(nèi)容時,處理器將直接從主存儲器中獲取最新的數(shù)據(jù)。
Cortex-M7處理器支持多種浮點支持選項,允許沒有FPU,只包含單精度FPU或者同時包含單精度和雙精度FPU。如果應用程序可以從雙精度浮點單元支持中獲益,該應用程序應該重新編譯以利用雙精度FPU。即使應用程序只使用單精度浮點運算,重新編譯為Cortex-M7處理器的代碼也是有益的,因為在Cortex-M7的FPU基于FPv5,而Cortex-M4處理器的FPU的是FPv4。FPv5增加了額外的浮點處理指令,有助于目標應用程序加速浮點數(shù)據(jù)處理。
程序代碼更改
有許多可能需要更改程序代碼的潛在領域。由于處理器具有更高的性能,一些程序代碼可能需要由于執(zhí)行速度變快進行適當?shù)恼{(diào)節(jié)。最常見的例子是使用硬編碼(hard code)的循環(huán)來實現(xiàn)延遲的應用程序,必須調(diào)整原本的循環(huán)次數(shù)以確保延時。
從一個微控制器設備遷移到另一個時,系統(tǒng)內(nèi)存映射經(jīng)常發(fā)生變化。另外,Cortex-M7處理器初始矢量表并不是必須從地址0x00000000開始。如果應用程序代碼假設初始向量表地址為0,用戶可能需要更新代碼,以便能夠通過讀取Vector Table Offset寄存器來確定初始矢量表的位置。
由于在Cortex-M7處理器的多總線接口和更強大的寫緩存,用戶可能會發(fā)現(xiàn)有必要在程序代碼中插入額外的內(nèi)存barrier指令。內(nèi)存barrier的使用指南請參閱“ARM application note AN321 – ARM Cortex-M Programming Guide to Memory Barrier Instructions”。在Cortex-M4處理器上,由于處理器流水線本身的特性,忽略內(nèi)存barrier指令并不會造成任何問題。但在Cortex-M7處理器上,對內(nèi)存barrier的需求是很嚴格的。
行動起來
Cortex-M7不僅繼承了Cortex-M系列處理器的特性,如能源效率、高性能、易用性和更小的代碼,它專門設計的靈活出色的內(nèi)存和連接選項使得它特別適合于汽車、物聯(lián)網(wǎng)和工業(yè)連接市場。在Cortex-M7處理器發(fā)布之后,基于它的MCU已經(jīng)相繼推出:
l 意法半導體于2014年10月在ARM TechCon上發(fā)布的STM32 F7系列。
l Atmel公司在2015 CES上發(fā)布的針對連接性和通用工業(yè)應用AM E70和SAM S70系列
l Atmel公司在2015 CES上發(fā)布的SAM V70和V71系列已取得汽車工業(yè)合格證,其采用Cortex-M7 DSP擴展,針對信息娛樂連接和音頻應用。
l NXP也公開宣布了采用Cortex-M7的Kinetis KV5x,針對高性能電源轉(zhuǎn)換、馬達控制和工業(yè)自動化。
由于ARM Cortex-M4和Cortex-M7處理器在架構(gòu)上有很多相似之處,確保了大部分應用程序代碼可以直接遷移。軟件開發(fā)人員可以開始動手,以確保他們的應用程序都適合于下一代智能連接嵌入式設備。遷移需要用戶進行一些適應性修改。開發(fā)者可以根據(jù)從ARM Cortex-M4處理器到Cortex-M7處理器的應用程序遷移 - 軟件開發(fā)人員指南( “Migrating Applications from an ARM Cortex-M4 Processor to a Cortex-M7 Processor - A Software Developer’s Guide”)”白皮書進一步了解遷移過程的細節(jié)。該白皮書可以在ARM Connected Community中找到,并提供了深入的技術討論。