引言
筆者接觸嵌入式領(lǐng)域軟件開發(fā)已近五年,幾乎用的都是 ARM Cortex M 內(nèi)核系列的微控制器。在這五年期間,感謝C語言編譯器的存在,讓我不用接觸匯編即可進行開發(fā),但是彷佛也錯過了一些風景,沒有領(lǐng)域到編譯器之美和CPU之美,所以決定周末無聊的休息時間通過尋找資料、動手實驗、得出結(jié)論的方法來探索 ARM CPU 架構(gòu)的美妙,以及C語言編譯器的奧秘。(因為我個人實在是不贊同學校中微機原理類課程的教學方法)。- ARM探索之旅 | 一、帶你認識ARM Cortex-M陣營
一、Arm指令集架構(gòu)
ARM指令集架構(gòu)簡稱為ISA,支持三種指令集:A64、A32、T32。- A64指令集在 Armv8-A 中,用于支持64位架構(gòu)
- A32指令集在 Armv6 和 Armv7架構(gòu)中,稱為ARM指令集
- T32指令集在 Armv6 和 Armv7架構(gòu)中,稱為Thumb指令集
A32 Instruction Set
A32指令集,在 armv8 之前的架構(gòu)中也被稱為 「ARM 指令集,指令長度固定32位,4字節(jié)對齊」。T32 Instruction Set
T32指令集,在 armv8 之前的架構(gòu)中被稱為 Thumb 指令集。最初,ARM 指令集的長度固定為 32 位,為了改善用戶代碼的代碼密度,「Thumb 指令集被設(shè)計為 16 位指令集」,開發(fā)者可以同時使用ARM指令集和Thumb指令集來降低代碼大小。但這是兩套指令集,兩個運行狀態(tài),需要在ARM狀態(tài)和Thumb狀態(tài)之間來回切換,非常麻煩。
隨著時間的推移和Thumb-2技術(shù)的引入,「作為Thumb指令集的補充,ARM指令集的大部分功能都被納入到了Thumb指令,Thumb指令集演化為16位和32位混合長度指令集,稱為Thumb-2指令集」。
Thumb-2指令集的誕生,使得編譯器可以在單個指令集中平衡性能和代碼的大小,提供了極好的代碼密度,最小化系統(tǒng)內(nèi)存大小和成本。
二、Arm架構(gòu)擴展
ARM還提供了一系列的架構(gòu)擴展用于滿足下一代處理器的需求,這些擴展為ARM處理器提供了一些新的功能。DSP擴展
DSP for Cortex-M 為 ARM Cortex-M 處理器提供了高性能的「信號處理能力」,用于聲音、音頻、傳感器中樞、機器學習等場景, 不需要額外的 DSP 設(shè)備即可完成信號處理的工作。帶有 DSP 擴展的處理器包括Cortex-M4、Cortex-M7、Cortex-M33、Cortex-M35P、Cortex-M55處理器。
DSP擴展指令在 Thumb 指令集和可選的浮點運算單元的基礎(chǔ)上添加,使得在為Cortex-M處理器添加數(shù)字信號處理的同時,保持了原有Cortex-M編程模型的易用性。
SIMD指令
這些帶有DSP擴展的 Cortex-M 處理器,還提供了 「SIMD 指令」來操作8位或者16位的整數(shù)。
SIMD表示單指令多數(shù)據(jù),在所有寄存器仍是32位的基礎(chǔ)上,「SIMD指令可以同時操作2個16 bit 的值或者4個8 bit 的值」。
工作于8位或16位數(shù)據(jù)的指令對于處理諸如視頻數(shù)據(jù)或者音頻數(shù)據(jù)的時候非常有用,因為這些數(shù)據(jù)不需要32位的寬度,SIMD指令提供了并行處理這些數(shù)據(jù)的能力。
浮點單元
ARM浮點單元技術(shù)為「半精度、單精度和雙精度的浮點運算」提供了高性能和高效率的硬件支持。Arm浮點單元使用完整的軟件庫支持,完全兼容IEEE-754標準,特別適用于對浮點計算精度要求比較高的應(yīng)用場景。
浮點數(shù)據(jù)類型的應(yīng)用場景如下:
- 汽車控制程序
- 3D圖形
- 工業(yè)控制系統(tǒng)
- 運動控制系統(tǒng)
Helium
ARM Helium 技術(shù)是ARM Cortex-M處理器系列的 M配置向量擴展,簡稱MVE,該技術(shù)是Armv8.1-M架構(gòu)的擴展,為小型嵌入式設(shè)備的機器學習應(yīng)用提供給了顯著的性能提升。Cortex-M55是首款具有該擴展的處理器。
Helium技術(shù)添加了150多個新的標量和向量指令,其中整數(shù)Helium技術(shù)使8位、16位、32位固定點數(shù)據(jù)的高效計算成為可能,16位和32位固定點格式在傳統(tǒng)的信號處理中廣泛應(yīng)用,比如音頻處理,而8位固定點格式在機器學習處理中很重要,比如神經(jīng)網(wǎng)絡(luò)計算,圖像處理等。
同樣,Helium也支持浮點數(shù)據(jù)類型,包括單精度浮點數(shù)(32位)和半精度浮點數(shù)(16位)。
三、Cortex-M用什么指令集
講述了ARM的基本指令集和擴展指令集,是時候來回答我們提出的問題:ARM Cortex-M用什么指令集?
「ARM Cortex-M 全部系列只支持唯一的指令集:Thumb指令集或Thumb-2指令集。確切的來說,是支持T32指令集?!?br />
在Cortex-M陣營眾多的成員中,每個處理器對 Thumb/Thumb-2 指令集的支持情況不同,「大部分處理器都是支持 Thumb/Thumb-2 指令集的子集」。
Cortex-M0、Cortex M3、Cortex M4、Cortex M7系列支持的Thumb指令集如圖所示。Cortex-M23和Cortex-M33內(nèi)核支持的Thumb指令如下圖所示,圖中黃色部分表示ArmV8-M系列新增的指令:
至此,ARM探索之旅第二站就結(jié)束啦!下一站再會!