處理器系列之PowerPC指令集

時間：2018-01-15 22:48:32

關鍵字： powerpc 處理器嵌入式處理器指令集

手機看文章

掃描二維碼
隨時隨地手機看文章

[導讀]對 PowerPC 體系結(jié)構家族樹的所有分支來說，PowerPC 體系結(jié)構和應用級編程模型是通用的。PowerPC 體系結(jié)構是一種精減指令集計算機(Reduced Instruction Set Computer，RISC

對 PowerPC 體系結(jié)構家族樹的所有分支來說，PowerPC 體系結(jié)構和應用級編程模型是通用的。

PowerPC 體系結(jié)構是一種精減指令集計算機(Reduced Instruction Set Computer，RISC)體系結(jié)構，定義了 200 多條指令。PowerPC 之所以是 RISC，原因在于大部分指令在一個單一的周期內(nèi)執(zhí)行，而且通常只執(zhí)行一個單一的操作(比如將內(nèi)存加載到寄存器，或者將寄存器數(shù)據(jù)存儲到內(nèi)存)。

PowerPC 體系結(jié)構分為三個級別(或者說是“book”)。通過對體系結(jié)構以這種方式進行劃分，為實現(xiàn)可以選擇價格/性能比平衡的復雜性級別留出了空間，同時還保持了實現(xiàn)間的代碼兼容性。

Book I. 用戶指令集體系結(jié)構

定義了通用于所有 PowerPC 實現(xiàn)的用戶指令和寄存器的基本集合。這些是非特權指令，為大多數(shù)程序所用。

Book II. 虛擬環(huán)境體系結(jié)構

定義了常規(guī)應用軟件要求之外的附加的用戶級功能，比如高速緩存管理、原子操作和用戶級計時器支持。雖然這些操作也是非特權的，但是程序通常還是通過操作系統(tǒng)調(diào)用來訪問這些函數(shù)。

Book III. 操作環(huán)境體系結(jié)構

定義了操作系統(tǒng)級需要和使用的操作。其中包括用于內(nèi)存管理、異常向量處理、特權寄存器訪問、特權計時器訪問的函數(shù)。Book III 中詳細說明了對各種系統(tǒng)服務和功能的直接硬件支持。

從最初的 PowerPC 體系結(jié)構的開發(fā)開始，就根據(jù)特定的市場需求而發(fā)生分支。當前，PowerPC 體系結(jié)構家族樹有兩個活躍的分支，分別是PowerPC AS體系結(jié)構和 PowerPC Book E體系結(jié)構。PowerPC AS 體系結(jié)構是 IBM 為了滿足它的 eServer pSeries UNIX 和 Linux 服務器產(chǎn)品家族及它的 eServer iSeries 企業(yè)服務器產(chǎn)品家族的具體需要而定義的(參閱參考資料中的鏈接以獲得更多資料)。PowerPC Book E 體系結(jié)構，也被稱為 Book E，是 IBM 和 Motorola 為滿足嵌入式市場的特定需求而合作推出的。PowerPC AS 所采用的原始 PowerPC 體系結(jié)構與 Book E 所采用的擴展之間的主要區(qū)別大部分集中于 Book III 區(qū)域中。

在這些衍生的體系結(jié)構中還有一些適當?shù)膽眉墧U展，這些擴展大部分與具體應用的場合相關，但是 PowerPC AS 和 PowerPC Book E 共享在 PowerPC 體系結(jié)構的 Book I 中定義的基本指令集。雖然三種體系結(jié)構主要在操作系統(tǒng)級別上表現(xiàn)出不同，但它們在很大程度上具備應用級的兼容性。

PowerPC 最初定義了同時對 32 位和 64 位實現(xiàn)的支持，可以讓 32 位的應用程序運行于 64 位系統(tǒng)之上。在 IBM pSeries 和 iSeries 服務器上使用的 PowerPC AS 系統(tǒng)現(xiàn)在只提供體系結(jié)構的 64 位實現(xiàn)，新的 64 位應用程序和遺留的 32 位的應用程序可以運行于同一個系統(tǒng)之上。PowerPC Book E 體系結(jié)構同時有 32 位實現(xiàn)和 64 位實現(xiàn)，64 位實現(xiàn)也完全兼容 32 位 PowerPC 應用程序。這兩種體系結(jié)構都具備與 PowerPC Book I 指令和寄存器的完全兼容性，同時提供了對內(nèi)存管理、異常和中斷、計時器支持和調(diào)試支持等各方面的系統(tǒng)級擴展。

POWER 的自然歷史

POWER 和 PowerPC 微處理器有著漫長而傳奇的歷史，最初是 IBM 801，其后是 POWER、RS64 和 PowerPC 芯片系列(這些并不是線性發(fā)展的)。每個芯片家族都對計算世界有自己強有力的影響，從游戲控制臺到主機，從數(shù)字手表到高端工作站，到處都得到了應用。欲了解全部歷史，請閱讀“ 人類的 POWER：IBM 的芯片制造歷史”。

最初的 PowerPC 體系結(jié)構仍是 PowerPC AS 和 PowerPC Book E 的主要組成部分，并仍保持了其完整性，表現(xiàn)出了令人信服的應用級兼容性。

PowerPC 應用程序編程模型

當用到不只一種類型的 PowerPC 處理器時，開發(fā)人員應時刻謹記處理器處理內(nèi)存的方式存在一些差異。

PowerPC 存儲模型

PowerPC 體系結(jié)構本身支持字節(jié)(8 位)、半字(16 位)、字(32 位) 和雙字(64 位) 數(shù)據(jù)類型。

PowerPC 實現(xiàn)還可以處理最長 128 字節(jié)的多字節(jié)字符串操作。32 位 PowerPC 實現(xiàn)支持 4-gigabyte 的有效地址空間，而 64 位 PowerPC 實現(xiàn)支持 16-exabyte 的有效地址空間。所有存儲都可以字節(jié)尋址。

對于錯位數(shù)據(jù)訪問來說，不同的產(chǎn)品家族提供了不同的校準支持，有一些是以處理異常的方式，其他的是通過硬件中的一步或者多步操作來處理訪問。

最高位字節(jié)在最前(Big-endian)還是最低位字節(jié)在最前(little-endian)?

PowerPC、PowerPC AS 以及早期的 IBM PowerPC 4xx 家族大部分是字節(jié)排列順序最高位在最前的機器，這就意味著對半字、字以及雙字訪問來說，最重要的字節(jié)(most-significant byte，MSB)位于最低的地址。各實現(xiàn)對最低位在最前的字節(jié)排列順序方式的支持不同。PowerPC 和 PowerPC AS 提供了最小限度的支持，而 4xx 家族為最低位字節(jié)在最前的存儲提供了更為健壯的支持。Book E 是字節(jié)排列順序無關的，因為 Book E 體系結(jié)構完全支持這兩種訪問方法。

PowerPC 應用級寄存器

PowerPC 的應用級寄存器分為三類：通用寄存器(general-purpose register，GPR)、浮點寄存器(floating-point register [FPR] 和浮點狀態(tài)和控制寄存器 [Floating-Point Status and Control Register，F(xiàn)PSCR])和專用寄存器(special-purpose register，SPR)。讓我們來分別看一下這三類寄存器。

通用寄存器(GPR)

用戶指令集體系結(jié)構(Book I)規(guī)定，所有實現(xiàn)都有 32 個 GPR(從GPR0 到 GPR31)。GPR 是所有整數(shù)操作的源和目的，也是所有加載/存儲操作的地址操作數(shù)的源。GPR 還提供對 SPR 的訪問。所有 GRP 都是可用的，只有一種情況例外：在某些指令中，GPR0 只是代表數(shù)值 0，而不會去查找 GPR0 的內(nèi)容。

浮點寄存器(FPR)

Book I 規(guī)定，所有實現(xiàn)都有 32 個 FPR(從 FPR0 到 FPR31)。FPR 是所有浮點操作的源和目的操作數(shù)，可以存放 32 位和 64 位的有符號和無符號整數(shù)，以及單精度和雙精度浮點數(shù)。FPR 還提供對 FPSCR 的訪問。

注意，嵌入式微處理器實現(xiàn)時經(jīng)常不提供對浮點指令集的直接硬件支持，或者只是提供一個附加浮點硬件的接口。很多嵌入式應用程序很少或者根本不需要浮點算法，而當需要的時候，對 PowerPC 浮點指令執(zhí)行進行軟件仿真就足夠了。在嵌入式微處理器中，硬件中省去浮點(支持)而為實現(xiàn)帶來的芯片面積和功率的減少是至關重要的。[!--empirenews.page--]

浮點狀態(tài)和控制寄存器(FPSCR)捕獲浮點操作的狀態(tài)和異常結(jié)果，F(xiàn)PSCR 還具有控制位，以支持特定的異常類型和對四種舍入模式之一的選擇。對 FPSCR 的訪問要通過 FPR。

專用寄存器(SPR)

SPR 給出處理器核心內(nèi)部資源的狀態(tài)并對其進行控制。不需要系統(tǒng)服務的支持就可以由應用程序讀寫的 SPR 包括計數(shù)寄存器(Count Register)、鏈接寄存器(Link Register)和整型異常寄存器(Integer Exception Register)。需要系統(tǒng)服務的支持才可以由應用程序讀寫的 SPR 包括時基(Time Base)和其他各種可能支持的計時器。

指令地址寄存器(Instruction Address Register，IAR)

這個寄存器就是程序員們所熟知的程序計數(shù)器或者指令指針。它是當前指令的地址。這實際上是一個偽寄存器，用戶只能通過“branch and link”指令才能直接使用這個寄存器。IAR 主要是由調(diào)試器使用，顯示將要被執(zhí)行的下一條指令。

鏈接寄存器(Link Register，LR)

這個寄存器存放的是函數(shù)調(diào)用結(jié)束處的返回地址。某些轉(zhuǎn)移指令可以自動加載 LR 到轉(zhuǎn)移之后的指令。每個轉(zhuǎn)移指令編碼中都有一個 LK 位。如果 LK 為 1，轉(zhuǎn)移指令就會將程序計數(shù)器移為 LR 中的地址。而且，條件轉(zhuǎn)移指令 bclr 轉(zhuǎn)移到 LR 中的值。

定點異常寄存器(Fixed-Point Exception Register，XER)

這個寄存器存放整數(shù)運算操作的進位以及溢出信息。它還存放某些整數(shù)運算操作的進位輸入以及加載和存儲指令( lswx 和 stswx )中傳輸?shù)淖止?jié)數(shù)。

計數(shù)寄存器(Count Register，CTR)

這個寄存器中存放了一個循環(huán)計數(shù)器，會隨特定轉(zhuǎn)移操作而遞減。條件轉(zhuǎn)移指令 bcctr 轉(zhuǎn)移到 CTR 中的值。

條件寄存器(Condition Register，CR)

這個寄存器分為八個字段，每個字段 4 位。很多 PowerPC 指令將指令的第 31 位編碼為 Rc 位，有一些指令要求 Rc 值等于 1。當 Rc 等于 1 且進行整數(shù)操作時，CR 字段 0 被設置來表示指令操作的結(jié)果：相等(Equal, EQ)，大于(Greater Than, GT)，小于(Less Than, LT)，以及和溢出(Summary Overflow, SO)。當 Rc 等于 1 且進行浮點操作時，CR 字段 1 被設置用來表示 FPSCR 中異常狀態(tài)位的狀態(tài)：FX、FEX、VX 和 OX。任何一個 CR 字段都可以是整數(shù)或者浮點比較指令的目標。CR 字段 0 還被設置用來表示條件存儲指令( stwcx 或者stdcx ) 的結(jié)果。還有一組指令可以操縱特定的 CR 位、特定的 CR 字段或者整個 CR，通常為了測試而將幾個條件組合到同一個位中。

處理器版本寄存器(Processor Version Register，PVR)

PVR 是一個 32 位只讀寄存器，標識處理器的版本和修訂級別。處理器版本由 PowerPC 體系結(jié)構過程分配。修訂級別由實現(xiàn)定義。需要有特權才能訪問 PVR，所以應用程序只能在操作系統(tǒng)函數(shù)的幫助下才可以確定處理器版本。

PowerPC 應用級指令集

表 1 列出了不同的指令類別以及每類的指令類型。

表 1. 指令類別

指令解析

所有指令的編碼長度都是 32 位。PowerPC 的位編號方式與大部分其他定義相反：第 0 位是最重要的位，第 31 位是最不重要的位。指令首先由一個字段中較高的 6 位進行解碼，這 6 位稱為主要操作碼(primary opcode)。其余 26 位包含的字段分別是操作數(shù)說明、立即(immediate)操作數(shù)以及擴展的操作碼(opcode)，而且這些還可能是保留的位或字段。表 2 列出了 PowerPC 定義的基本指令格式。

表 2. PowerPC 指令格式

D-form

這一指令格式提供至多兩個寄存器作為源操作數(shù)，一個立即源，至多兩個寄存器作為目的操作數(shù)。這一指令格式的一些變種使用部分目的和源寄存器操作數(shù)說明符作為立即字段或作為擴展的操作碼。

X-form

這一指令格式提供至多兩個寄存器作為源操作數(shù)，至多兩個目的操作數(shù)。這一指令格式的一些變種使用部分目的和源寄存器操作數(shù)說明符作為立即字段或作為擴展的操作碼。

A-form

這一指令格式提供至多三個寄存器作為源操作數(shù)，以及一個目的操作數(shù)。這一指令格式的一些變種使用部分目的和源寄存器操作數(shù)說明符作為立即字段或作為擴展的操作碼。

BD-form

條件轉(zhuǎn)移指令使用的是這一指令格式。BO 指令字段指定了條件的類型;BI 指令字段指定了以哪個 CR 位作為條件;BD 字段用作轉(zhuǎn)移位置。AA 位指定了轉(zhuǎn)移是絕對轉(zhuǎn)移還是相對轉(zhuǎn)移。換名話說，轉(zhuǎn)移目標地址是立即字段的值，還是立即字段的值與轉(zhuǎn)移地址的和。LK 位指定了下一個順序指令的地址是否作為子例程調(diào)用的返回地址保存在鏈接寄存器中。

I-form

無條件轉(zhuǎn)移指令使用這一指令格式。由于是無條件的，BD 格式中的 BO 和 BI 字段改變?yōu)榱硗獾霓D(zhuǎn)移位置，以構成 LI 指令字段。同 BD 格式一樣，這一指令格式也支持 AA 和 LK 位。

如前所述，這些指令格式各有其變種。不過，這些格式是對大部分 PowerPC 指令集編碼結(jié)構的最好描述。

轉(zhuǎn)移指令

PowerPC 為控制流程提供了一組指令，包括：

條件和無條件轉(zhuǎn)移指令。

“遞減計數(shù)和如果是零或者非零時轉(zhuǎn)移”的能力。

絕對轉(zhuǎn)移和相對轉(zhuǎn)移。

使用鏈接寄存器或計數(shù)寄存器來指定轉(zhuǎn)移目標地址的轉(zhuǎn)移指令。

所有的轉(zhuǎn)移指令都具備保存后繼順序指令地址的能力，包括到鏈接寄存器的轉(zhuǎn)移。條件寄存器 32 位中的任意一位都可以指定為條件轉(zhuǎn)移的條件，并可以指定 CR 位是否必須為 0 或 1 時轉(zhuǎn)移條件才成立。[!--empirenews.page--]

條件寄存器指令

PowerPC 提供了一組用于對 CR 的特定位執(zhí)行布爾操作和對 CR 字段進行拷貝的指令。它允許組合多個轉(zhuǎn)移條件，這樣可以減少代價高昂的條件轉(zhuǎn)移的數(shù)量。表 3 列出了 PowerPC CR 邏輯指令。

表 3. PowerPC CR 邏輯指令

整數(shù)運算指令

很多指令用于執(zhí)行運算操作，包括 add、substract、negate、compare、multiply 和 divide。很多格式用于立即值、溢出檢測以及進位和借位。各實現(xiàn)中 multiply 和 divide 的執(zhí)行是不同的，因為這些通常是多周期指令。表 4 列出了 PowerPC 整數(shù)運算指令。

表 4. PowerPC 整數(shù)運算指令

邏輯、循環(huán)和移位指令

PowerPC 提供了一組完整的邏輯操作(指令)，還支持對符號的擴展以及對 GPR 中前置零的統(tǒng)計。表 5 列出了 PowerPC 邏輯指令。

表 5. PowerPC 邏輯指令

PowerPC 提供了一組健壯而強大的循環(huán)和移位操作(指令)，如表 6 所列。

表 6. PowerPC 循環(huán)和移位指令

浮點指令

PowerPC 提供了一組健壯的浮點運算、比較和轉(zhuǎn)換操作(指令)。與軟件支持一道，PowerPC 浮點運算完全符合 ANSI/IEEE 標準 754-1985 規(guī)范。在所有運算和比較操作中都支持單精度和雙精度浮點格式。

雖然浮點數(shù)以雙精度格式存儲于 FPR 中，但是，有一組單精度運算指令，可以執(zhí)行運算操作并將最終結(jié)果舍入為單精度，同時檢測進行單精度操作時可能會發(fā)生的異常(比如指數(shù)溢出、下溢和失去精度)。

一組 Load Floating-point Single指令可以訪問存儲器中的字，并在將其放入目標 FPR 前把單精度值轉(zhuǎn)換為雙精度值。

一組 Store Floating-point Single指令可以將源 FPR 中的源操作數(shù)在存儲到存儲器中目標字之前轉(zhuǎn)換為單精度格式。

可以啟用或禁用具體種類的浮點異常來支持設陷(trapping) 環(huán)境。表 7 列出了基本的和可選的 PowerPC 浮點指令集。

表 7. PowerPC 浮點指令

FPSCR 處理指令

表 8 列出了基本的 PowerPC FPSCR 處理指令集。

表 8. PowerPC FPSCR 處理指令集

加載和存儲指令

所有加載和存儲指令的執(zhí)行都使用 GPR 或者 GPR 和指令中的立即字段作為存儲器訪問的地址說明符。用指令生成的數(shù)據(jù)有效地址來更新基址寄存器(也就是 RA)是大部分加載和存儲指令的一個可選項。

有用于以下方面的指令：

字節(jié)、半字、字和雙字大小。

在 GPR 或 FPR 與存儲器之間移動數(shù)據(jù)。

特殊的存儲器訪問指令包括：

多字加載/存儲

即 lmw 和 stmw ，可以操作最多 31 個 32 位字。

字符串指令

這些指令可以操作最長 128 字節(jié)的字符串。

內(nèi)存同步指令

這些用于實現(xiàn)內(nèi)存同步。CR 的第 2 位(EQ 位) 設置用來記錄存儲操作的成功完成。內(nèi)存同步指令包括：lwarx / ldarx 執(zhí)行加載并設置處理器內(nèi)部的預留位，編程模型不必明確了解這些行為。如果設置了預留位，相應的存儲指令 stwcx. /stdcx. 執(zhí)行條件存儲，并清除預留位。

lwarx (加載字并預留變址)

ldarx (加載雙字并預留變址)

stwcx (存儲字條件變址)

stdcx (存儲雙字條件變址)

棧

PowerPC 體系結(jié)構沒有關于本地存儲器的棧的概念。體系結(jié)構沒有定義壓入或者彈出指令，也沒有定義專門的棧指針寄存器。不過，有一個軟件標準可用于 C/C++ 程序，這個標準叫做嵌入式應用程序二進制接口( Embedded Application Binary Interface，EABI)，它定義了棧寄存器和內(nèi)存的約定。EABI 將 GPR1 預留為棧指針，GPR3 到 GPR7 用于函數(shù)參數(shù)傳遞，GPR3 用于函數(shù)返回值。

需要為 C/C++ 提供接口的匯編語言程序必須遵循同樣的標準來保持約定。

高速緩存管理指令

PowerPC 體系結(jié)構包含了面向應用級高速緩存訪問的高速緩存管理指令。高速緩存指令在表 9 中列出。

表 9. 高速緩存管理指令

當將高速緩存處理代碼移植到不同的 PowerPC 實現(xiàn)時要當心。雖然高速緩存指令可能是跨不同實現(xiàn)而通用的，高速緩存的組織和大小可能會有變化。例如，假定高速緩存大小以對其進行刷新的代碼，在用于其他大小的高速緩存時可能需要進行修改。而且，各實現(xiàn)的高速緩存初始化可能不同。有一些實現(xiàn)提供了自動清除高速緩存標簽的硬件，而其他實現(xiàn)需要使用軟件循環(huán)來使高速緩存標簽無效。[!--empirenews.page--]

自修改代碼

雖然編寫自修改代碼不是一個工業(yè)標準，但有些情況下它是必不可少的。下面的序列介紹了執(zhí)行代碼修改用到的指令：

存儲修改的指令。

執(zhí)行 dcbst 指令，強制包含有修改過的指令的高速緩存行進行存儲。

執(zhí)行 sync 指令，確保 dcbst 完成。

執(zhí)行 icbi 指令，使將要存放修改后指令的指令高速緩存行無效。

執(zhí)行 isync 指令，清除所有指令的指令管道，那些指令在高速緩存行被設為無效之前可能早已被取走了。

現(xiàn)在可以運行修改后的指令了。當取這個指令時會發(fā)生指令高速緩存失敗，結(jié)果就會從存儲器中取得修改后的指令。

計時器

大部分實現(xiàn)都提供了一個 64 位時基，可以通過兩個 32 位寄存器讀取，或者通過一個 64 位寄存器讀取。各實現(xiàn)的計時器增量不同，SPR 數(shù)和訪問時基的指令也不同。所以，跨實現(xiàn)移植計時器代碼時要當心。另外的計時器可能也不同，但大多數(shù)實現(xiàn)都提供了至少一種遞減的可編程計時器。

保持代碼的兼容性

需要在多個實現(xiàn)上進行編程的 PowerPC 用戶通常會問及保持代碼兼容性的技巧。下面的建議將有助于盡量減少移植問題：

盡可能使用 C 代碼。

當今的 C 編譯器在很多情況下可以生成與直接手寫的匯編代碼在性能上相當?shù)拇a。作為 Book I 代碼，C 代碼將保證代碼的兼容性。

盡可能避免使用處理器相關的匯編指令。

盡量不要在 C 中嵌入處理器相關的匯編指令，因為它們將更難被發(fā)現(xiàn)。分離開那些已知會包含設備相關寄存器或指令的代碼。這些通常是啟動次序和設備驅(qū)動程序，不過也可能包括浮點代碼(包括 long long 類型)。保持假定和依賴全部歸檔。

使用處理器版本寄存器(PVR)，但只在適當?shù)臅r候用。

跨差別較小的實現(xiàn)的通用代碼還好，PVR 可以用于做出判斷。但是，在需要進行較大修改的情況下(例如，PowerPC AS 相對于 Book E MMU 代碼)，建議使用單獨的代碼庫(code base)。

結(jié)束語

PowerPC AS 和 PowerPC 都支持最初的 PowerPC 體系結(jié)構中定義的應用級基礎設施，同時為它們的具體目標市場提供了最佳的優(yōu)化。

就其兩種操作模式之一而言，PowerPC AS 實質(zhì)上與最初的 PowerPC 相同，而 PowerPC Book E 在它的 Book III 級別的定義中，已經(jīng)走向了不同的方向，為低價格、低功率以及體系結(jié)構靈活的嵌入式應用進行了最優(yōu)化。當然，在 32 位的實現(xiàn)上還不能用雙字整數(shù)指令，在大部分嵌入式實現(xiàn)中浮點指令也只是通過軟件仿真提供支持。

不過，這對應用程序二進制在 PowerPC 體系結(jié)構家族樹的分支中自由地遷移來說是一個非常有意義的機會。