經(jīng)典實用技術(shù)文：GCC如何內(nèi)嵌匯編指令？

時間：2020-05-14 15:05:56

關(guān)鍵字： GCC 匯編指令 BSP 寄存器

手機看文章

掃描二維碼
隨時隨地手機看文章

[導(dǎo)讀]來源：cnblogs，作者：byeyear 有時候我們希望在C/C++代碼中使用嵌入式匯編，因為C中沒有對應(yīng)的函數(shù)或語法可用。比如我最近在ARM上寫FIR程序時，需要對最后的結(jié)果進行飽和處理，但gcc沒有提供ssat這樣的函數(shù)，于是不得不在C代碼中嵌入?yún)R編指令。在C語言中如

來源：cnblogs，作者：byeyear

有時候我們希望在C/C++代碼中使用嵌入式匯編，因為C中沒有對應(yīng)的函數(shù)或語法可用。比如我最近在ARM上寫FIR程序時，需要對最后的結(jié)果進行飽和處理，但gcc沒有提供ssat這樣的函數(shù)，于是不得不在C代碼中嵌入匯編指令。

在C語言中如何使用匯編語言呢？這個問題在不同的編譯器中，具體實現(xiàn)方法是不同的。不過在實現(xiàn)大方上也不過就是有兩種，而且各種編譯器的實現(xiàn)方法也是大同小異。一種是在C語言中嵌入?yún)R編語言代碼，另一種是讓C語言從外部調(diào)用匯編。下面我們就以 Borland格式為例來說一說具體用法。但是,匯編指令與Microsoft的實現(xiàn)方法的與Borland只在格式上有點區(qū)別。當(dāng)然，GCC的嵌入?yún)R編是 AT&T格式的。還好，不管什么格式，只是表達形式的不同而已，其內(nèi)在含義是一模一樣的。還是那句話各種編譯器的實現(xiàn)方法是大同小異的，并沒有本質(zhì)的區(qū)別。

兩種實現(xiàn)方式

首先，我們看一看在C語言中如何嵌入?yún)R編語言代碼。在C語言中嵌入?yún)R編語言代碼，也有兩種格式，一種是單句的，一種是模塊的。

我們來看看一些簡單的例子。

例子1：

單句格式的：

main（）｛asm mov ah,2;asm mov bh,0;asm mov dl, 20;asm mov dh,10;asm     int 10h; /*調(diào)用BIOS中斷設(shè)置光標(biāo)位置*/｝模塊格式的：main（）｛asm｛mov ah,2mov bh,0mov dl, 20mov dh,10int 10h   ｝｝

在這個小程序里面并沒有突出“嵌入”二字。不過從這個程序中可以看出其基本格式。嵌入的各行代碼前面加上asm關(guān)鍵字或者把匯編語句放入asm代碼塊中，每行以分號或換行符結(jié)束，而注釋必須是C語言格式的。

下面我們來看一個讓C語言和匯編協(xié)作的例子：

例子2：

main(){char const *MESSAGE=”O(jiān)utPut from asm..\n$”;asm{ mov ah, 9mov dx, MESSAGEint 21h}}

上面這個例子十分的簡單，它的純C語言版本是：

＃include <stdio.h>main(){ printf(“OutPut from asm..\n$”);}

接下來我們看一看如何讓C語言調(diào)用匯編例程。我們還是看一個簡單的小程序：

C語言部分如下：

extern cursor (int,int),main(){ cursor(15,12);}

匯編語言部分如下：

.MODEL SMALL.CODEPUBLIC
_CURSOR PROC
PUSH BPMOV BP,SPMOV DH,[BP+4]MOV DL,[BP+6]MOV AH,02MOV BH,00INT 10HPOP BPRET
_CURSOR ENDP

通過上面這個程序，你會看到調(diào)用匯編語言的關(guān)鍵就是如何傳遞參數(shù)。事實上，是通過堆棧來傳遞的但是具體規(guī)則是什么呢？下面我就來看看。

調(diào)用規(guī)則

實際上，在C語言中使用匯編語言最困難的就是如何安全有效的傳遞參數(shù)。否則在調(diào)用匯編子程序時就會從堆棧中取出錯誤的參數(shù)。更可惡的是這種錯誤在編譯的時候是不會發(fā)現(xiàn)錯誤提示的。

下面是C與MASM匯編語言混合是用的時候采用的規(guī)則：

1、參數(shù)傳遞的次序與它們出現(xiàn)的次序是相反的。例如上例中的cursor (x,y)中，首先傳遞的是y，然后才是x。這與我們的一般想法是不一樣的，所以在這兒容易出現(xiàn)錯誤。

2、傳遞完參數(shù)后，C程序還將保存（CS，IP）。如果C程序是SMALL或COMPACT存儲模式下編譯的（或者過程是NEAR型的），那么只保存IP，而在MEDIUM、LARGE或HUGE模式下編譯的（或者過程是FAR型的），那么CS和IP都會被壓入堆棧，其順序是CS在前，IP在后。不過這個過程是C語言自動進行的而不需要我們干預(yù)。這也就是我們在例子2中為什么用MOV DH,[BP+4]而不是MOV DH,[BP]。因為前面是CS和IP而不是參數(shù)，真正的參數(shù)從[BP+4]開始。

3、還有BP也必須保存在堆棧中，然后我們才可以通過BP和偏移地址來訪問參數(shù)。

4、最后一條指令應(yīng)當(dāng)是后面不帶數(shù)字的RET，因為把堆棧到原始位置的工作將由C程序重新獲得控制權(quán)以后才會執(zhí)行。

5、任何于C程序共享的名稱都必須在前面加下劃線，而且C語言只識別前8個字

符。

6、對于普通的參數(shù)C語言傳遞的是參數(shù)值，而對于數(shù)組，傳遞的是指針（也就是數(shù)據(jù)的地址）。

7、如果C程序是在MEDIUM、LARGE或HUGE模式下編譯的，那么匯編語言過程應(yīng)該設(shè)為FAR型，C程序是SMALL或COMPACT存儲模式下編譯的，那么匯編語言過程應(yīng)該設(shè)為NEAR型。

不過在MASM5.1或TASM1.0以及更高的版本的時候就不必擔(dān)心偏移地址、在共享名稱前加下劃線以及保存BP這些瑣事了，因為它們可以由編譯器自動完成了。很顯然例子2是舊格式的。

把匯編語言程序與C語言程序鏈接到一起

1、確保匯編語言中的過程被定義為PUBLIC，過程名以下劃線開始。例如，在C語言中叫做“sum”到匯編語言中就應(yīng)該是“_sum”.

2、在C語言程序中過程定義為外部類型，例如在例子2中的extern cursor (int,int)。

3、用匯編器對匯編語言程序匯編，得到XXX.obj文件。

4、用C語言編譯器編譯C語言程序，得到Y(jié)YY.obj文件。

5、用鏈接器將它們鏈接到一起生成可執(zhí)行文件：

link XXX.obj + YYY.obj

以上就是混合使用C語言和匯編語言應(yīng)該注意的幾點問題。關(guān)于在GCC中使用匯編語言大體上是和上面一樣的，只是實現(xiàn)細節(jié)上有一點區(qū)別而已。下面的這篇文章對于在GCC中使用內(nèi)嵌匯編進行詳細的解釋。

GCC使用的內(nèi)嵌匯編語法格式小教程

1. 入門

在C中嵌入?yún)R編的最大問題是如何將C語言變量與指令操作數(shù)相關(guān)聯(lián)。當(dāng)然，gcc都幫我們想好了。下面是是一個簡單例子。

asm(“fsinx %1, %0”:”=f”(result):”f”(angle));

這里我們不需要關(guān)注fsinx指令是干啥的；只需要知道這條指令需要兩個浮點寄存器作為操作數(shù)。作為專職處理C語言的gcc編譯器，它是沒辦法知道fsinx這條匯編指令需要什么樣的操作數(shù)的，這就要求程序猿告知gcc相關(guān)信息，方法就是指令后面的”=f”和”f”，表示這是兩個浮點寄存器操作數(shù)。這被稱為操作數(shù)規(guī)則（constraint）。規(guī)則前面加上”=”表示這是一個輸出操作數(shù)，否則是輸入操作數(shù)。constraint后面括號內(nèi)的是與該寄存器關(guān)聯(lián)的變量。這樣gcc就知道如何將這條嵌入式匯編語句轉(zhuǎn)成實際的匯編指令了：

fsinx：匯編指令名
%1, %0：匯編指令操作數(shù)
“=f”(result)：操作數(shù)%0是一個浮點寄存器，與變量result關(guān)聯(lián)（對輸出操作數(shù)，“關(guān)聯(lián)”的意思就是說gcc執(zhí)行完這條匯編指令后會把寄存器%0的內(nèi)容送到變量result中）
“f”(angle)：操作數(shù)%1是一個浮點寄存器，與變量angle關(guān)聯(lián)（對輸入操作數(shù)，“關(guān)聯(lián)”的意思是就是說gcc執(zhí)行這條匯編指令前會先將變量angle的值讀取到寄存器%1中）

因此這條嵌入式匯編會轉(zhuǎn)換為至少三條匯編指令（非優(yōu)化）：

將angle變量的值加載到寄存器%1
fsinx匯編指令，源寄存器%1，目標(biāo)寄存器%0
將寄存器%0的值存儲到變量result

當(dāng)然，在高優(yōu)化級別下上面的敘述可能不適用；比如源操作數(shù)可能本來就已經(jīng)在某個浮點寄存器中了。

這里我們也看到constraint前加”=”符號的意義：gcc需要知道這個操作數(shù)是在執(zhí)行嵌入?yún)R編前從變量加載到寄存器，還是在執(zhí)行后從寄存器存儲到變量中。

常用的constraints有以下幾個（更多細節(jié)參見gcc手冊）：

m 內(nèi)存操作數(shù)
r 寄存器操作數(shù)
i 立即數(shù)操作數(shù)（整數(shù)）
f 浮點寄存器操作數(shù)
F 立即數(shù)操作數(shù)（浮點）

從這個栗子也可以看出嵌入式匯編的基本格式：

asm(“匯編指令”:”=輸出操作數(shù)規(guī)則”(關(guān)聯(lián)變量):”輸入操作數(shù)規(guī)則”(關(guān)聯(lián)變量));

輸出操作數(shù)必須為左值；這個顯然。

2. 多個操作數(shù)，或沒有輸出操作數(shù)

如果某個指令有多個輸入或輸出操作數(shù)怎么辦？例如arm有很多指令是三操作數(shù)指令。這個時候用逗號分隔多個規(guī)則：

asm(“add %0, %1, %2”:”=r”(sum):”r”(a), “r”(b));

每條操作數(shù)規(guī)則按順序?qū)?yīng)操作數(shù)%0, %1, %2。

對于沒有輸出操作數(shù)的情況，在匯編指令后就沒有輸出規(guī)則，于是就出現(xiàn)兩個連續(xù)冒號，后跟輸入規(guī)則。

3. 輸入-輸出（或讀-寫）操作數(shù)

有時候一個操作數(shù)既是輸入又是輸出，比如x86下的這條指令：

add %eax, %ebx

注意指令使用AT&T格式而不是Intel格式。寄存器ebx同時作為輸入操作數(shù)和輸出操作數(shù)。對這樣的操作數(shù)，在規(guī)則前使用”+”字符：

asm("add %1, %0" : "+r"(a) : "r"(b));

對應(yīng)C語言語句a=a+b。

注意這樣的操作數(shù)不能使用”=”符號，因為gcc看到”=”符號會認為這是一個單輸出操作數(shù)，于是在將嵌入?yún)R編轉(zhuǎn)換為真正匯編的時候就不會預(yù)先將變量a的值加載到寄存器%0中。

另一個辦法是將讀-寫操作數(shù)在邏輯上拆分為兩個操作數(shù)：

asm(“add %2, %0” : “=r”(a) : “0”(a), “r”(b));

對“邏輯”輸入操作數(shù)1指定數(shù)字規(guī)則”0”，表示這個邏輯操作數(shù)占用和操作數(shù)0一樣的“位置”（占用同一個寄存器）。這種方法的特點是可以將兩個“邏輯”操作數(shù)關(guān)聯(lián)到兩個不同的C語言變量上：

asm("add %2, %0" : "=r"(c) : "0"(a), "r"(b));

對應(yīng)于C程序語句c=a+b。

數(shù)字規(guī)則僅能用于輸入操作數(shù)，且必須引用到輸出操作數(shù)。拿上例來說，數(shù)字規(guī)則”0”位于輸入規(guī)則段，且引用到輸出操作數(shù)0，該數(shù)字規(guī)則自身占用操作數(shù)計數(shù)1。

這里要注意，通過同名C語言變量是無法保證兩個操作數(shù)占用同一“位置”的。比如下面這樣的寫法是不行的:

（錯誤寫法）asm(“add %2, %0”:”=r”(a):”r”(a), “r”(b));

4. 指定寄存器

有時候我們需要在指令中使用指定的寄存器；典型的栗子是系統(tǒng)調(diào)用，必須將系統(tǒng)調(diào)用碼和參數(shù)放在指定寄存器中。為了達到這個目的，我們要在聲明變量時使用擴展語法：

asm("add %1, %0" : "+r"(a) : "r"(b)); // statement 3

注意只有在執(zhí)行匯編指令時能確定a在eax中，b在ebx中，其他時候a和b的存放位置是不可知的。

另外，在這么用的時候要注意，防止statement 2在執(zhí)行時覆蓋了eax。例如statement 2改成下面這句：

函數(shù)調(diào)用約定會將func()的返回值放在eax里，于是破壞了statement 1對a的賦值。這個時候可以先用一條語句將func返回值放在臨時變量里：

int t = func();

asm("add %1, %0" : "+r"(a) : "r"(b)); // statement 3

5. 隱式改變寄存器

有的匯編指令會隱含修改一些不在指令操作數(shù)中的寄存器，為了讓gcc知道這個情況，將隱式改變寄存器規(guī)則列在輸入規(guī)則之后。下面是VAX機上的栗子：

asm volatile(“movc3 %0,%1,%2”

: /* no outputs */

:”g”(from),”g”(to),”g”(count)

:”r0”,”r1”,”r2”,”r3”,”r4”,”r5”);

（movc3是一條字符塊移動（Move characters）指令）

這里要注意的是輸入/輸出規(guī)則中列出的寄存器不能和隱含改變規(guī)則中的寄存器有交叉。比如在上面的栗子里，規(guī)則“g”中就不能包含r0-r5。以指定寄存器語法聲明的變量，所占用的寄存器也不能和隱含改變規(guī)則有交叉。這個應(yīng)該好理解：隱含改變規(guī)則是告訴gcc有額外的寄存器需要照顧，自然不能和輸入/輸出寄存器有交集。

另外，如果你在指令里顯式指定某個寄存器，那么這個寄存器也必須列在隱式改變規(guī)則之中（有點繞了哈）。上面我們說過gcc自身是不了解匯編指令的，所以你在指令中顯式指定的寄存器，對gcc來說是隱式的，因此必須包含在隱式規(guī)則之中。另外，指令中的顯式寄存器前需要一個額外的%，比如%%eax。

6. volatile

asm volatile通知gcc你的匯編指令有side effect，千萬不要給優(yōu)化沒了，比如上面的栗子。

如果你的指令只是做些計算，那么不需要volatile，讓gcc可以優(yōu)化它；除此以外，無腦給每個asm加上volatile或者是個好辦法。

-END-