經(jīng)典實用技術(shù)文:GCC如何內(nèi)嵌匯編指令?
在C語言中如何使用匯編語言呢?這個問題在 不同的編譯器中,具體實現(xiàn)方法是不同的。不過在實現(xiàn)大方上也不過就是有兩種,而且各種編譯器的實現(xiàn)方法也是大同小異。一種是在C語言中嵌入?yún)R編語言代碼, 另一種是讓C語言從外部調(diào)用匯編。下面我們就以 Borland格式為例來說一說具體用法。但是,匯編指令與Microsoft的實現(xiàn)方法的與Borland只在格式上有點區(qū)別。當(dāng)然,GCC的嵌入?yún)R編是 AT&T格式的。還好,不管什么格式,只是表達形式的不同而已,其內(nèi)在含義是一模一樣的。還是那句話各種編譯器的實現(xiàn)方法是大同小異的,并沒有本質(zhì)的區(qū)別。
兩種實現(xiàn)方式
首先,我們看一看在C語言中如何嵌入?yún)R編語言代碼。在C語言中嵌入?yún)R編語言代碼,也有兩種格式,一種是單句的,一種是模塊的。
我們來看看一些簡單的例子。
例子1:
單句格式的:
main()
{
asm mov ah,2;
asm mov bh,0;
asm mov dl, 20;
asm mov dh,10;
asm int 10h; /*調(diào)用BIOS中斷設(shè)置光標(biāo)位置*/
}
模塊格式的:
main()
{
asm{
mov ah,2
mov bh,0
mov dl, 20
mov dh,10
int 10h
}
}
在這個小程序里面并沒有突出“嵌入”二字。不過從這個程序中可以看出其基本格式。嵌入的各行代碼前面加上asm關(guān)鍵字或者把匯編語句放入asm代碼塊中,每行以分號或換行符結(jié)束,而注釋必須是C語言格式的。
下面我們來看一個讓C語言和匯編協(xié)作的例子:
例子2:
main()
{
char const *MESSAGE=”O(jiān)utPut from asm..\n$”;
asm{
mov ah, 9
mov dx, MESSAGE
int 21h
}
}
上面這個例子十分的簡單,它的純C語言版本是:
#include <stdio.h>
main()
{
printf(“OutPut from asm..\n$”);
}
接下來我們看一看如何讓C語言調(diào)用匯編例程。我們還是看一個簡單的小程序:
C語言部分如下:
extern cursor (int,int),
main()
{
cursor(15,12);
}
匯編語言部分如下:
SMALL
.CODE
PUBLIC
_CURSOR PROC
PUSH BP
MOV BP,SP
MOV DH,[BP+4]
MOV DL,[BP+6]
MOV AH,02
MOV BH,00
INT 10H
POP BP
RET
_CURSOR ENDP
通過上面這個程序,你會看到調(diào)用匯編語言的關(guān)鍵就是如何傳遞參數(shù)。事實上,是通過堆棧來傳遞的但是具體規(guī)則是什么呢?下面我就來看看。
調(diào)用規(guī)則
實際上,在C語言中使用匯編語言最困難的就是如何安全有效的傳遞參數(shù)。否則在調(diào)用匯編子程序時就會從堆棧中取出錯誤的參數(shù)。更可惡的是這種錯誤在編譯的時候是不會發(fā)現(xiàn)錯誤提示的。
下面是C與MASM匯編語言混合是用的時候采用的規(guī)則:
1、參數(shù)傳遞的次序與它們出現(xiàn)的次序是相反的。例如上例中的cursor (x,y)中,首先傳遞的是y,然后才是x。這與我們的一般想法是不一樣的,所以在這兒容易出現(xiàn)錯誤。
2、 傳遞完參數(shù)后,C程序還將保存(CS,IP)。如果C程序是SMALL或COMPACT存儲模式下編譯的(或者過程是NEAR型的),那么只保存IP,而 在MEDIUM、LARGE或HUGE模式下編譯的(或者過程是FAR型的),那么CS和IP都會被壓入堆棧,其順序是CS在前,IP在后。不過這個過程 是C語言自動進行的而不需要我們干預(yù)。這也就是我們在例子2中為什么用MOV DH,[BP+4]而不是MOV DH,[BP]。因為前面是CS和IP而不是參數(shù),真正的參數(shù)從[BP+4]開始。
3、還有BP也必須保存在堆棧中,然后我們才可以通過BP和偏移地址來訪問參數(shù)。
4、最后一條指令應(yīng)當(dāng)是后面不帶數(shù)字的RET,因為把堆棧到原始位置的工作將由C程序重新獲得控制權(quán)以后才會執(zhí)行。
5、任何于C程序共享的名稱都必須在前面加下劃線,而且C語言只識別前8個字
符。
6、對于普通的參數(shù)C語言傳遞的是參數(shù)值,而對于數(shù)組,傳遞的是指針(也就是數(shù)據(jù)的地址)。
7、如果C程序是在MEDIUM、LARGE或HUGE模式下編譯的,那么匯編語言過程應(yīng)該設(shè)為FAR型,C程序是SMALL或COMPACT存儲模式下編譯的,那么匯編語言過程應(yīng)該設(shè)為NEAR型。
不過在MASM5.1或TASM1.0以及更高的版本的時候就不必擔(dān)心偏移地址、在共享名稱前加下劃線以及保存BP這些瑣事了,因為它們可以由編譯器自動完成了。很顯然例子2是舊格式的。
把匯編語言程序與C語言程序鏈接到一起
1、確保匯編語言中的過程被定義為PUBLIC,過程名以下劃線開始。例如,在C語言中叫做“sum”到匯編語言中就應(yīng)該是“_sum”.
2、在C語言程序中過程定義為外部類型,例如在例子2中的extern cursor (int,int)。
3、用匯編器對匯編語言程序匯編,得到XXX.obj文件。
4、用C語言編譯器編譯C語言程序,得到Y(jié)YY.obj文件。
5、用鏈接器將它們鏈接到一起生成可執(zhí)行文件:
link XXX.obj + YYY.obj
以上就是混合使用C語言和匯編語言應(yīng)該注意的幾點問題。關(guān)于在GCC中使用匯編語言大體上是和上面一樣的,只是實現(xiàn)細節(jié)上有一點區(qū)別而已。下面的這篇文章對于在GCC中使用內(nèi)嵌匯編進行詳細的解釋。
GCC使用的內(nèi)嵌匯編語法格式小教程
asm(“fsinx %1, %0”:”=f”(result):”f”(angle));
這里我們不需要關(guān)注fsinx指令是干啥的;只需要知道這條指令需要兩個浮點寄存器作為操作數(shù)。作為專職處理C語言的gcc編譯器,它是沒辦法知道fsinx這條匯編指令需要什么樣的操作數(shù)的,這就要求程序猿告知gcc相關(guān)信息,方法就是指令后面的”=f”和”f”,表示這是兩個浮點寄存器操作數(shù)。這被稱為操作數(shù)規(guī)則(constraint)。規(guī)則前面加上”=”表示這是一個輸出操作數(shù),否則是輸入操作數(shù)。constraint后面括號內(nèi)的是與該寄存器關(guān)聯(lián)的變量。這樣gcc就知道如何將這條嵌入式匯編語句轉(zhuǎn)成實際的匯編指令了:
-
fsinx:匯編指令名 -
%1, %0:匯編指令操作數(shù) -
“=f”(result):操作數(shù)%0是一個浮點寄存器,與變量result關(guān)聯(lián)(對輸出操作數(shù),“關(guān)聯(lián)”的意思就是說gcc執(zhí)行完這條匯編指令后會把寄存器%0的內(nèi)容送到變量result中) -
“f”(angle):操作數(shù)%1是一個浮點寄存器,與變量angle關(guān)聯(lián)(對輸入操作數(shù),“關(guān)聯(lián)”的意思是就是說gcc執(zhí)行這條匯編指令前會先將變量angle的值讀取到寄存器%1中)
因此這條嵌入式匯編會轉(zhuǎn)換為至少三條匯編指令(非優(yōu)化):
-
將angle變量的值加載到寄存器%1 -
fsinx匯編指令,源寄存器%1,目標(biāo)寄存器%0 -
將寄存器%0的值存儲到變量result
當(dāng)然,在高優(yōu)化級別下上面的敘述可能不適用;比如源操作數(shù)可能本來就已經(jīng)在某個浮點寄存器中了。
這里我們也看到constraint前加”=”符號的意義:gcc需要知道這個操作數(shù)是在執(zhí)行嵌入?yún)R編前從變量加載到寄存器,還是在執(zhí)行后從寄存器存儲到變量中。
-
m 內(nèi)存操作數(shù) -
r 寄存器操作數(shù) -
i 立即數(shù)操作數(shù)(整數(shù)) -
f 浮點寄存器操作數(shù) -
F 立即數(shù)操作數(shù)(浮點)
從這個栗子也可以看出嵌入式匯編的基本格式:
asm(“匯編指令”:”=輸出操作數(shù)規(guī)則”(關(guān)聯(lián)變量):”輸入操作數(shù)規(guī)則”(關(guān)聯(lián)變量));
輸出操作數(shù)必須為左值;這個顯然。
如果某個指令有多個輸入或輸出操作數(shù)怎么辦?例如arm有很多指令是三操作數(shù)指令。這個時候用逗號分隔多個規(guī)則:
asm(“add %0, %1, %2”:”=r”(sum):”r”(a), “r”(b));
每條操作數(shù)規(guī)則按順序?qū)?yīng)操作數(shù)%0, %1, %2。
對于沒有輸出操作數(shù)的情況,在匯編指令后就沒有輸出規(guī)則,于是就出現(xiàn)兩個連續(xù)冒號,后跟輸入規(guī)則。
有時候一個操作數(shù)既是輸入又是輸出,比如x86下的這條指令:
add %eax, %ebx
注意指令使用AT&T格式而不是Intel格式。寄存器ebx同時作為輸入操作數(shù)和輸出操作數(shù)。對這樣的操作數(shù),在規(guī)則前使用”+”字符:
asm("add %1, %0" : "+r"(a) : "r"(b));
對應(yīng)C語言語句a=a+b。
注意這樣的操作數(shù)不能使用”=”符號,因為gcc看到”=”符號會認為這是一個單輸出操作數(shù),于是在將嵌入?yún)R編轉(zhuǎn)換為真正匯編的時候就不會預(yù)先將變量a的值加載到寄存器%0中。
另一個辦法是將讀-寫操作數(shù)在邏輯上拆分為兩個操作數(shù):
asm(“add %2, %0” : “=r”(a) : “0”(a), “r”(b));
對“邏輯”輸入操作數(shù)1指定數(shù)字規(guī)則”0”,表示這個邏輯操作數(shù)占用和操作數(shù)0一樣的“位置”(占用同一個寄存器)。這種方法的特點是可以將兩個“邏輯”操作數(shù)關(guān)聯(lián)到兩個不同的C語言變量上:
asm("add %2, %0" : "=r"(c) : "0"(a), "r"(b));
對應(yīng)于C程序語句c=a+b。
數(shù)字規(guī)則僅能用于輸入操作數(shù),且必須引用到輸出操作數(shù)。拿上例來說,數(shù)字規(guī)則”0”位于輸入規(guī)則段,且引用到輸出操作數(shù)0,該數(shù)字規(guī)則自身占用操作數(shù)計數(shù)1。
有時候我們需要在指令中使用指定的寄存器;典型的栗子是系統(tǒng)調(diào)用,必須將系統(tǒng)調(diào)用碼和參數(shù)放在指定寄存器中。為了達到這個目的,我們要在聲明變量時使用擴展語法:
register int a asm(“%eax”) = 1; // statement 1
register int b asm(“%ebx”) = 2; // statement 2
asm("add %1, %0" : "+r"(a) : "r"(b)); // statement 3
注意只有在執(zhí)行匯編指令時能確定a在eax中,b在ebx中,其他時候a和b的存放位置是不可知的。
另外,在這么用的時候要注意,防止statement 2在執(zhí)行時覆蓋了eax。例如statement 2改成下面這句:
register int b asm(“%ebx”) = func();
函數(shù)調(diào)用約定會將func()的返回值放在eax里,于是破壞了statement 1對a的賦值。這個時候可以先用一條語句將func返回值放在臨時變量里:
int t = func();
register int a asm(“%eax”) = 1; // statement 1
register int b asm(“%ebx”) = t; // statement 2
asm("add %1, %0" : "+r"(a) : "r"(b)); // statement 3
asm volatile(“movc3 %0,%1,%2”
: /* no outputs */
:”g”(from),”g”(to),”g”(count)
:”r0”,”r1”,”r2”,”r3”,”r4”,”r5”);
(movc3是一條字符塊移動(Move characters)指令)
這里要注意的是輸入/輸出規(guī)則中列出的寄存器不能和隱含改變規(guī)則中的寄存器有交叉。比如在上面的栗子里,規(guī)則“g”中就不能包含r0-r5。以指定寄存器語法聲明的變量,所占用的寄存器也不能和隱含改變規(guī)則有交叉。這個應(yīng)該好理解:隱含改變規(guī)則是告訴gcc有額外的寄存器需要照顧,自然不能和輸入/輸出寄存器有交集。
推薦閱讀
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務(wù)。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!