經(jīng)典實(shí)用技術(shù)文:GCC如何內(nèi)嵌匯編指令?
在C語(yǔ)言中如何使用匯編語(yǔ)言呢?這個(gè)問(wèn)題在 不同的編譯器中,具體實(shí)現(xiàn)方法是不同的。不過(guò)在實(shí)現(xiàn)大方上也不過(guò)就是有兩種,而且各種編譯器的實(shí)現(xiàn)方法也是大同小異。一種是在C語(yǔ)言中嵌入?yún)R編語(yǔ)言代碼, 另一種是讓C語(yǔ)言從外部調(diào)用匯編。下面我們就以 Borland格式為例來(lái)說(shuō)一說(shuō)具體用法。但是,匯編指令與Microsoft的實(shí)現(xiàn)方法的與Borland只在格式上有點(diǎn)區(qū)別。當(dāng)然,GCC的嵌入?yún)R編是 AT&T格式的。還好,不管什么格式,只是表達(dá)形式的不同而已,其內(nèi)在含義是一模一樣的。還是那句話各種編譯器的實(shí)現(xiàn)方法是大同小異的,并沒(méi)有本質(zhì)的區(qū)別。
兩種實(shí)現(xiàn)方式
首先,我們看一看在C語(yǔ)言中如何嵌入?yún)R編語(yǔ)言代碼。在C語(yǔ)言中嵌入?yún)R編語(yǔ)言代碼,也有兩種格式,一種是單句的,一種是模塊的。
我們來(lái)看看一些簡(jiǎn)單的例子。
例子1:
單句格式的:
main()
{
asm mov ah,2;
asm mov bh,0;
asm mov dl, 20;
asm mov dh,10;
asm int 10h; /*調(diào)用BIOS中斷設(shè)置光標(biāo)位置*/
}
模塊格式的:
main()
{
asm{
mov ah,2
mov bh,0
mov dl, 20
mov dh,10
int 10h
}
}
在這個(gè)小程序里面并沒(méi)有突出“嵌入”二字。不過(guò)從這個(gè)程序中可以看出其基本格式。嵌入的各行代碼前面加上asm關(guān)鍵字或者把匯編語(yǔ)句放入asm代碼塊中,每行以分號(hào)或換行符結(jié)束,而注釋必須是C語(yǔ)言格式的。
下面我們來(lái)看一個(gè)讓C語(yǔ)言和匯編協(xié)作的例子:
例子2:
main()
{
char const *MESSAGE=”O(jiān)utPut from asm..\n$”;
asm{
mov ah, 9
mov dx, MESSAGE
int 21h
}
}
上面這個(gè)例子十分的簡(jiǎn)單,它的純C語(yǔ)言版本是:
#include <stdio.h>
main()
{
printf(“OutPut from asm..\n$”);
}
接下來(lái)我們看一看如何讓C語(yǔ)言調(diào)用匯編例程。我們還是看一個(gè)簡(jiǎn)單的小程序:
C語(yǔ)言部分如下:
extern cursor (int,int),
main()
{
cursor(15,12);
}
匯編語(yǔ)言部分如下:
SMALL
.CODE
PUBLIC
_CURSOR PROC
PUSH BP
MOV BP,SP
MOV DH,[BP+4]
MOV DL,[BP+6]
MOV AH,02
MOV BH,00
INT 10H
POP BP
RET
_CURSOR ENDP
通過(guò)上面這個(gè)程序,你會(huì)看到調(diào)用匯編語(yǔ)言的關(guān)鍵就是如何傳遞參數(shù)。事實(shí)上,是通過(guò)堆棧來(lái)傳遞的但是具體規(guī)則是什么呢?下面我就來(lái)看看。
調(diào)用規(guī)則
實(shí)際上,在C語(yǔ)言中使用匯編語(yǔ)言最困難的就是如何安全有效的傳遞參數(shù)。否則在調(diào)用匯編子程序時(shí)就會(huì)從堆棧中取出錯(cuò)誤的參數(shù)。更可惡的是這種錯(cuò)誤在編譯的時(shí)候是不會(huì)發(fā)現(xiàn)錯(cuò)誤提示的。
下面是C與MASM匯編語(yǔ)言混合是用的時(shí)候采用的規(guī)則:
1、參數(shù)傳遞的次序與它們出現(xiàn)的次序是相反的。例如上例中的cursor (x,y)中,首先傳遞的是y,然后才是x。這與我們的一般想法是不一樣的,所以在這兒容易出現(xiàn)錯(cuò)誤。
2、 傳遞完參數(shù)后,C程序還將保存(CS,IP)。如果C程序是SMALL或COMPACT存儲(chǔ)模式下編譯的(或者過(guò)程是NEAR型的),那么只保存IP,而 在MEDIUM、LARGE或HUGE模式下編譯的(或者過(guò)程是FAR型的),那么CS和IP都會(huì)被壓入堆棧,其順序是CS在前,IP在后。不過(guò)這個(gè)過(guò)程 是C語(yǔ)言自動(dòng)進(jìn)行的而不需要我們干預(yù)。這也就是我們?cè)诶?中為什么用MOV DH,[BP+4]而不是MOV DH,[BP]。因?yàn)榍懊媸荂S和IP而不是參數(shù),真正的參數(shù)從[BP+4]開始。
3、還有BP也必須保存在堆棧中,然后我們才可以通過(guò)BP和偏移地址來(lái)訪問(wèn)參數(shù)。
4、最后一條指令應(yīng)當(dāng)是后面不帶數(shù)字的RET,因?yàn)榘讯褩5皆嘉恢玫墓ぷ鲗⒂蒀程序重新獲得控制權(quán)以后才會(huì)執(zhí)行。
5、任何于C程序共享的名稱都必須在前面加下劃線,而且C語(yǔ)言只識(shí)別前8個(gè)字
符。
6、對(duì)于普通的參數(shù)C語(yǔ)言傳遞的是參數(shù)值,而對(duì)于數(shù)組,傳遞的是指針(也就是數(shù)據(jù)的地址)。
7、如果C程序是在MEDIUM、LARGE或HUGE模式下編譯的,那么匯編語(yǔ)言過(guò)程應(yīng)該設(shè)為FAR型,C程序是SMALL或COMPACT存儲(chǔ)模式下編譯的,那么匯編語(yǔ)言過(guò)程應(yīng)該設(shè)為NEAR型。
不過(guò)在MASM5.1或TASM1.0以及更高的版本的時(shí)候就不必?fù)?dān)心偏移地址、在共享名稱前加下劃線以及保存BP這些瑣事了,因?yàn)樗鼈兛梢杂删幾g器自動(dòng)完成了。很顯然例子2是舊格式的。
把匯編語(yǔ)言程序與C語(yǔ)言程序鏈接到一起
1、確保匯編語(yǔ)言中的過(guò)程被定義為PUBLIC,過(guò)程名以下劃線開始。例如,在C語(yǔ)言中叫做“sum”到匯編語(yǔ)言中就應(yīng)該是“_sum”.
2、在C語(yǔ)言程序中過(guò)程定義為外部類型,例如在例子2中的extern cursor (int,int)。
3、用匯編器對(duì)匯編語(yǔ)言程序匯編,得到XXX.obj文件。
4、用C語(yǔ)言編譯器編譯C語(yǔ)言程序,得到Y(jié)YY.obj文件。
5、用鏈接器將它們鏈接到一起生成可執(zhí)行文件:
link XXX.obj + YYY.obj
以上就是混合使用C語(yǔ)言和匯編語(yǔ)言應(yīng)該注意的幾點(diǎn)問(wèn)題。關(guān)于在GCC中使用匯編語(yǔ)言大體上是和上面一樣的,只是實(shí)現(xiàn)細(xì)節(jié)上有一點(diǎn)區(qū)別而已。下面的這篇文章對(duì)于在GCC中使用內(nèi)嵌匯編進(jìn)行詳細(xì)的解釋。
GCC使用的內(nèi)嵌匯編語(yǔ)法格式小教程
asm(“fsinx %1, %0”:”=f”(result):”f”(angle));
這里我們不需要關(guān)注fsinx指令是干啥的;只需要知道這條指令需要兩個(gè)浮點(diǎn)寄存器作為操作數(shù)。作為專職處理C語(yǔ)言的gcc編譯器,它是沒(méi)辦法知道fsinx這條匯編指令需要什么樣的操作數(shù)的,這就要求程序猿告知gcc相關(guān)信息,方法就是指令后面的”=f”和”f”,表示這是兩個(gè)浮點(diǎn)寄存器操作數(shù)。這被稱為操作數(shù)規(guī)則(constraint)。規(guī)則前面加上”=”表示這是一個(gè)輸出操作數(shù),否則是輸入操作數(shù)。constraint后面括號(hào)內(nèi)的是與該寄存器關(guān)聯(lián)的變量。這樣gcc就知道如何將這條嵌入式匯編語(yǔ)句轉(zhuǎn)成實(shí)際的匯編指令了:
-
fsinx:匯編指令名 -
%1, %0:匯編指令操作數(shù) -
“=f”(result):操作數(shù)%0是一個(gè)浮點(diǎn)寄存器,與變量result關(guān)聯(lián)(對(duì)輸出操作數(shù),“關(guān)聯(lián)”的意思就是說(shuō)gcc執(zhí)行完這條匯編指令后會(huì)把寄存器%0的內(nèi)容送到變量result中) -
“f”(angle):操作數(shù)%1是一個(gè)浮點(diǎn)寄存器,與變量angle關(guān)聯(lián)(對(duì)輸入操作數(shù),“關(guān)聯(lián)”的意思是就是說(shuō)gcc執(zhí)行這條匯編指令前會(huì)先將變量angle的值讀取到寄存器%1中)
因此這條嵌入式匯編會(huì)轉(zhuǎn)換為至少三條匯編指令(非優(yōu)化):
-
將angle變量的值加載到寄存器%1 -
fsinx匯編指令,源寄存器%1,目標(biāo)寄存器%0 -
將寄存器%0的值存儲(chǔ)到變量result
當(dāng)然,在高優(yōu)化級(jí)別下上面的敘述可能不適用;比如源操作數(shù)可能本來(lái)就已經(jīng)在某個(gè)浮點(diǎn)寄存器中了。
這里我們也看到constraint前加”=”符號(hào)的意義:gcc需要知道這個(gè)操作數(shù)是在執(zhí)行嵌入?yún)R編前從變量加載到寄存器,還是在執(zhí)行后從寄存器存儲(chǔ)到變量中。
-
m 內(nèi)存操作數(shù) -
r 寄存器操作數(shù) -
i 立即數(shù)操作數(shù)(整數(shù)) -
f 浮點(diǎn)寄存器操作數(shù) -
F 立即數(shù)操作數(shù)(浮點(diǎn))
從這個(gè)栗子也可以看出嵌入式匯編的基本格式:
asm(“匯編指令”:”=輸出操作數(shù)規(guī)則”(關(guān)聯(lián)變量):”輸入操作數(shù)規(guī)則”(關(guān)聯(lián)變量));
輸出操作數(shù)必須為左值;這個(gè)顯然。
如果某個(gè)指令有多個(gè)輸入或輸出操作數(shù)怎么辦?例如arm有很多指令是三操作數(shù)指令。這個(gè)時(shí)候用逗號(hào)分隔多個(gè)規(guī)則:
asm(“add %0, %1, %2”:”=r”(sum):”r”(a), “r”(b));
每條操作數(shù)規(guī)則按順序?qū)?yīng)操作數(shù)%0, %1, %2。
對(duì)于沒(méi)有輸出操作數(shù)的情況,在匯編指令后就沒(méi)有輸出規(guī)則,于是就出現(xiàn)兩個(gè)連續(xù)冒號(hào),后跟輸入規(guī)則。
有時(shí)候一個(gè)操作數(shù)既是輸入又是輸出,比如x86下的這條指令:
add %eax, %ebx
注意指令使用AT&T格式而不是Intel格式。寄存器ebx同時(shí)作為輸入操作數(shù)和輸出操作數(shù)。對(duì)這樣的操作數(shù),在規(guī)則前使用”+”字符:
asm("add %1, %0" : "+r"(a) : "r"(b));
對(duì)應(yīng)C語(yǔ)言語(yǔ)句a=a+b。
注意這樣的操作數(shù)不能使用”=”符號(hào),因?yàn)間cc看到”=”符號(hào)會(huì)認(rèn)為這是一個(gè)單輸出操作數(shù),于是在將嵌入?yún)R編轉(zhuǎn)換為真正匯編的時(shí)候就不會(huì)預(yù)先將變量a的值加載到寄存器%0中。
另一個(gè)辦法是將讀-寫操作數(shù)在邏輯上拆分為兩個(gè)操作數(shù):
asm(“add %2, %0” : “=r”(a) : “0”(a), “r”(b));
對(duì)“邏輯”輸入操作數(shù)1指定數(shù)字規(guī)則”0”,表示這個(gè)邏輯操作數(shù)占用和操作數(shù)0一樣的“位置”(占用同一個(gè)寄存器)。這種方法的特點(diǎn)是可以將兩個(gè)“邏輯”操作數(shù)關(guān)聯(lián)到兩個(gè)不同的C語(yǔ)言變量上:
asm("add %2, %0" : "=r"(c) : "0"(a), "r"(b));
對(duì)應(yīng)于C程序語(yǔ)句c=a+b。
數(shù)字規(guī)則僅能用于輸入操作數(shù),且必須引用到輸出操作數(shù)。拿上例來(lái)說(shuō),數(shù)字規(guī)則”0”位于輸入規(guī)則段,且引用到輸出操作數(shù)0,該數(shù)字規(guī)則自身占用操作數(shù)計(jì)數(shù)1。
有時(shí)候我們需要在指令中使用指定的寄存器;典型的栗子是系統(tǒng)調(diào)用,必須將系統(tǒng)調(diào)用碼和參數(shù)放在指定寄存器中。為了達(dá)到這個(gè)目的,我們要在聲明變量時(shí)使用擴(kuò)展語(yǔ)法:
register int a asm(“%eax”) = 1; // statement 1
register int b asm(“%ebx”) = 2; // statement 2
asm("add %1, %0" : "+r"(a) : "r"(b)); // statement 3
注意只有在執(zhí)行匯編指令時(shí)能確定a在eax中,b在ebx中,其他時(shí)候a和b的存放位置是不可知的。
另外,在這么用的時(shí)候要注意,防止statement 2在執(zhí)行時(shí)覆蓋了eax。例如statement 2改成下面這句:
register int b asm(“%ebx”) = func();
函數(shù)調(diào)用約定會(huì)將func()的返回值放在eax里,于是破壞了statement 1對(duì)a的賦值。這個(gè)時(shí)候可以先用一條語(yǔ)句將func返回值放在臨時(shí)變量里:
int t = func();
register int a asm(“%eax”) = 1; // statement 1
register int b asm(“%ebx”) = t; // statement 2
asm("add %1, %0" : "+r"(a) : "r"(b)); // statement 3
asm volatile(“movc3 %0,%1,%2”
: /* no outputs */
:”g”(from),”g”(to),”g”(count)
:”r0”,”r1”,”r2”,”r3”,”r4”,”r5”);
(movc3是一條字符塊移動(dòng)(Move characters)指令)
這里要注意的是輸入/輸出規(guī)則中列出的寄存器不能和隱含改變規(guī)則中的寄存器有交叉。比如在上面的栗子里,規(guī)則“g”中就不能包含r0-r5。以指定寄存器語(yǔ)法聲明的變量,所占用的寄存器也不能和隱含改變規(guī)則有交叉。這個(gè)應(yīng)該好理解:隱含改變規(guī)則是告訴gcc有額外的寄存器需要照顧,自然不能和輸入/輸出寄存器有交集。
推薦閱讀
免責(zé)聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺(tái)僅提供信息存儲(chǔ)服務(wù)。文章僅代表作者個(gè)人觀點(diǎn),不代表本平臺(tái)立場(chǎng),如有問(wèn)題,請(qǐng)聯(lián)系我們,謝謝!