引言
使用Shell進行工作的人們對Unix/Linux下的Shell編程都很熟悉,在所有的Shell編程的書中都會提到#!/bin/bash,而這里到底包含了些什么?對操作系統(tǒng)而言,這一行字符串意味著什么?你可能會說,不就是會讓/bin/bash程序來解釋這個腳本程序嗎?當(dāng)然你是對的,看看我們的標(biāo)題,這里我們談?wù)劷忉屍?,讓我們一起來看看腳本文件里的第一句到底對系統(tǒng)而言意味著什么。但有一點我們可先明確一下,所謂解釋器就是指#!行后面的可執(zhí)行的程序。
一、我們從exec族函數(shù)談起
如果你從不寫C程序,可能需要對本節(jié)的內(nèi)容看得更為仔細并且試驗一下。
代碼:
#include <unistd.h>
extern char **environ;
int execl(const char *path, const char *arg, ...);
int execlp(const char *file, const char *arg, ...);
int execle(const char *path, const char *arg , ..., char * const envp[]);
int execv(const char *path, char *const argv[]);
int execvp(const char *file, char *const argv[]);exec族函數(shù)一共有上面所列的5個,作用都是一樣:執(zhí)行一段新的代碼。區(qū)別只是向函數(shù)傳遞的參數(shù)方式不同而已,我在這里講講execl函數(shù):第一個參數(shù)path是指向設(shè)置了執(zhí)行位文件的路徑,后面的可變參數(shù)列表分別指向了傳遞給此執(zhí)行文件的參數(shù)列表(包括了參數(shù)0,即是執(zhí)行文件的名稱)。最后一個參數(shù)為(char *) 0,表示參數(shù)列表結(jié)束。
對于解釋器,exec族函數(shù)是這樣做的(以execl為例),如果path是指向了一個腳本,腳本的第一行以#!開頭,則這樣調(diào)用:
以#!后面的字符串為命令,后面加上execl參數(shù)列表中指定的參數(shù)列表,這樣形成了新的程序執(zhí)行。
下面我們以例子來驗證這個結(jié)果:
下面這個C程序的作用是回射所有命令行參數(shù)。
代碼:
/* Program source : showargs.c *
* Program name : showargs */
#include <unistd.h>
int
main(int argc, char *argv[])
{
int i;
for(i = 0; i < argc; i++)
{
printf("arg[%d]: %s\n", i, argv);
}
return 0;
}編譯:gcc -o showargs showargs.c
執(zhí)行:
代碼:
$ pwd
/home/kiron
$ ./showargs arg1 arg2
arg[0]: ./showargs
arg[1]: arg1
arg[2]: arg2
我們在同一個目錄下再寫一個腳本:
代碼:
#!/home/kiron/showargs addargs我沒有打錯,是的,這個腳本就只有一行,這個腳本我們命名為testexec,加上執(zhí)行位后,執(zhí)行情況如下:
代碼:
$ ./testexec
arg[0]: /home/kiron/showargs
arg[1]: addargs
arg[2]: ./testexec怎么會這樣?我猜會有人對第2個參數(shù)./testexec不理解,暫且賣個關(guān)子,再引出一個C程序:
代碼:
/* Program source : mytest.c *
* Program name : mytest */
#include <stdio.h>
int
main(void)
{
execl("/home/kiron/testexec", "testexec", "arg1", "arg2", (char *) 0);
return 0;
}編譯:gcc -o mytest mytest.c
執(zhí)行:
代碼:
$ ./mytest
arg[0]: /home/kiron/showargs
arg[1]: addargs
arg[2]: /home/kiron/testexec
arg[3]: arg1
arg[4]: arg2仔細觀察上面的三個例子,答案開始浮出水面了。正如在開始時講到的,exec族函數(shù)的處理是把#!后面的字符串為命令,后面加上execl參數(shù)列表中指定的參數(shù)列表,這樣形成了新的程序執(zhí)行。分析一下mytest.c源程序,execl把命令的結(jié)果是這樣執(zhí)行的/home/kiron/testexec的內(nèi)容是#!/home/kiron/showargs addargs,則#!后面的字符串"/home/kiron/showargs addargs"加上命令參數(shù)列表:"/home/kiron/testexec arg1 arg2"就形成了新的程序行:/home/kiron/showargs addargs /home/kiron/testexec arg1 arg2。對于testexec腳本,我們在shell中調(diào)用它時,shell調(diào)用了fork,exec,wait來執(zhí)行它,也就是和程序mytest.c一樣用了exec函數(shù),首先,exec函數(shù)對#!行分析后得出此腳本的解釋器為/home/kiron/showargs,然后就形成了把命令行處理成了:“/home/kiron/showargs addargs ./testexec”。
注意:#!行中的解釋器的路徑必須是全路徑,exec函數(shù)并不對其特殊處理,比如用PATH變量來搜索它的真實路徑,所以路徑是由程序員來保證正確的。
二、我的腳本第一句必須得是#!/bin/bash嗎?
當(dāng)然不必了,通過上面的解釋,其實第一句的#!是對腳本的解釋器程序路徑,腳本的內(nèi)容是由解釋器解釋的,我們可以用各種各樣的解釋器來寫對應(yīng)的腳本,比如說/bin/csh腳本,/bin/perl腳本,/bin/awk腳本,/bin/sed腳本,甚至/bin/echo等等。那我們真的能寫一個/bin/echo的腳本文件嗎?我們來試試,下面是一個例子:
代碼:
#!/bin/echo -e我把這只有一行的程序(實際上它也只能是一行,echo程序并不是被設(shè)計成像awk那樣的編程語言,能寫成源程序文件)命名為myecho,加上權(quán)限后執(zhí)行它:
代碼:
$ ./myecho "hi\a"
./myecho hi如果你的echo支持-e選項并且你工作的環(huán)境還算安靜,你在得到上面的結(jié)果的時候也應(yīng)該聽到清脆的終端響鈴。但這種程序是毫無作用的。
三、我能利用解釋器來做什么?
但是上面的echo腳本實際應(yīng)用時并沒有什么作用,我們可以得出一個小小的實驗結(jié)果,并不是所有的可執(zhí)行二進制文件都可以用來寫解釋器腳本。那我編寫解釋器的腳本有什么用?如果你有一個可編程的解釋器,那你或許能編寫該解釋器的程序來簡化你工作。比如說常用到的解釋器如awk,perl,bash等等。但是正如我們上面總結(jié)的實驗結(jié)果,很不幸地,并不是全部的可編程程序都是有用的解釋器,exec腳本時,能從第一行得到腳本的解釋器,然后用exec去解釋腳本(可能是選項去控制,如#!/bin/awk -f),也包括了形如#!/PATH/的第一行,如果該解釋器對這行不能忽略的話,就會出錯,另外解釋器也必須要對余下的程序語句能解釋(這句好像是廢話,但想象一下,上面myecho程序加一些"hello world"的行來,會有效嗎?下面的mysed程序中的s/UNIX/unix/p也是一樣的道理)。像awk,perl,bash等程序?qū)?開頭的行當(dāng)成注釋行處理,就能寫成有用的腳本。[!--empirenews.page--]
再看下面的mysed程序,
代碼:
#!/bin/sed -f
s/UNIX/unix/p執(zhí)行./mysed時出錯了。因為被解釋成了"/bin/sed -f ./mysed",其中-f選項是表示以文件里的內(nèi)容作為sed的命令輸入,但sed的命令輸入不能對"#!/bin/sed -f"解釋,那么程序出錯了。
所以,有用的解釋器應(yīng)該是類似bash,perl,awk的程序,并且能對一些規(guī)定的語句有解釋功能的。下面給出一個awk程序?qū)懙慕y(tǒng)計文件行數(shù)和單詞數(shù)的腳本程序myawk。
代碼:
#!/usr/bin/awk -f
BEGIN {
sum = 0;
}
{sum += NF;}
END {
printf("file \"%s\" have %d line, %d words.\n", FILENAME, NR, sum);
}設(shè)置執(zhí)行位之后,執(zhí)行如下:
代碼:
$ echo -e "hi\nhello world">test.txt
$ ./myawk test.txt
file "test.txt" have 2 line, 3 words這里執(zhí)行./myawk被執(zhí)行成“/usr/bin/awk -f ./myawk test.txt”,因為awk的命令中,以#開頭的行被認為是注釋行而忽略,awk忽略了第一行"#!/usr/bin/awk -f",正確的以非#開頭行當(dāng)成模式和命令的輸入并能對其解釋,所以這個程序是正確的,能被順利地執(zhí)行。
OK,關(guān)于Linux系統(tǒng)的解釋器的介紹就說到這了,希望大家能對解釋器的原理有更多的認識,而不是給我越說越糊涂^_^。