DELPHI的原子世界
在使用Delphi開發(fā)軟件的過程中,我們就像草原上一群快樂牛羊,無憂無慮地享受著Object Pascal語言為我們帶來的陽光和各種VCL控件提供的豐富的水草。抬頭望望無邊無際蔚藍(lán)的天空,低頭品嘗大地上茂密的青草,誰會(huì)去想宇宙有多大,比分子和原子更小的東西是什么?那是哲學(xué)家的事。而哲學(xué)家此時(shí)正坐在高高的山頂上,仰望宇宙星云變換,凝視地上小蟲的爬行,驀然回頭,對(duì)我們這群吃草的牛羊點(diǎn)頭微笑。隨手扯起一根小草,輕輕地含在嘴里,閉上眼睛細(xì)細(xì)品嘗,不知道這根青草在哲學(xué)家的嘴里是什么味道?只是,他的臉上一直帶著滿意的微笑。
??? 認(rèn)識(shí)和了解DELPHI微觀的原子世界,可以使我們徹底理解DELPHI的宏觀應(yīng)用程序結(jié)構(gòu),從而在更廣闊的思想空間中開發(fā)我們的軟件。這就好像,牛頓發(fā)現(xiàn)了宏觀物體的運(yùn)動(dòng),卻因?yàn)楦悴磺逦矬w為什么會(huì)這樣運(yùn)動(dòng)而苦惱,相反,愛因斯坦卻在基本粒子規(guī)律和宏觀物體運(yùn)動(dòng)之間體驗(yàn)著相對(duì)論的快樂生活!
?
第一節(jié)? TObject原子
??? TObject是什么?
??? 是Object Pascal語言體系結(jié)構(gòu)的基本核心,也是各種VCL控件的起源。我們可以認(rèn)為,TObject是構(gòu)成DELPHI應(yīng)用程序的原子之一,當(dāng)然,他們又是由基本Pascal語法元素等更細(xì)微的粒子構(gòu)成。
??? 說TObject是DELPHI程序的原子,是因?yàn)門Object是DELPHI編譯器內(nèi)部支持的。所有的對(duì)象類都是從TObject派生的,即使你并未指定TObject為祖先類。TObject被定義在System單元,它是系統(tǒng)的一部分。在System.pas單元的開頭,有這樣的注釋文本:
??? { Predefined constants, types, procedures, }
??? { and functions (sUCh as True, Integer, or }
??? { Writeln) do not have actual declarations.}
??? { Instead they are built into the compiler }
??? { and are treated as if they were declared }
??? { at the beginning of the System unit.??? }
??? 它的意思說,這一單元包含預(yù)定義的常量、類型、過程和函數(shù)(諸如:Ture、Integer或Writeln),它們并沒有實(shí)際的聲明,而是編譯器內(nèi)置的,并在編譯的開始就被認(rèn)為是已經(jīng)聲明的定義。你可以將Classes.pas或Windows.pas等其他源程序文件加入你的項(xiàng)目文件中進(jìn)行編譯和調(diào)試其源代碼,但你絕對(duì)無法將System.pas源程序文件加入到你的項(xiàng)目文件中進(jìn)行編譯!DELPHI將報(bào)告重復(fù)定義System的編譯錯(cuò)誤!
??? 因此,TObject是編譯器內(nèi)部提供的定義,對(duì)于我們使用DELPHI開發(fā)程序的人來說,TObject是原子性的東西。
??? TObject在System單元中的定義是這樣的:
? TObject = class
??? constructor Create;
??? procedure Free;
??? class function InitInstance(Instance: Pointer): TObject;
?
??? procedure CleanupInstance;
??? function ClassType: TClass;
??? class function ClassName: ShortString;
??? class function ClassNameIs(const Name: string): Boolean;
??? class function ClassParent: TClass;
??? class function ClassInfo: Pointer;
??? class function InstanceSize: Longint;
??? class function InheritsFrom(AClass: TClass): Boolean;
??? class function MethodAddress(const Name: ShortString): Pointer;
??? class function MethodName(Address: Pointer): ShortString;
??? function FieldAddress(const Name: ShortString): Pointer;
??? function GetInterface(const IID: TGUID; out Obj): Boolean;
??? class function GetInterfaceEntry(const IID: TGUID): PInterfaceEntry;
??? class function GetInterfaceTable: PInterfaceTable;
??? function SafeCallException(ExceptObject: TObject;
????? ExceptAddr: Pointer): HResult; virtual;
??? procedure AfterConstruction; virtual;
??? procedure BeforeDestruction; virtual;
??? procedure Dispatch(var Message); virtual;
??? procedure DefaultHandler(var Message); virtual;
??? class function NewInstance: TObject; virtual;
??? procedure FreeInstance; virtual;
??? destructor Destroy; virtual;
? end;
?
??? 下面,我們將逐步敲開TObject原子的大門,看看里面到底是什么結(jié)構(gòu)。
??? 我們知道,TObject是所有對(duì)象的基本類,那么,一個(gè)對(duì)象到底是什么?
? DELPHI中的任何對(duì)象都是一個(gè)指針,這個(gè)指針指明該對(duì)象在內(nèi)存中所占據(jù)的一塊空間!雖然,對(duì)象是一個(gè)指針,可是我們引用對(duì)象的成員時(shí)卻不用寫成這樣的代碼MyObject^.GetName,而只能寫成MyObject.GetName,這是Object Pascal語言擴(kuò)充的語法,是由編譯器支持的。使用C++ Builder的朋友就很清楚對(duì)象與指針的關(guān)系,因?yàn)樵贑++ Builder的對(duì)象都要定義為指針。對(duì)象指針指向的地方就是對(duì)象存儲(chǔ)數(shù)據(jù)的對(duì)象空間,我們來分析一下對(duì)象指針指向的內(nèi)存空間的數(shù)據(jù)結(jié)構(gòu)。
??? 對(duì)象空間的頭4個(gè)字節(jié)是指向該對(duì)象類的虛方法地址表(VMT – Vritual Method Table)。接下來的空間就是存儲(chǔ)對(duì)象本身成員數(shù)據(jù)的空間,并按從該對(duì)象最原始祖先類的數(shù)據(jù)成員到該對(duì)象類的數(shù)據(jù)成員的總順序,和每一級(jí)類中數(shù)據(jù)成員的定義順序存儲(chǔ)。
? ??類的虛方法地址表(VMT)保存從該類的原始祖先類派生到該類的所有類的虛方法的過程地址。類的虛方法,就是用保留字vritual聲明的方法,虛方法是實(shí)現(xiàn)對(duì)象多態(tài)性的基本機(jī)制。雖然,用保留字dynamic聲明的動(dòng)態(tài)方法也可實(shí)現(xiàn)對(duì)象的多態(tài)性,但這樣的方法不保存在虛方法地址表(VMT)中,它只是Object Pascal提供的另一種可節(jié)約類存儲(chǔ)空間的多態(tài)實(shí)現(xiàn)機(jī)制,但卻是以犧牲調(diào)用速度為代價(jià)的。
??? 即使,我們自己并未定義任何類的虛方法,但該類的對(duì)象仍然存在指向虛方法地址表的指針,只是地址項(xiàng)的長度為零??墒牵赥Object中定義的那些虛方法,如Destroy、FreeInstance等等,又存儲(chǔ)在什么地方呢?原來,他們的方法地址存儲(chǔ)在相對(duì)VMT指針負(fù)方向偏移的空間中。其實(shí),在VMT表的負(fù)方向偏移76個(gè)字節(jié)的數(shù)據(jù)空間是對(duì)象類的系統(tǒng)數(shù)據(jù)結(jié)構(gòu),這些數(shù)據(jù)結(jié)構(gòu)是與編譯器相關(guān)的,并且在將來的DELPHI版本中有可能被改變。
??? 因此,你可以認(rèn)為,VMT是一個(gè)從負(fù)偏移地址空間開始的數(shù)據(jù)結(jié)構(gòu),負(fù)偏移數(shù)據(jù)區(qū)是VMT的系統(tǒng)數(shù)據(jù)區(qū),VMT的正偏移數(shù)據(jù)是用戶數(shù)據(jù)區(qū)(自定義的虛方法地址表)。TObject中定義的有關(guān)類信息或?qū)ο筮\(yùn)行時(shí)刻信息的函數(shù)和過程,一般都與VMT的系統(tǒng)數(shù)據(jù)有關(guān)。
??? 一個(gè)VMT數(shù)據(jù)就代表一個(gè)類,其實(shí)VMT就是類!在Object Pascal中我們用TObject、TComponent等等標(biāo)識(shí)符表示類,它們?cè)贒ELPHI的內(nèi)部實(shí)現(xiàn)為各自的VMT數(shù)據(jù)。而用class of保留字定義的類的類型,實(shí)際就是指向相關(guān)VMT數(shù)據(jù)的指針。
??? 對(duì)我們的應(yīng)用程序來說,VMT數(shù)據(jù)是靜態(tài)的數(shù)據(jù),當(dāng)編譯器編譯完成我們的應(yīng)用程序之后,這些數(shù)據(jù)信息已經(jīng)確定并已初始化。我們編寫的程序語句可訪問VMT相關(guān)的信息,獲得諸如對(duì)象的尺寸、類名或運(yùn)行時(shí)刻的屬性資料等等信息,或者調(diào)用虛方法或讀取方法的名稱與地址等等操作。
??? 當(dāng)一個(gè)對(duì)象產(chǎn)生時(shí),系統(tǒng)會(huì)為該對(duì)象分配一塊內(nèi)存空間,并將該對(duì)象與相關(guān)的類聯(lián)系起來,于是,在為對(duì)象分配的數(shù)據(jù)空間中的頭4個(gè)字節(jié),就成為指向類VMT數(shù)據(jù)的指針。
??? 我們?cè)賮砜纯磳?duì)象是怎樣誕生和滅亡的??粗胰龤q的兒子在草地上活蹦亂跳,正是由于親眼目睹過生命的誕生過程,我才能真真體會(huì)到生命的意義和偉大。也只有那些經(jīng)歷過死別的人,才會(huì)更加理解和珍惜生命。那么,就讓我們理解一下對(duì)象的產(chǎn)生和消亡的過程吧!
??? 我們都知道,用下面的語句可以構(gòu)造一個(gè)最簡單對(duì)象:
????? AnObject := TObject.Create;
??? 編譯器將其編譯實(shí)現(xiàn)為:
??? 用TObject對(duì)應(yīng)的VMT為依據(jù),調(diào)用TObject的Create構(gòu)造函數(shù)。而在Create構(gòu)造函數(shù)調(diào)用了系統(tǒng)的ClassCreate過程,系統(tǒng)的ClassCreate過程又通過存儲(chǔ)在類VMT調(diào)用NewInstance虛方法。調(diào)用NewInstance方法的目的是要建立對(duì)象的實(shí)例空間,因?yàn)槲覀儧]有重載該方法,所以,它就是TObject類的NewInstance。TObjec類的NewInstance方法將根據(jù)編譯器在VMT表中初始化的對(duì)象實(shí)例尺寸(InstanceSize),調(diào)用GetMem過程為該對(duì)象分配內(nèi)存,然后調(diào)用InitInstance方法將分配的空間初始化。InitInstance方法首先將對(duì)象空間的頭4個(gè)字節(jié)初始化為指向?qū)ο箢悓?duì)應(yīng)VMT的指針,然后將其余的空間清零。建立對(duì)象實(shí)例之后,還調(diào)用了一個(gè)虛方法AfterConstruction。最后,將對(duì)象實(shí)例數(shù)據(jù)的地址指針保存到AnObject變量中,這樣,AnObject對(duì)象就誕生了。
?
??? 同樣,用下面的語句可以消滅一個(gè)對(duì)象:
????? AnObject.Destroy;
??? TObject的析構(gòu)函數(shù)Destroy被聲明為虛方法,它也是系統(tǒng)固有的虛方法之一。Destory方法首先調(diào)用了BeforeDestruction虛方法,然后調(diào)用系統(tǒng)的ClassDestroy過程。ClassDestory過程又通過類VMT調(diào)用FreeInstance虛方法,由FreeInstance方法調(diào)用FreeMem過程釋放對(duì)象的內(nèi)存空間。就這樣,一個(gè)對(duì)象就在系統(tǒng)中消失。
?
??? 對(duì)象的析構(gòu)過程比對(duì)象的構(gòu)造過程簡單,就好像生命的誕生是一個(gè)漫長的孕育過程,而死亡卻相對(duì)的短暫,這似乎是一種必然的規(guī)律。
在對(duì)象的構(gòu)造和析構(gòu)過程中,調(diào)用了NewInstance和FreeInstance兩個(gè)虛函數(shù),來創(chuàng)建和釋放對(duì)象實(shí)例的內(nèi)存空間。之所以將這兩個(gè)函數(shù)聲明為虛函數(shù),是為了能讓用戶在編寫需要用戶自己管理內(nèi)存的特殊對(duì)象類時(shí)(如在一些特殊的工業(yè)控制程序中),有擴(kuò)展的空間。
??? 而將AfterConstruction和BeforeDestruction聲明為虛函數(shù),也是為了將來派生的類在產(chǎn)生對(duì)象之后,有機(jī)會(huì)讓新誕生的對(duì)象呼吸第一口新鮮空氣,而在對(duì)象消亡之前可以允許對(duì)象完成善后事宜,這都是合情合理的事。其實(shí),TForm對(duì)象和TDataModule對(duì)象的OnCreate事件和OnDestroy事件,就是在TForm和TDataModule重載的這兩個(gè)虛函數(shù)過程分別觸發(fā)的。
此外,TObjec還提供了一個(gè)Free方法,它不是虛方法,它是為了那些搞不清對(duì)象是否為空(nil)的情況下能安全釋放對(duì)象而專門提供的。其實(shí),搞不清對(duì)象是否為空,本身就有程序邏輯不清晰的問題。不過,任何人都不是完美的,都可能犯錯(cuò),使用Free能避免偶然的錯(cuò)誤也是件好事。然而,編寫正確的程序不能一味依靠這樣的解決方法,還是應(yīng)該以保證程序的邏輯正確性為編程的第一目標(biāo)!
??? 有興趣的朋友可以讀一讀System單元的原代碼,其中,大量的代碼是用匯編語言書寫的。細(xì)心的朋友可以發(fā)現(xiàn),TObject的構(gòu)造函數(shù)Create和析構(gòu)函數(shù)Destory竟然沒有寫任何代碼,其實(shí),在調(diào)試狀態(tài)下通過Debug的CPU窗口,可清楚地反映出Create和Destory的匯編代碼。因?yàn)?,締造DELPHI的大師門不想將過多復(fù)雜的東西提供給用戶,他們希望用戶在簡單的概念上編寫應(yīng)用程序,將復(fù)雜的工作隱藏在系統(tǒng)的內(nèi)部由他們承擔(dān)。所以,在發(fā)布System.pas單元時(shí)特別將這兩個(gè)函數(shù)的代碼去掉,讓用戶認(rèn)為TObject是萬物之源,用戶派生的類完全從虛無中開始,這本身并沒有錯(cuò)。雖然,閱讀DELPHI的這些最本質(zhì)的代碼需要少量的匯編語言知識(shí),但閱讀這樣的代碼,可以讓我們更深刻認(rèn)識(shí)DELPHI世界的起源和發(fā)展的基本規(guī)律。即使看不太懂,能起碼了解一些基本東西,對(duì)我們編寫DELPHI程序也是大有幫助。
?
第二節(jié)? TClass原子
在System.pas單元中,TClass是這樣定義的:
? TClass = class of TObject;
它的意思是說,TClass是TObject的類。因?yàn)門Object本身就是一個(gè)類,所以TClass就是所謂的類的類。
從概念上說,TClass是類的類型,即,類之類。但是,我們知道DELPHI的一個(gè)類,代表著一項(xiàng)VMT數(shù)據(jù)。因此,類之類可以認(rèn)為是為VMT數(shù)據(jù)項(xiàng)定義的類型,其實(shí),它就是一個(gè)指向VMT數(shù)據(jù)的指針類型!
在以前傳統(tǒng)的C++語言中,是不能定義類的類型的。對(duì)象一旦編譯就固定下來,類的結(jié)構(gòu)信息已經(jīng)轉(zhuǎn)化為絕對(duì)的機(jī)器代碼,在內(nèi)存中將不存在完整的類信息。一些較高級(jí)的面向?qū)ο笳Z言才可支持對(duì)類信息的動(dòng)態(tài)訪問和調(diào)用,但往往需要一套復(fù)雜的內(nèi)部解釋機(jī)制和較多的系統(tǒng)資源。而DELPHI的Object Pascal語言吸收了一些高級(jí)面向?qū)ο笳Z言的優(yōu)秀特征,又保留可將程序直接編譯成機(jī)器代碼的傳統(tǒng)優(yōu)點(diǎn),比較完美地解決了高級(jí)功能與程序效率的問題。
正是由于DELPHI在應(yīng)用程序中保留了完整的類信息,才能提供諸如as和is等在運(yùn)行時(shí)刻轉(zhuǎn)換和判別類的高級(jí)面向?qū)ο蠊δ埽惖腣MT數(shù)據(jù)在其中起了關(guān)鍵性的核心作用。有興趣的朋友可以讀一讀System單元的AsClass和IsClass兩個(gè)匯編過程,他們是as和is操作符的實(shí)現(xiàn)代碼,以加深對(duì)類和VMT數(shù)據(jù)的理解。
有了`類的類型,就可以將類作為變量來使用。可以將類的變量理解為一種特殊的對(duì)象,你可以象訪問對(duì)象那樣訪問類變量的方法。例如:我們來看看下面的程序片段:
type
? TSampleClass = class of TSampleObject;
? TSampleObject = class( TObject )
? public
??? constructor Create;
??? destructor Destroy; override;
??? class function GetSampleObjectCount:Integer;
??? procedure GetObjectIndex:Integer;
? end;
?
var
? aSampleClass : TSampleClass;
? aClass : TClass;
?
在這段代碼中,我們定義了一個(gè)類TSampleObject及其相關(guān)的類類型TSampleClass,還包括兩個(gè)類變量aSampleClass和aClass。此外,我們還為TSampleObject類定義了構(gòu)造函數(shù)、析構(gòu)函數(shù)、一個(gè)類方法GetSampleObjectCount和一個(gè)對(duì)象方法GetObjectIndex。
首先,我們來理解一下類變量aSampleClass和aClass的含義。
顯然,你可以將TSampleObject和TObject當(dāng)作常量值,并可將它們賦值給aClass變量,就好象將123常量值賦值給整數(shù)變量i一樣。所以,類類型、類和類變量的關(guān)系就是類型、常量和變量的關(guān)系,只不過是在類的這個(gè)層次上而不是對(duì)象層次上的關(guān)系。當(dāng)然,直接將TObject賦值給aSampleClass是不合法的,因?yàn)閍SampleClass是TObject派生類TSampleObject的類變量,而TObject并不包含與TSampleClass類型兼容的所有定義。相反,將TSampleObject賦值給aClass變量卻是合法的,因?yàn)門SampleObject是TObject的派生類,是和TClass類型兼容的。這與對(duì)象變量的賦值和類型匹配關(guān)系完全相似。
然后,我們?cè)賮砜纯词裁词穷惙椒ā?
所謂類方法,就是指在類的層次上調(diào)用的方法,如上面所定義的GetSampleObjectCount方法,它是用保留字class聲明的方法。類方法是不同于在對(duì)象層次上調(diào)用的對(duì)象方法的,對(duì)象方法已經(jīng)為我們所熟悉,而類方法總是在訪問和控制所有類對(duì)象的共同特性和集中管理對(duì)象這一個(gè)層次上使用的。在TObject的定義中,我們可以發(fā)現(xiàn)大量的類方法,如ClassName、ClassInfo和NewInstance等等。其中,NewInstance還被定義為virtual的,即虛的類方法。這意味作你可以在派生的子類中重新編寫NewInstance的實(shí)現(xiàn)方法,以便用特殊的方式構(gòu)造該類的對(duì)象實(shí)例。
?
在類方法中你也可使用self這一標(biāo)識(shí)符,不過其所代表的含義與對(duì)象方法中的self是不同的。類方法中的self表示的是自身的類,即指向VMT的指針,而對(duì)象方法中的self表示的是對(duì)象本身,即指向?qū)ο髷?shù)據(jù)空間的指針。雖然,類方法只能在類層次上使用,但你仍可通過一個(gè)對(duì)象去調(diào)用類方法。例如,可以通過語句aObject.ClassName調(diào)用對(duì)象TObject的類方法ClassName,因?yàn)閷?duì)象指針?biāo)赶虻膶?duì)象數(shù)據(jù)空間中的頭4個(gè)字節(jié)又是指向類VMT的指針。相反,你不可能在類層次上調(diào)用對(duì)象方法,象TObject.Free的語句一定是非法的。
值得注意的是,構(gòu)造函數(shù)是類方法,而析構(gòu)函數(shù)是對(duì)象方法!
什么?構(gòu)造函數(shù)是類方法,析構(gòu)函數(shù)是對(duì)象方法!有沒有搞錯(cuò)?
你看看,當(dāng)你創(chuàng)建對(duì)象時(shí)分明使用的是類似于下面的語句:
??? aObject := TObject.Create;
分明是調(diào)用類TObject的Create方法。而刪除對(duì)象時(shí)卻用的下面的語句:
??? aObject.Destroy;
即使使用Free方法釋放對(duì)象,也是間接調(diào)用了對(duì)象的Destroy方法。
原因很簡單,在構(gòu)造對(duì)象之前,對(duì)象還不存在,只存在類,創(chuàng)建對(duì)象只能用類方法。相反,刪除對(duì)象一定是刪除已經(jīng)存在的對(duì)象,是對(duì)象被釋放,而不是類被釋放。
最后,順便討論一下虛構(gòu)造函數(shù)的問題。
在傳統(tǒng)的C++語言中,可以實(shí)現(xiàn)虛析構(gòu)函數(shù),但實(shí)現(xiàn)虛構(gòu)造函數(shù)卻是一個(gè)難題。因?yàn)?,在傳統(tǒng)的C++語言中,沒有類的類型。全局對(duì)象的實(shí)例是在編譯時(shí)就存在于全局?jǐn)?shù)據(jù)空間中,函數(shù)的局部對(duì)象也是編譯時(shí)就在堆棧空間中映射的實(shí)例,即使是動(dòng)態(tài)創(chuàng)建的對(duì)象,也是用new操作符按固定的類結(jié)構(gòu)在堆空間中分配的實(shí)例,而構(gòu)造函數(shù)只是一個(gè)對(duì)已產(chǎn)生的對(duì)象實(shí)例進(jìn)行初始化的對(duì)象方法而已。傳統(tǒng)C++語言沒有真正的類方法,即使可以定義所謂靜態(tài)的基于類的方法,其最終也被實(shí)現(xiàn)為一種特殊的全局函數(shù),更不用說虛擬的類方法,虛方法只能針對(duì)具體的對(duì)象實(shí)例有效。因此,傳統(tǒng)的C++語言認(rèn)為,在具體的對(duì)象實(shí)例產(chǎn)生之前,卻要根據(jù)即將產(chǎn)生的對(duì)象構(gòu)造對(duì)象本身,這是不可能的。的確不可能,因?yàn)檫@會(huì)在邏輯上產(chǎn)生自相矛盾的悖論!
然而,正是由于在DELPHI中有動(dòng)態(tài)的類的類型信息,有真正虛擬的類方法,以及構(gòu)造函數(shù)是基于類實(shí)現(xiàn)的等等這些關(guān)鍵概念,才可實(shí)現(xiàn)虛擬的構(gòu)造函數(shù)。對(duì)象是由類產(chǎn)生的,對(duì)象就好象成長中的嬰兒,而類就是它的母親,嬰兒自己的確不知道自己將來會(huì)成為什么樣的人,可是母親們卻用各自的教育方法培養(yǎng)出不同的人,道理是相通的。
正是在TComponent類的定義中,構(gòu)造函數(shù)Create被定義為虛擬的,才能使不同類型的控件實(shí)現(xiàn)各自的構(gòu)造方法。這就是TClass創(chuàng)造的類之類概念的偉大,也是DELPHI的偉大。
?
?
第三章? WIN32的時(shí)空觀
??? 我的老父親看著地上玩玩具的小孫子,然后對(duì)我說:“這孩子和小時(shí)的你一樣,喜歡把東西拆開,看過究竟才罷手”。想想我小時(shí)侯,經(jīng)常將玩具車、小鬧鐘、音樂盒,等等,拆得一塌糊涂,常常被母親訓(xùn)斥。
??? 我第一次理解計(jì)算機(jī)的基本原理,與我拆過的音樂盒有關(guān)。那是在念高中時(shí)的一本漫畫書上,一位白胡子老頭在講解智能機(jī)的理論,一位留八字胡的叔叔在說計(jì)算機(jī)和音樂盒。他們說,計(jì)算機(jī)的中央處理器就是音樂盒中用來發(fā)音的那一排音樂簧片,計(jì)算機(jī)程序就是音樂盒中那個(gè)小圓筒上密布的凸點(diǎn),小圓筒的轉(zhuǎn)動(dòng)相當(dāng)于中央處理器的指令指針的自然移動(dòng),而小圓筒上代表音樂的凸點(diǎn)控制音樂簧片振動(dòng)發(fā)音相當(dāng)于中央處理器執(zhí)行程序的指令。音樂盒發(fā)出美妙的旋律,是按工匠早已刻在小圓筒上的音樂譜演奏的,計(jì)算機(jī)完成復(fù)雜的處理,是根據(jù)程序員預(yù)先編制好的程序?qū)崿F(xiàn)的。上大學(xué)之后,我才知道那個(gè)白胡子老頭就是科學(xué)巨匠圖靈,他的有限自動(dòng)機(jī)理論推動(dòng)了整個(gè)信息革命的發(fā)展,而那個(gè)留八字胡的叔叔就是計(jì)算機(jī)之父馮.諾依曼,馮氏計(jì)算機(jī)體系結(jié)構(gòu)至今仍然是計(jì)算機(jī)的主要體系機(jī)構(gòu)。音樂盒沒白拆,母親可以寬心。
??? 有深入淺出的理解,才能有高深而又簡潔的創(chuàng)造。
??? 這一章我們將討論Windows的32位操作系統(tǒng)中與我們編程有關(guān)的基本概念,建立WIN32中正確的時(shí)空觀。希望閱讀完本章之后,我們能更加深入地理解程序、進(jìn)程和線程,理解執(zhí)行文件、動(dòng)態(tài)連接庫和運(yùn)行包的原理,看清全局?jǐn)?shù)據(jù)、局部數(shù)據(jù)和參數(shù)在內(nèi)存中的真相。
?
第一節(jié)? 理解進(jìn)程
??? 由于歷史的原因,Windows是起源于DOS。而在DOS時(shí)代,我們一直只有程序的概念,而沒有進(jìn)程的概念。那時(shí)侯,只有操作系統(tǒng)的正規(guī)軍,如UNIX和VMS等等,才有進(jìn)程的概念,而且多進(jìn)程就意味著小型機(jī)、終端和多用戶,也意味著金錢。我絕大多數(shù)的時(shí)間只能使用相對(duì)廉價(jià)的微機(jī)和DOS系統(tǒng),只是在學(xué)操作系統(tǒng)這門課程時(shí)才開始接觸進(jìn)程和小型機(jī)。
??? 在Windows 3.X之后,Microsoft才在圖形界面的操作系統(tǒng)站住腳跟,而我也是在這時(shí)開始正式面對(duì)多任務(wù)和進(jìn)程的概念。以前在DOS下,同一時(shí)間只能執(zhí)行一個(gè)程序,而在Windows下同一時(shí)間可執(zhí)行多個(gè)程序,這就是多任務(wù)。在DOS下運(yùn)行一個(gè)程序的同時(shí),不能執(zhí)行相同的程序,而在Windows下,同一程序可以同時(shí)有兩個(gè)以上的副本在運(yùn)行,每一個(gè)運(yùn)行的程序副本就是一個(gè)進(jìn)程。更確切地說,任何程序的一次運(yùn)行就產(chǎn)生一個(gè)任務(wù),而每個(gè)任務(wù)就是一個(gè)進(jìn)程。
??? 當(dāng)將程序和進(jìn)程放到一起理解時(shí),可以認(rèn)為程序一詞說的是靜態(tài)的東西,一個(gè)典型的程序是由一個(gè)EXE文件或一個(gè)EXE文件加上若干DLL文件組成的靜態(tài)代碼和數(shù)據(jù)。而進(jìn)程是程序的一次運(yùn)行,是在內(nèi)存中動(dòng)態(tài)運(yùn)行的代碼和動(dòng)態(tài)變化的數(shù)據(jù)。當(dāng)靜態(tài)的程序要求運(yùn)行時(shí),操作系統(tǒng)將為本次運(yùn)行提供一定的內(nèi)存空間,把靜態(tài)的程序代碼和數(shù)據(jù)調(diào)入這些內(nèi)存空間,將程序的代碼和數(shù)據(jù)進(jìn)行重定位映射之后,就在該空間內(nèi)執(zhí)行程序,這樣就產(chǎn)生了動(dòng)態(tài)的進(jìn)程。
??? 同一個(gè)程序同時(shí)運(yùn)行著的兩個(gè)副本,意味著在系統(tǒng)內(nèi)存中有兩個(gè)進(jìn)程空間,只不過它們的程序功能是一樣的,但處于不同的動(dòng)態(tài)變化的狀態(tài)之中。
??? 從進(jìn)程運(yùn)行的時(shí)間上來說,各進(jìn)程是同時(shí)執(zhí)行的,專業(yè)術(shù)語稱為并行執(zhí)行或并發(fā)執(zhí)行。但這主要是操作系統(tǒng)給我們的表面感覺,實(shí)際上各進(jìn)程是分時(shí)執(zhí)行的,也就是各進(jìn)程輪流占用CPU的時(shí)間來執(zhí)行進(jìn)程的程序指令。對(duì)于一個(gè)CPU來說,同一時(shí)間只有一個(gè)進(jìn)程的指令在執(zhí)行。操作系統(tǒng)是調(diào)度進(jìn)程運(yùn)行的幕后操縱者,它不斷保存和切換各進(jìn)程在CPU中執(zhí)行的當(dāng)前狀態(tài),使得每一個(gè)被調(diào)度的進(jìn)程都認(rèn)為自己是完整和連續(xù)地運(yùn)行著。由于進(jìn)程分時(shí)調(diào)度的速度非常快,所以給我們的感覺就是進(jìn)程都是同時(shí)運(yùn)行的。其實(shí),真正意義上的同時(shí)運(yùn)行只有在多CPU的硬件環(huán)境中才有。稍后在講述線程一節(jié)時(shí),我們將發(fā)現(xiàn),真正推動(dòng)進(jìn)程運(yùn)轉(zhuǎn)的是線程,進(jìn)程更重要的是提供了進(jìn)程空間。
??? 從進(jìn)程占據(jù)的空間上來說,各進(jìn)程空間是相對(duì)獨(dú)立的,每一個(gè)進(jìn)程在自己獨(dú)立的空間中運(yùn)行。一個(gè)程序既包括代碼空間又包括數(shù)據(jù)空間,代碼和數(shù)據(jù)都要占據(jù)進(jìn)程空間。Windows為每一進(jìn)程所需的數(shù)據(jù)空間分配實(shí)際的內(nèi)存,而對(duì)代碼空間一般都采用共享手段,將一個(gè)程序的一份代碼映射給該程序的多個(gè)進(jìn)程。這意味著,如果一個(gè)程序有100K的代碼并需要100K的數(shù)據(jù)空間,也就是總共需要200K的進(jìn)程空間,則第一次運(yùn)行程序時(shí)操作系統(tǒng)將分配200K的進(jìn)程空間,而運(yùn)行程序的第二個(gè)進(jìn)程時(shí),操作系統(tǒng)只分配100K的數(shù)據(jù)空間,而代碼空間則共享前一個(gè)進(jìn)程的空間。
??? 上面所說的是Windows操作系統(tǒng)中進(jìn)程的基本時(shí)空觀,其實(shí)Windows的16位和32位操作系統(tǒng)在進(jìn)程的時(shí)空觀上有很大的差異。
??? 從時(shí)間上來說,16位的Windows操作系統(tǒng),如Windows 3.x等,進(jìn)程管理是非常簡單的,它實(shí)際上只是一個(gè)多任務(wù)管理操作系統(tǒng)。而且,操作系統(tǒng)對(duì)任務(wù)的調(diào)度是被動(dòng)的,如果一個(gè)任務(wù)不自己放棄對(duì)消息的處理,操作系統(tǒng)就必須等待。由于16位Windows系統(tǒng)在管理進(jìn)程方面的缺陷,一個(gè)進(jìn)程運(yùn)行時(shí),完全占有著CPU的資源。在那個(gè)年代,為了16位Windows可以有機(jī)會(huì)調(diào)度別的任務(wù),微軟公司大力贊揚(yáng)開發(fā)Windows應(yīng)用程序的開發(fā)者是心胸寬闊的程序員,以使得他們樂意多編寫幾行恩賜給操作系統(tǒng)的代碼。相反,WIN32的操作系統(tǒng),如Windows 95和NT等,才是具備了真正的多進(jìn)程和多任務(wù)操作系統(tǒng)的能力。WIN32中的進(jìn)程完全由操作系統(tǒng)調(diào)度,一旦進(jìn)程運(yùn)行的時(shí)間片結(jié)束,不管進(jìn)程是否還在處理數(shù)據(jù),操作系統(tǒng)將主動(dòng)切換到下一進(jìn)程。嚴(yán)格地說,16位的Windows操作系統(tǒng)不能算是完整的操作系統(tǒng),而32位的WIN32操作系統(tǒng)才是真正意義上的操作系統(tǒng)。當(dāng)然,微軟公司不會(huì)說WIN32彌補(bǔ)了16位Windows的缺陷,而是宣稱WIN32實(shí)現(xiàn)了一種稱為“搶占式多任務(wù)”的先進(jìn)技術(shù),這是商業(yè)手段。
??? 從空間上看,16位的Windows操作系統(tǒng)中的進(jìn)程空間雖然相對(duì)獨(dú)立,但進(jìn)程之間可已很容易地互相訪問對(duì)方的數(shù)據(jù)空間。因?yàn)?,這些進(jìn)程實(shí)際是在相同的物理空間中的不同的數(shù)據(jù)段而已,而且不當(dāng)?shù)牡刂凡僮骱苋菀自斐慑e(cuò)誤的空間讀寫,并使操作系統(tǒng)崩潰。然而,在WIN32操作系統(tǒng)中,各進(jìn)程空間完全是獨(dú)立的。WIN32為每一個(gè)進(jìn)程提供一個(gè)可達(dá)4G的虛擬的,并且是連續(xù)的地址空間。所謂連續(xù)的地址空間,是指每一個(gè)進(jìn)程都擁有從$00000000到$FFFFFFFF的地址空間,而不是向16位Windows的分段式空間。在WIN32中,你完全不必?fù)?dān)心自己的讀寫操作會(huì)無意地影響到其他進(jìn)程空間中的數(shù)據(jù),也不用擔(dān)心別的進(jìn)程會(huì)來騷擾你的工作。同時(shí),WIN32為你的進(jìn)程提供的連續(xù)的4G虛擬空間,是操作系統(tǒng)在硬件的支持下將物理內(nèi)存映射給你的,你雖然擁有如此廣闊的虛擬空間,但系統(tǒng)決不會(huì)浪費(fèi)一個(gè)字節(jié)的物理內(nèi)存。
?
第二節(jié)? 進(jìn)程空間
??? 在我們用DELPHI編寫WIN32的應(yīng)用程序時(shí),很少去關(guān)心進(jìn)程在運(yùn)行時(shí)的內(nèi)部世界。因?yàn)閃IN32為我們的進(jìn)程提供了4G的連續(xù)虛擬進(jìn)程空間,可能目前世界上最龐大的應(yīng)用程序也只用到了其中的部分空間。似乎進(jìn)程空間是無限的,但4G的進(jìn)程空間是虛擬的,而你機(jī)器的實(shí)際內(nèi)存可能與此相差甚遠(yuǎn)。雖然,進(jìn)程擁有如此廣闊的空間,但有些復(fù)雜算法的程序還是會(huì)因?yàn)槎褩R绯龆鵁o法運(yùn)行,特別是含有大量遞歸算法的程序。
??? 因此,深入地認(rèn)識(shí)和了解這4G的進(jìn)程空間的結(jié)構(gòu),以及它與物理內(nèi)存的關(guān)系等等,將有助于我們更清楚地認(rèn)識(shí)WIN32的時(shí)空世界,從而可在實(shí)際的開發(fā)工作中運(yùn)用正確的世界觀和方法論解決各種難題。
??? 下面,我們將通過簡單的實(shí)驗(yàn),來了解WIN32的進(jìn)程空間的內(nèi)部世界。這可能需要一些對(duì)CUP寄存器和匯編語言的知識(shí),但我盡量用簡單的語言來說明。
??? 當(dāng)啟動(dòng)DELPHI時(shí),將自動(dòng)產(chǎn)生一個(gè)Project1的項(xiàng)目,我們就拿它開刀。在Project1.dpr原程序的任意位置設(shè)一斷點(diǎn),比如,就在begin一句處設(shè)一斷點(diǎn)。然后運(yùn)行程序,當(dāng)程序運(yùn)行到斷點(diǎn)時(shí)會(huì)自動(dòng)停下來。這時(shí),我們就可以打開調(diào)試工具中的CPU窗口來觀察進(jìn)程空間的內(nèi)部結(jié)構(gòu)了。
??? 當(dāng)前的指令指針寄存器EIP是停在$0043E4B8,從程序指令所在地址的最高兩位16進(jìn)制數(shù)都是零,可以看出當(dāng)前的程序處在4G進(jìn)程空間相當(dāng)?shù)锥说牡刂肺恢?,其占?jù)$00000000到$FFFFFFFF的相當(dāng)少的地址空間。
??? 在CPU窗口中的指令框中,你可以向上查看進(jìn)程空間中的內(nèi)容。當(dāng)查看小于$00400000的空間內(nèi)容時(shí),你會(huì)發(fā)現(xiàn)小于$00400000的內(nèi)容出現(xiàn)一串串的問號(hào)“????”,那是因?yàn)樵摰刂房臻g還未映射到實(shí)際物理空間的緣故。如果在這時(shí),你查看一下全局變量HInstance的16進(jìn)制值就會(huì)發(fā)現(xiàn)它也是$00400000。雖然HInstance反映的是進(jìn)程實(shí)例的句柄,其實(shí),它就是程序被加載到內(nèi)存中的起始地址值,在16位Windows中也是如此。因此,我們可以認(rèn)為進(jìn)程的程序是從$00400000開始加載的,也就是從4G虛擬空間中的4M以后的空間開始是程序加載的空間。
??? 從$00400000往后,到$0044D000之前,主要是程序代碼和全局?jǐn)?shù)據(jù)的地址空間。在CPU窗口中的堆??蛑?,可以查看到當(dāng)前堆棧的地址。同樣,你會(huì)發(fā)現(xiàn)當(dāng)前堆棧的地址空間是從$0067B000到$00680000的,長度為$5000。其實(shí),進(jìn)程最小的堆??臻g大小就是$5000,它是根據(jù)編譯DELPHI程序時(shí)在ProjectOptions中Linker頁中設(shè)置的Min stack size值,加上$1000而得到的。堆棧是由高端地址向底端增長的,當(dāng)程序運(yùn)行的堆棧不夠時(shí),系統(tǒng)將自動(dòng)向地端地址方向增加堆棧空間的大小,這一過程將把更多的實(shí)際內(nèi)存映射到進(jìn)程空間。可在編譯DELPHI程序時(shí),通過設(shè)置ProjectOptions中Linker頁中Max stack size的值,控制可增加的最大堆??臻g。特別是在含有深層次的子程序調(diào)用關(guān)系或運(yùn)用遞歸算法的程序中,一定要合理地設(shè)置Max stack size的值。因?yàn)?,調(diào)用子程序是需要耗用堆棧空間,而堆棧耗盡之后,系統(tǒng)就會(huì)拋出“Stack overflow”的錯(cuò)誤。
??? 似乎,從堆??臻g之后的進(jìn)程空間就應(yīng)該是自由的空間了吧。其實(shí)不然,WIN32的有關(guān)資料說,$80000000之后的2G空間是系統(tǒng)使用的空間??磥?,進(jìn)程能夠真正擁有的只有2G空間。其實(shí),進(jìn)程能真正擁有的空間連2G都不夠,因?yàn)閺?00000000到$00400000的這4M空間也是禁區(qū)。
?
??? 但不管怎樣,我們的進(jìn)程可以使用的地址還是非常廣闊的。特別是堆棧空間之后到$80000000之間,是進(jìn)程空間的主戰(zhàn)場。進(jìn)程從系統(tǒng)分配的內(nèi)存空間將被映射到這塊空間,進(jìn)程加載的動(dòng)態(tài)連接庫將被映射到這塊空間,新建線程的線程堆??臻g也將映射到這塊空間,幾乎所有涉及分配內(nèi)存的操作都將映射到這塊空間。請(qǐng)注意,這里所說的映射,意味著實(shí)際內(nèi)存與這塊虛擬空間的對(duì)應(yīng),沒有映射為實(shí)際內(nèi)存的進(jìn)程空間是無法使用的,就象調(diào)試時(shí)CPU窗口指令框中的那一串串的“????”。