在C和C++語言開發(fā)中,指針、內存一直是學習的重點。因為C語言作為一種偏底層的中低級語言,提供了大量的內存直接操作的方法,這一方面使程序的靈活度最大化,同時也為bug埋下很多隱患。
因此,無論如何,我們都要對內存有一個清晰的理解。
一、對內的分配
32位操作系統(tǒng)支持4GB內存的連續(xù)訪問,但通常把內存分為兩個2GB的空間,每個進程在運行時最大可以使用2GB的私有內存(0x00000000—0x7FFFFFFF)。即理論上支持如下的大數(shù)組:
char szBuffer[2*1024*1024*1024];
當然,由于在實際運行時,程序還有代碼段、臨時變量段、動態(tài)內存申請等,實際上是不可能用到上述那么大的數(shù)組的。
至于高端的2GB內存地址(0x80000000—0xFFFFFFFF),操作系統(tǒng)一般內部保留使用,即供操作系統(tǒng)內核代碼使用。在Windows和Linux平臺上,一些動態(tài)鏈接庫(Windows的dll,Linux的so)以及ocx控件等,由于是跨進程服務的,因此一般也在高2GB內存空間運行。
可以看到,每個進程都能看到自己的2GB內存以及系統(tǒng)的2GB內存,但是不同進程之間是無法彼此看到對方的。當然,操作系統(tǒng)在底層做了很多工作,比如磁盤上的虛擬內存交換(請看下以標題),不同的內存塊動態(tài)映射等等。
二、虛擬內存
虛擬內存的基本思想是:用廉價但緩慢的磁盤來擴充快速卻昂貴的內存。在一定時刻,程序實際需要使用的虛擬內存區(qū)段的內容就被載入物理內存中。當物理內存中的數(shù)據(jù)有一段時間未被使用,它們就可能被轉移到硬盤中,節(jié)省下來的物理內存空間用于載入需要使用的其他數(shù)據(jù)。
在進程執(zhí)行過程中,操作系統(tǒng)負責具體細節(jié),使每個進程都以為自己擁有整個地址空間的獨家訪問權。這個幻覺是通過“虛擬內存”實現(xiàn)的。所有進程共享機器的物理內存,當內存使用完時就用磁盤保存數(shù)據(jù)。在進程運行時,數(shù)據(jù)在磁盤和內存之間來回移動。內存管理硬件負責把虛擬地址翻譯為物理地址,并讓一個進程始終運行于系統(tǒng)的真正內存中,應用程序員只看到虛擬地址,并不知道自己的進程在磁盤與內存之間來回切換。
從潛在的可能性上說,與進程有關的所有內存都將被系統(tǒng)所使用,如果該進程可能不會馬上運行(可能它的優(yōu)先級低,也可能是它處于睡眠狀態(tài)),操作系統(tǒng)可以暫時取回所有分配給它的物理內存資源,將該進程的所有相關信息都備份到磁盤上。
進程只能操作位于物理內存中的頁面。當進程引用一個不在物理內存中的頁面時,MMU就會產(chǎn)生一個頁錯誤。內存對此事做出響應,并判斷該引用是否有效。如果無效,內核向進程發(fā)出一個“segmentation violation(段違規(guī))”的信號,內核從磁盤取回該頁,換入內存中,一旦頁面進入內存,進程便被解鎖,可以重新運行——進程本身并不知道它曾經(jīng)因為頁面換入事件等待了一會。
三、內存的使用
對于程序員,我們最重要的是能理解不同進程間私有內存空間的含義。C和C++的編譯器把私有內存分為3塊:基棧、浮動棧和堆。如下圖:
(1)基棧:也叫靜態(tài)存儲區(qū),這是編譯器在編譯期間就已經(jīng)固定下來必須要使用的內存,如程序的代碼段、靜態(tài)變量、全局變量、const常量等。
(2)浮動棧:很多書上稱為“棧”,就是程序開始運行,隨著函數(shù)、對象的一段執(zhí)行,函數(shù)內部變量、對象的內部成員變量開始動態(tài)占用內存,浮動棧一般都有生命周期,函數(shù)結束或者對象析構,其對應的浮動??臻g的就拆除了,這部分內容總是變來變去,內存占用也不是固定,因此叫浮動棧。
(3)堆:C和C++語言都支持動態(tài)內存申請,即程序運行期可以自由申請內存,這部分內存就是在堆空間申請的。堆位于2GB的最頂端,自上向下分配,這是避免和浮動?;斓揭黄穑缓霉芾?。我們用到malloc和new都是從堆空間申請的內存,new比malloc多了對象的支持,可以自動調用構造函數(shù)。另外,new創(chuàng)建對象,其成員變量位于堆里面。
我們來看一個例子:
const int n = 100;void Func(void)
{
char ch = 0;
char* pBuff = (char*)malloc(10);
//…
}
這個函數(shù)如果運行,其中n由于是全局靜態(tài)變量,位于基棧,ch和pBuff這兩個函數(shù)內部變量,ch位于浮動棧,而pBuff指向的由malloc分配的內存區(qū),則位于堆棧。
在內存理解上,最著名的例子就是線程啟動時的參數(shù)傳遞。
函數(shù)啟動一個線程,很多時候需要向線程傳參數(shù),但是線程是異步啟動的,即很可能啟動函數(shù)已經(jīng)退出了,而線程函數(shù)都還沒有正式開始運行,因此,絕不能用啟動函數(shù)的內部變量給線程傳參。道理很簡單,函數(shù)的內部變量在浮動棧,但函數(shù)退出時,浮動棧自動拆除,內存空間已經(jīng)被釋放了。當線程啟動時,按照給的參數(shù)指針去查詢變量,實際上是在讀一塊無效的內存區(qū)域,程序會因此而崩潰。
那怎么辦呢?我們應該直接用malloc函數(shù)給需要傳遞的參數(shù)分配一塊內存區(qū)域,將指針傳入線程,線程收到后使用,最后線程退出時,free釋放。
我們來看例子:
//這個結構體就是參數(shù)表typedef struct _CListen_ListenAcceptTask_Param_
{
Linux_Win_SOCKET m_nSocket;
//其他參量… …}SCListenAcceptTaskParam;
//習慣性寫法,設置結構體后,立即聲明結構體的尺寸,為后續(xù)malloc提供方便const ULONG SCListenAcceptTaskParamSize = sizeof(SCListenAcceptTaskParam);
//這里接收到連接請求,申請參數(shù)區(qū)域,將關鍵信息帶入?yún)?shù)區(qū)域,幫助后續(xù)線程工作。
bool CListen::ListenTaskCallback(void* pCallParam,int& nStatus)
{
//正常的函數(shù)邏輯… …
//假定s是accept到的socket,需要傳入后續(xù)線程工作
//在此準備一塊參數(shù)區(qū)域,從遠堆上申請
SCListenAcceptTaskParam* pParam = (SCListenAcceptTaskParam*) malloc(SCListenAcceptTaskParamSize);
//給參數(shù)區(qū)域賦值
pParam->m_nSocket = s;
//此處啟動線程,將pParam傳遞給線程… …
//正常的函數(shù)邏輯… …
}
//這是線程函數(shù),負責處理上文accept到的socket
bool CListen::ListenAcceptTask(void* pCallParam,int& nStatus)
{
//第一句話就是強制指針類型轉換,獲得外界傳入的參數(shù)區(qū)域
SCListenAcceptTaskParam* pParam= (SCListenAcceptTaskParam*)pCallParam;
//正常的函數(shù)邏輯… …
//退出前,必須要做的工作,確保資源不被泄露
close(pParam->m_nSocket); //關閉socket
free(pCallParam); // free傳入的參數(shù)區(qū)域
//… …
}
四、內存bug
無規(guī)則的濫用內存和指針會導致大量的bug,程序員應該對內存的使用保持高度的敏感性和警惕性,謹慎地使用內存資源。
使用內存時最容易出現(xiàn)的bug是:
(1)壞指針值錯誤:在指針賦值之前就用它來引用內存,或者向庫函數(shù)傳送一個壞指針,第三種可能導致壞指針的原因是對指針進行釋放之后再訪問它的內容??梢孕薷膄ree語句,在指針釋放之后再將它置為空值。
free(p); p = NULL;
這樣,如果在指針釋放之后繼續(xù)使用該指針,至少程序能在終止之前進行信息轉儲。
(2)改寫(overwrite)錯誤:越過數(shù)組邊界寫入數(shù)據(jù),在動態(tài)分配的內存兩端之外寫入數(shù)據(jù),或改寫一些堆管理數(shù)據(jù)結構(在動態(tài)分配內存之前的區(qū)域寫入數(shù)據(jù)就很容易發(fā)生這種情況)
p = malloc(256); p[-1] = 0; p[256] = 0;
(3)指針釋放引起的錯誤:釋放同一個內存塊兩次,或釋放一塊未曾使用malloc分配的內存,或釋放仍在使用中的內存,或釋放一個無效的指針。一個極為常見的與釋放內存有關的錯誤就是在 for(p=start;p=p->next) 這樣的循環(huán)中迭代一個鏈表,并在循環(huán)體內使用 free(p) 語句。這樣,在下一次循環(huán)迭代時,程序就會對已經(jīng)釋放的指針進行解除引用操作,從而導致不可預料的結果。
我們可以這樣迭代:
struct node *p, *tart, *temp;for(p = start; p ; p = temp)
{
temp = p->next;
free(p);
}