在C語(yǔ)言開發(fā)中,指針內(nèi)存一直是重點(diǎn),談?wù)劤绦騿T對(duì)內(nèi)存的理解
掃描二維碼
隨時(shí)隨地手機(jī)看文章
在C和C++語(yǔ)言開發(fā)中,指針、內(nèi)存一直是學(xué)習(xí)的重點(diǎn)。因?yàn)镃語(yǔ)言作為一種偏底層的中低級(jí)語(yǔ)言,提供了大量的內(nèi)存直接操作的方法,這一方面使程序的靈活度最大化,同時(shí)也為bug埋下很多隱患。
因此,無(wú)論如何,我們都要對(duì)內(nèi)存有一個(gè)清晰的理解。
一、對(duì)內(nèi)的分配
32位操作系統(tǒng)支持4GB內(nèi)存的連續(xù)訪問(wèn),但通常把內(nèi)存分為兩個(gè)2GB的空間,每個(gè)進(jìn)程在運(yùn)行時(shí)最大可以使用2GB的私有內(nèi)存(0x00000000—0x7FFFFFFF)。即理論上支持如下的大數(shù)組:
char szBuffer[2*1024*1024*1024];
當(dāng)然,由于在實(shí)際運(yùn)行時(shí),程序還有代碼段、臨時(shí)變量段、動(dòng)態(tài)內(nèi)存申請(qǐng)等,實(shí)際上是不可能用到上述那么大的數(shù)組的。
至于高端的2GB內(nèi)存地址(0x80000000—0xFFFFFFFF),操作系統(tǒng)一般內(nèi)部保留使用,即供操作系統(tǒng)內(nèi)核代碼使用。在Windows和Linux平臺(tái)上,一些動(dòng)態(tài)鏈接庫(kù)(Windows的dll,Linux的so)以及ocx控件等,由于是跨進(jìn)程服務(wù)的,因此一般也在高2GB內(nèi)存空間運(yùn)行。
可以看到,每個(gè)進(jìn)程都能看到自己的2GB內(nèi)存以及系統(tǒng)的2GB內(nèi)存,但是不同進(jìn)程之間是無(wú)法彼此看到對(duì)方的。當(dāng)然,操作系統(tǒng)在底層做了很多工作,比如磁盤上的虛擬內(nèi)存交換(請(qǐng)看下以標(biāo)題),不同的內(nèi)存塊動(dòng)態(tài)映射等等。
二、虛擬內(nèi)存
虛擬內(nèi)存的基本思想是:用廉價(jià)但緩慢的磁盤來(lái)擴(kuò)充快速卻昂貴的內(nèi)存。在一定時(shí)刻,程序?qū)嶋H需要使用的虛擬內(nèi)存區(qū)段的內(nèi)容就被載入物理內(nèi)存中。當(dāng)物理內(nèi)存中的數(shù)據(jù)有一段時(shí)間未被使用,它們就可能被轉(zhuǎn)移到硬盤中,節(jié)省下來(lái)的物理內(nèi)存空間用于載入需要使用的其他數(shù)據(jù)。
在進(jìn)程執(zhí)行過(guò)程中,操作系統(tǒng)負(fù)責(zé)具體細(xì)節(jié),使每個(gè)進(jìn)程都以為自己擁有整個(gè)地址空間的獨(dú)家訪問(wèn)權(quán)。這個(gè)幻覺是通過(guò)“虛擬內(nèi)存”實(shí)現(xiàn)的。所有進(jìn)程共享機(jī)器的物理內(nèi)存,當(dāng)內(nèi)存使用完時(shí)就用磁盤保存數(shù)據(jù)。在進(jìn)程運(yùn)行時(shí),數(shù)據(jù)在磁盤和內(nèi)存之間來(lái)回移動(dòng)。內(nèi)存管理硬件負(fù)責(zé)把虛擬地址翻譯為物理地址,并讓一個(gè)進(jìn)程始終運(yùn)行于系統(tǒng)的真正內(nèi)存中,應(yīng)用程序員只看到虛擬地址,并不知道自己的進(jìn)程在磁盤與內(nèi)存之間來(lái)回切換。
從潛在的可能性上說(shuō),與進(jìn)程有關(guān)的所有內(nèi)存都將被系統(tǒng)所使用,如果該進(jìn)程可能不會(huì)馬上運(yùn)行(可能它的優(yōu)先級(jí)低,也可能是它處于睡眠狀態(tài)),操作系統(tǒng)可以暫時(shí)取回所有分配給它的物理內(nèi)存資源,將該進(jìn)程的所有相關(guān)信息都備份到磁盤上。
進(jìn)程只能操作位于物理內(nèi)存中的頁(yè)面。當(dāng)進(jìn)程引用一個(gè)不在物理內(nèi)存中的頁(yè)面時(shí),MMU就會(huì)產(chǎn)生一個(gè)頁(yè)錯(cuò)誤。內(nèi)存對(duì)此事做出響應(yīng),并判斷該引用是否有效。如果無(wú)效,內(nèi)核向進(jìn)程發(fā)出一個(gè)“segmentation violation(段違規(guī))”的信號(hào),內(nèi)核從磁盤取回該頁(yè),換入內(nèi)存中,一旦頁(yè)面進(jìn)入內(nèi)存,進(jìn)程便被解鎖,可以重新運(yùn)行——進(jìn)程本身并不知道它曾經(jīng)因?yàn)轫?yè)面換入事件等待了一會(huì)。
三、內(nèi)存的使用
對(duì)于程序員,我們最重要的是能理解不同進(jìn)程間私有內(nèi)存空間的含義。C和C++的編譯器把私有內(nèi)存分為3塊:基棧、浮動(dòng)棧和堆。如下圖:
(1)基棧:也叫靜態(tài)存儲(chǔ)區(qū),這是編譯器在編譯期間就已經(jīng)固定下來(lái)必須要使用的內(nèi)存,如程序的代碼段、靜態(tài)變量、全局變量、const常量等。
(2)浮動(dòng)棧:很多書上稱為“棧”,就是程序開始運(yùn)行,隨著函數(shù)、對(duì)象的一段執(zhí)行,函數(shù)內(nèi)部變量、對(duì)象的內(nèi)部成員變量開始動(dòng)態(tài)占用內(nèi)存,浮動(dòng)棧一般都有生命周期,函數(shù)結(jié)束或者對(duì)象析構(gòu),其對(duì)應(yīng)的浮動(dòng)??臻g的就拆除了,這部分內(nèi)容總是變來(lái)變?nèi)?,?nèi)存占用也不是固定,因此叫浮動(dòng)棧。
(3)堆:C和C++語(yǔ)言都支持動(dòng)態(tài)內(nèi)存申請(qǐng),即程序運(yùn)行期可以自由申請(qǐng)內(nèi)存,這部分內(nèi)存就是在堆空間申請(qǐng)的。堆位于2GB的最頂端,自上向下分配,這是避免和浮動(dòng)?;斓揭黄?,不好管理。我們用到malloc和new都是從堆空間申請(qǐng)的內(nèi)存,new比malloc多了對(duì)象的支持,可以自動(dòng)調(diào)用構(gòu)造函數(shù)。另外,new創(chuàng)建對(duì)象,其成員變量位于堆里面。
我們來(lái)看一個(gè)例子:
const int n = 100;void Func(void)
{
char ch = 0;
char* pBuff = (char*)malloc(10);
//…
}
這個(gè)函數(shù)如果運(yùn)行,其中n由于是全局靜態(tài)變量,位于基棧,ch和pBuff這兩個(gè)函數(shù)內(nèi)部變量,ch位于浮動(dòng)棧,而pBuff指向的由malloc分配的內(nèi)存區(qū),則位于堆棧。
在內(nèi)存理解上,最著名的例子就是線程啟動(dòng)時(shí)的參數(shù)傳遞。
函數(shù)啟動(dòng)一個(gè)線程,很多時(shí)候需要向線程傳參數(shù),但是線程是異步啟動(dòng)的,即很可能啟動(dòng)函數(shù)已經(jīng)退出了,而線程函數(shù)都還沒有正式開始運(yùn)行,因此,絕不能用啟動(dòng)函數(shù)的內(nèi)部變量給線程傳參。道理很簡(jiǎn)單,函數(shù)的內(nèi)部變量在浮動(dòng)棧,但函數(shù)退出時(shí),浮動(dòng)棧自動(dòng)拆除,內(nèi)存空間已經(jīng)被釋放了。當(dāng)線程啟動(dòng)時(shí),按照給的參數(shù)指針去查詢變量,實(shí)際上是在讀一塊無(wú)效的內(nèi)存區(qū)域,程序會(huì)因此而崩潰。
那怎么辦呢?我們應(yīng)該直接用malloc函數(shù)給需要傳遞的參數(shù)分配一塊內(nèi)存區(qū)域,將指針傳入線程,線程收到后使用,最后線程退出時(shí),free釋放。
我們來(lái)看例子:
//這個(gè)結(jié)構(gòu)體就是參數(shù)表typedef struct _CListen_ListenAcceptTask_Param_
{
Linux_Win_SOCKET m_nSocket;
//其他參量… …}SCListenAcceptTaskParam;
//習(xí)慣性寫法,設(shè)置結(jié)構(gòu)體后,立即聲明結(jié)構(gòu)體的尺寸,為后續(xù)malloc提供方便const ULONG SCListenAcceptTaskParamSize = sizeof(SCListenAcceptTaskParam);
//這里接收到連接請(qǐng)求,申請(qǐng)參數(shù)區(qū)域,將關(guān)鍵信息帶入?yún)?shù)區(qū)域,幫助后續(xù)線程工作。
bool CListen::ListenTaskCallback(void* pCallParam,int& nStatus)
{
//正常的函數(shù)邏輯… …
//假定s是accept到的socket,需要傳入后續(xù)線程工作
//在此準(zhǔn)備一塊參數(shù)區(qū)域,從遠(yuǎn)堆上申請(qǐng)
SCListenAcceptTaskParam* pParam = (SCListenAcceptTaskParam*) malloc(SCListenAcceptTaskParamSize);
//給參數(shù)區(qū)域賦值
pParam->m_nSocket = s;
//此處啟動(dòng)線程,將pParam傳遞給線程… …
//正常的函數(shù)邏輯… …
}
//這是線程函數(shù),負(fù)責(zé)處理上文accept到的socket
bool CListen::ListenAcceptTask(void* pCallParam,int& nStatus)
{
//第一句話就是強(qiáng)制指針類型轉(zhuǎn)換,獲得外界傳入的參數(shù)區(qū)域
SCListenAcceptTaskParam* pParam= (SCListenAcceptTaskParam*)pCallParam;
//正常的函數(shù)邏輯… …
//退出前,必須要做的工作,確保資源不被泄露
close(pParam->m_nSocket); //關(guān)閉socket
free(pCallParam); // free傳入的參數(shù)區(qū)域
//… …
}
四、內(nèi)存bug
無(wú)規(guī)則的濫用內(nèi)存和指針會(huì)導(dǎo)致大量的bug,程序員應(yīng)該對(duì)內(nèi)存的使用保持高度的敏感性和警惕性,謹(jǐn)慎地使用內(nèi)存資源。
使用內(nèi)存時(shí)最容易出現(xiàn)的bug是:
(1)壞指針值錯(cuò)誤:在指針賦值之前就用它來(lái)引用內(nèi)存,或者向庫(kù)函數(shù)傳送一個(gè)壞指針,第三種可能導(dǎo)致壞指針的原因是對(duì)指針進(jìn)行釋放之后再訪問(wèn)它的內(nèi)容。可以修改free語(yǔ)句,在指針釋放之后再將它置為空值。
free(p); p = NULL;
這樣,如果在指針釋放之后繼續(xù)使用該指針,至少程序能在終止之前進(jìn)行信息轉(zhuǎn)儲(chǔ)。
(2)改寫(overwrite)錯(cuò)誤:越過(guò)數(shù)組邊界寫入數(shù)據(jù),在動(dòng)態(tài)分配的內(nèi)存兩端之外寫入數(shù)據(jù),或改寫一些堆管理數(shù)據(jù)結(jié)構(gòu)(在動(dòng)態(tài)分配內(nèi)存之前的區(qū)域?qū)懭霐?shù)據(jù)就很容易發(fā)生這種情況)
p = malloc(256); p[-1] = 0; p[256] = 0;
(3)指針釋放引起的錯(cuò)誤:釋放同一個(gè)內(nèi)存塊兩次,或釋放一塊未曾使用malloc分配的內(nèi)存,或釋放仍在使用中的內(nèi)存,或釋放一個(gè)無(wú)效的指針。一個(gè)極為常見的與釋放內(nèi)存有關(guān)的錯(cuò)誤就是在 for(p=start;p=p->next) 這樣的循環(huán)中迭代一個(gè)鏈表,并在循環(huán)體內(nèi)使用 free(p) 語(yǔ)句。這樣,在下一次循環(huán)迭代時(shí),程序就會(huì)對(duì)已經(jīng)釋放的指針進(jìn)行解除引用操作,從而導(dǎo)致不可預(yù)料的結(jié)果。
我們可以這樣迭代:
struct node *p, *tart, *temp;for(p = start; p ; p = temp)
{
temp = p->next;
free(p);
}