理解代碼的內存消耗,最關鍵是要知道自己所用編程語言的內存管理。
不同語言的內存管理
不同的編程語言各自的內存管理方式。
- C/C 這種內存堆空間的申請和釋放完全靠自己管理
- Java 依賴JVM來做內存管理,不了解jvm內存管理的機制,很可能會因一些錯誤的代碼寫法而導致內存泄漏或內存溢出
- Python內存管理是由私有堆空間管理的,所有的python對象和數(shù)據(jù)結構都存儲在私有堆空間中。程序員沒有訪問堆的權限,只有解釋器才能操作。
C 的內存管理
以C 為例來介紹一下編程語言的內存管理。如果我們寫C 的程序,就要知道棧和堆的概念,程序運行時所需的內存空間分為 固定部分,和可變部分,如下:
固定部分的內存消耗 是不會隨著代碼運行產生變化的, 可變部分則是會產生變化的
更具體一些,一個由C/C 編譯的程序占用的內存分為以下幾個部分:
- 棧區(qū)(Stack) :由編譯器自動分配釋放,存放函數(shù)的參數(shù)值,局部變量的值等,其操作方式類似于數(shù)據(jù)結構中的棧。
- 堆區(qū)(Heap) :一般由程序員分配釋放,若程序員不釋放,程序結束時可能由OS收回
- 未初始化數(shù)據(jù)區(qū)(Uninitialized Data):存放未初始化的全局變量和靜態(tài)變量
- 初始化數(shù)據(jù)區(qū)(Initialized Data):存放已經初始化的全局變量和靜態(tài)變量
- 程序代碼區(qū)(Text):存放函數(shù)體的二進制代碼
在可變部分中,棧區(qū)間的數(shù)據(jù)在代碼塊執(zhí)行結束之后,系統(tǒng)會自動回收,而堆區(qū)間數(shù)據(jù)是需要程序員自己回收,所以也就是造成內存泄漏的發(fā)源地。
而Java、Python的話則不需要程序員去考慮內存泄漏的問題,虛擬機都做了這些事情
如何計算程序占用多大內存
想要算出自己程序會占用多少內存就一定要了解自己定義的數(shù)據(jù)類型的大小,如下:注意圖中有兩個不一樣的地方,為什么64位的指針就占用了8個字節(jié),而32位的指針占用4個字節(jié)呢?
1個字節(jié)占8個比特,那么4個字節(jié)就是32個比特,可存放數(shù)據(jù)的大小為2^32,也就是4G空間的大小,即:可以尋找4G空間大小的內存地址。
大家現(xiàn)在使用的計算機一般都是64位了,所以編譯器也都是64位的。
安裝64位的操作系統(tǒng)的計算機內存都已經超過了4G,也就是指針大小如果還是4個字節(jié)的話,就已經不能尋址全部的內存地址,所以64位編譯器使用8個字節(jié)的指針才能尋找所有的內存地址。
注意2^64是一個非常巨大的數(shù),對于尋找地址來說已經足夠用了。
內存對齊
再介紹一下內存管理中另一個重要的知識點:內存對齊。不要以為只有C/C 才會有內存對齊,只要可以跨平臺的編程語言都需要做內存對齊,Java、Python都是一樣的。
而且這是面試中面試官非常喜歡問到的問題,就是:為什么會有內存對齊?
主要是兩個原因
-
平臺原因:不是所有的硬件平臺都能訪問任意內存地址上的任意數(shù)據(jù),某些硬件平臺只能在某些地址處取某些特定類型的數(shù)據(jù),否則拋出硬件異常。為了同一個程序可以在多平臺運行,需要內存對齊。
-
硬件原因:經過內存對齊后,CPU訪問內存的速度大大提升。
struct node{
int num;
char cha;
}st;
int main() {
int a[100];
char b[100];
cout << sizeof(int) << endl;
cout << sizeof(char) << endl;
cout << sizeof(a) << endl;
cout << sizeof(b) << endl;
cout << sizeof(st) << endl;
}
看一下和自己想的結果一樣么, 我們來逐一分析一下。
其輸出的結果依次為:
4
1
400
100
8
此時會發(fā)現(xiàn),和單純計算字節(jié)數(shù)的話是有一些誤差的。
這就是因為內存對齊的原因。
來看一下內存對齊和非內存對齊產生的效果區(qū)別。
CPU讀取內存不是一次讀取單個字節(jié),而是一塊一塊的來讀取內存,塊的大小可以是2,4,8,16個字節(jié),具體取多少個字節(jié)取決于硬件。
假設CPU把內存劃分為4字節(jié)大小的塊,要讀取一個4字節(jié)大小的int型數(shù)據(jù),來看一下這兩種情況下CPU的工作量:
第一種就是內存對齊的情況,如圖:
內存對齊一字節(jié)的char占用了四個字節(jié),空了三個字節(jié)的內存地址,int數(shù)據(jù)從地址4開始。
此時,直接將地址4,5,6,7處的四個字節(jié)數(shù)據(jù)讀取到即可。
第二種是沒有內存對齊的情況如圖:
非內存對齊char型的數(shù)據(jù)和int型的數(shù)據(jù)挨在一起,該int數(shù)據(jù)從地址1開始,那么CPU想要讀這個數(shù)據(jù)的話來看看需要幾步操作:
- 因為CPU是四個字節(jié)四個字節(jié)來尋址,首先CPU讀取0,1,2,3處的四個字節(jié)數(shù)據(jù)
- CPU讀取4,5,6,7處的四個字節(jié)數(shù)據(jù)
- 合并地址1,2,3,4處四個字節(jié)的數(shù)據(jù)才是本次操作需要的int數(shù)據(jù)
大家可能會發(fā)現(xiàn)內存對齊豈不是浪費的內存資源么?
是這樣的,但事實上,相對來說計算機內存資源一般都是充足的,我們更希望的是提高運行速度。
編譯器一般都會做內存對齊的優(yōu)化操作,也就是說當考慮程序真正占用的內存大小的時候,也需要認識到內存對齊的影響。
總結
不少同學對這方面的知識很欠缺,基本處于盲區(qū),通過這一篇大家可以初步補齊一下這塊。之后也可以有意識的去學習自己所用的編程語言是如何管理內存的,這些也是程序員的內功。