前言
今天,我們來思考幾個問題:
為什么負數(shù)要用補碼表示?
十進制小數(shù)怎么轉(zhuǎn)成二進制?
計算機是怎么存小數(shù)的?
0.1 + 0.2 == 0.3 嗎?
…
別看這些問題都看似簡單,但是其實還是有點東西的這些問題。
正文
為什么負數(shù)要用補碼表示?
十進制轉(zhuǎn)換二進制的方法相信大家都熟能生巧了,如果你說你還不知道,我覺得你還是太謙虛,可能你只是忘記了,即使你真的忘記了,不怕,貼心的小林在和你一起回憶一下。
十進制數(shù)轉(zhuǎn)二進制采用的是除 2 取余法,比如數(shù)字 8 轉(zhuǎn)二進制的過程如下圖:
接著,我們看看「整數(shù)類型」的數(shù)字在計算機的存儲方式,這其實很簡單,也很直觀,就是將十進制的數(shù)字轉(zhuǎn)換成二進制即可。
我們以?int
?類型的數(shù)字作為例子,int 類型是?32
?位的,其中最高位是作為「符號標志位」,正數(shù)的符號位是?0
,負數(shù)的符號位是?1
,剩余的 31 位則表示二進制數(shù)據(jù)。
那么,對于 int 類型的數(shù)字 1 的二進制數(shù)表示如下:
而負數(shù)就比較特殊了點,負數(shù)在計算機中是以「補碼」表示的,所謂的補碼就是把正數(shù)的二進制全部取反再加 1,比如 -1 的二進制是把數(shù)字 1 的二進制取反后再加 1,如下圖:
不知道你有沒有想過,為什么計算機要用補碼的方式來表示負數(shù)?在回答這個問題前,我們假設不用補碼的方式來表示負數(shù),而只是把最高位的符號標志位變?yōu)?1 表示負數(shù),如下圖過程:
如果采用這種方式來表示負數(shù)的二進制的話,試想一下?-2 + 1
?的運算過程,如下圖:
按道理,-2 + 1 = -1
,但是上面的運算過程中得到結(jié)果卻是?-3
,所可以發(fā)現(xiàn),這種負數(shù)的表示方式是不能用常規(guī)的加法來計算了,就需要特殊處理,要先判斷數(shù)字是否為負數(shù),如果是負數(shù)就要把加法操作變成減法操作才可以得到正確對結(jié)果。
到這里,我們就可以回答前面提到的「負數(shù)為什么要用補碼方式來表示」的問題了。
如果負數(shù)不是使用補碼的方式表示,則在做基本對加減法運算的時候,還需要多一步操作來判斷是否為負數(shù),如果為負數(shù),還得把加法反轉(zhuǎn)成減法,或者把減法反轉(zhuǎn)成加法,這就非常不好了,畢竟加減法運算在計算機里是很常使用的,所以為了性能考慮,應該要盡量簡化這個運算過程。
而用了補碼的表示方式,對于負數(shù)的加減法操作,實際上是和正數(shù)加減法操作一樣的。你可以看到下圖,用補碼表示的負數(shù)在運算?-2 + 1
?過程的時候,其結(jié)果是正確的:
十進制小數(shù)與二進制的轉(zhuǎn)換
好了,整數(shù)十進制轉(zhuǎn)二進制我們知道了,接下來看看小數(shù)是怎么轉(zhuǎn)二進制的,小數(shù)部分的轉(zhuǎn)換不同于整數(shù)部分,它采用的是乘 2 取整法,將十進制中的小數(shù)部分乘以 2 作為二進制的一位,然后繼續(xù)取小數(shù)部分乘以 2 作為下一位,直到不存在小數(shù)為止。
話不多說,我們就以?8.625
?轉(zhuǎn)二進制作為例子,直接上圖:
最后把「整數(shù)部分 + 小數(shù)部分」結(jié)合在一起后,其結(jié)果就是?1000.101
。
但是,并不是所有小數(shù)都可以用二進制表示,前面提到的 0.625 小數(shù)是一個特例,剛好通過乘 2 取整法的方式完整的轉(zhuǎn)換成二進制,如果我們用相同的方式,來把?0.1
?轉(zhuǎn)換成二進制,過程如下:
可以發(fā)現(xiàn),0.1
?的二進制表示是無限循環(huán)的,由于計算機的資源是有限的,所以是沒辦法用二進制精確的表示 0.1,只能用「近似值」來表示,就是在有限的精度情況下,最大化接近 0.1 的二進制數(shù),于是就會造成精度缺失的情況。
對于二進制小數(shù)轉(zhuǎn)十進制時,需要注意一點,小數(shù)點后面的指數(shù)冪是負數(shù),比如二進制?0.1
?轉(zhuǎn)成十進制就是?2^(-1)
,也就是十進制?0.5
,二進制?0.01
?轉(zhuǎn)成十進制就是?2^-2
,也就是十進制?0.25
,以此類推。
舉個例子,二進制?1010.101
?轉(zhuǎn)十進制的過程,如下圖:
計算機是怎么存小數(shù)的?
1000.101
?這種二進制小數(shù)是「定點數(shù)」形式,代表著小數(shù)點是定死的,不能移動,如果你移動了它的小數(shù)點,這個數(shù)就變了, 就不再是它原來的值了。
然而,計算機并不是這樣存儲的小數(shù)的,計算機存儲小數(shù)的采用的是浮點數(shù),名字里的「浮點」表示小數(shù)點是可以浮動的,比如?1000.101
?這個二進制數(shù),可以表示成?1.000101 x 2^(-3)
,類似于數(shù)學上的科學記數(shù)法。
既然提到了科學計數(shù)法,我再幫大家復習一下,比如有個很大的十進制數(shù) 1230000,我們可以也可以表示成?1.23 x 10^6
,這種方式就稱為科學記數(shù)法,該方法在小數(shù)點左邊只有一個數(shù)字,而且把這種整數(shù)部分沒有前導 0 的數(shù)字稱為規(guī)格化,比如?1.0 x 10^(-9)
?是規(guī)格化的科學記數(shù)法,而?0.1 x 10^(-9)
?和?10.0 x 10^(-9)
?就不是了。
因此,如果二進制要用到科學記數(shù)法,同時要規(guī)范化,那么不僅要保證基數(shù)為 2,還要保證小數(shù)點左側(cè)只有 1 位,而且必須為 1,所以通常將?1000.101
?這種二進制數(shù),表示成?1.000101 x 2^(-3)
,其中,最為關(guān)鍵的是 000101 和 -3 這兩個東西,它就可以包含了這個二進制小數(shù)的所有信息,000101
?稱為尾數(shù),即小數(shù)點后面的數(shù)字,-3
?稱為指數(shù),指定了小數(shù)點在數(shù)據(jù)中的位置。
現(xiàn)在絕大多數(shù)計算機使用的浮點數(shù),一般采用的是 IEEE 制定的國際標準,這種標準形式如下圖:
這三個重要部分的意義如下:
符號位:表示數(shù)字是正數(shù)還是負數(shù),為 0 表示正數(shù),為 1 表示負數(shù);
指數(shù)位:指定了小數(shù)點在數(shù)據(jù)中的位置,指數(shù)可以是負數(shù),也可以是正數(shù),指數(shù)位的長度越長則數(shù)值的表達范圍就越大;
尾數(shù)位:小數(shù)點右側(cè)的數(shù)字,也就是小數(shù)部分,比如二進制 1.0011 x 2^(-2),尾數(shù)部分就是 0011,而且尾數(shù)的長度決定了這個數(shù)的精度,因此如果要表示精度更高的小數(shù),則就要提高尾數(shù)位的長度;
用?32
?位來表示的浮點數(shù),則稱為單精度浮點數(shù),也就是我們編程語言中的?float
?變量,而用?64
?位來表示的浮點數(shù),稱為雙精度浮點數(shù),也就是?double
?變量,它們的結(jié)構(gòu)如下:
可以看到:
double 的尾數(shù)部分是 52 位,float 的尾數(shù)部分是 23 位,由于同時都帶有一個固定隱含位(這個后面會說),所以 double 有 53 個二進制有效位,float 有 24 個二進制有效位,所以所以它們的精度在十進制中分別是?
log10(2^53)
?約等于?15.95
?和?log10(2^24)
約等于?7.22
?位,因此 double 的有效數(shù)字是?15~16
?位,float 的有效數(shù)字是?7~8
位,這些是有效位是包含整數(shù)部分和小數(shù)部分;double 的指數(shù)部分是 11 位,而 float 的指數(shù)位是 8 位,意味著 double 相比 float 能表示更大的數(shù)值范圍;
那二進制小數(shù),是如何轉(zhuǎn)換成二進制浮點數(shù)的呢?我們就以?10.625
?作為例子,看看這個數(shù)字在 float 里是如何存儲的。
首先,我們計算出 10.625 的二進制小數(shù)為 1010.101,然后把小數(shù)點,移動到第一個有效數(shù)字后面,即將 1010.101 右移?3
?位成?1.010101
,右移 3 位就代表 +3,左移 3 位就是 -3,float 中的「指數(shù)位」就跟這里移動的位數(shù)有關(guān)系,把移動的位數(shù)再加上「偏移量」,float 的話偏移量是 127,相加后就是指數(shù)位的值了,即指數(shù)位這 8 位存的是?10000010
(十進制 130),因此你可以認為「指數(shù)位」相當于指明了小數(shù)點在數(shù)據(jù)中的位置。
1.010101
?這小數(shù)點右側(cè)的數(shù)字就是 float 里的「尾數(shù)位」,由于尾數(shù)位是 23 位,則后面要補充 0,所以最終尾數(shù)位存儲的數(shù)字是?01010100000000000000000
。
在算指數(shù)的時候,你可能會有疑問為什么要加上偏移量呢?
前面也提到,指數(shù)可能是正數(shù),也可能是負數(shù),即指數(shù)是有符號的整數(shù),而有符號整數(shù)的計算是比無符號整數(shù)麻煩的,所以為了減少不必要的麻煩,在實際存儲指數(shù)的時候,需要把指數(shù)轉(zhuǎn)換成無符號整數(shù),float 的指數(shù)部分是 8 位,IEEE 標準規(guī)定單精度浮點的指數(shù)取值范圍是?-127 ~ +128
,于是為了把指數(shù)轉(zhuǎn)換成無符號整數(shù),就要加個偏移量,比如 float 的指數(shù)偏移量是?127
,這樣指數(shù)就不會出現(xiàn)負數(shù)了。
比如,指數(shù)如果是 8,則實際存儲的指數(shù)是 8 + 127 = 135,即把 135 轉(zhuǎn)換為二進制之后再存儲,而當我們需要計算實際的十進制數(shù)的時候,再把指數(shù)減去偏移量即可。
細心的朋友肯定發(fā)現(xiàn),移動后的小數(shù)點左側(cè)的有效位(即 1)消失了,它并沒有存儲到 float 里,這是因為 IEEE 標準規(guī)定,二進制浮點數(shù)的小數(shù)點左側(cè)只能有 1 位,并且還只能是 1,既然這一位永遠都是 1,那就可以不用存起來了,于是就讓 23 位尾數(shù)只存儲小數(shù)部分,電路在計算時會自動把這個 1 加上,這樣就可以節(jié)約 1 位的空間,尾數(shù)就能多存一位小數(shù),相應的精度就更高了一點。
那么,對于我們在從 float 的二進制浮點數(shù)轉(zhuǎn)換成十進制時,要考慮到這個隱含的 1,轉(zhuǎn)換公式如下:
舉個例子,我們把下圖這個 float 的數(shù)據(jù)轉(zhuǎn)換成十進制,過程如下:
0.1 + 0.2 == 0.3 ?
前面提到過,并不是所有小數(shù)都可以用「完整」的二進制來表示的,比如十進制 0.1 在轉(zhuǎn)換成二進制小數(shù)的時候,是一串無限循環(huán)的二進制數(shù),計算機是無法表達無限循環(huán)的二進制數(shù)的,畢竟計算機的資源是有限。
因此,計算機只能用「近似值」來表示該二進制,那么意味著計算機存放的小數(shù)可能不是一個真實值,現(xiàn)在基本都是用 IEEE 754 規(guī)范的單精度浮點類型或雙精度浮點類型來存儲小數(shù)的,根據(jù)精度的不同,近似值也會不同。
那計算機是存儲 0.1 是一個怎么樣的二進制浮點數(shù)呢?偷個懶,我就不自己手動算了,可以使用 binaryconvert 這個工具,將十進制 0.1 小數(shù)轉(zhuǎn)換成 float 浮點數(shù):
可以看到,8 位指數(shù)部分是?01111011
,23 位的尾數(shù)部分是?10011001100110011001101
,可以看到尾數(shù)部分是?0011
?是一直循環(huán)的,只不過尾數(shù)是有長度限制的,所以只會顯示一部分,所以是一個近似值,精度十分有限。
接下來,我們看看 0.2 的 float 浮點數(shù):
可以看到,8 位指數(shù)部分是?01111100,稍微和 0.1 的指數(shù)不同,23 位的尾數(shù)部分是 10011001100110011001101 和 0.1 的尾數(shù)部分是相同的,也是一個近似值。
0.1 的二進制浮點數(shù)轉(zhuǎn)換成十進制的結(jié)果是?0.100000001490116119384765625
:
0.2 的二進制浮點數(shù)轉(zhuǎn)換成十進制的結(jié)果是?0.20000000298023223876953125
:
這兩個結(jié)果相加就是?0.300000004470348358154296875
:
所以,你會看到在計算機中 0.1 + 0.2 并不等于完整的 0.3,這主要是因為有的小數(shù)無法可以用「完整」的二進制來表示,所以計算機里只能采用近似數(shù)的方式來保存,那兩個近似數(shù)相加,得到的必然也是一個近似數(shù)。
我們在 JavaScript 里執(zhí)行 0.1 + 0.2,你會得到下面這個結(jié)果:
結(jié)果和我們前面推到的類似,因為 JavaScript 對于數(shù)字都是使用 IEEE 754 標準下的雙精度浮點類型來存儲的,而我們二進制只能精準表達 2 除盡的數(shù)字 1/2, 1/4, 1/8,但是例如 0.1(1/10) 和 0.2(1/5),在二進制中都無法精準表示時,需要根據(jù)精度舍入。
我們?nèi)祟愂煜さ氖M制運算系統(tǒng),可以精準表達 2 和 5 除盡的數(shù)字,例如1/2, 1/4, 1/5(0.2), 1/8, 1/10(0.1)。當然,十進制也有無法除盡的地方,例如 1/3, 1/7,也需要根據(jù)精度舍入。
總結(jié)
最后,再來回答開頭多問題。
為什么負數(shù)要用補碼表示?
負數(shù)之所以用補碼的方式來表示,主要是為了統(tǒng)一和正數(shù)的加減法操作一樣,畢竟數(shù)字的加減法是很常用的一個操作,就不要搞特殊化,盡量以統(tǒng)一的方式來運算。
十進制小數(shù)怎么轉(zhuǎn)成二進制?
十進制整數(shù)轉(zhuǎn)二進制使用的是「除 2 取余法」,十進制小數(shù)使用的是「乘 2 取整法」。
計算機是怎么存小數(shù)的?
計算機是以浮點數(shù)的形式存儲小數(shù)的,大多數(shù)計算機都是 IEEE 754 標準定義的浮點數(shù)格式,包含三個部分:
符號位:表示數(shù)字是正數(shù)還是負數(shù),為 0 表示正數(shù),為 1 表示負數(shù);
指數(shù)位:指定了小數(shù)點在數(shù)據(jù)中的位置,指數(shù)可以是負數(shù),也可以是正數(shù),指數(shù)位的長度越長則數(shù)值的表達范圍就越大;
尾數(shù)位:小數(shù)點右側(cè)的數(shù)字,也就是小數(shù)部分,比如二進制 1.0011 x 2^(-2),尾數(shù)部分就是 0011,而且尾數(shù)的長度決定了這個數(shù)的精度,因此如果要表示精度更高的小數(shù),則就要提高尾數(shù)位的長度;
用 32 位來表示的浮點數(shù),則稱為單精度浮點數(shù),也就是我們編程語言中的 float 變量,而用 64 位來表示的浮點數(shù),稱為雙精度浮點數(shù),也就是 double 變量。
0.1 + 0.2 == 0.3 嗎?
不是的,0.1 和 0.2 這兩個數(shù)字用二進制表達會是一個一直循環(huán)的二進制數(shù),比如 0.1 的二進制表示為 0.0 0011 0011 0011… (0011 無限循環(huán)),對于計算機而言,0.1 無法精確表達,這是浮點數(shù)計算造成精度損失的根源。
因此,計算機只能用「近似值」來表示該二進制,那么意味著計算機存放的小數(shù)可能不是一個真實值。
0.1 + 0.2 并不等于完整的 0.3,這主要是因為這兩個小數(shù)無法用「完整」的二進制來表示,所以計算機里只能采用近似數(shù)的方式來保存,那兩個近似數(shù)相加,得到的必然也是一個近似數(shù)。
最近,labuladong 的算法小抄出版了,我在昨天也收到了東哥的親手簽名版本,簡直太榮幸了,被東哥照顧了下。
不得不說,東哥這本書內(nèi)容很棒,而且還沒出這本書的時候,東哥的算法小抄的 github 不到一年的時間就斬獲了近 70k star,可以說文章的內(nèi)容都是經(jīng)過萬人洗禮過的,經(jīng)得住考驗。
而且,東哥也在今年秋招靠這個 github 斬獲了國內(nèi)非常多的一線大廠的 offer,不少都是都是 sp 級別的 offer。
大家都知道,現(xiàn)在大廠特別愛考察算法,特別是校園招聘,所以如果算法這一關(guān)過不去,基本無緣大廠的了,這么愛考察算法的原因,主要是為了減少篩選人才的成本。
那么,《labuladong 的算法小抄》這本書就總結(jié)了刷算法題的框架思維以及常見算法的題解,說白了就是教你一些刷題的小套路,讓你在刷算法的路上能事半功倍。這本書已經(jīng)在京東和當當已經(jīng)有購買渠道,新書剛出版,活動多多,目前是半價在銷售,是買書的好時機。
小林這邊也從出版社拿到 8 本書,也自己掏錢買了 5 本,所以共會送出 13 本《labuladong 的算法小抄》給到小林的讀者們。
其中,在公眾號里送出 10?本,小林的微信朋友圈送出 3 本。
?公眾號參與抽獎的方式:我會在本文的贊賞里面抽 10 位幸運讀者,大家打賞 1 元就可以參與抽獎了,之所以在贊賞里抽,是怕如果選擇留言的方式會有人刷贊,再來通過打賞也可以快速篩選出真正想要這本書的讀者。
朋友圈參與抽獎的方式;我會在朋友圈發(fā)布點贊抽獎的信息,送出 3 本書,還沒加小林微信的朋友,趕緊上車啦,我的微信號是:linzr1995
祝大家好運!
免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!