當前位置:首頁 > 公眾號精選 > 小林coding
[導讀]今天,我們來思考幾個問題:為什么負數(shù)要用補碼表示? 十進制小數(shù)怎么轉(zhuǎn)成二進制? 計算機是怎么存小數(shù)的? 0.1 + 0.2 == 0.3 嗎? …

前言

今天,我們來思考幾個問題:

  • 為什么負數(shù)要用補碼表示?

  • 十進制小數(shù)怎么轉(zhuǎn)成二進制?

  • 計算機是怎么存小數(shù)的?

  • 0.1 + 0.2 == 0.3 嗎?

別看這些問題都看似簡單,但是其實還是有點東西的這些問題。


正文

為什么負數(shù)要用補碼表示?

十進制轉(zhuǎn)換二進制的方法相信大家都熟能生巧了,如果你說你還不知道,我覺得你還是太謙虛,可能你只是忘記了,即使你真的忘記了,不怕,貼心的小林在和你一起回憶一下。

十進制數(shù)轉(zhuǎn)二進制采用的是除 2 取余法,比如數(shù)字 8 轉(zhuǎn)二進制的過程如下圖:

接著,我們看看「整數(shù)類型」的數(shù)字在計算機的存儲方式,這其實很簡單,也很直觀,就是將十進制的數(shù)字轉(zhuǎn)換成二進制即可。

我們以?int?類型的數(shù)字作為例子,int 類型是?32?位的,其中最高位是作為「符號標志位」,正數(shù)的符號位是?0,負數(shù)的符號位是?1剩余的 31 位則表示二進制數(shù)據(jù)。

那么,對于 int 類型的數(shù)字 1 的二進制數(shù)表示如下:

而負數(shù)就比較特殊了點,負數(shù)在計算機中是以「補碼」表示的,所謂的補碼就是把正數(shù)的二進制全部取反再加 1,比如 -1 的二進制是把數(shù)字 1 的二進制取反后再加 1,如下圖:

不知道你有沒有想過,為什么計算機要用補碼的方式來表示負數(shù)?在回答這個問題前,我們假設不用補碼的方式來表示負數(shù),而只是把最高位的符號標志位變?yōu)?1 表示負數(shù),如下圖過程:

如果采用這種方式來表示負數(shù)的二進制的話,試想一下?-2 + 1?的運算過程,如下圖:

按道理,-2 + 1 = -1,但是上面的運算過程中得到結(jié)果卻是?-3,所可以發(fā)現(xiàn),這種負數(shù)的表示方式是不能用常規(guī)的加法來計算了,就需要特殊處理,要先判斷數(shù)字是否為負數(shù),如果是負數(shù)就要把加法操作變成減法操作才可以得到正確對結(jié)果。

到這里,我們就可以回答前面提到的「負數(shù)為什么要用補碼方式來表示」的問題了。

如果負數(shù)不是使用補碼的方式表示,則在做基本對加減法運算的時候,還需要多一步操作來判斷是否為負數(shù),如果為負數(shù),還得把加法反轉(zhuǎn)成減法,或者把減法反轉(zhuǎn)成加法,這就非常不好了,畢竟加減法運算在計算機里是很常使用的,所以為了性能考慮,應該要盡量簡化這個運算過程。

而用了補碼的表示方式,對于負數(shù)的加減法操作,實際上是和正數(shù)加減法操作一樣的。你可以看到下圖,用補碼表示的負數(shù)在運算?-2 + 1?過程的時候,其結(jié)果是正確的:


十進制小數(shù)與二進制的轉(zhuǎn)換

好了,整數(shù)十進制轉(zhuǎn)二進制我們知道了,接下來看看小數(shù)是怎么轉(zhuǎn)二進制的,小數(shù)部分的轉(zhuǎn)換不同于整數(shù)部分,它采用的是乘 2 取整法,將十進制中的小數(shù)部分乘以 2 作為二進制的一位,然后繼續(xù)取小數(shù)部分乘以 2 作為下一位,直到不存在小數(shù)為止。

話不多說,我們就以?8.625?轉(zhuǎn)二進制作為例子,直接上圖:

最后把「整數(shù)部分 + 小數(shù)部分」結(jié)合在一起后,其結(jié)果就是?1000.101。

但是,并不是所有小數(shù)都可以用二進制表示,前面提到的 0.625 小數(shù)是一個特例,剛好通過乘 2 取整法的方式完整的轉(zhuǎn)換成二進制,如果我們用相同的方式,來把?0.1?轉(zhuǎn)換成二進制,過程如下:

可以發(fā)現(xiàn),0.1?的二進制表示是無限循環(huán)的,由于計算機的資源是有限的,所以是沒辦法用二進制精確的表示 0.1,只能用「近似值」來表示,就是在有限的精度情況下,最大化接近 0.1 的二進制數(shù),于是就會造成精度缺失的情況。

對于二進制小數(shù)轉(zhuǎn)十進制時,需要注意一點,小數(shù)點后面的指數(shù)冪是負數(shù),比如二進制?0.1?轉(zhuǎn)成十進制就是?2^(-1),也就是十進制?0.5,二進制?0.01?轉(zhuǎn)成十進制就是?2^-2,也就是十進制?0.25,以此類推。

舉個例子,二進制?1010.101?轉(zhuǎn)十進制的過程,如下圖:


計算機是怎么存小數(shù)的?

1000.101?這種二進制小數(shù)是「定點數(shù)」形式,代表著小數(shù)點是定死的,不能移動,如果你移動了它的小數(shù)點,這個數(shù)就變了, 就不再是它原來的值了。

然而,計算機并不是這樣存儲的小數(shù)的,計算機存儲小數(shù)的采用的是浮點數(shù),名字里的「浮點」表示小數(shù)點是可以浮動的,比如?1000.101?這個二進制數(shù),可以表示成?1.000101 x 2^(-3),類似于數(shù)學上的科學記數(shù)法。

既然提到了科學計數(shù)法,我再幫大家復習一下,比如有個很大的十進制數(shù) 1230000,我們可以也可以表示成?1.23 x 10^6,這種方式就稱為科學記數(shù)法,該方法在小數(shù)點左邊只有一個數(shù)字,而且把這種整數(shù)部分沒有前導 0 的數(shù)字稱為規(guī)格化,比如?1.0 x 10^(-9)?是規(guī)格化的科學記數(shù)法,而?0.1 x 10^(-9)?和?10.0 x 10^(-9)?就不是了。

因此,如果二進制要用到科學記數(shù)法,同時要規(guī)范化,那么不僅要保證基數(shù)為 2,還要保證小數(shù)點左側(cè)只有 1 位,而且必須為 1,所以通常將?1000.101?這種二進制數(shù),表示成?1.000101 x 2^(-3),其中,最為關(guān)鍵的是 000101 和 -3 這兩個東西,它就可以包含了這個二進制小數(shù)的所有信息,000101?稱為尾數(shù),即小數(shù)點后面的數(shù)字,-3?稱為指數(shù),指定了小數(shù)點在數(shù)據(jù)中的位置。

現(xiàn)在絕大多數(shù)計算機使用的浮點數(shù),一般采用的是 IEEE 制定的國際標準,這種標準形式如下圖:

這三個重要部分的意義如下:

  • 符號位:表示數(shù)字是正數(shù)還是負數(shù),為 0 表示正數(shù),為 1 表示負數(shù);

  • 指數(shù)位:指定了小數(shù)點在數(shù)據(jù)中的位置,指數(shù)可以是負數(shù),也可以是正數(shù),指數(shù)位的長度越長則數(shù)值的表達范圍就越大;

  • 尾數(shù)位:小數(shù)點右側(cè)的數(shù)字,也就是小數(shù)部分,比如二進制 1.0011 x 2^(-2),尾數(shù)部分就是 0011,而且尾數(shù)的長度決定了這個數(shù)的精度,因此如果要表示精度更高的小數(shù),則就要提高尾數(shù)位的長度;

用?32?位來表示的浮點數(shù),則稱為單精度浮點數(shù),也就是我們編程語言中的?float?變量,而用?64?位來表示的浮點數(shù),稱為雙精度浮點數(shù),也就是?double?變量,它們的結(jié)構(gòu)如下:

可以看到:

  • double 的尾數(shù)部分是 52 位,float 的尾數(shù)部分是 23 位,由于同時都帶有一個固定隱含位(這個后面會說),所以 double 有 53 個二進制有效位,float 有 24 個二進制有效位,所以所以它們的精度在十進制中分別是?log10(2^53)?約等于?15.95?和?log10(2^24)約等于?7.22?位,因此 double 的有效數(shù)字是?15~16?位,float 的有效數(shù)字是?7~8位,這些是有效位是包含整數(shù)部分和小數(shù)部分;

  • double 的指數(shù)部分是 11 位,而 float 的指數(shù)位是 8 位,意味著 double 相比 float 能表示更大的數(shù)值范圍;

那二進制小數(shù),是如何轉(zhuǎn)換成二進制浮點數(shù)的呢?我們就以?10.625?作為例子,看看這個數(shù)字在 float 里是如何存儲的。

首先,我們計算出 10.625 的二進制小數(shù)為 1010.101,然后把小數(shù)點,移動到第一個有效數(shù)字后面,即將 1010.101 右移?3?位成?1.010101,右移 3 位就代表 +3,左移 3 位就是 -3,float 中的「指數(shù)位」就跟這里移動的位數(shù)有關(guān)系,把移動的位數(shù)再加上「偏移量」,float 的話偏移量是 127,相加后就是指數(shù)位的值了,即指數(shù)位這 8 位存的是?10000010(十進制 130),因此你可以認為「指數(shù)位」相當于指明了小數(shù)點在數(shù)據(jù)中的位置。

1.010101?這小數(shù)點右側(cè)的數(shù)字就是 float 里的「尾數(shù)位」,由于尾數(shù)位是 23 位,則后面要補充 0,所以最終尾數(shù)位存儲的數(shù)字是?01010100000000000000000。

在算指數(shù)的時候,你可能會有疑問為什么要加上偏移量呢?

前面也提到,指數(shù)可能是正數(shù),也可能是負數(shù),即指數(shù)是有符號的整數(shù),而有符號整數(shù)的計算是比無符號整數(shù)麻煩的,所以為了減少不必要的麻煩,在實際存儲指數(shù)的時候,需要把指數(shù)轉(zhuǎn)換成無符號整數(shù),float 的指數(shù)部分是 8 位,IEEE 標準規(guī)定單精度浮點的指數(shù)取值范圍是?-127 ~ +128,于是為了把指數(shù)轉(zhuǎn)換成無符號整數(shù),就要加個偏移量,比如 float 的指數(shù)偏移量是?127,這樣指數(shù)就不會出現(xiàn)負數(shù)了。

比如,指數(shù)如果是 8,則實際存儲的指數(shù)是 8 + 127 = 135,即把 135 轉(zhuǎn)換為二進制之后再存儲,而當我們需要計算實際的十進制數(shù)的時候,再把指數(shù)減去偏移量即可。

細心的朋友肯定發(fā)現(xiàn),移動后的小數(shù)點左側(cè)的有效位(即 1)消失了,它并沒有存儲到 float 里,這是因為 IEEE 標準規(guī)定,二進制浮點數(shù)的小數(shù)點左側(cè)只能有 1 位,并且還只能是 1,既然這一位永遠都是 1,那就可以不用存起來了,于是就讓 23 位尾數(shù)只存儲小數(shù)部分,電路在計算時會自動把這個 1 加上,這樣就可以節(jié)約 1 位的空間,尾數(shù)就能多存一位小數(shù),相應的精度就更高了一點。

那么,對于我們在從 float 的二進制浮點數(shù)轉(zhuǎn)換成十進制時,要考慮到這個隱含的 1,轉(zhuǎn)換公式如下:

舉個例子,我們把下圖這個 float 的數(shù)據(jù)轉(zhuǎn)換成十進制,過程如下:


0.1 + 0.2 == 0.3 ?

前面提到過,并不是所有小數(shù)都可以用「完整」的二進制來表示的,比如十進制 0.1 在轉(zhuǎn)換成二進制小數(shù)的時候,是一串無限循環(huán)的二進制數(shù),計算機是無法表達無限循環(huán)的二進制數(shù)的,畢竟計算機的資源是有限。

因此,計算機只能用「近似值」來表示該二進制,那么意味著計算機存放的小數(shù)可能不是一個真實值,現(xiàn)在基本都是用 IEEE 754 規(guī)范的單精度浮點類型或雙精度浮點類型來存儲小數(shù)的,根據(jù)精度的不同,近似值也會不同。

那計算機是存儲 0.1 是一個怎么樣的二進制浮點數(shù)呢?偷個懶,我就不自己手動算了,可以使用 binaryconvert 這個工具,將十進制 0.1 小數(shù)轉(zhuǎn)換成 float 浮點數(shù):

可以看到,8 位指數(shù)部分是?01111011,23 位的尾數(shù)部分是?10011001100110011001101,可以看到尾數(shù)部分是?0011?是一直循環(huán)的,只不過尾數(shù)是有長度限制的,所以只會顯示一部分,所以是一個近似值,精度十分有限。

接下來,我們看看 0.2 的 float 浮點數(shù):

可以看到,8 位指數(shù)部分是?01111100,稍微和 0.1 的指數(shù)不同,23 位的尾數(shù)部分是 10011001100110011001101 和 0.1 的尾數(shù)部分是相同的,也是一個近似值。

0.1 的二進制浮點數(shù)轉(zhuǎn)換成十進制的結(jié)果是?0.100000001490116119384765625

0.2 的二進制浮點數(shù)轉(zhuǎn)換成十進制的結(jié)果是?0.20000000298023223876953125

這兩個結(jié)果相加就是?0.300000004470348358154296875

所以,你會看到在計算機中 0.1 + 0.2 并不等于完整的 0.3,這主要是因為有的小數(shù)無法可以用「完整」的二進制來表示,所以計算機里只能采用近似數(shù)的方式來保存,那兩個近似數(shù)相加,得到的必然也是一個近似數(shù)。

我們在 JavaScript 里執(zhí)行 0.1 + 0.2,你會得到下面這個結(jié)果:

結(jié)果和我們前面推到的類似,因為 JavaScript 對于數(shù)字都是使用 IEEE 754 標準下的雙精度浮點類型來存儲的,而我們二進制只能精準表達 2 除盡的數(shù)字 1/2, 1/4, 1/8,但是例如 0.1(1/10) 和 0.2(1/5),在二進制中都無法精準表示時,需要根據(jù)精度舍入。

我們?nèi)祟愂煜さ氖M制運算系統(tǒng),可以精準表達 2 和 5 除盡的數(shù)字,例如1/2, 1/4, 1/5(0.2), 1/8, 1/10(0.1)。當然,十進制也有無法除盡的地方,例如 1/3, 1/7,也需要根據(jù)精度舍入。


總結(jié)

最后,再來回答開頭多問題。

為什么負數(shù)要用補碼表示?

負數(shù)之所以用補碼的方式來表示,主要是為了統(tǒng)一和正數(shù)的加減法操作一樣,畢竟數(shù)字的加減法是很常用的一個操作,就不要搞特殊化,盡量以統(tǒng)一的方式來運算。

十進制小數(shù)怎么轉(zhuǎn)成二進制?

十進制整數(shù)轉(zhuǎn)二進制使用的是「除 2 取余法」,十進制小數(shù)使用的是「乘 2 取整法」。

計算機是怎么存小數(shù)的?

計算機是以浮點數(shù)的形式存儲小數(shù)的,大多數(shù)計算機都是 IEEE 754 標準定義的浮點數(shù)格式,包含三個部分:

  • 符號位:表示數(shù)字是正數(shù)還是負數(shù),為 0 表示正數(shù),為 1 表示負數(shù);

  • 指數(shù)位:指定了小數(shù)點在數(shù)據(jù)中的位置,指數(shù)可以是負數(shù),也可以是正數(shù),指數(shù)位的長度越長則數(shù)值的表達范圍就越大;

  • 尾數(shù)位:小數(shù)點右側(cè)的數(shù)字,也就是小數(shù)部分,比如二進制 1.0011 x 2^(-2),尾數(shù)部分就是 0011,而且尾數(shù)的長度決定了這個數(shù)的精度,因此如果要表示精度更高的小數(shù),則就要提高尾數(shù)位的長度;

用 32 位來表示的浮點數(shù),則稱為單精度浮點數(shù),也就是我們編程語言中的 float 變量,而用 64 位來表示的浮點數(shù),稱為雙精度浮點數(shù),也就是 double 變量。

0.1 + 0.2 == 0.3 嗎?

不是的,0.1 和 0.2 這兩個數(shù)字用二進制表達會是一個一直循環(huán)的二進制數(shù),比如 0.1 的二進制表示為 0.0 0011 0011 0011… (0011 無限循環(huán)),對于計算機而言,0.1 無法精確表達,這是浮點數(shù)計算造成精度損失的根源。

因此,計算機只能用「近似值」來表示該二進制,那么意味著計算機存放的小數(shù)可能不是一個真實值。

0.1 + 0.2 并不等于完整的 0.3,這主要是因為這兩個小數(shù)無法用「完整」的二進制來表示,所以計算機里只能采用近似數(shù)的方式來保存,那兩個近似數(shù)相加,得到的必然也是一個近似數(shù)。


送書送書

最近,labuladong 的算法小抄出版了,我在昨天也收到了東哥的親手簽名版本,簡直太榮幸了,被東哥照顧了下。

不得不說,東哥這本書內(nèi)容很棒,而且還沒出這本書的時候,東哥的算法小抄的 github 不到一年的時間就斬獲了近 70k star,可以說文章的內(nèi)容都是經(jīng)過萬人洗禮過的,經(jīng)得住考驗。

而且,東哥也在今年秋招靠這個 github 斬獲了國內(nèi)非常多的一線大廠的 offer,不少都是都是 sp 級別的 offer。

大家都知道,現(xiàn)在大廠特別愛考察算法,特別是校園招聘,所以如果算法這一關(guān)過不去,基本無緣大廠的了,這么愛考察算法的原因,主要是為了減少篩選人才的成本。

那么,《labuladong 的算法小抄》這本書就總結(jié)了刷算法題的框架思維以及常見算法的題解,說白了就是教你一些刷題的小套路,讓你在刷算法的路上能事半功倍。這本書已經(jīng)在京東和當當已經(jīng)有購買渠道,新書剛出版,活動多多,目前是半價在銷售,是買書的好時機。

小林這邊也從出版社拿到 8 本書,也自己掏錢買了 5 本,所以共會送出 13 本《labuladong 的算法小抄》給到小林的讀者們。

其中,在公眾號里送出 10?本,小林的微信朋友圈送出 3 本。

  1. ?公眾號參與抽獎的方式:我會在本文的贊賞里面抽 10 位幸運讀者,大家打賞 1 元就可以參與抽獎了,之所以在贊賞里抽,是怕如果選擇留言的方式會有人刷贊,再來通過打賞也可以快速篩選出真正想要這本書的讀者。

  2. 朋友圈參與抽獎的方式;我會在朋友圈發(fā)布點贊抽獎的信息,送出 3 本書,還沒加小林微信的朋友,趕緊上車啦,我的微信號是:linzr1995

祝大家好運!

免責聲明:本文內(nèi)容由21ic獲得授權(quán)后發(fā)布,版權(quán)歸原作者所有,本平臺僅提供信息存儲服務。文章僅代表作者個人觀點,不代表本平臺立場,如有問題,請聯(lián)系我們,謝謝!

本站聲明: 本文章由作者或相關(guān)機構(gòu)授權(quán)發(fā)布,目的在于傳遞更多信息,并不代表本站贊同其觀點,本站亦不保證或承諾內(nèi)容真實性等。需要轉(zhuǎn)載請聯(lián)系該專欄作者,如若文章內(nèi)容侵犯您的權(quán)益,請及時聯(lián)系本站刪除。
換一批
延伸閱讀

9月2日消息,不造車的華為或?qū)⒋呱龈蟮莫毥谦F公司,隨著阿維塔和賽力斯的入局,華為引望愈發(fā)顯得引人矚目。

關(guān)鍵字: 阿維塔 塞力斯 華為

加利福尼亞州圣克拉拉縣2024年8月30日 /美通社/ -- 數(shù)字化轉(zhuǎn)型技術(shù)解決方案公司Trianz今天宣布,該公司與Amazon Web Services (AWS)簽訂了...

關(guān)鍵字: AWS AN BSP 數(shù)字化

倫敦2024年8月29日 /美通社/ -- 英國汽車技術(shù)公司SODA.Auto推出其旗艦產(chǎn)品SODA V,這是全球首款涵蓋汽車工程師從創(chuàng)意到認證的所有需求的工具,可用于創(chuàng)建軟件定義汽車。 SODA V工具的開發(fā)耗時1.5...

關(guān)鍵字: 汽車 人工智能 智能驅(qū)動 BSP

北京2024年8月28日 /美通社/ -- 越來越多用戶希望企業(yè)業(yè)務能7×24不間斷運行,同時企業(yè)卻面臨越來越多業(yè)務中斷的風險,如企業(yè)系統(tǒng)復雜性的增加,頻繁的功能更新和發(fā)布等。如何確保業(yè)務連續(xù)性,提升韌性,成...

關(guān)鍵字: 亞馬遜 解密 控制平面 BSP

8月30日消息,據(jù)媒體報道,騰訊和網(wǎng)易近期正在縮減他們對日本游戲市場的投資。

關(guān)鍵字: 騰訊 編碼器 CPU

8月28日消息,今天上午,2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會開幕式在貴陽舉行,華為董事、質(zhì)量流程IT總裁陶景文發(fā)表了演講。

關(guān)鍵字: 華為 12nm EDA 半導體

8月28日消息,在2024中國國際大數(shù)據(jù)產(chǎn)業(yè)博覽會上,華為常務董事、華為云CEO張平安發(fā)表演講稱,數(shù)字世界的話語權(quán)最終是由生態(tài)的繁榮決定的。

關(guān)鍵字: 華為 12nm 手機 衛(wèi)星通信

要點: 有效應對環(huán)境變化,經(jīng)營業(yè)績穩(wěn)中有升 落實提質(zhì)增效舉措,毛利潤率延續(xù)升勢 戰(zhàn)略布局成效顯著,戰(zhàn)新業(yè)務引領(lǐng)增長 以科技創(chuàng)新為引領(lǐng),提升企業(yè)核心競爭力 堅持高質(zhì)量發(fā)展策略,塑強核心競爭優(yōu)勢...

關(guān)鍵字: 通信 BSP 電信運營商 數(shù)字經(jīng)濟

北京2024年8月27日 /美通社/ -- 8月21日,由中央廣播電視總臺與中國電影電視技術(shù)學會聯(lián)合牽頭組建的NVI技術(shù)創(chuàng)新聯(lián)盟在BIRTV2024超高清全產(chǎn)業(yè)鏈發(fā)展研討會上宣布正式成立。 活動現(xiàn)場 NVI技術(shù)創(chuàng)新聯(lián)...

關(guān)鍵字: VI 傳輸協(xié)議 音頻 BSP

北京2024年8月27日 /美通社/ -- 在8月23日舉辦的2024年長三角生態(tài)綠色一體化發(fā)展示范區(qū)聯(lián)合招商會上,軟通動力信息技術(shù)(集團)股份有限公司(以下簡稱"軟通動力")與長三角投資(上海)有限...

關(guān)鍵字: BSP 信息技術(shù)
關(guān)閉
關(guān)閉