很多年沒有看到像區(qū)塊鏈這樣有生命力的事物了。它像一個欣欣向榮的新大陸一樣,把技術理想主義者,圍觀者,投資者,投機者,甚至流氓騙子各色人等聚集在一起。
在此亂象中,我深感于現(xiàn)在區(qū)塊鏈,觀點太多,事實太少。我作為一個個體去摸這頭大象的時候,比較擅長的是以技術的角度切入,看它到底是如何工作,如何發(fā)展的,從而把這一只象腿摸清楚。我把自己的學習記錄下來。這些記錄可能很入門,甚至有錯誤,但是或許對于同樣感興趣的人有所幫助。
鏈表從技術角度看,區(qū)塊鏈的底層是精妙設計的鏈表數(shù)據(jù)結構①。
什么是鏈表呢?就是有順序的一串數(shù)據(jù)塊,一個跟在另一個后面,這個順序是嚴格規(guī)定的,不能亂。區(qū)塊鏈,食物鏈,供應鏈,資金鏈,甚至鄙視鏈,描述的就是這樣有順序的一串物品②。
我們以比特幣為例,來剖析這個鏈表。
為了構成鏈表,鏈表的數(shù)據(jù)塊里面有兩個基本的部分:區(qū)塊頭,和數(shù)據(jù)本身。區(qū)塊頭里面有一個字段指明了上一個區(qū)塊的id,而所有區(qū)塊的id既不是順序的,也不是隨機的,而是區(qū)塊頭這80個字節(jié)的兩次哈希值。
哈希 Hash這可能是區(qū)塊鏈里面最讓非理工科出身的學習者費解的概念了。聽起來很嚇人,實際很簡單。哈希就是一個算法,能把任意長度的內容(無論是一個數(shù),還是文章,圖像,視頻,總之就是任何數(shù)字化的信息)轉換成一串看似沒有規(guī)律的固定長度的數(shù)字(哈希值),并保證結果唯一,而從這個結果幾乎沒有辦法推算出原始數(shù)據(jù)。比特幣用的是叫做SHA256的哈希算法。
比如: 1 的SHA256哈希結果是: 0x6b86b273ff34fce19d6b804eff5a3f5747ada4eaa22f1d49c01e52ddb7875b4b
2 的SHA256哈希結果是:
0xd4735e3a265e16eee03f59718b9b5d03019c07d8b6c51f90da3a666eec13ab35
我們把這個哈希值看成亂碼好了,因為唯一的規(guī)律就是沒有規(guī)律。同時,在原始數(shù)據(jù)中哪怕有一點點改動,產生的哈希就會產生巨大的變化。這個特性常常用來做“數(shù)字指紋”。
用日常例子來打個比方。比如按照配方做菜就是個哈希過程:有了配方精確的做菜容易,而從菜品推測出配方難得多。給出兩個數(shù)算出他們的平方和比較容易,給出一個數(shù)求是哪兩個數(shù)的平方和就難很多。哈希算法就大概這么個意思。
區(qū)塊頭和id剛才講到,每個區(qū)塊的id從它的區(qū)塊頭的80個字節(jié)數(shù)據(jù)兩次SHA256哈希得到。區(qū)塊鏈的一個精妙的設計就是,它對于的id是有要求的。只有滿足特定的規(guī)則的id才是合法的。這個規(guī)則就是:區(qū)塊頭的哈希值必須小于一個數(shù),直觀看到的就是,每個新的區(qū)塊的長達64個字符的id必須以比如18個零開頭④,一個合法的區(qū)塊id是長成這個樣子的: 000000000000000000 3c19cdbebe2df5c7f82558e2c80a0c7341e25072b732a2
區(qū)塊頭這80個字節(jié)里面的6個字段,5個是不能改的,它們是:
1. 版本號 最近一直是0x20000000 ⑥
2. 上一個塊的哈希值 這個是排隊時候的隊尾,改了就排不到隊里了
3. 數(shù)據(jù)的哈希 這個是區(qū)塊里的交易數(shù)據(jù),也不能改③
4. 時間 不能改,就是現(xiàn)在的時間。
5. 難度 每個給定的時間全網的難度是一樣的④
只有第六個字段是隨便寫的,這個數(shù)字叫做No nce
6. No nce
網絡上任何一臺機器只要找到一個合適的數(shù)字填到自己的這個區(qū)塊的No nce位置,使得區(qū)塊頭這6個字段(80個字節(jié))的數(shù)據(jù)的哈希值的哈希值以18個以上的0開頭,誰就找到了那個金子⑦!既然我們無法事先寫好一個滿足18個0的數(shù)字然后反推Nounce,唯一的做法就是從0開始一個一個的嘗試,看結果是不是滿足要求,不滿足就再試下一個,直到找到。
這個過程被戲稱為挖礦。其實我覺得這個過程和淘金更像。淘金者做的事情很簡單,卻很重復,就是對于河里所有沙子,拿起來一個,判斷是不是金子。如果不是,扔掉再拿一個。如此重復幾百萬次,總有一個是金子。而在區(qū)塊鏈世界,那64個十六進制的字符串,第一個是0的概率是1/16,第二個也是0的概率再乘以1/16,第18個還是零的概率可想而知。所以大家為了找到這個金子一般的No nce一般要花費十幾億次嘗試,雖然每次算哈希的工作并不那么費時間,重復十幾億次還是要耗費巨大的計算機資源和電力資源。
比特幣體系的另外一個精妙設計就是它動態(tài)的調整難度,以無論有多少臺礦機在尋找那個珍貴的正確的No nce,都保證大約每10分鐘產生一個塊。這也是一個類似經濟學的算法。它每2016的塊(也就是2周)就計算一下前面2016個塊平均每個塊花了多少時間,如果低于10分鐘就按照低的比例調高難度,如果高于10分鐘調低難度。這樣礦機無論增減,比特幣都可以按照每10分鐘找到一個塊的金數(shù)字并且生成一個合法的塊。
找到了那個金子一樣的數(shù)字以后呢?
誰找到了那個數(shù)字,誰都可以向全網廣播這個新塊了。而真正的財富秘密在于在這個新塊的數(shù)據(jù)區(qū)的交易數(shù)據(jù)里面,第一條交易中,挖礦的人可以憑空的給一個地址(通常是自己的)發(fā)放12.5個比特幣。這是規(guī)則認可的,就好像賭場里荷官可以合法的從桌上拿一部分錢進自己的口袋一樣。這12.5個比特幣是比特幣網絡上唯一沒有發(fā)款人,只有收款人的交易,新的比特幣就這樣憑空誕生了。這個激勵每4年減半,再過兩年就只有6.25個了,這樣2140年左右兩千一百萬個比特幣就基本上全產生了并且不會增加了。
區(qū)塊鏈的網絡剛才描述的是在一臺電腦上的樣子。實際上,這一串數(shù)據(jù)是通過P2P網絡分布在無數(shù)的電腦(節(jié)點)上的。任何礦工找到了那個金子數(shù)字后就立刻全網絡剛播新找到的塊。如果所有節(jié)點在一個大的聊天室里面倒也簡單,但實際上這個廣播是跟烽火臺一樣接力的傳遞的。每個節(jié)點告訴周圍的,然后它再告訴周圍的。有意或無意的,就會有兩個或多個礦工近似同時對于網絡的一部分分別宣布發(fā)現(xiàn)了新塊。這個時候的規(guī)則就是,每個節(jié)點只會接受最長的鏈并且丟棄較短的鏈⑤。經過幾個節(jié)點后一定有一個勝出,另外一個被拋棄,而添加新塊是需要算力的,最終一定是擁有最大算力的一方獲勝。這也就是如果沒有人掌超過50%的算力就無法控制區(qū)塊鏈。
小結
以比特幣體系為例,最底層就是一串這樣以80個字節(jié)的區(qū)塊頭開始,約1M的數(shù)據(jù)跟著的數(shù)據(jù)。用哈希這樣的算法,一層一層的鎖定,形成了固若金湯的鏈條。再把它分布在成千上萬的節(jié)點上,再又成千上萬的礦機通過挖礦來保持算力高壓,讓篡改數(shù)據(jù)需要算力門檻。同時,任何人對于歷史數(shù)據(jù),哪怕就改了很小的一部分,數(shù)據(jù)的哈希就變了,區(qū)塊頭就變了,它的兩次哈希結果就變了,它后面的塊就連不上來了,就會被立刻發(fā)現(xiàn)。如此幾層嵌套,一個人類到現(xiàn)在為止最為安全和防篡改的公共信息系統(tǒng)誕生了。