數(shù)據(jù)治理和高質(zhì)量的區(qū)塊鏈如何協(xié)同發(fā)展
掃描二維碼
隨時隨地手機(jī)看文章
怎么發(fā)展好區(qū)塊鏈?zhǔn)钱?dāng)前亟須回答的關(guān)鍵命題。本文認(rèn)為,先從數(shù)據(jù)存證、共享入手是務(wù)實(shí)策略,考慮到技術(shù)前沿在公有鏈,我們應(yīng)支持公有鏈的研究,為了防范風(fēng)險,須改造公有鏈。基于現(xiàn)實(shí)環(huán)境,聯(lián)盟鏈或許是應(yīng)用落地的較優(yōu)選擇。應(yīng)加強(qiáng)國產(chǎn)密碼算法應(yīng)用和創(chuàng)新發(fā)展,以保障我國區(qū)塊鏈安全可控。當(dāng)前最重要的是,我們應(yīng)提倡區(qū)塊鏈的高質(zhì)量發(fā)展,為此,需要加強(qiáng)鏈上和鏈下數(shù)據(jù)治理(Data Governance),建立有效的區(qū)塊鏈數(shù)字治理體系。
習(xí)近平總書記在中共中央政治局第十八次集體學(xué)習(xí)的講話內(nèi)涵豐富,思想深邃。他敏銳地抓住現(xiàn)代信息技術(shù)發(fā)展的前沿?zé)狳c(diǎn),強(qiáng)調(diào)要加快推動區(qū)塊鏈技術(shù)和產(chǎn)業(yè)創(chuàng)新發(fā)展,高屋建瓴地提出我國區(qū)塊鏈技術(shù)發(fā)展藍(lán)圖,為我們指引了方向。同時他又要求客觀辯證地看待創(chuàng)新技術(shù)的“雙刃劍”效應(yīng),強(qiáng)調(diào)要加強(qiáng)對區(qū)塊鏈技術(shù)的引導(dǎo)和規(guī)范,加強(qiáng)風(fēng)險研究和分析,加強(qiáng)行業(yè)自律,落實(shí)安全責(zé)任,依法治鏈,推動區(qū)塊鏈安全有序發(fā)展。
應(yīng)該說,要不要發(fā)展區(qū)塊鏈,已無爭議,怎么發(fā)展才是當(dāng)前亟須回答的關(guān)鍵命題。本文認(rèn)為,先從數(shù)據(jù)存證、共享入手是務(wù)實(shí)策略,考慮到技術(shù)前沿在公有鏈,我們應(yīng)支持公有鏈的研究,基于現(xiàn)實(shí)環(huán)境,聯(lián)盟鏈或許是應(yīng)用落地的較優(yōu)選擇。密碼學(xué)是區(qū)塊鏈技術(shù)的重要基石,應(yīng)加強(qiáng)國產(chǎn)密碼算法應(yīng)用和創(chuàng)新發(fā)展,以保障我國區(qū)塊鏈安全可控。當(dāng)前最重要的是,我們應(yīng)提倡區(qū)塊鏈的高質(zhì)量發(fā)展,為此,需要加強(qiáng)鏈上和鏈下數(shù)據(jù)治理(Data Governance),建立有效的區(qū)塊鏈數(shù)字治理體系。
先從數(shù)據(jù)存證、共享入手,逐步向價值網(wǎng)絡(luò)發(fā)展,是務(wù)實(shí)的落地策略
從現(xiàn)階段技術(shù)成熟度看,區(qū)塊鏈在價值轉(zhuǎn)移方面,還存在性能上的爭議,但其本身就是一個點(diǎn)對點(diǎn)的數(shù)據(jù)共享網(wǎng)絡(luò),因此其在數(shù)據(jù)存證、共享方面的適用性存在較少分歧。在總書記的重要講話中,促進(jìn)數(shù)據(jù)共享是他指出的五大區(qū)塊鏈作用之一,也是他強(qiáng)調(diào)的區(qū)塊鏈重點(diǎn)應(yīng)用方向。利用區(qū)塊鏈數(shù)據(jù)可信優(yōu)勢,建立數(shù)據(jù)存證、共享的創(chuàng)新模式,可實(shí)現(xiàn)政務(wù)數(shù)據(jù)跨部門、跨區(qū)域共同維護(hù)和利用,促進(jìn)城市地區(qū)在信息、資金、人才、誠信等方面更大規(guī)模的互聯(lián)互通,保障生產(chǎn)要素在區(qū)域內(nèi)有序高效流動,提升城市管理的智能化、精準(zhǔn)化水平。
但是區(qū)塊鏈技術(shù)本身對數(shù)據(jù)高度冗余的要求,客觀上增加了計(jì)算與存儲開銷;另外,區(qū)塊鏈技術(shù)在數(shù)據(jù)透明方面的特性,須結(jié)合安全多方計(jì)算、同態(tài)加密、零知識證明等隱私保護(hù)技術(shù),才能在各方自主可控前提下大范圍應(yīng)用,而隱私保護(hù)技術(shù)本身的效率還在提高過程中。
因此,當(dāng)前比較合理的實(shí)現(xiàn)方法是鏈上共享數(shù)據(jù)的Hash指紋存證與信息披露,真實(shí)數(shù)據(jù)按照“數(shù)據(jù)不出門、數(shù)據(jù)不落地、數(shù)據(jù)可用不可見”三原則,依托安全隱私保護(hù)技術(shù)在鏈下按照授權(quán)來共享使用。將來隨著基礎(chǔ)設(shè)施與安全技術(shù)的進(jìn)步,有計(jì)劃地將系統(tǒng)和受保護(hù)的真實(shí)數(shù)據(jù)遷移到區(qū)塊鏈上,進(jìn)而發(fā)展成為價值網(wǎng)絡(luò)。
技術(shù)研究在公有鏈,場景應(yīng)用在聯(lián)盟鏈
從私有鏈到聯(lián)盟鏈、公有鏈,社區(qū)信任程度逐步遞減,相應(yīng)帶來的技術(shù)難題(比如共識機(jī)制、性能問題、隱私保護(hù)等)逐步遞增。私有鏈類似于傳統(tǒng)信息系統(tǒng),聯(lián)盟鏈?zhǔn)窍嗷バ湃蔚臋C(jī)構(gòu)之間的互聯(lián)互通,介于去中心化和中心化之間,根據(jù)業(yè)務(wù)場景的要求,不一定只采用POS或POW,可采用PBFT等傳統(tǒng)共識機(jī)制,也可以采用多種共識協(xié)議相結(jié)合的混合共識機(jī)制,Libra即是聯(lián)盟鏈。而公有鏈的相互信任程度最低,高度開放和容錯下的安全和性能挑戰(zhàn)所要求的技術(shù)水平最高。公有鏈的前沿技術(shù)突破,將為聯(lián)盟鏈和私有鏈現(xiàn)有技術(shù)問題提供新的解決方案。因此,就學(xué)術(shù)而言,區(qū)塊鏈的技術(shù)創(chuàng)新關(guān)鍵點(diǎn)更多的是在公有鏈上。支持公有鏈的研究,推進(jìn)聯(lián)盟鏈的應(yīng)用,是我國區(qū)塊鏈發(fā)展戰(zhàn)略的應(yīng)有之義。
以監(jiān)管科技應(yīng)對金融科技,是區(qū)塊鏈治理的應(yīng)對之道
可以說,區(qū)塊鏈的去中心化對金融監(jiān)管提出了全新的命題和挑戰(zhàn),完全開放自由的公有鏈存在合規(guī)風(fēng)險,如承載金融科技應(yīng)用則必須予以改進(jìn)。應(yīng)對之道或許是以監(jiān)管科技應(yīng)對金融科技,聯(lián)盟鏈?zhǔn)窃S可鏈,既可以開展跨機(jī)構(gòu)應(yīng)用,也可為行業(yè)自律和監(jiān)管提供服務(wù)。有鑒于此,可考慮在不損害區(qū)塊鏈技術(shù)優(yōu)勢的前提下,在公有鏈上增加監(jiān)管節(jié)點(diǎn),保障公有鏈的合法合規(guī),或者采用多鏈策略,即采用聯(lián)盟鏈+公有鏈的“二元模式”,聯(lián)盟鏈向相關(guān)監(jiān)管部門注冊,開展鏈上監(jiān)管,去中心化應(yīng)用則使用公有鏈,開展去中心化商業(yè)活動。若有需要,監(jiān)管者亦可從聯(lián)盟鏈穿透到公有鏈,管控全局?;谝婪ê弦?guī)的現(xiàn)實(shí)要求,聯(lián)盟鏈或許是應(yīng)用落地的較優(yōu)選擇。
國產(chǎn)密碼算法的應(yīng)用和創(chuàng)新發(fā)展,是我國區(qū)塊鏈安全可控的基礎(chǔ)
本質(zhì)上,區(qū)塊鏈?zhǔn)且粋€基于密碼學(xué)原理的分布式共享存儲與計(jì)算系統(tǒng),其對中心化機(jī)構(gòu)的揚(yáng)棄和對密碼學(xué)技術(shù)的依賴,標(biāo)志著一種全新范式的控制權(quán)的轉(zhuǎn)移。就這一個角度而言,國產(chǎn)密碼算法的應(yīng)用和創(chuàng)新發(fā)展,意義重大。關(guān)鍵領(lǐng)域的區(qū)塊鏈應(yīng)用,密碼學(xué)技術(shù)必須符合國家密碼標(biāo)準(zhǔn)。
目前,國家密碼局公布的中國自主研發(fā)的國家商用密碼算法,包括SSF33、SM1(SCB2)、SM2、SM3、SM4、SM7、SM9、祖沖之密碼算法(ZUC)等。其中SSF33、SM1、SM4、SM7、ZUC是對稱算法;SM2、SM9是非對稱算法;SM3是哈希算法。國密算法有優(yōu)點(diǎn),但也有需要改進(jìn)的地方。以SM2為例,相比傳統(tǒng)的橢圓曲線簽名算法ECDSA,兩者的簽名和驗(yàn)簽的核心步驟相近,SM2簽名驗(yàn)證算法加入了較多的檢錯功能,提高了簽名驗(yàn)證系統(tǒng)的數(shù)據(jù)完整性、系統(tǒng)可靠性和安全性;與廣泛應(yīng)用的RSA數(shù)字簽名算法相比,SM2在同等安全強(qiáng)度下所需密鑰位數(shù)更少,且密鑰對生成速度,簽名速度均優(yōu)于RSA數(shù)字簽名算法。但SM2也有其劣勢,比如驗(yàn)簽速度相比RSA處于明顯的劣勢,尚需改進(jìn)。
目前國密算法還沒有覆蓋到同態(tài)加密、零知識證明、多方安全計(jì)算等,亟須拓展相應(yīng)國密算法庫,并實(shí)現(xiàn)標(biāo)準(zhǔn)化。而隨著我國區(qū)塊鏈應(yīng)用跨出國門,國密算法也應(yīng)一并走向世界,成為國際標(biāo)準(zhǔn)。這些都對我國國密算法提出了更高的要求。
雖然區(qū)塊鏈的應(yīng)用是去中心化的,但區(qū)塊鏈的密碼標(biāo)準(zhǔn)體系是由特定的機(jī)構(gòu)來制定的。某種意義上,誰掌握了密碼標(biāo)準(zhǔn)體系,誰就掌握了區(qū)塊鏈發(fā)展的話語權(quán)。
加強(qiáng)鏈上和鏈下數(shù)據(jù)治理,是現(xiàn)階段推動區(qū)塊鏈高質(zhì)量發(fā)展的關(guān)鍵
如前述所言,數(shù)據(jù)的互聯(lián)互通應(yīng)是現(xiàn)階段區(qū)塊鏈技術(shù)的重點(diǎn)應(yīng)用方向,聯(lián)盟鏈或?qū)⑹瞧渲饕问?。但我們?yīng)提倡區(qū)塊鏈的高質(zhì)量發(fā)展,警惕“大干特干,一擁而上”的無序低質(zhì)量發(fā)展。需要強(qiáng)調(diào)的是,區(qū)塊鏈上的數(shù)據(jù)應(yīng)該是具備較高價值的可公開的不宜修改的數(shù)據(jù)。這是它的特性,更是它的優(yōu)勢和品質(zhì)所在。若無謂地把無價值的且可隨意更改的數(shù)據(jù)上鏈,實(shí)際上是對區(qū)塊鏈技術(shù)的濫用,也無法構(gòu)建起符合實(shí)際業(yè)務(wù)需求的應(yīng)用。為此,我們需要建立有效的區(qū)塊鏈數(shù)據(jù)治理體系,以保障區(qū)塊鏈應(yīng)用的質(zhì)量和品質(zhì)。
通俗來說,數(shù)據(jù)治理是指所有為提高數(shù)據(jù)質(zhì)量而展開的業(yè)務(wù)、技術(shù)和管理活動,包括組織架構(gòu)、政策制度、技術(shù)工具、數(shù)據(jù)標(biāo)準(zhǔn)、流程規(guī)范、監(jiān)督考核等。國際數(shù)據(jù)管理協(xié)會(DAMA)的《數(shù)據(jù)管理知識體系指南(DMBOK)》則將數(shù)據(jù)治理框架定義為數(shù)據(jù)控制、數(shù)據(jù)架構(gòu)管理、數(shù)據(jù)開發(fā)、數(shù)據(jù)操作管理、數(shù)據(jù)安全管理、數(shù)據(jù)質(zhì)量管理、參考數(shù)據(jù)和主數(shù)據(jù)管理、數(shù)據(jù)倉庫和商務(wù)智能管理、文件和內(nèi)容管理、元數(shù)據(jù)管理等10個方面。針對區(qū)塊鏈技術(shù)的特性,或許可從以下幾個方面入手,構(gòu)建區(qū)塊鏈數(shù)據(jù)治理體系:
第一,加強(qiáng)鏈下數(shù)據(jù)治理的評估與監(jiān)督,防止短板效應(yīng)
區(qū)塊鏈技術(shù)可以解決鏈上的信任問題,保障鏈上數(shù)據(jù)的真實(shí)性、準(zhǔn)確性與一致性,但對于鏈下數(shù)據(jù),區(qū)塊鏈則“鞭長莫及”,無法保證其質(zhì)量。倘若鏈下源頭數(shù)據(jù)被“污染”了,區(qū)塊鏈上流轉(zhuǎn)的數(shù)據(jù)就成了“垃圾”,也就是所謂的“垃圾進(jìn)垃圾出”(“Garbage in, Garbage out”)。因此,高質(zhì)量鏈下數(shù)據(jù)是高質(zhì)量區(qū)塊鏈的前提。而要實(shí)現(xiàn)這個前提,則需要依靠各節(jié)點(diǎn)的鏈下數(shù)據(jù)治理。雖然說各節(jié)點(diǎn)的鏈下數(shù)據(jù)治理似乎是各家自己的事情,但某一節(jié)點(diǎn)的數(shù)據(jù)治理缺失往往會限制區(qū)塊鏈的整體質(zhì)量和價值,形成短板效應(yīng)。因此,各節(jié)點(diǎn)應(yīng)采取有效的技術(shù)工具、管理手段和組織體系,對數(shù)據(jù)在計(jì)劃、獲取、存儲、共享、維護(hù)、應(yīng)用、消亡全生命周期可能存在的質(zhì)量問題,進(jìn)行識別、度量、監(jiān)控、預(yù)警和改進(jìn)。
為了避免短板效應(yīng),可考慮成立聯(lián)盟鏈聯(lián)合工作組,評測各節(jié)點(diǎn)鏈下數(shù)據(jù)治理的成熟度,督促各方提高上鏈的數(shù)據(jù)質(zhì)量,必要時可設(shè)置數(shù)據(jù)治理成熟度的準(zhǔn)入門檻。目前已經(jīng)有了比較成熟的數(shù)據(jù)治理評價模型可供采用,比如IBM的數(shù)據(jù)治理成熟度評估模型、CMMI的數(shù)據(jù)能力成熟度模型(DMM)、EDM的數(shù)據(jù)能力成熟度模型(DCAM)、DataFlux的數(shù)據(jù)治理成熟度模型、Oracle MDM主數(shù)據(jù)管理成熟度模型、MD3M主數(shù)據(jù)管理能力成熟度模型,以及我國信息技術(shù)標(biāo)準(zhǔn)化技術(shù)委員在2014年啟動并于2018年發(fā)布的《數(shù)據(jù)管理能力成熟度評估模型》(Data Capability Maturity Model,簡稱DCMM)國家標(biāo)準(zhǔn)。
第二,參照主數(shù)據(jù)管理理論,開展鏈上數(shù)據(jù)治理
在數(shù)據(jù)治理框架中,主數(shù)據(jù)管理是核心。所謂的主數(shù)據(jù)是指描述機(jī)構(gòu)核心業(yè)務(wù)實(shí)體的、在機(jī)構(gòu)內(nèi)外被廣泛應(yīng)用和共享的數(shù)據(jù),是機(jī)構(gòu)的核心資產(chǎn),具有高價值和高敏感性。構(gòu)建統(tǒng)一的主數(shù)據(jù)標(biāo)準(zhǔn),可將原先各個處于豎井之中的業(yè)務(wù)系統(tǒng)在主數(shù)據(jù)層面實(shí)現(xiàn)互通和共享,保障主數(shù)據(jù)的全局一致性和準(zhǔn)確性。事實(shí)上,區(qū)塊鏈技術(shù)也可看作跨節(jié)點(diǎn)主數(shù)據(jù)的集成技術(shù)或架構(gòu)。因此,我們可參照主數(shù)據(jù)管理理論,開展鏈上數(shù)據(jù)治理。
一是清晰的業(yè)務(wù)需求。不是所有的數(shù)據(jù)都要上鏈。只有需要多方共享的高價值數(shù)據(jù),或者說只有主數(shù)據(jù),才需要上鏈,早期甚至只有主數(shù)據(jù)的Hash指紋存證在鏈上。
二是明確的主數(shù)據(jù)規(guī)則和標(biāo)準(zhǔn)。聯(lián)盟鏈的各方應(yīng)預(yù)先在標(biāo)準(zhǔn)和規(guī)則層面達(dá)成一致:是各節(jié)點(diǎn)的上鏈數(shù)據(jù)在鏈下統(tǒng)一標(biāo)準(zhǔn),還是各自規(guī)范,僅在上鏈時通過數(shù)據(jù)抽取引擎(比如ETL、ESB),將異構(gòu)數(shù)據(jù)轉(zhuǎn)為鏈上統(tǒng)一格式的標(biāo)準(zhǔn)數(shù)據(jù)集。如果是前者,那么各方應(yīng)共同制定鏈下數(shù)據(jù)標(biāo)準(zhǔn),即統(tǒng)一的數(shù)據(jù)定義、分類、記錄格式和編碼,以及分類規(guī)范、編碼結(jié)構(gòu)、數(shù)據(jù)模型、屬性描述。如果是后者,各節(jié)點(diǎn)在數(shù)據(jù)上鏈之前通過數(shù)據(jù)抽取引擎,對欲上鏈的數(shù)據(jù)進(jìn)行一系列的加工處理,以形成標(biāo)準(zhǔn)統(tǒng)一的主數(shù)據(jù),然后再根據(jù)鏈上數(shù)據(jù)操作規(guī)范要求進(jìn)行數(shù)據(jù)存證與信息披露。
三是統(tǒng)一的鏈上元數(shù)據(jù)標(biāo)準(zhǔn)。為了使多源的鏈上數(shù)據(jù)能被區(qū)塊鏈各參與節(jié)點(diǎn)方準(zhǔn)確理解和使用,需要事先對每個數(shù)據(jù)元素進(jìn)行元數(shù)據(jù)定義,消除數(shù)據(jù)的二義性,降低數(shù)據(jù)集成的成本,讓各方能夠在統(tǒng)一的邏輯框架上解讀和驗(yàn)證鏈上與鏈下數(shù)據(jù)。
四是適當(dāng)?shù)母深A(yù)機(jī)制。歐盟《通用數(shù)據(jù)保護(hù)條例》(General Data Protection RegulaTIon,簡稱GDPR)規(guī)定數(shù)據(jù)主體享有知情同意權(quán)、訪問權(quán)、拒絕權(quán)、可攜權(quán)、刪除權(quán)(被遺忘權(quán))、更正權(quán)、持續(xù)控制權(quán)等多項(xiàng)權(quán)利。其中,刪除權(quán)(被遺忘權(quán))是數(shù)據(jù)主體有權(quán)要求數(shù)據(jù)控制者立刻刪除與其有關(guān)的個人數(shù)據(jù)及其副本、備份和任何鏈接。更正權(quán)是指數(shù)據(jù)主體有權(quán)要求數(shù)據(jù)控制者更正并且完善與其有關(guān)的個人數(shù)據(jù)的權(quán)利。從這一角度看,區(qū)塊鏈的難以篡改與上述兩個數(shù)據(jù)主體權(quán)利存在一定的沖突。因此,需要在聯(lián)盟鏈上建立適當(dāng)?shù)母深A(yù)機(jī)制,以滿足法律上的數(shù)據(jù)主體權(quán)利保護(hù)要求和其他合規(guī)要求,而且這也是保障良好網(wǎng)絡(luò)生態(tài)的應(yīng)有之義。
五是科學(xué)的管理體系。數(shù)字治理本質(zhì)上是一種管理活動,需要有相應(yīng)的運(yùn)維組織、管理流程和考核機(jī)制,推動數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范的落地實(shí)施和有效執(zhí)行。比如可考慮成立聯(lián)盟鏈聯(lián)合工作組,負(fù)責(zé)開展明確數(shù)據(jù)需求、制定標(biāo)準(zhǔn)、統(tǒng)一規(guī)則、監(jiān)督評估等治理工作,并負(fù)責(zé)評測各節(jié)點(diǎn)的鏈下數(shù)據(jù)治理成熟度,行使節(jié)點(diǎn)的許可準(zhǔn)入權(quán)力。
第三,加強(qiáng)數(shù)據(jù)安全管理與隱私保護(hù),保障數(shù)據(jù)資產(chǎn)價值
隨著數(shù)字經(jīng)濟(jì)時代的到來,數(shù)據(jù)已成為關(guān)鍵的生產(chǎn)要素。數(shù)據(jù)具有經(jīng)濟(jì)價值,是重要資產(chǎn)。如何在數(shù)據(jù)共享的同時避免數(shù)據(jù)泄露,自然是數(shù)據(jù)治理的重中之重。在需求規(guī)劃時,各節(jié)點(diǎn)應(yīng)預(yù)先梳理各自的數(shù)據(jù),識別哪些是非密數(shù)據(jù),哪些是保密數(shù)據(jù),哪些是敏感數(shù)據(jù),哪些是邊緣數(shù)據(jù),哪些可公開,對誰可見,和誰共享,在此基礎(chǔ)上,根據(jù)數(shù)據(jù)的價值、敏感性和隱私性進(jìn)行分級,制定訪問控制矩陣和差異化隱私策略。在數(shù)據(jù)上鏈時,應(yīng)保證接口安全。無論鏈上數(shù)據(jù)訪問,還是鏈下數(shù)據(jù)訪問,應(yīng)有身份認(rèn)證、分級授權(quán)等訪問控制,防止攻擊者假冒合法用戶獲得訪問權(quán)限,保證系統(tǒng)和數(shù)據(jù)的安全。在數(shù)據(jù)的傳輸和共享過程中,可根據(jù)數(shù)據(jù)的共享和安全需要,對不同的數(shù)據(jù)進(jìn)行脫敏,或者采用數(shù)據(jù)加密技術(shù),比如零知識證明(ZKP)算法對數(shù)據(jù)加密,亦可采用一些通道技術(shù)來限制數(shù)據(jù)共享范圍,控制數(shù)據(jù)泄露風(fēng)險。
結(jié)語
當(dāng)前,區(qū)塊鏈技術(shù)已儼然成為一種不可阻擋的技術(shù)趨勢,是全球產(chǎn)業(yè)變革的全新賽道,各國均在發(fā)力,加速布局。在這樣一個全球矚目的陣地,我們應(yīng)扎實(shí)備戰(zhàn),搶占技術(shù)制高點(diǎn)。習(xí)總書記的講話是我國區(qū)塊鏈技術(shù)創(chuàng)新和產(chǎn)業(yè)發(fā)展的指導(dǎo)思想和根本遵循,我們應(yīng)積極貫徹落實(shí)總書記重要講話精神,珍惜戰(zhàn)略機(jī)遇,求真務(wù)實(shí),勇于探索,使區(qū)塊鏈技術(shù)在建設(shè)網(wǎng)絡(luò)強(qiáng)國、發(fā)展數(shù)字經(jīng)濟(jì)、助力經(jīng)濟(jì)社會發(fā)展等方面真正發(fā)揮作用。