北電數(shù)智攜手北京大學(xué)、中日友好醫(yī)院發(fā)布可信數(shù)據(jù)空間實(shí)踐研究報(bào)告
隨著對 AI 應(yīng)用的探索日趨深入,當(dāng)前的公開數(shù)據(jù)在大模型訓(xùn)練進(jìn)程中漸趨枯竭,而 " 數(shù)據(jù)煙囪 " 又對高質(zhì)量數(shù)據(jù)流通使用形成了阻礙,數(shù)據(jù)要素的價(jià)值釋放成為 AI 產(chǎn)業(yè)向前發(fā)展過程中繞不開的話題。9 月起,國家數(shù)據(jù)局接連出臺(tái)政策,點(diǎn)明公共數(shù)據(jù)開發(fā)利用是產(chǎn)業(yè)大勢,并出臺(tái) " 可信數(shù)據(jù)空間 " 建設(shè)計(jì)劃,目標(biāo)于 2028 年前建成 100 個(gè)可信數(shù)據(jù)空間,培育五類空間、突破九項(xiàng)關(guān)鍵技術(shù)。
北京電子數(shù)智科技有限責(zé)任公司(以下簡稱 " 北電數(shù)智 ")精準(zhǔn)洞察數(shù)據(jù)要素價(jià)值,憑借全棧 AI 能力投身 " 可信數(shù)據(jù)空間 " 實(shí)踐,加速產(chǎn)品落地,助力人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展。
明確價(jià)值
可信數(shù)據(jù)空間是數(shù)據(jù)要素流通基建,也是全行業(yè)數(shù)據(jù)流通的關(guān)鍵保障,可借助隱私計(jì)算、虛擬沙箱等技術(shù)保障流通安全高效。具體展現(xiàn)為:以 " 數(shù)字合約 " 規(guī)范流通規(guī)則,提升效率;用可控、可追溯鏈路保護(hù)數(shù)據(jù)安全;靠分布式架構(gòu)讓數(shù)據(jù)由持有方保管,確保數(shù)據(jù)產(chǎn)權(quán)不轉(zhuǎn)移。
借鑒經(jīng)驗(yàn)
目前國內(nèi)外已有不少可信數(shù)據(jù)空間案例。歐盟構(gòu)建多層次可信數(shù)據(jù)空間體系,在科研、健康等領(lǐng)域成效斐然。例如:歐洲開放科學(xué)云(EOSC)匯聚豐富的科研數(shù)據(jù)資源,助力科研創(chuàng)新。同時(shí),放眼國內(nèi)的政務(wù)、跨境、工業(yè)等領(lǐng)域,也有諸多實(shí)踐。例如:政務(wù)數(shù)據(jù)空間領(lǐng)域的 " 區(qū)塊鏈 + 審判 " 應(yīng)用可提效司法、跨境數(shù)據(jù)空間可促進(jìn)科研數(shù)據(jù)與實(shí)驗(yàn)裝置共享、工業(yè)數(shù)據(jù)空間可助力制造升級。
精準(zhǔn)施策
我國可信數(shù)據(jù)空間起步不久," 大模型 + 數(shù)據(jù)空間 " 因技術(shù)難、成本高,導(dǎo)致應(yīng)用案例相對稀缺。要推動(dòng)發(fā)展,需統(tǒng)一技術(shù)路線與標(biāo)準(zhǔn),解決二者結(jié)合問題?!堆芯繄?bào)告》提議國資企業(yè)可帶頭打造安全高效公平的流通環(huán)境發(fā)揮領(lǐng)頭效應(yīng)和示范作用。
北電數(shù)智紅湖可信數(shù)據(jù)空間的設(shè)計(jì)嚴(yán)守算法安全,依托混元算力構(gòu)建,通過嵌入機(jī)密計(jì)算能力、隱私計(jì)算軟硬一體設(shè)計(jì)等技術(shù)建設(shè)可信數(shù)據(jù)空間。在算法開發(fā)時(shí),紅湖可信數(shù)據(jù)空間提供了大模型開發(fā)算法融入數(shù)據(jù)空間的標(biāo)準(zhǔn)化路徑,以此護(hù)航數(shù)據(jù)隱私。
在保障數(shù)據(jù)流通的安全性上,紅湖可信數(shù)據(jù)空間同樣極具針對性。面對不同應(yīng)用場景下的數(shù)據(jù)特性,它采取差異化安全技術(shù)策略。倘若遇到數(shù)據(jù)量大、關(guān)聯(lián)超大模型且敏感度低的數(shù)據(jù),就運(yùn)用策略控制與軟件隔離手段,讓大模型訓(xùn)練安全、高效地推進(jìn);要是碰到多方來源、數(shù)據(jù)量小卻敏感度高的數(shù)據(jù),便啟用基于密碼學(xué)密文計(jì)算的樣本對齊、模型推理等技術(shù),全方位確保數(shù)據(jù)流通與使用過程中的安全無虞。
目前,北電數(shù)智已面向多行業(yè)打造可信數(shù)據(jù)空間系列方案,如:醫(yī)療領(lǐng)域整合異構(gòu)數(shù)據(jù)、挖掘 AI 數(shù)據(jù),訓(xùn)練專病垂類大模型并打造面向診療等場景智能體;科研領(lǐng)域推出 "1+1+N" 科研數(shù)據(jù)服務(wù)解決方案,構(gòu)建科研與產(chǎn)品服務(wù)生態(tài)網(wǎng)絡(luò);公共數(shù)據(jù)運(yùn)營領(lǐng)域貫通數(shù)據(jù)全鏈條,釋放公共數(shù)據(jù)價(jià)值賦能區(qū)域和相關(guān)產(chǎn)業(yè)鏈。
展望未來,北電數(shù)智將繼續(xù)深耕可信數(shù)據(jù)空間領(lǐng)域,依托自身強(qiáng)大的技術(shù)研發(fā)實(shí)力與敏銳的行業(yè)洞察力,持續(xù)鍛造 " 紅湖 · 可信數(shù)據(jù)空間 " 產(chǎn)品服務(wù)能力,將更多創(chuàng)新方案推廣至更廣泛的領(lǐng)域,讓數(shù)據(jù)要素在安全有序的環(huán)境中充分流動(dòng),助力我國人工智能產(chǎn)業(yè)及數(shù)字經(jīng)濟(jì)邁向更高峰。