創(chuàng)新是國產(chǎn)數(shù)據(jù)庫的唯一出路 | DTCC2022
2022年12月14日~16日,由IT168聯(lián)合旗下ITPUB、ChinaUnix兩大技術社區(qū)主辦的第13屆中國數(shù)據(jù)庫技術大會(DTCC2022)在線上隆重召開。大會以“數(shù)據(jù)智能 價值創(chuàng)新”為主題,設置2大主會場,20+技術專場,超百位行業(yè)專家,為廣大數(shù)據(jù)領域從業(yè)人士提供了一場年度的饕餮盛宴。
正如ITPUB總經(jīng)理、中國數(shù)據(jù)庫技術大會創(chuàng)辦人唐川所說,從2010年開始到目前為止,DTCC中國數(shù)據(jù)庫技術大會可謂是見證了數(shù)據(jù)庫技術的發(fā)展與變革。ITPUB社區(qū)也走過了二十二個年頭,伴隨著多少技術人一起走過青春年華。近12年來,國內數(shù)據(jù)庫市場不斷有新的廠商涌現(xiàn),而本次數(shù)據(jù)庫技術大會更是匯集了華為、騰訊、阿里、達夢、亞馬遜等國內外主流的數(shù)據(jù)庫廠商,可謂是百花齊放。
如今的DTCC已然成為國內數(shù)據(jù)庫領域的技術風向標,今年云原生數(shù)據(jù)庫、分布式數(shù)據(jù)庫是行業(yè)重點發(fā)展趨勢,金融業(yè)的數(shù)據(jù)庫探索實踐更是引發(fā)廣泛討論和關注。本次大會設置了金融行業(yè)數(shù)據(jù)庫技術實踐、云原生數(shù)據(jù)庫開發(fā)與實踐、分布式數(shù)據(jù)庫應用最佳實踐、圖數(shù)據(jù)庫技術與應用創(chuàng)新等專場,分享數(shù)據(jù)庫最前沿的技術動態(tài)和探索實踐。
金融業(yè)數(shù)據(jù)庫升級提速
在主會場,渤海銀行生產(chǎn)運行中心副主任、首席數(shù)據(jù)庫專家王飛鵬帶來“商業(yè)銀行核心數(shù)據(jù)庫從集中式到分布式架構轉型最佳實踐”的主題演講,介紹了商業(yè)銀行數(shù)據(jù)庫架構演進趨勢,王飛鵬指出,金融科技的本質是利用信息科技為金融發(fā)展全面賦能。在金融科技潮流之下,數(shù)據(jù)庫做為商業(yè)銀行承載業(yè)務數(shù)據(jù)的核心,其在選型規(guī)劃中務必堅持戰(zhàn)略思維,要從根本性、全局性、長遠性的問題進行科學謀劃,具體來說,穩(wěn)定優(yōu)先,數(shù)據(jù)庫架構要首先滿足銀行對系統(tǒng)可用性、數(shù)據(jù)一致性、系統(tǒng)安全性等核心要求;隨著銀行對業(yè)務快速創(chuàng)新的要求日益迫切,數(shù)據(jù)庫系統(tǒng)應支撐業(yè)務快速上線投產(chǎn);還要滿足自主可控要求,數(shù)據(jù)庫架構要從傳統(tǒng)商業(yè)封閉式向開源、開放、自主可控的架構轉型;隨著銀行交易量和數(shù)據(jù)量的爆發(fā)式增長,數(shù)據(jù)庫架構從集中式向分布式轉型已成為必然趨勢;還有降本增效,銀行經(jīng)營環(huán)境的變化,要求運行數(shù)據(jù)庫的基礎設施從昂貴的IBM小型機向PC服務器、從EMC集中式存儲向本地盤等低成本設施轉型。
王飛鵬介紹,銀行引入分布式數(shù)據(jù)庫面臨著選型、開發(fā)、遷移、運維四個方面的挑戰(zhàn)。選型方面,目前分布式數(shù)據(jù)庫在國內取得快速發(fā)展,初步具備對國外數(shù)據(jù)庫的替換能力,但也面臨各廠商能力參差不齊的問題,需要對分布式數(shù)據(jù)庫進行選型,選擇最合適的產(chǎn)品;開發(fā)方面,對行內的應用開發(fā)人員而言,大家習慣使用Oracle等數(shù)據(jù)庫,應用都是基于Oracle進行開發(fā),遷移到分布式數(shù)據(jù)庫面臨代碼的應用和遷移問題;遷移方面,把一些系統(tǒng)從集中式遷移到分布式技術棧,存在比較多的工作和風險;運維方面,不同信創(chuàng)數(shù)據(jù)庫的實際功能、高可用能力、可擴展能力和災備能力存在差異,為在生產(chǎn)運維環(huán)境做好數(shù)據(jù)庫運維提出了挑戰(zhàn)。分布式數(shù)據(jù)庫產(chǎn)品的成熟度、穩(wěn)定性還需要經(jīng)過真實生產(chǎn)環(huán)境的打磨,才能真正穩(wěn)定。
武漢達夢數(shù)據(jù)庫股份有限公司技術總監(jiān)黃海明指出,當前外部形勢非常動蕩,金融數(shù)據(jù)庫的安全風險和供應鏈風險值得關注。當前時間緊、任務重,金融數(shù)據(jù)庫國產(chǎn)化轉型的關鍵因素在于解決工程化難題,要以工程化方式快速、大批量替代海外數(shù)據(jù)庫,需要考慮風險、效率和成本等多方面因素。達夢的解決方案可以在架構層面實現(xiàn)同等替代,可以最大程度上降低替代的風險,保護用戶既有投資。
創(chuàng)新是國產(chǎn)數(shù)據(jù)庫發(fā)展的唯一出路
達夢數(shù)據(jù)技術(江蘇)有限公司總經(jīng)理付新指出,當下,數(shù)據(jù)庫甚至整個軟件領域最流行的兩個技術架構相關的關鍵詞是分布式和云原生。此外,可以看到數(shù)據(jù)庫技術發(fā)展的重要趨勢是融合,從不同的角度都可以看到融合趨勢。在軟件和硬件一體化方面,當下國內數(shù)據(jù)庫一體機的熱度開始增加,特別是基于國產(chǎn)軟硬件平臺的數(shù)據(jù)庫一體機非常契合當下黨政、央企等用戶的需要。此外還有多模數(shù)據(jù)庫、HTAP、湖倉一體、流批一體等數(shù)據(jù)技術融合發(fā)展。在融合之外,數(shù)據(jù)庫技術還向著專精特新的細分方向發(fā)展。
付新強調,數(shù)據(jù)庫技術發(fā)展的最終目標是持續(xù)不斷降低運維成本、降低運行成本,最終降低用戶的數(shù)據(jù)庫總體擁有成本。對于未來國產(chǎn)數(shù)據(jù)庫的發(fā)展,達夢認為創(chuàng)新才是國產(chǎn)數(shù)據(jù)庫發(fā)展的唯一出路,自主創(chuàng)新是達夢公司堅定不移的技術發(fā)展路線。創(chuàng)新離不開人才、技術、資本和需求四大要素,而中國已經(jīng)具備了所有的基礎條件。
云數(shù)據(jù)庫加速融合發(fā)展
騰訊云數(shù)據(jù)庫總經(jīng)理王義成帶來了題為“騰訊云數(shù)據(jù)庫賦能企業(yè)釋放數(shù)據(jù)生產(chǎn)力”的主題演講,王義成指出,云數(shù)據(jù)庫的發(fā)展經(jīng)歷了三個發(fā)展階段,云數(shù)據(jù)庫1.0,是云數(shù)據(jù)庫發(fā)展初期,特征是原生數(shù)據(jù)庫的平臺化和自動化。云數(shù)據(jù)庫2.0,是云原生數(shù)據(jù)庫+國產(chǎn)化數(shù)據(jù)庫多樣化發(fā)展。云數(shù)據(jù)庫3.0,即下一代數(shù)據(jù)庫的核心趨勢是自研+融合一體化輸出。騰訊云數(shù)據(jù)庫堅持自研和融合兩個戰(zhàn)略。其中,融合分為產(chǎn)品能力融合和生態(tài)融合,產(chǎn)品能力融合包括HTAP、軟件硬件等融合,產(chǎn)業(yè)融合則要做到產(chǎn)業(yè)上下游體系真正地融合。
華為云計算技術有限公司華為云數(shù)據(jù)庫服務產(chǎn)品部總經(jīng)理蘇光牛指出,數(shù)據(jù)庫的發(fā)展需要自主創(chuàng)新,就像攀登珠穆朗瑪峰時,一種是從北坡攀登,一種是從南坡攀登,數(shù)據(jù)庫技術需要迎難而上,克服最核心的技術來攀上珠峰。蘇光牛指出,從數(shù)據(jù)庫角度來說,分布式和云基礎能力的結合將是數(shù)據(jù)庫市場的未來。他表示,在技術實踐上,在面向金融政企的國產(chǎn)分布式數(shù)據(jù)領域,GaussDB在高可靠、安全、性能方面進行多項新特性發(fā)布,全面超越國外主流數(shù)據(jù)庫產(chǎn)品;在面向互聯(lián)網(wǎng)的云原生領域,云原生數(shù)據(jù)庫完成三大轉變,實現(xiàn)Serverless、Regionless、Modeless的全新架構演進。
阿里巴巴集團副總裁、阿里云數(shù)據(jù)庫產(chǎn)品事業(yè)部負責人李飛飛在“PolarDB向云原生一體化的演進和發(fā)展”的主題演講中表示,PolarDB向云原生一體化方向快速演進,提供企業(yè)級云原生數(shù)據(jù)處理能力,例如serverless、共享內存、多租戶多寫、分布式等,針對海量數(shù)據(jù)提供實時融合分析與計算的云原生HTAP能力以及結合ADB提供一體化HTAP能力。
阿里云認為數(shù)據(jù)庫將向云原生一站式數(shù)據(jù)管理與服務縱深發(fā)展,并提出云原生化、平臺化、一體化、智能化“四化”趨勢,其中云原生化中最關鍵的能力是serverless。未來,云原生要持續(xù)做強,基于資源池化、資源解耦、微服務化、容器化等構建下一代原生數(shù)據(jù)庫。隨著物理世界數(shù)字化、生物世界數(shù)字化,如何更好支持多模態(tài)數(shù)據(jù)也將面臨挑戰(zhàn)。接下來三到五年,數(shù)據(jù)庫市場需要關注云原生、多模、智能化、集中分布式一體化,以及軟硬結合創(chuàng)新,未來有競爭力的數(shù)據(jù)庫系統(tǒng)一定是和云基礎設施、云平臺深度融合,做軟硬協(xié)同平臺化創(chuàng)新。未來數(shù)據(jù)庫需要提升數(shù)據(jù)的可信與安全,最終實現(xiàn)搭積木式的高性能、低成本、多場景一站式能力。
分布式數(shù)據(jù)庫大有可為
OceanBase首席架構師楊志豐在“OceanBase 4.0:單機分布式一體化的技術演進”的主題演講中表示,從2014年OceanBase 0.5版本開始,經(jīng)過多年多版本的更新,OceanBase逐漸演進的越來越成熟,并在TPC-C國際權威的OLTP評測中表現(xiàn)突出,具有很好的擴展性。OceanBase 4.0作為單機分布式一體化數(shù)據(jù)庫,實現(xiàn)了單機部署并兼顧分布式架構的擴展性與集中式架構的性能優(yōu)勢,不僅突破了分布式數(shù)據(jù)庫單機性能的瓶頸,還實現(xiàn)了單機性能趕超集中式數(shù)據(jù)庫的跨越,可以更好支持不同規(guī)模的企業(yè)應用。
金篆信科副總經(jīng)理秦延濤介紹了中興通訊專為拓展分布式數(shù)據(jù)庫產(chǎn)業(yè)而成立的控股子公司——金篆信科,分享了GoldenDB的發(fā)展歷程、v7.0技術優(yōu)勢等。GoldenDB在金融、運營商等行業(yè)積累了大量的數(shù)據(jù)庫遷移實踐經(jīng)驗,秦延濤介紹,在系統(tǒng)遷移過程中,除了需要做數(shù)據(jù)全量遷移、增量遷移比對以外,一般推薦客戶做回流方案,即設計逃生通道,當老系統(tǒng)遷移到新系統(tǒng)以后,GoldenDB支持數(shù)據(jù)回流到老系統(tǒng)數(shù)據(jù)庫,如果新系統(tǒng)里出現(xiàn)異常,可以返回到原來的老系統(tǒng)里,確保業(yè)務不受影響,為客戶增強遷移的信心,此外,從集中式系統(tǒng)遷移到分布式架構,需要一個好的運維管控平臺,需要一套完善的運維體系來做支撐,確保運維團隊快速了解系統(tǒng)運行狀態(tài)。
圖數(shù)據(jù)庫的未來在于生態(tài)發(fā)展
在圖數(shù)據(jù)技術與應用創(chuàng)新專場,來自字節(jié)跳動、螞蟻集團、等方面的專家重點介紹了圖數(shù)據(jù)庫技術的前沿發(fā)展與創(chuàng)新應用。去年的圖數(shù)據(jù)庫專場,大家談論比較多的技術細節(jié),比如萬億大圖的點切以及邊切等,今年談論更多的是圖數(shù)據(jù)庫的應用以及生態(tài)建設等。
字節(jié)跳動研發(fā)工程師陳超帶來了“字節(jié)跳動圖數(shù)據(jù)架構演進——索引和執(zhí)行優(yōu)化”的主題演講,聚焦于圖數(shù)據(jù)庫中的索引加速和執(zhí)行優(yōu)化,分享 ByteGraph 在性能優(yōu)化方面的一些進展。ByteGraph是字節(jié)跳動自研的分布式圖數(shù)據(jù)庫存儲系統(tǒng),采用計算存儲分離架構,支持有效圖模型,支持Gremlin圖查詢語言,讀寫吞吐可以擴展到千萬QPS,目前ByteGraph已經(jīng)部署了1000多個集群,遍布全球多個機房,支持頭條、抖音、西瓜視頻、電商風控圖譜等多個業(yè)務。在社交網(wǎng)絡中,圖計算系統(tǒng)會存在超級節(jié)點問題,例如抖音中網(wǎng)紅大V會有千萬或者上億粉絲,超級節(jié)點會影響單機的可用性,針對超級節(jié)點,ByteGraph會對每條查詢分為輕查詢和重查詢兩類,同時會把單機資源劃分到新查詢池和重查詢池,查詢時將對應類別查詢,通過這種方式,限制重查詢使用的資源量,避免少量重查詢打滿單機CPU,后續(xù)ByteGraph也會持續(xù)優(yōu)化自適應限流機制。針對超級節(jié)點,除了限流,還會做一些自適應局部索引,在系統(tǒng)內部會衡量識別查詢代價和構建索引后的執(zhí)行代價。
螞蟻集團圖數(shù)據(jù)庫負責人洪春濤帶來了“螞蟻高性能圖數(shù)據(jù)庫TuGraph-DB技術思考及實踐”的主題演講,關聯(lián)數(shù)據(jù)爆炸性增長對圖計算高效處理提出迫切需求,圖計算利用圖形結構描述事物聯(lián)系,成為分析復雜關系數(shù)據(jù)的重要使能技術。螞蟻集團聯(lián)合清華大學研發(fā)了大規(guī)模圖計算系統(tǒng)TuGraph。TuGraph圖計算系統(tǒng)由圖數(shù)據(jù)庫TuGraph-DB,流式圖計算系統(tǒng)TuGraph-DataFlow,離線圖計算系統(tǒng)TuGraph-Compute等多個子系統(tǒng)構成。其中TuGraph-DB是一個高性能分布式圖數(shù)據(jù)庫,它歷經(jīng)螞蟻萬億級業(yè)務的實際場景錘煉,已經(jīng)成熟應用于金融風控、搜索推薦、設備管理等內外部場景。
洪春濤指出,圖計算是一種很通用的、更高層次的抽象計算方法,上個世紀70年代末80年代初其實就已經(jīng)有圖數(shù)據(jù)庫概念,后來關系型數(shù)據(jù)庫得以快速發(fā)展,而圖數(shù)據(jù)庫沒有那么快發(fā)展起來,主要原因在于彼時計算機還沒有那么強大,關系數(shù)據(jù)庫這種二維表的表達對計算機會更友好,而現(xiàn)在多跳查詢等復雜關系的查詢,SQL會有挑戰(zhàn),圖計算在多跳查詢等方面會有很大的優(yōu)勢。洪春濤認為目前圖計算系統(tǒng)的發(fā)展還處于一個比較早期的階段,未來走向普及還有很多工作要做,包括易用性、性能和成本以及標準化等問題。圖計算系統(tǒng)的發(fā)展最重要的是生態(tài),需要有更多的用戶、更多的場景來應用,才能不斷推動圖計算系統(tǒng)的發(fā)展。
第十三屆中國數(shù)據(jù)庫技術大會(DTCC2022)獲得了圓滿成功,有太多的不易,有太多需要感謝,有太多值得被記錄。一點一滴,創(chuàng)新永無止境,眾志成城,未來必將行遠。中國數(shù)據(jù)庫技術發(fā)展的新歷史正在被書寫,創(chuàng)新是國產(chǎn)數(shù)據(jù)庫的唯一出路,未來的輝煌需要每一個數(shù)據(jù)庫從業(yè)者共同去創(chuàng)造。我們有幸是時代的見證者,我們有幸是時代的參與者,在這個數(shù)據(jù)庫的好時代,我們滿懷熱情,腳踏實地。我們期待下一次相遇,因為每一次相遇都會有前進的歡喜。DTCC2023,第十四屆中國數(shù)據(jù)庫技術大會,不見不散!