刷新塵封九年記錄 阿里數(shù)據(jù)庫真的超過Oracle了么?
國慶期間,一則“阿里數(shù)據(jù)庫成績刷新Oracle塵封九年記錄”消息蔓延,讓不少行外人士為之一振。事情是這樣的:螞蟻金服自主研發(fā)的金融級分布式關(guān)系數(shù)據(jù)庫 OceanBase,不久前在被譽(yù)為“數(shù)據(jù)庫領(lǐng)域世界杯”的 TPC-C 基準(zhǔn)測試中打破了由美國公司 Oracle(甲骨文)保持了 9 年之久的世界記錄,成為首個登頂該榜單的中國數(shù)據(jù)庫產(chǎn)品。
但雷鋒網(wǎng)卻發(fā)現(xiàn)這件事在傳播過程存在信息缺失的問題,不可否認(rèn)阿里OceanBase的努力,但也應(yīng)該正確看待這項(xiàng)測試本身,綜合多方消息,雷鋒網(wǎng)希望呈現(xiàn)測試的原貌和代表的意義。
TPC-C 基準(zhǔn)測試是什么?
TPC(transaction processing performancecouncil)被稱為事務(wù)處理性能委員會,負(fù)責(zé)定義諸如 TPC-C、TPC-H&TPC-R 和 TPC-W 基準(zhǔn)測試之類的事務(wù)處理與數(shù)據(jù)庫性能基準(zhǔn)測試,并依據(jù)這些基準(zhǔn)測試項(xiàng)目發(fā)布客觀性能數(shù)據(jù),也正是因?yàn)槠錂?quán)威客觀,TPC-C是行業(yè)中公認(rèn)的權(quán)威和最為復(fù)雜的在線事務(wù)處理基準(zhǔn)測試,TPC-C基準(zhǔn)測試成為OLTP(在線事務(wù)處理系統(tǒng)) 基準(zhǔn)測試的工業(yè)標(biāo)準(zhǔn)。
TPC-C 于 1992 年 7 月 23 日認(rèn)可為新的基準(zhǔn)測試,通過模擬倉庫和訂單管理系統(tǒng),測試廣泛的數(shù)據(jù)庫功能,包括查詢、更新和 mini-batch事務(wù)(隊(duì)列式小批量事務(wù)),TPC-C基準(zhǔn)測試針對一種模擬訂單錄入與銷售環(huán)境測量,tpmC代表每分鐘能處理的事務(wù)數(shù)量。
記錄塵封九年,不是因?yàn)闊o法突破
非不能也,實(shí)不為也。
雷鋒網(wǎng)從數(shù)據(jù)庫行業(yè)人士獲悉,TPC-C 基準(zhǔn)測試的準(zhǔn)備至少要半年,阿里在后續(xù)公布的信息中也披露,OceanBase團(tuán)隊(duì)前后準(zhǔn)備時間超過一年,全世界僅有的三個官方審計(jì)員有兩個參與到本次測試審計(jì)工作中。
而且九年間不只是Oracle,其他數(shù)據(jù)庫廠商也沒有選擇去刷新榜單,僅僅是因?yàn)镺racle的成績已經(jīng)領(lǐng)先其他廠商九年么?性價比是一個不得不提的因素。
突破這個測試能帶來多少有形的或者無形的回報(bào),是廠商需要考慮的現(xiàn)實(shí)問題。自媒體特大號就指出,在TPC-C官方370多行的榜單中,只有螞蟻金福的測試結(jié)果是白背景,其他公司因?yàn)槎际腔疑尘?。榜單備注著:“所有灰色背景的測試結(jié)果,由于軟硬件升級的原因而過期”。
九年之后,螞蟻金服排名第一60,880,800 tpmC,排名第二的是九年之前的甲骨文,成績?yōu)?0,249,688 tpmC。
九年之后,螞蟻金服所用的測試系統(tǒng)總造價:380,452,842人民幣;服務(wù)器硬件為420顆英特爾至強(qiáng)白金8163,總核數(shù)6720,總線程13440;數(shù)據(jù)庫是OceanBase2.2。九年之前,Oracle所用的測試系統(tǒng)總造價:30,528,863美元≈213,702,041人民幣;服務(wù)器用了108顆 SUN Sparc T3,內(nèi)核總數(shù)1728,線程總數(shù)13824,數(shù)據(jù)庫為Oracle 11g R2。
硬件性能的提升雖然不能百分百反映在數(shù)據(jù)庫性能的提升上,不過實(shí)際轉(zhuǎn)換的性能也今非昔比,而且Oracle數(shù)據(jù)庫也已經(jīng)迭代到19c版本,2020年1月將會發(fā)布全新版本 Oracle Database 20c,兩家廠商所使用的軟硬件差距都比較大。
前述行業(yè)人士認(rèn)為,Oracle可能也覺得純刷榜單意義不大,本身準(zhǔn)備測試耗時耗力,九年時間測試結(jié)果也說明從硬指標(biāo)翻過Oracle也比較難,測試結(jié)果證明阿里數(shù)據(jù)庫性能能達(dá)到某個特定值,但是誤傳成比賽不太妥當(dāng)。
拋開榜單,OceanBase也是第一梯隊(duì)
那么,OceanBase有沒有必要去刷新這個榜單?雷鋒網(wǎng)認(rèn)為還是有必要的。以往行業(yè)都在討論國產(chǎn)數(shù)據(jù)庫何時能翻過Oracle這座大山,而現(xiàn)在我們至少看到了山路。業(yè)內(nèi)比較公認(rèn)的是,即使所有國產(chǎn)廠商都做TPC-C測試,OceanBase至少也是第一梯隊(duì)的水平。
雷鋒網(wǎng)(公眾號:雷鋒網(wǎng))獲悉,阿里目前自研數(shù)據(jù)庫分為兩個支線,OceanBase和POLARDB,OceanBase主要是螞蟻金服體系使用,作為阿里自研的國產(chǎn)分布式數(shù)據(jù)庫,支付寶使用的就是OceanBase;POLARDB也是阿里自研的,定位是下一代關(guān)系型分布式云原生數(shù)據(jù)庫,是阿里云主推的云原生數(shù)據(jù)庫,目前OceanBase也在阿里云上公測。
OceanBase產(chǎn)品架構(gòu)
支付寶在自研之前使用的也是Oracle數(shù)據(jù)庫,阿里去IOE大潮下,2016年,OceanBase替換了支付寶最核心的賬務(wù)系統(tǒng)中的Oracle數(shù)據(jù)庫,OceanBase實(shí)現(xiàn)了OLTP聯(lián)機(jī)交易處理過程下,前臺接收的用戶數(shù)據(jù),可以立即傳送到計(jì)算中心進(jìn)行處理并在很短的時間內(nèi)給出處理結(jié)果。
OceanBase和POLARDB在阿里內(nèi)部也存在部分競爭關(guān)系,但總體上都是為了下一代數(shù)據(jù)庫而努力。OceanBase在普通服務(wù)器上實(shí)現(xiàn)了金融級高可用,支持“三地五中心”城市級故障自動無損容災(zāi),同時具備在線水平擴(kuò)展能力。
而從實(shí)際使用角度,測試所用的服務(wù)器和存儲等都很可能不是用戶真實(shí)場景,比如全閃變混閃,服務(wù)器利舊直接使用老款產(chǎn)品,Oracle的測試結(jié)果也是經(jīng)過優(yōu)化的,阿里OceanBase的成績已經(jīng)足以滿足大部分場景的性能要求,而且重要的是價格低不少。比如在OceanBase的測試中,硬件成本只占整體成本的18%左右,只考慮硬件的性價比大幅優(yōu)于集中式數(shù)據(jù)庫。
對此,阿里可能也沒想到事態(tài)的發(fā)展,會向著“中國自研數(shù)據(jù)庫打破西方壟斷”的方向傳播,阿里內(nèi)部人士也對雷鋒網(wǎng)表示,內(nèi)部對此測試結(jié)果沒有太大反應(yīng)。
此前業(yè)內(nèi)專家向雷鋒網(wǎng)表示,云原生數(shù)據(jù)庫市場可能在未來的兩三年內(nèi)就會爆發(fā)。公有云市場增速減緩,云原生數(shù)據(jù)庫更迎合市場需求;當(dāng)前國外數(shù)據(jù)庫廠商的技術(shù)壟斷逐漸被打破,國產(chǎn)數(shù)據(jù)庫崛起勢頭強(qiáng)勁有望進(jìn)一步發(fā)展。
數(shù)據(jù)庫市場即將開始下半場角逐,云廠商是影響這場戰(zhàn)役新的變量,與Oracle對標(biāo)并做到Oracle這種程度是很長的過程,當(dāng)下并不現(xiàn)實(shí)。廠商如何用對數(shù)據(jù)庫市場的理解,或者在數(shù)據(jù)庫技術(shù)上的優(yōu)勢來去打動價值20-40億元的市場客戶,是擺在數(shù)據(jù)庫廠商面前的現(xiàn)實(shí)問題。
阿里和Oracle數(shù)據(jù)庫本身的定位就不同,OceanBase的優(yōu)勢在于采用分布式架構(gòu),硬件成本更低,可用性更好且能夠做到線性擴(kuò)展,但是,OceanBase單機(jī)的性能離Oracle、DB2還有不小的差距,后續(xù)需要重點(diǎn)優(yōu)化單機(jī)存儲性能。
此外,OceanBase的定位是在同一套引擎同時支持OLTP業(yè)務(wù)和OLAP業(yè)務(wù),而目前OceanBase的OLAP處理能力還不如Oracle,后續(xù)需要加強(qiáng)存儲模塊對大查詢的處理能力,支持將OLAP算子下壓到存儲層甚至在壓縮后的數(shù)據(jù)上直接做OLAP計(jì)算。
九年前,云計(jì)算在國內(nèi)剛剛興起,如同云計(jì)算對于專有IT基礎(chǔ)設(shè)施的沖擊,新的數(shù)據(jù)庫也在沖擊傳統(tǒng)數(shù)據(jù)庫,當(dāng)性價比達(dá)到一定程度,云計(jì)算的需求自然浮現(xiàn),而且隨著技術(shù)的演進(jìn),云計(jì)算能夠在某些場景體現(xiàn)出不弱于專有IT基礎(chǔ)設(shè)施的表現(xiàn),數(shù)據(jù)庫領(lǐng)域正在重演九年前一幕。