張平平 李晨曦
“中國的移動互聯(lián)網(wǎng)用戶超過12億,人均上網(wǎng)時長6.9小時,每天提供在線總時長80億小時?!?/p>
近日,中國工業(yè)經(jīng)濟學會會長、中國社科院大學教授江小涓談論數(shù)字經(jīng)濟時表示,相信中國個人數(shù)據(jù)的流量產(chǎn)生是全球第一。
《數(shù)字中國發(fā)展報告(2022年)》顯示,截至2022年底,中國數(shù)據(jù)存儲量已達724.5EB(艾字節(jié)),同比增長21.1%,全球占比14.4%。
近年來,中國移動互聯(lián)網(wǎng)的發(fā)展帶來了數(shù)據(jù)量的爆發(fā)式增長,以及高度不確定的交易量變化,也催生了企業(yè)數(shù)字化轉型的強烈需求,而承載海量數(shù)據(jù)的存儲、處理等需求的主流數(shù)據(jù)庫產(chǎn)品仍沿用著數(shù)十年前誕生的傳統(tǒng)集中式架構。
在主流數(shù)據(jù)庫架構與中國移動互聯(lián)網(wǎng)業(yè)務場景需求的錯位中,國產(chǎn)分布式數(shù)據(jù)庫OceanBase應運而生。
在OceanBase CEO楊冰看來,主流數(shù)據(jù)庫設計者在40年前所作的假設正在經(jīng)受現(xiàn)實的挑戰(zhàn),過去說的“大數(shù)據(jù)”與當下的大數(shù)據(jù)已經(jīng)無法相提并論。“這就意味著,需要新的假設、新的架構來解決新階段的問題?!睏畋硎?,隨著數(shù)字經(jīng)濟的發(fā)展,分布式架構將是支撐現(xiàn)代化數(shù)據(jù)庫的新架構。
近日,OceanBase2023年度發(fā)布會上,該公司披露已服務超過1000家客戶,去年一年客戶數(shù)增長150%。在1000家客戶中,30%將OceanBase應用于核心系統(tǒng),為核心系統(tǒng)升級首選。在金融領域,OceanBase已成為市場占有率名列前茅的分布式數(shù)據(jù)庫。
數(shù)據(jù)庫,是和芯片、操作系統(tǒng)并列的現(xiàn)代信息技術領域的三大核心基礎之一,是基礎軟件“皇冠上的明珠”。在企業(yè)的數(shù)字化轉型過程中,數(shù)據(jù)庫的升級是關鍵環(huán)節(jié)。
數(shù)字化轉型先從應用層開始,很快觸碰到底層計算網(wǎng)絡等基礎設施瓶頸,從而推動云計算和大數(shù)據(jù)平臺的發(fā)展。作為PaaS層之一,數(shù)據(jù)庫下接IaaS層、上承SaaS層,數(shù)據(jù)庫的升級改造實際上是IT系統(tǒng)中最為關鍵、最為復雜的環(huán)節(jié),是“最難啃的骨頭”。
過去十年,中國的IaaS層經(jīng)歷了一輪“到云上去”的初步洗禮,而當IaaS層升級完成,PaaS層既需要匹配新的底座基礎設施、又要承接SaaS層的快速迭代,在此之外還必須具備數(shù)據(jù)庫應有的安全、可靠、穩(wěn)定。
正如相關領域?qū)<宜?,構建?shù)據(jù)存儲安全可信保障體系是時代的需要、歷史的使命。
IDC中國副總裁兼首席分析師武連峰也曾表示,對下一代數(shù)據(jù)庫的要求,至少有彈性擴展、穩(wěn)定可靠、極致性能、融合分析、平滑遷移、多模能力、AI融合七大要求。
始于20世紀末的中國數(shù)據(jù)庫產(chǎn)業(yè),在近十年快速發(fā)展,并伴隨數(shù)字化熱潮迎來新機遇?!稊?shù)據(jù)庫發(fā)展研究報告(2023年)》顯示,2022年全球數(shù)據(jù)庫市場規(guī)模為833億美元,其中中國數(shù)據(jù)庫市場規(guī)模為59.7億美元,折合人民幣約為403.6億元,占全球的7.2%。
而到了當下,人工智能爆火,海量數(shù)據(jù)價值的挖掘和應用,成為推動創(chuàng)新的重要力量。這對數(shù)據(jù)存儲和計算的性能成本提出更高要求。
“從數(shù)字化轉型角度來說,數(shù)據(jù)庫更要滿足企業(yè)業(yè)務流程創(chuàng)新、用戶體驗創(chuàng)新、產(chǎn)品服務創(chuàng)新、商業(yè)模式創(chuàng)新、社會責任創(chuàng)新、風險管控創(chuàng)新等多個價值的需要。”在武連峰看來,對數(shù)據(jù)庫的要求越來越苛刻,這對國內(nèi)數(shù)據(jù)庫產(chǎn)品來說既是挑戰(zhàn),更是前所未有的發(fā)展機遇。
OceanBase創(chuàng)始人陽振坤曾說,從OceanBase誕生的第一天起,團隊成員的目標就是一致的:不只是做一款給自己用的數(shù)據(jù)庫,而是做一款能推動整個社會進步、推動社會生產(chǎn)力發(fā)生變化的數(shù)據(jù)庫。
毫無疑問,OceanBase是一款由業(yè)務場景倒逼出來的產(chǎn)品。十多年前,當成千上萬的用戶集中在一個時點支付貨款,瞬時交易峰值對電商和支付平臺IT系統(tǒng)的考驗猶如洪峰過境。2010年,淘寶“雙11”活動創(chuàng)造了超過9億元的銷售“神話”,而前所未有的巨大成交量也導致全國數(shù)家銀行網(wǎng)銀癱瘓。同年,OceanBase誕生。
2014年起,OceanBase開始逐漸取代Oracle(甲骨文)支撐支付寶核心交易系統(tǒng),承擔“雙11”交易流量。2017年,替換螞蟻集團核心系統(tǒng)最后一個Oracle數(shù)據(jù)庫。2019年“雙11”,OceanBase錄得6100萬次/秒的數(shù)據(jù)庫處理峰值記錄。
隨著OceanBase數(shù)據(jù)庫支撐的業(yè)務從邊緣到核心,團隊對數(shù)據(jù)庫應用場景的痛點也不斷有更深入的感觸。在數(shù)據(jù)庫實際應用中,企業(yè)往往面臨著業(yè)務規(guī)模增長、業(yè)務場景變多、IT架構應用漸趨復雜的難題,造成數(shù)據(jù)庫越用越多、越用越復雜的現(xiàn)狀。
本著“把復雜留給自己、把簡單留給客戶”的產(chǎn)品理念,OceanBase團隊以一體化的設計思路,解決并控制了客戶使用的復雜度,致力于實現(xiàn)“用一款數(shù)據(jù)庫解決80%的問題”。
為此,在OceanBase誕生的13年中,數(shù)據(jù)庫代碼有過兩次重構。
第一次是從0.5版本到1.0版本,團隊將原有代碼推翻重寫,把數(shù)據(jù)庫代碼從最樸素的分布式變成工程一體化,初步解決了分布式架構帶來的高復雜操作問題。
第二次是2022年,OceanBase發(fā)布單機分布式一體化數(shù)據(jù)庫OceanBase 4.0“小魚”。該版本既可以實現(xiàn)單機部署,又可以在單機部署下實現(xiàn)分布式部署的完整功能,得以滿足企業(yè)從小體量到大體量的不同發(fā)展需求。
楊冰坦言,設計4.0“刀子動得很大”。也正是這次重構,讓OceanBase能夠觸達更多場景,變成了一個通用數(shù)據(jù)庫。
“從OceanBase整個演進來看,一體化設計就是OceanBase產(chǎn)品的DNA,未來OceanBase也將持續(xù)踐行一體化的產(chǎn)品戰(zhàn)略。”楊冰表示。
2020年,OceanBase誕生的第十年,這款經(jīng)歷了數(shù)年“雙11”錘煉的產(chǎn)品踏上了正式商業(yè)化運作的道路。
正式商業(yè)化當年,OceanBase協(xié)助工商銀行完成了對公(法人)理財系統(tǒng)從大型主機到分布式架構改造。這也是工商銀行首次在螞蟻自主研發(fā)的數(shù)據(jù)庫上運行重要業(yè)務系統(tǒng)。
關于商業(yè)化的三年,楊冰介紹,在最開始,OceanBase深入探索了金融、運營商、政務等場景,把所有的路幾乎都走了一遍,在這些領域已經(jīng)開始出現(xiàn)規(guī)模化復制的跡象;此外,2021年,OceanBase將核心的300萬行代碼進行開源,隨著開源生態(tài)的不斷成熟,已經(jīng)有500家客戶將OceanBase的社區(qū)版本應用于實際的業(yè)務生產(chǎn)系統(tǒng);2022年OB Cloud上線以來,公有云客戶數(shù)量已經(jīng)增長150%。
但各行各業(yè)的需求有參差,隨著客戶的行業(yè)跨度增加,OceanBase也面臨著迥異的客戶需求。
在金融行業(yè),大型機構、小型機構的需求、關注點是不太一樣的。大型機構基礎設施比較好,在TPS、響應時間等各方面要求會比較高,所以關注點不僅是分布式,還要有完整的單元化分布式整體解決方案和在分布式架構下如何構建高可用的技術風險體系。而中小型金融機構,首先需要數(shù)據(jù)庫的分布式能力,但在使用上根本不希望對此有感知,而是希望像集中式數(shù)據(jù)庫一樣使用數(shù)據(jù)庫。
運營商行業(yè)對數(shù)據(jù)庫的使用非常深,而且一般系統(tǒng)之間的耦合度比較高,數(shù)據(jù)的集中度也比較高,一旦涉及數(shù)據(jù)庫替換往往復雜度和風險要比金融機構還要高。這部分客戶會更關注數(shù)據(jù)庫的兼容性,以及數(shù)據(jù)遷移和評估等配套工具完善度和成熟度,以減少遷移時的風險。
某些行業(yè),對宕機后的恢復速度要求不是最高,但對成本非常敏感;某些行業(yè)則特別看重秒級回切,可以回檔。
“數(shù)據(jù)庫是用出來的?!睏畋粺o感嘆地說道。三年來,從金融核心到政企和大型國計民生的核心系統(tǒng),再到運營商和新零售新制造的核心,OceanBase在千行百業(yè)的“關鍵業(yè)務”中邊磨邊干,才得以打拼出一條積極的商業(yè)化增長曲線,也為客戶創(chuàng)造出了更大的價值。
國際咨詢機構Forrester報告顯示,企業(yè)在采用OceanBase數(shù)據(jù)庫之后,存儲空間節(jié)約比例超過70%,服務器資源節(jié)約比例達到85%,平均每注冊用戶的數(shù)據(jù)庫成本節(jié)約超過50%。
從2010年發(fā)展至今,OceanBase從1.0進化至4.0,支撐系統(tǒng)也從邊緣應用走向“關鍵業(yè)務負載型的業(yè)務”。而從2020年只有18個客戶,到2023年客戶突破1000家,OceanBase只用了三年。