“不是任何一朵云都能撐住像‘雙11’這樣的流量?!卑⒗锇桶图瘓F(tuán)CTO、阿里云智能總裁張建鋒表示。
2019年天貓“雙11”再次刷新世界紀(jì)錄:總成交額2684億元,訂單峰值54.4萬(wàn)筆/秒,單日數(shù)據(jù)處理量970PB。這是在阿里巴巴核心系統(tǒng)今年已100%上云的情況完成的創(chuàng)紀(jì)錄之舉。阿里巴巴這朵云經(jīng)受住了“雙11”這一世界級(jí)流量洪峰。
用公共云承載一個(gè)萬(wàn)億規(guī)模的核心系統(tǒng),阿里云做到了??梢钥隙ǖ氖牵磥?lái)阿里的全部系統(tǒng)都將運(yùn)行在阿里云上。
其實(shí),從去年開(kāi)始,阿里已經(jīng)決定將整個(gè)阿里巴巴的核心系統(tǒng)全部遷移到云上。阿里為什么敢為天下先?首先,阿里云是阿里自己從頭研發(fā)的一朵云,每一行代碼都是自己的,累積、驗(yàn)證、迭代了十年,這就是大家今天看到的“飛天操作系統(tǒng)”;阿里云將原來(lái)專用的技術(shù)變成公共云,所有核心系統(tǒng)都在公共云上,讓所有人都可以來(lái)享受普惠的服務(wù)。
今年的“雙11”已經(jīng)證明,阿里云100%核心系統(tǒng)上云是成功的。這背后不僅僅是簡(jiǎn)單的替換,上云之后,系統(tǒng)整體性能有了非常大的提升。在交易開(kāi)始的前十分鐘,消費(fèi)者基本沒(méi)有感受到任何抖動(dòng),購(gòu)物非常順暢。這主要得益于阿里云在以下幾方面的優(yōu)化:
首先,在核心虛擬機(jī)層面,阿里自研的神龍架構(gòu)基于自研的服務(wù)器實(shí)現(xiàn)虛擬化,其性能的輸出是穩(wěn)定的、線性的;其次,阿里自研的OceanBase 金融級(jí)分布式數(shù)據(jù)庫(kù)與PolarDB 數(shù)據(jù)庫(kù)同樣表現(xiàn)優(yōu)異,其每秒峰值遠(yuǎn)超原來(lái)采用的Oracle 傳統(tǒng)數(shù)據(jù)庫(kù);再次,實(shí)現(xiàn)計(jì)算與存儲(chǔ)的分離,阿里巴巴有一個(gè)專門的存儲(chǔ)池,所有數(shù)據(jù)都是從遠(yuǎn)端存取,存儲(chǔ)的擴(kuò)展非常方便;最后,大規(guī)模采用RDMA 網(wǎng)絡(luò),保證訪問(wèn)性能。
今年的“雙11“總共處理了970P 的數(shù)據(jù)。在每個(gè)一個(gè)時(shí)間點(diǎn),所處理的工作負(fù)載又各不相同,同時(shí)還要實(shí)現(xiàn)實(shí)時(shí)處理,難度就更大。阿里采用了分而治之的措施,在零點(diǎn)時(shí),將大部分計(jì)算機(jī)資源分配給交易等應(yīng)用,在一點(diǎn)之后,則把數(shù)據(jù)分配給數(shù)據(jù)處理系統(tǒng)。
今年“雙11”除了數(shù)據(jù)的批處理以外,還有大量的流處理,即實(shí)時(shí)處理所有數(shù)據(jù),每生成一筆訂單,系統(tǒng)就會(huì)自動(dòng)將數(shù)據(jù)逐層匯集上來(lái)。阿里采用的這一流式處理系統(tǒng),每秒能處理25 億筆記錄。
飛天操作系統(tǒng)能夠在10萬(wàn)臺(tái)級(jí)別以上的服務(wù)器中做調(diào)度。管理如此龐大的服務(wù)器,除了飛天操作系統(tǒng)之外,還需要管理所有的消息流轉(zhuǎn)。因此,阿里自研了MQ 消息系統(tǒng),這是目前全球最大的一個(gè)消息系統(tǒng)。從飛天操作系統(tǒng)、大數(shù)據(jù)處理平臺(tái)到智能化應(yīng)用,這些技術(shù)疊加起來(lái),構(gòu)成了一個(gè)強(qiáng)大的分布式的云平臺(tái),才掌起了阿里整個(gè)經(jīng)濟(jì)體的所有核心應(yīng)用。
特別值得一提的是,阿里今年發(fā)布了自研的芯片含光800。明年的“雙11”,阿里大量的人工智能應(yīng)用都會(huì)跑在自研的芯片之上。
硬件、數(shù)據(jù)庫(kù)、云計(jì)算操作系統(tǒng),再加上核心應(yīng)用平臺(tái),阿里以自研為起點(diǎn),始終保持快速創(chuàng)新、快速迭代,才能在“雙11”這樣的硬仗面前,游刃有余,從容不迫。