趙艷秋
被數(shù)據(jù)流通和應(yīng)用所改變的用戶們。
2016年1月,阿里云在云棲大會(huì)上海峰會(huì)首次公布全面的大數(shù)據(jù)戰(zhàn)略和一站式大數(shù)據(jù)平臺(tái)“數(shù)加”。當(dāng)時(shí),參會(huì)者在展區(qū)圍住阿里云數(shù)據(jù)業(yè)務(wù)部高級(jí)專家陳鵬宇,甚至有企業(yè)在現(xiàn)場直接拉群,邀請陳鵬宇入群探討數(shù)據(jù)業(yè)務(wù)。
陳鵬宇2010年加入阿里巴巴,從負(fù)責(zé)螞蟻小貸業(yè)務(wù)的大數(shù)據(jù)技術(shù)開始,在早期就參與了阿里大數(shù)據(jù)業(yè)務(wù)的發(fā)展過程。在阿里云公布大數(shù)據(jù)戰(zhàn)略一年多后,陳鵬宇總結(jié)企業(yè)用戶在大數(shù)據(jù)實(shí)踐中的“三部曲”:看數(shù)據(jù)、用數(shù)據(jù)和跨行業(yè)打通數(shù)據(jù)。
“看數(shù)據(jù)”要像“看電視”
“Data 1.0階段是看數(shù)據(jù),這是大部分企業(yè)的基本剛需?!标慁i宇說。雖然看數(shù)據(jù)的傳統(tǒng)BI工具已發(fā)展多年,但對企業(yè)老總和業(yè)務(wù)人員來說,看數(shù)據(jù)仍然不是一件簡單輕松的事。這是因?yàn)閭鹘y(tǒng)BI都太復(fù)雜,企業(yè)還要花大量時(shí)間來解決數(shù)據(jù)孤島問題。
“現(xiàn)在有了云,數(shù)據(jù)采集后直接上云,天生就能融合在一起。只要有合適的工具,就能讓看數(shù)據(jù)變得簡單”。
阿里推出了看數(shù)據(jù)的工具Quick BI,突出“快”。它的理念是,老板和業(yè)務(wù)人員有需求,不再需要傳統(tǒng)上分析師轉(zhuǎn)化需求和數(shù)據(jù)工程師準(zhǔn)備數(shù)據(jù)的過程,不用寫代碼,可直接連上云端的各種數(shù)據(jù)庫,用戶“拖拖拽拽”就能產(chǎn)生各種數(shù)據(jù)報(bào)表。而之前,“看數(shù)據(jù)”的響應(yīng)周期是以周來計(jì)算的。
“我們希望今年把Quick BI做成阿里云的標(biāo)配,就好比每家每戶都有電視機(jī)一樣?!标慁i宇說。
在“看數(shù)據(jù)”上,阿里云還有一種大屏產(chǎn)品DataV,據(jù)說這是阿里云上生意極為興隆的業(yè)務(wù)之一。它是一種軟硬結(jié)合平臺(tái),無論阿里自己的日常業(yè)務(wù)展示、“雙十一”大屏展現(xiàn),還是長江三峽工程、杭州城市數(shù)據(jù)大腦中都有這種大屏的身影。
今天在數(shù)加平臺(tái)上有3萬個(gè)大屏模板,都是客戶設(shè)計(jì)分享出來的?!拔艺娴臎]有想到,它很快就成了一個(gè)爆款?!标慁i宇說。
機(jī)器學(xué)習(xí)“不高深”
到了Data 2.0階段,數(shù)據(jù)要直接為業(yè)務(wù)所用,就像創(chuàng)新小貸業(yè)務(wù),沒有信貸員,用數(shù)據(jù)決策貸款發(fā)放。“數(shù)據(jù)+算法就能解決業(yè)務(wù)問題。”陳鵬宇說,“其中最關(guān)鍵的是算法效果,這方面的人才很缺,我們叫他數(shù)據(jù)科學(xué)家?!?/p>
陳鵬宇觀察,目前市場上需求強(qiáng)勁的是個(gè)性化推薦。但以前只有淘寶、亞馬遜這些大公司才能玩,因?yàn)橐獙懰惴?、要有龐大的?jì)算資源反復(fù)訓(xùn)練模型。
中小電商、新聞網(wǎng)站、音樂社區(qū)能不能達(dá)到千人千變的效果?現(xiàn)在,阿里團(tuán)隊(duì)把推薦算法和數(shù)據(jù)處理過程包裝起來,用戶只要按預(yù)定格式輸入三類數(shù)據(jù)——脫敏客戶信息、物品信息及客戶和物品之間的歷史行為,就可以得到推薦結(jié)果。
在新聞推薦上,陳鵬宇坦言《今日頭條》做的推薦算法不錯(cuò)?!斑@要對新聞做比較完整的畫像,與商品推薦不同,要通過自然語言處理,提煉出新聞內(nèi)容的關(guān)鍵詞”。
不難想象,推薦算法用到了機(jī)器學(xué)習(xí),但這是一般企業(yè)都不敢碰的高深技術(shù),同時(shí)還需要大量計(jì)算資源——一個(gè)個(gè)性化推薦算法,模型訓(xùn)練周期很長,可能要跑好幾天。為此,2015年阿里云推出了機(jī)器學(xué)習(xí)平臺(tái)PAI,最近這個(gè)平臺(tái)剛剛發(fā)布2.0版。它把機(jī)器學(xué)習(xí)算法封裝好,將成百上千的參數(shù)隱藏起來,提供很多模板。
“你只要大概了解一下邏輯回歸、數(shù)據(jù)森林用在什么場景下,就可以開始工作了?!标慁i宇說,“有了這類平臺(tái),做過數(shù)據(jù)分析和數(shù)據(jù)開發(fā)的工程師都可能往數(shù)據(jù)挖掘的道路上轉(zhuǎn)型?!?/p>
機(jī)器學(xué)習(xí)技術(shù)的普世化讓大量中小創(chuàng)新夢想成真。如利用PAI,墨跡天氣每5分鐘就可針對某一精準(zhǔn)區(qū)域做一次天氣預(yù)報(bào)。
“受控的核反應(yīng)堆”
到了Data 3.0階段,業(yè)界將交叉打通數(shù)據(jù)。
去年,曾有企業(yè)推出人工智能手機(jī)——手機(jī)能神奇地了解你的所需,并主動(dòng)幫忙。例如,你外出旅行,飛機(jī)落地可以自動(dòng)幫你叫車去之前訂好的酒店;你在電商平臺(tái)購物,它會(huì)貨比三家,還能在你走近快件儲(chǔ)存柜時(shí),自動(dòng)提示取件碼。僅僅這幾個(gè)場景,背后就需要打通航班、酒店、叫車、電商和物流等不同領(lǐng)域大企業(yè)的數(shù)據(jù)。
陳鵬宇預(yù)測,在Data 3.0階段,會(huì)有很多公司提供數(shù)據(jù)打通和應(yīng)用創(chuàng)新服務(wù)?!岸鴶?shù)據(jù)打通一定要有機(jī)制?!彼f,“我們說是在一個(gè)受控的核反應(yīng)堆里,完成數(shù)據(jù)新能源的化學(xué)反應(yīng)?!?/p>
這意味著,當(dāng)不同企業(yè)的數(shù)據(jù)進(jìn)入到受控平臺(tái),他們可以寫程序,用到平臺(tái)中的各種數(shù)據(jù),哪怕是用戶的敏感信息。但任何人,包括寫程序的人都看不到數(shù)據(jù),這叫“數(shù)據(jù)可用不可見”,而且誰也拿不走?!拔覀兇_保數(shù)據(jù)的流通和使用權(quán),但不是版權(quán)和擁有權(quán)。裸的數(shù)據(jù)拖來拖去,一定是不行的”。
今年春節(jié)后,菜鳥與物流公司在阿里數(shù)加平臺(tái)上構(gòu)建一個(gè)受控的數(shù)據(jù)交換中心,叫菜鳥物流云數(shù)據(jù)池。菜鳥和物流公司都把數(shù)據(jù)放在那兒,并使用平臺(tái)上的配套工具分析數(shù)據(jù),展現(xiàn)結(jié)果。如查看哪些包裹線路比較繁忙,物流公司可在倉儲(chǔ)、人力上進(jìn)行更好地調(diào)配。
這樣的數(shù)據(jù)流通和應(yīng)用機(jī)制,能讓一些公司改變態(tài)度?!耙?yàn)楝F(xiàn)在基本上每家公司都想用別人的數(shù)據(jù),但又不想把自己的數(shù)據(jù)給出去”。
傳統(tǒng)企業(yè)的積極姿態(tài)
對數(shù)據(jù)的應(yīng)用需求不僅來自互聯(lián)網(wǎng)企業(yè),傳統(tǒng)企業(yè)也找到大型互聯(lián)網(wǎng)公司尋求合作與創(chuàng)新?!疤貏e是以前沒怎么具備數(shù)據(jù)化服務(wù)的行業(yè),如地產(chǎn)、旅游和工業(yè)”。
協(xié)鑫光伏科技有限公司是全球第一大光伏企業(yè)。在太陽能面板生產(chǎn)中,生產(chǎn)良品率每提升1%,公司就能提高上億元收入。“我們通過歷史上每一次切割的參數(shù)值和最終切出來的良品率去做分析,最終找到影響良品率的600多個(gè)因素,協(xié)助協(xié)鑫調(diào)整生產(chǎn)工藝和流程”。這套方法論是可以復(fù)制的。同樣的,阿里也協(xié)助中策橡膠提升了3%到5%的良品率。
再如像波司登羽絨服,以前的渠道主要是門店,但“雙十一”購物大潮到來之后,波司登也有了很多電商渠道。如果這兩套系統(tǒng)不打通,倉儲(chǔ)和調(diào)貨會(huì)很麻煩。波司登利用阿里云企業(yè)級(jí)互聯(lián)網(wǎng)架構(gòu),打通了它的內(nèi)部數(shù)據(jù),把庫存降了下來。很多企業(yè)類似波司登,采用混合云,先把線下門店和線上門店數(shù)據(jù)跑通,來降低庫存。
陳鵬宇不斷強(qiáng)調(diào)云上數(shù)據(jù)的安全性。這是很多客戶的顧慮?!爱?dāng)數(shù)據(jù)在線化后,企業(yè)會(huì)擔(dān)心數(shù)據(jù)在一朵云上,會(huì)被云供應(yīng)商管控了,其實(shí)這個(gè)擔(dān)心是沒有必要的。”陳宇鵬說,“我們給客戶提供所有第三方審計(jì),例如我們通過了公安部的等保三級(jí)認(rèn)證,相當(dāng)于金融服務(wù)水平。你把數(shù)據(jù)放在云上,就好比把錢存在銀行,或者放心打手機(jī)而不擔(dān)心被監(jiān)控是一樣的?!?