大數(shù)據(jù)將怎么樣改變?nèi)藗兊纳??維克托·爾耶·舍恩伯格在《大數(shù)據(jù)時代:生活、工作與思維的大變革》中前瞻性地指出,大數(shù)據(jù)時代最大的轉(zhuǎn)變就是放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。
這本書是國外大數(shù)據(jù)系統(tǒng)研究的先河之作,作者維克托被譽為“大數(shù)據(jù)時代的預(yù)言家”,他的判斷顛覆了千百年來人類的思維慣例,對人類的認(rèn)知和與世界交流的方式提出了全新的挑戰(zhàn)。
目前,大數(shù)據(jù)分析已成為IT界競相爭奪的新戰(zhàn)場。與整體IT行業(yè)相比,業(yè)務(wù)分析市場的增長更為迅猛。Gartner預(yù)測,2015年,90%以上的主管都會把信息視為一種戰(zhàn)略資產(chǎn),但只有不到10%的主管能充分實現(xiàn)這些信息的經(jīng)濟價值。
落地的前提
業(yè)界已經(jīng)從對大數(shù)據(jù)重要性的認(rèn)識階段,發(fā)展到實踐大數(shù)據(jù)的戰(zhàn)略實施階段。因此,如何保證數(shù)據(jù)的真實性、如何挖掘數(shù)據(jù)價值,成為大數(shù)據(jù)應(yīng)用的關(guān)鍵問題。
對此,2013年3月12日發(fā)布的《分析:大數(shù)據(jù)在現(xiàn)實世界中的應(yīng)用》白皮書提供了大數(shù)據(jù)應(yīng)用的五大關(guān)鍵性建議,其中包括:以“客戶為中心”,制定前期“大數(shù)據(jù)戰(zhàn)略規(guī)劃”;制定全面完整的企業(yè)“大數(shù)據(jù)藍圖”;從現(xiàn)有數(shù)據(jù)入手,設(shè)定并完成短期和階段性的“大數(shù)據(jù)戰(zhàn)略目標(biāo)”;根據(jù)業(yè)務(wù)優(yōu)先級,逐步建立分析體系,循序漸進提升“大數(shù)據(jù)分析能力”;定制可衡量的指標(biāo)分析“大數(shù)據(jù) ROI(投資回報率)”。
該結(jié)論來自于IBM商業(yè)價值研究院與牛津大學(xué)賽德商學(xué)院共同進行的大數(shù)據(jù)研究。該項目對全球95個國家、26個行業(yè)的1144名業(yè)務(wù)人員和IT專業(yè)人士進行了調(diào)研,采訪了20多名學(xué)者、業(yè)務(wù)主題專家和企業(yè)高管。
可見,大數(shù)據(jù)應(yīng)用若想落地,就必須與業(yè)務(wù)需求相結(jié)合。各行業(yè)在決定采用大數(shù)據(jù)分析工具之前,應(yīng)該先搞清楚幾個問題,比如數(shù)據(jù)從哪里來,數(shù)據(jù)的質(zhì)量如何,數(shù)據(jù)可以做什么用,數(shù)據(jù)的價值如何等。
首先,數(shù)據(jù)是否豐富和開放。大數(shù)據(jù)從本質(zhì)上要求信息開放,而信息開放是一個復(fù)雜問題。有些涉及行業(yè)內(nèi)部競爭,受到商業(yè)因素影響,企業(yè)不愿意開放;有些涉及個人或者行業(yè)本身的隱私或機密,無法開放。在大數(shù)據(jù)應(yīng)用的過程中,對互聯(lián)網(wǎng)用戶隱私權(quán)和數(shù)據(jù)的保護,是開放信息時的重要考慮因素。
其次,是否掌握強大的數(shù)據(jù)分析工具。要以低成本和可擴展的方式處理大數(shù)據(jù),這就需要對整個IT架構(gòu)進行重構(gòu),開發(fā)先進的軟件平臺和算法。這方面,國外又一次走在我們前面。特別是近年來以開源模式發(fā)展起來的Hadoop等大數(shù)據(jù)處理軟件平臺及其相關(guān)產(chǎn)業(yè),已經(jīng)在美國初步形成。
第三,管理理念和運作方式能否適配數(shù)據(jù)化決策。大數(shù)據(jù)開發(fā)的根本目的是以數(shù)據(jù)分析為基礎(chǔ),幫助人們作出更明智的決策,優(yōu)化企業(yè)和社會運轉(zhuǎn)。哈佛商業(yè)評論說,大數(shù)據(jù)本質(zhì)上是“一場管理革命”。大數(shù)據(jù)時代的決策不能僅憑經(jīng)驗,要拿數(shù)據(jù)說話。因此,大數(shù)據(jù)能夠真正發(fā)揮作用,深層次看,還要改善我們的管理模式,需要管理方式和架構(gòu)與大數(shù)據(jù)技術(shù)工具相適配。這或許是我們最難邁過的一道坎了。
IBM的2013年大數(shù)據(jù)策略在醫(yī)療、客戶服務(wù)、保險、金融服務(wù)、零售、通信等多個領(lǐng)域做了行業(yè)前景設(shè)想。在利用大數(shù)據(jù)之后,有些領(lǐng)域的企業(yè)可以更好地了解客戶,創(chuàng)建更加個性化的客戶體驗,最終提高客戶的滿意度和忠誠度,并增加收入,避免客戶流向競爭對手。
但這些設(shè)想在中國大部分還沒有真正試驗性地落地,而由企業(yè)內(nèi)部業(yè)務(wù)驅(qū)動來運用大數(shù)據(jù)的企業(yè)就更少之又少。不過,大數(shù)據(jù)已經(jīng)是在落地進行中了,各行業(yè)的先行者都在思考這個問題,比如下面介紹的醫(yī)療行業(yè)。
醫(yī)療業(yè)的落地嘗試
維克托認(rèn)為,大數(shù)據(jù)的核心就是預(yù)測。
這個核心代表著我們分析信息時的三個轉(zhuǎn)變:一是,我們可以分析更多的數(shù)據(jù),有時候甚至可以處理和某個特別現(xiàn)象相關(guān)的所有數(shù)據(jù),而不再依賴于隨機采樣;二是,研究數(shù)據(jù)如此之多,以至于我們不再熱衷于追求精確度;第三個轉(zhuǎn)變因前兩個轉(zhuǎn)變而促成,即我們不再熱衷于尋找因果關(guān)系。
我們通過醫(yī)療行業(yè)的案例來窺探這種轉(zhuǎn)變。
據(jù)IBM全球副總裁兼中國開發(fā)中心總經(jīng)理王陽對記者介紹,IBM與廣東省中醫(yī)院的合作案例,就是大數(shù)據(jù)在醫(yī)療行業(yè)的落地探索。
早在2010年6月,IBM宣布將與中國華南權(quán)威的醫(yī)院廣東省中醫(yī)院繼續(xù)展開合作,共同啟動一項創(chuàng)新型醫(yī)療數(shù)據(jù)分析項目,幫助醫(yī)生對上千份匿名電子病歷進行分析并從中提煉不同群體對特定疾病的發(fā)病規(guī)律。該項技術(shù)還將幫助臨床醫(yī)生對某些傳統(tǒng)中醫(yī)療法的功效進行實證研究。
隨著電子病歷及其他系統(tǒng)的應(yīng)用,越來越多的醫(yī)療數(shù)據(jù)從中產(chǎn)生,提取和整理相關(guān)病人數(shù)據(jù),來快速發(fā)現(xiàn)問題關(guān)鍵所在并找到數(shù)據(jù)中的特定模式。
王陽說,“廣東省中醫(yī)院一天接待超過2萬的患者,一年就會有600多萬患者的數(shù)據(jù)積累。大數(shù)據(jù)首先要完成一個數(shù)字化的過程,把患者的各項檢查指標(biāo)數(shù)據(jù)存儲下來。這后面就可以進行分析和優(yōu)化,比如醫(yī)生一看凡是慢性腎病的人絕大多數(shù)都有這些癥狀,然后反過來就可以說,有這些癥狀的患者得慢性腎病的概率高。以往是通過醫(yī)生、專家的經(jīng)驗來判斷、診斷病癥,現(xiàn)在借助大數(shù)據(jù)挖掘手段和比對,可以智能診斷出患者對應(yīng)的病癥,并推薦匹配的配藥?!?/p>
為了解決這個問題,當(dāng)時,IBM研究院的科學(xué)家們首創(chuàng)了醫(yī)療信息數(shù)據(jù)倉庫的分析和共享技術(shù)(以下簡稱HIWAS)。廣東省中醫(yī)院的臨床醫(yī)生將使用它來研究傳統(tǒng)中西醫(yī)結(jié)合在治療慢性腎臟病方面的療效。
HIWAS儲存并整合分析匿名病人數(shù)據(jù),為醫(yī)生提供病人病情及個人信息的詳細(xì)報告,包括年齡、性別等,以及是否患有其他病癥,如心臟病或糖尿病。該技術(shù)幫助醫(yī)生提取、過濾并綜合相關(guān)病人的數(shù)據(jù)及類似醫(yī)療狀況,幫助醫(yī)生為病人量身定制治療方案,另一方面也幫助醫(yī)生更好理解不同治療方法對不同人群所產(chǎn)生的反應(yīng)。HIWAS還幫助科研人員為臨床及治療研究方面進行深入的數(shù)據(jù)分析。
這一探索性的項目讓醫(yī)療專業(yè)人士可以從大量數(shù)據(jù)中提取有用的臨床信息,以便更好地了解病史和預(yù)測治療效果,從而改善病人護理,并降低成本。