對大數(shù)據(jù)我不是專家,但由于大數(shù)據(jù)也是開放性的命題,所以我也就自己的認知水平,談談我對大數(shù)據(jù)的看法,更多集中在數(shù)據(jù)的金融應用上。
早在1980年,著名未來學家阿爾文· 托夫勒就在《第三次浪潮》一書中,將大數(shù)據(jù)熱情地贊頌為“第三次浪潮”。不過,直到2009年前后,“大數(shù)據(jù)”才成為互聯(lián)網(wǎng)信息技術行業(yè)的流行詞匯。2013 年,隨著互聯(lián)網(wǎng)金融的空前熱門,也才真正意義上將“大數(shù)據(jù)”推到了高潮。如果探究互聯(lián)網(wǎng)金融與大數(shù)據(jù)流行之間的關聯(lián),背后有一個很關鍵的因素,就是互聯(lián)網(wǎng)金融一直無法解答一個核心命題——風險控制。即互聯(lián)網(wǎng)沒有找到比傳統(tǒng)金融更具優(yōu)勢的風控方法,從而使得互聯(lián)網(wǎng)金融在興起的過程中飽受質疑。而橫空出世的大數(shù)據(jù)成為了互聯(lián)網(wǎng)金融支持者的一個重要精神支柱。大數(shù)據(jù)越不可測,就越具備想象力,對互聯(lián)網(wǎng)金融而言,就越具解釋力。
所以每當爭論互聯(lián)網(wǎng)金融的風控問題如何解決的時候,支持方就會說,我們有大數(shù)據(jù)。于是,別人就無話可說了。大數(shù)據(jù)如同萬金油一般,隨時隨地都能用。但是現(xiàn)實情況必然不是這樣的,大數(shù)據(jù)并非是萬能的,也不可能是萬能的。
那么什么是大數(shù)據(jù)呢?我談談自己的看法。
大概四五年前,美國《商業(yè)周刊》資深作家約翰·伯恩一本暢銷書《藍血十杰》,對今天中國互聯(lián)網(wǎng)金融和大數(shù)據(jù)理論愛好者們產(chǎn)生了極大的影響。這本書講述了十個年輕人,出身名校哈佛,心懷理想,是天才中的天才。他們二戰(zhàn)期間成為了美國空軍的后勤英雄,卓有成效地將數(shù)字化管理模式應用于戰(zhàn)爭,為盟軍節(jié)約了十億美元的耗費,幫助盟軍取得了勝利。
這說明數(shù)據(jù)的分析和管理,很早就被用于國家戰(zhàn)爭和商業(yè)運營了,為什么現(xiàn)在非要在數(shù)據(jù)前面加個“大”字呢?
上次在鴻儒論道,聽社科院何帆教授的課程,他提到,從本質上講一切的社會現(xiàn)象都是統(tǒng)計現(xiàn)象,并不像實驗室里的試驗那樣有明確的因果關系。如經(jīng)濟學的供求定理就是一個統(tǒng)計規(guī)律。但是人類認知能力中最差的也是統(tǒng)計思維。
諾貝爾獎得主、心理學家卡尼曼曾經(jīng)講過,人類頭腦中有兩套思維。一套思維是本能的,比如我們的語言能力、模仿能力、第六感,等等,都是與生俱來的。如麻省理工學院的語言學家喬姆斯基指出,小孩子為什么到3 歲就能學會說話,而要到十幾歲才能學會微積分呢?語言學得這么快,不是小孩子自己能學會的,是他出生時大腦中就預裝了一套系統(tǒng)。此外,察言觀色的能力也不用特意學或教,小孩子就已經(jīng)會了。所以這是人類的第一套系統(tǒng),也是能夠讓我們快速反應的系統(tǒng)。第二套系統(tǒng),是當我們做數(shù)學推理,尤其是統(tǒng)計分析時需要用到的。第二套系統(tǒng)運轉很慢,因為占的內存太大,往往我們犯錯誤就是因為決策太快,在統(tǒng)計判斷的方面出現(xiàn)問題。
所以,我們在談大數(shù)據(jù)的時候,都認為是個新潮的概念,但是作為方法論而言,大數(shù)據(jù)已經(jīng)有很長的歷史了。那為什么現(xiàn)在大家突然講大數(shù)據(jù)了呢?主要是因為現(xiàn)在的數(shù)據(jù)越來越多,一方面隨著IT 革命,存儲和計算能力在不斷提高,未來可能會出現(xiàn)無限存儲、瞬間計算的新時代;另一方面,能夠被數(shù)據(jù)化的東西也越來越多,過去只有數(shù)字,而會計制度出來后,經(jīng)濟活動開始可以通過記賬數(shù)據(jù)化。現(xiàn)在大家拿的pad 和電子閱讀器中的文字、圖像也是數(shù)字化的。隨著能夠變成數(shù)據(jù)的東西越來越多,計算和處理數(shù)據(jù)的能力越來越強,大家突然發(fā)現(xiàn)這個東西很有意思。一旦把統(tǒng)計學和現(xiàn)在大規(guī)模的數(shù)據(jù)融合在一起,就會顛覆很多我們原來的思維。endprint