閆安
使用大數(shù)據(jù)已經(jīng)成為大家的普遍觀念,而不只是個別人很感興趣。就像美國著名統(tǒng)計學(xué)家、質(zhì)量管理學(xué)家愛德華茲·戴明所說,除了上帝之外,任何人都必須用數(shù)據(jù)說話。
大數(shù)據(jù)改變生活
大家每天打出租車,已經(jīng)習(xí)慣了使用滴滴打車等軟件,因為這些軟件采用大數(shù)據(jù)技術(shù),經(jīng)過各種計算,能將行程狀況、乘客的愛好和拼車習(xí)慣等信息更精準地進行匹配,從而找到最合適的線路。
有人曾經(jīng)根據(jù)百度搜索詞的信息來推測某地發(fā)生了流感。如果在百度上有很多人搜索和流感相關(guān)的詞匯,并且集中出現(xiàn)在某個區(qū)域的話,就可以基本判斷那個地區(qū)的流感比較集中,有關(guān)部門就能有針對性地部署對策。美國每周會對谷歌的搜索詞進行分析,然后發(fā)布一個失業(yè)報告,計算出這一周的失業(yè)率是上升還是下降。因為失業(yè)的人會在網(wǎng)上搜索和別人不一樣的內(nèi)容,像“我怎樣申請救濟、我怎么找工作、我的社保怎么辦”之類的問題,根據(jù)這些搜索詞來分析,結(jié)果往往非常精準。
阿里小貸服務(wù),是大數(shù)據(jù)催生新業(yè)務(wù)的典型。阿里在做淘寶時,發(fā)現(xiàn)沉淀下來很多電商的數(shù)據(jù),比如這家淘寶店主過去幾年做得好不好,現(xiàn)在是在上升期還是下降期,這些都可以從這家店的所有賬目流水中得知。如果這個淘寶店主想去銀行貸款,大銀行對這種小店主基本上是不提供貸款的,或者貸款成本很高。但是通過大數(shù)據(jù),阿里發(fā)現(xiàn)自己對這個店主知根知底,知道他所有的流水數(shù)據(jù),只要用大數(shù)據(jù)建一個模型,就能立刻算出這個淘寶店主的信用風(fēng)險是高還是低。于是,阿里巴巴后來就催生出芝麻信用業(yè)務(wù),全程零人工介入,由電腦放貸,這在銀行是不可能操作的。數(shù)據(jù)顯示,阿里小貸服務(wù)的壞賬率低于1%,遠遠低于銀行的壞賬率。
再進一步,從企業(yè)信用發(fā)展到個人信用。根據(jù)消費者在淘寶上花錢的情況,甚至包括其朋友圈里其他朋友的花錢情況,從理論上說,信用好的人,他的朋友信用也不錯,利用這些信息就可以打出每個人的個人征信分數(shù)。芝麻信用好的人,出差住旅館不需要押金,離店不需要查房,去很多國家能免簽證,這樣,信用的概念也就慢慢進入了我們的生活。
“算”出來的人工智能
最近有一個刷屏的新聞,沙特授予了機器人索菲亞公民身份。在新聞發(fā)布會上,有人問了機器人一個問題:你怎么看待人?機器人反問道:你們?nèi)嗽趺凑J為自己不是機器人呢?這說明人工智能已經(jīng)離我們越來越接近了。什么是人工智能?其實很簡單,人工智能就是通過大數(shù)據(jù)和大計算解決一些本來是人做的而機器不會做的事情。歷史上留下很多數(shù)據(jù),包括各種文檔、書、視頻、文獻,還有采集來的數(shù)據(jù),機器具備了一定的學(xué)習(xí)能力以后,經(jīng)過一定的算法,就可以形成各種各樣的智能應(yīng)用。大家耳熟能詳?shù)陌柗ü罚ˋlphaGo),就是利用數(shù)據(jù)開發(fā)的智能應(yīng)用,所以下圍棋的水平很高。
人工智能的應(yīng)用非常廣泛。比如,智能交通。大家外出時經(jīng)常使用高德、百度地圖,它會告訴你哪條路是堵的,哪條路是暢通的。現(xiàn)在杭州正在試點“城市大腦”,就是在交通信號燈上安裝了很多聯(lián)網(wǎng)的裝置,把數(shù)據(jù)采集回來,這樣就可以利用這些大數(shù)據(jù),開發(fā)“互聯(lián)網(wǎng)信號燈”,從而更好地控制信號燈以及信號燈的用時長短,有效地降低交通擁堵。試點后城市的擁堵指數(shù)可以降低到10%。所謂的智慧城市,就是運用信息和通信技術(shù)手段感測、分析、整合城市運行核心系統(tǒng)的各項關(guān)鍵信息,從而對包括民生、環(huán)保、公共安全、城市服務(wù)、工商業(yè)活動在內(nèi)的各種需求做出智能響應(yīng)。通過在城市里大量安裝傳感器,可以搜集到很多人活動的軌跡信息,比如什么時候坐地鐵的人最多,某條交通干道一天24小時的人流軌跡等等,把這些信息采集起來,進行大數(shù)據(jù)分析,可以實現(xiàn)城市智慧式管理和運行,提高政務(wù)效率,進而促進城市的和諧、可持續(xù)成長。
人工智能也在進行金融方面的探索。比如原先要研究一家企業(yè),現(xiàn)在的做法是,讓計算機把財報中的內(nèi)容進行提煉,用各種圖表的形式展示出來,包括這家公司和其他公司的比較,公司內(nèi)部過去幾年的業(yè)績比較,再從簡單的數(shù)字型分析進入到非結(jié)構(gòu)化的深入分析。
在醫(yī)療保健領(lǐng)域,人工智能深度學(xué)習(xí)的能力,最近幾年從圖像識別和語音識別開始形成了突破。國外一些成熟的圖像識別數(shù)據(jù)集,已具有非常準確的識別率。在疾病診斷方面,可以拿著X光片、CT片來診斷癌癥,這在近期很有可能形成新的突破。
在電商零售業(yè),現(xiàn)在很多電商企業(yè)像亞馬遜等,每天在倉庫里跑來跑去的都是機器人,公司日常的管理、運輸、退貨,機器就可以解決了。甚至客戶服務(wù)也是由聊天機器人擔(dān)任,等回答不了消費者的問題時,才會自動轉(zhuǎn)接人工服務(wù)。
教育領(lǐng)域的人工智能發(fā)展同樣非常迅速?,F(xiàn)在的英語語法人工評測、普通話考試等,都可以由人工智能完成。比如一位老師要參加普通話考試,她的面前就是一臺能夠進行語音識別的機器,能對她所說的普通話逐一進行打分。學(xué)生學(xué)習(xí)英語,也可以用人工智能來評價其語法是否規(guī)范,還可以判斷一個人的發(fā)音更像是中國式英語、美國式英語,還是更像英國式英語,這個人工智能可以判斷??梢哉f在教育領(lǐng)域,人工智能在很多方面取得了成功。
目前,對于人的自然語言的評判,人工智能還不是很成熟。就現(xiàn)在來說,人工智能能夠做到理解人說的話,但如果要和人真正地對話,可能還需要10年以上的時間。
強人工智能約2045年登場
人工智能的發(fā)展歷程曾經(jīng)起起落落,其中有過兩次大的低谷。因為要讓機器模擬人的智能,科學(xué)家們先后從兩個方向入手研究。一部分科學(xué)家研究人腦是怎么工作的,也就是從神經(jīng)科學(xué)入手研究;另一部分科學(xué)家則從數(shù)學(xué)的角度入手,從統(tǒng)計模型來進行各種預(yù)測、歸類。兩次低谷都是由于技術(shù)發(fā)展遇到了一定的瓶頸、計算能力跟不上而引起的。
最近幾年人工智能又一次在世界范圍內(nèi)大熱,這次人工智能標志性的技術(shù)是深度學(xué)習(xí)的發(fā)展,包括阿爾法狗的勝利、各種無人駕駛汽車、各種圖像識別和語音識別的發(fā)展,都是和深度學(xué)習(xí)能力相關(guān)的。
但是,無論如何,現(xiàn)在還是處在弱人工智能的階段。什么是弱人工智能的階段呢?比如說,阿爾法狗下棋可以下贏世界冠軍,但是如果讓它看圖識別,它不如3歲的小孩。你給3歲的小孩看一張熊貓的圖片,告訴他這是熊貓,然后你帶他去動物園看熊貓,他一眼就知道這是熊貓了。但如果是機器人,你需要給他看成千上萬張熊貓的照片,它才能知道這是熊貓。所謂的強人工智能,就是擁有自我進化能力的機器人。比如,谷歌讓人工智能來進行人工智能程序的開發(fā),寫出一些簡單的程序,以此來了解人工智能以后發(fā)展的方向,這種做法是可以產(chǎn)生進化能力的。
從強人工智能到超人工智能的進展速度會越來越快,一旦人工智能的腦力發(fā)展到一定程度之后,可能會以小時、以分鐘為單位,迅速進化成為像神一樣的超級人物。強人工智能發(fā)生的時間點,我認為可能會在2045年左右,就像特斯拉的創(chuàng)始人馬斯科所言,強人工智能發(fā)展到一定的階段會產(chǎn)生極點,會發(fā)生人類不可控的事情,所以必須提前做出規(guī)劃和限制。
為什么是2045年?因為人腦的計算能力和超級計算機天河二號差不多,持續(xù)計算速度達到每秒3.39億億次。根據(jù)現(xiàn)在的發(fā)展速度,到2025年,天河二號可以裝到筆記本電腦里。每一個創(chuàng)業(yè)公司都可以花很低的錢進行大體量的云計算,所以再過20年,人類的進步將是天翻地覆的,20年之后人工智能會發(fā)生什么樣的變化真的很難說。
用大數(shù)據(jù)可以驅(qū)動整個人工智能的進化,不是機器的進化,而是我們的生活、我們的工作,都能用數(shù)據(jù)驅(qū)動,用智能演進。endprint