文 張首晟
我講3個題目:量子計算、人工智能與區(qū)塊鏈。我認為這是在整個IT行業(yè)中基礎(chǔ)科技里最重要的3個模塊。我首先講量子計算,跟大家分享一個科學(xué)發(fā)現(xiàn)的故事。
很多比較有意思的科學(xué)發(fā)現(xiàn)都跟哲學(xué)觀念的改變有所關(guān)聯(lián),最根深蒂固的哲學(xué)觀念就是中華民族的古老哲學(xué)上體現(xiàn)出來的——好像世界從來都是正負對立的,有正數(shù)必有負數(shù),有存款必有貸款,有陰必有陽,有善必有惡,有天使必有魔鬼。所以這種對立的世界觀在基本粒子的物理世界里面也有一種呈現(xiàn)。
曾經(jīng)有一位非常偉大的理論物理學(xué)家狄拉克,他和愛因斯坦、楊振寧是我認為20世紀(jì)做出最偉大貢獻的3位物理學(xué)家,他把愛因斯坦的狹義相對論和量子力學(xué)統(tǒng)一起來,在統(tǒng)一的過程中他要做一個非常簡單的數(shù)學(xué)運算,就是開一個根號。
在開根號的時候始終會出現(xiàn)正負兩個解,一般人可能只關(guān)心正解,不關(guān)心負解。但是狄拉克很聰明,他把負解解釋成所有的基本粒子有粒子必然有反粒子。
這在當(dāng)時是非常驚人的預(yù)言。1928年還沒有發(fā)現(xiàn)反粒子,大家都對他提出非常大的質(zhì)疑,說他這個方程肯定不對,世界上肯定沒有看到反粒子。他說“我的方程實在是太美了,你們繼續(xù)去尋找”。他非常幸運,僅過了5年,大家就在宇宙輻射的射線里找到了電子的反粒子,就是正粒子,命名為狄拉克海。
最近好萊塢對科學(xué)前沿發(fā)展非常感興趣,所以有些好萊塢大片都是跟科學(xué)發(fā)現(xiàn)有關(guān)。大家可能都看過一個電影叫《達芬奇密碼》,有一個系列片叫《天使與魔鬼》,講的就是有天使必然有魔鬼,有粒子必然有反粒子??植婪肿拥綒W洲的實驗加速器里面偷出來一百萬分之一克的反粒子就可以做成炸彈,它的威力相當(dāng)于4噸TNT的威力,這是人類能量儲存密度最高的辦法。
今天中國對科學(xué)發(fā)展非常關(guān)心,可能大家會問我科學(xué)發(fā)展最大的驅(qū)動力是什么?我會毫不遲疑地回答:這是一種好奇心的驅(qū)動。
牛頓因蘋果掉下來激發(fā)了他的靈感,萬有引力就被發(fā)現(xiàn)了。愛因斯坦在坐電梯的時候感覺到電梯的上下和引力的作用非常相似,由此創(chuàng)造了偉大的廣義相對論。當(dāng)時,狄拉克已經(jīng)成為非常有名的理論物理學(xué)家,大家都非常堅信在世界上有粒子必然有反粒子。但是另外一位理論物理學(xué)家Majorana完全出于好奇心,他問世界上會不會有一些粒子并沒有反粒子?他果然又找到了一個方程,現(xiàn)在以他的名字叫Majorana方程,這個方程奇妙地描寫了有一種粒子沒有反粒子,或者它自己就是自己的反粒子。他的文章發(fā)表之后并沒人理他,因為所有的反粒子都找到了,所以他沒有像狄拉克那么幸運。Majorana也感到自己的人生非常失落,在意大利的一個港口城市上了渡輪,本來想去西西里島,但是從此之后沒有了蹤跡。
這就成了整個物理學(xué)的兩個大謎團,一個是粒子有沒有存在——我們稱它為Majorana費米子,它沒有反粒子,只有它自己或者它自己就是自己的反粒子。另外就是Majorana本人也是非常大的謎,他好像泄露天機之后就被天使叫去了。
在整個物理學(xué)界有一個所有人夢寐以求都想尋找的名單,這其中包括大家可能聽說過的上帝粒子,2012年在歐洲的加速器被找到,預(yù)言它的那位物理學(xué)家希格斯也得了諾貝爾獎。
我們前年找到了引力波,這也是愛因斯坦100年前預(yù)言的現(xiàn)象。另外我們也想找磁單極等。在這份夢寐以求的名單中,Majorana費米子的確是大家夢寐以求的目標(biāo),但整整找了80年還無果。
我是做理論工作的,我現(xiàn)在經(jīng)常要接待很多國內(nèi)的訪問團來到斯坦福大學(xué),他們都說“我想?yún)⒂^一下你的實驗室”,我會告訴大家我的實驗室就是一張紙和一根筆,但是我非常自豪。理論物理學(xué)家會作出預(yù)言,讓實驗物理學(xué)家來測試。
我的實驗小組在2010年時就預(yù)言了在哪個系統(tǒng)里面會找到這樣一個神奇的粒子,我們預(yù)言在這么一個組合型的器件里面可以找到Majorana費米子。但就是找到也沒有用,就是系統(tǒng)有也不是完全有用,一定要告訴大家是怎樣一個信號真正說明這種神奇粒子的存在。任何一個粒子,沒有人可以用肉眼觀測到,我們總是要找到一個信號,什么信號能夠證明這種粒子的存在,也需要進一步的靈感。
有一天,我想既然基本的粒子有兩種,有正面有反面,就像硬幣有正面有反面,但是Majorana費米子只有一面,沒有反面,所以在某種意義上它是通常粒子的一半。但是通常粒子在電導(dǎo)是臺階性的量子化,要不是0,要不是1,要不是2等。所以我們理論小組做了大膽的預(yù)言,既然Majorana費米子跟通常粒子不一樣,在某種意義上它只是通常粒子的一半;而通常的粒子電導(dǎo)率是0、1、2、3的整數(shù)倍,那么Majorana費米子的電導(dǎo)率必然會導(dǎo)致半整數(shù)倍的電導(dǎo)臺階,也就是會有0.5或1/2的臺階。
后來我們理論小組就和實驗小組做了一個緊密的合作。實驗小組來自UCLA、UC DavisUC Irvine,他們做了一個實驗,的確在0.5的地方可以看到實驗的原始圖案并出現(xiàn)了臺階,鐵證如山地證明了Majorana費米子的存在。
這是一個激動人心的時刻!2017年7月,我們準(zhǔn)備向全世界宣布這個激動人心的發(fā)現(xiàn)時,我又來了一個靈感,想到本來有天使必有魔鬼,但我們好像找到了一個只有天使沒有魔鬼、只有正沒有負的粒子,所以我們將它取名為“天使粒子”,大家非常喜歡這個名字。
前段時間,美國物理學(xué)會召開了一個每年最大的會議,邀請我作一個主題報告,就是在引力波發(fā)現(xiàn)之后的“天使粒子”發(fā)現(xiàn)報告,差不多有好幾千人參加,大家都覺得這是物理學(xué)里面非常振奮人心的發(fā)現(xiàn)。
但是這跟IT峰會有什么關(guān)系?IT峰會最關(guān)心的是計算機,計算機已經(jīng)分成兩類,有經(jīng)典計算機和量子計算機。有些問題,經(jīng)典計算機很容易解決,比如把兩個大的數(shù)乘起來,經(jīng)典計算機可以算得很快。
看一個數(shù)能不能拆成另外兩個數(shù)的乘積,比如15=3X5,這個數(shù)比較小,你自己也可以算出來。但是給你一個很大的數(shù),經(jīng)典的計算機要算這個數(shù)到底是不是兩個數(shù)的乘積需要花很長的時間,因為它用的算法是窮舉法,把所有可能被除的數(shù)一個個除過來,最后才能確認這到底是不是兩個數(shù)的乘積,經(jīng)典計算機算起來非常慢。
今天人工智能要做的事情,是整個人類所有計算的事情最終能轉(zhuǎn)化為優(yōu)化的問題,有很多的可能性,我們要找到最佳的可能性,經(jīng)典計算機只能用窮舉法,最后才算出一個答案。但是量子世界是非常神奇的世界,是平行的世界。比如一個著名的試驗,如果我放出一個粒子,比如光子,它有左右兩個孔。我要打一個炮彈過去,要不就是從左邊穿過要不就是從右邊穿過,不可能在同一個時間既穿過左邊又穿過右邊。但是量子世界有一種本真的平行在里面,一個基本粒子在某一個瞬間同時穿過了兩個孔,只有這種行為才能解釋在后面形成的干擾條紋。假定要么是左要么是右的話,看起來的圖像就不是這個顯示的圖像。量子的世界本身就是平行的。如果用量子世界來做計算的話就能夠秒算,把所有的可能性一下子算出來,因為量子世界有它的平行性,這是量子計算最基本的概念。
要真正造出這個量子計算機非常困難。比如經(jīng)典計算機最基本的單位是比特,用0、1就能夠表達所有的信息;但在量子世界里,一個粒子同時穿過左孔和右孔,處在某一種疊加的狀態(tài)時,一個量子比特講不清是0還是1,它是處在0和1疊加的狀態(tài)里面。
這種基本的現(xiàn)象說明一個量子的比特本身是不太穩(wěn)定的,你去觀察一下周圍就知道它要不就是在左邊,要不就是在右邊,要不是0,要不就是1,任何一個噪聲都會對量子比特產(chǎn)生很大的干擾。
最近量子計算機成為全球和美國著名公司特別關(guān)注的焦點,谷歌、微軟、IBM、英特爾都在做投資,但不能從根本上解決這個問題,其研發(fā)就很困難。一個量子比特是非常不穩(wěn)定的,如果哪天我們做了50量子比特,關(guān)鍵還要看有用的比特是多少,如果只有一個有用的比特,在量子計算的框架下,往往需要10個、20個甚至40個、50個糾錯的比特來為它服務(wù)。這使得量子計算很難真正實現(xiàn)。
但是天使粒子的發(fā)現(xiàn)使這一切根本改變了。這是量變到質(zhì)變的過程,并不是把量子比特做的越多越好,量子比特本身自帶糾錯的能力,即通常一個量子比特能夠拆分成兩個天使粒子。
我剛才一直在講基本概念,通常的粒子有兩面,天使粒子只有一面,所以天使粒子通常只相當(dāng)于一個粒子的一半。所以通常一個量子比特就可以用兩個天使粒子來儲存它。一旦用了兩個粒子儲存它,它們在遙遠的地方相互糾纏。但經(jīng)典世界里面的噪音相互之間沒有糾纏,這樣就沒法用噪聲來破壞由天使粒子所儲存的量子。這是一個革命性的改變。
天使粒子的發(fā)現(xiàn)是激動人心的,不用附加糾錯的比特,自帶糾錯功能,這會對量子計算起到巨大的推動作用。
我接下來跟大家分享一下人工智能。人工智能也是一個基本概念,20世紀(jì)60年代就已經(jīng)提出來。之所以今天人工智能能夠有突飛猛進的發(fā)展,主要是3個大潮流的匯總。
根據(jù)摩爾定律的迭代,CPU的性能每過18個月能夠翻倍,如果用量子計算的話,不只是按摩爾定律18個月翻倍,而是完全從量變到質(zhì)變的,我們的計算能力在不斷增長。另外,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)的產(chǎn)生,造成大量的大數(shù)據(jù),大數(shù)據(jù)能夠幫機器真正學(xué)習(xí)。再好的算法、再強勁的計算機沒有數(shù)據(jù)都不能達成最佳的人工智能。
整個人工智能,大家雖然看到它突飛猛進地在改變,但是我覺得它還是處在非常早期的階段,今后的前景非常廣闊。為什么這么講呢?做一個簡單類比,比如我們曾經(jīng)看到鳥飛,人也非常想飛,但是早期學(xué)習(xí)飛行只是簡單的仿生,我們在自己的手臂上綁上翅膀。真正達到飛行的境界是由于我們理解了飛行的第一性原理就是空氣動力學(xué),有了數(shù)學(xué)原理和數(shù)學(xué)方程之后就可以人為設(shè)計最佳的飛行,就是現(xiàn)在的飛機,飛得又高又快又好,但是并不像鳥,這是非常核心的一點。
可能現(xiàn)在人工智能是在簡單地模仿人的神經(jīng)元,但我們更應(yīng)該思考的是,這里面有一個基礎(chǔ)科學(xué)重大突破的機會,就是我們真正去理解智慧和智能的基本原理,基本的數(shù)學(xué)原理,這樣真正能夠使人工智能有突飛猛進的變化。
另外,大家經(jīng)常問到底用怎樣的判據(jù)能夠真正衡量人工智能是否達到人的標(biāo)準(zhǔn)?大家可能聽說過圖靈測試,圖靈測試是人跟機器對話,但是我們不知道在背面到底是人還是機器。整個對話過程中,你如果花了一天的時間根本感覺不出來,那就是說機器人好像已經(jīng)達到人的水平。
雖然圖靈是一個偉大的計算機科學(xué)家,但是我并不贊同這個判決。人也是在進化的,人的很多情感并不是理性的情感,要讓一個理性的機器學(xué)一個非理性的人的大腦并不是那么容易,比如你故意激怒機器人,說不定它也不怎么理你。人最偉大的一點就是我們能夠做科學(xué)的發(fā)現(xiàn),我想提出一個新的、最好的判據(jù),就是如果哪一天機器人真能夠做科學(xué)的發(fā)現(xiàn),到那一天機器就超過人類了。
最近我在人工智能方面寫了一篇文章,將會在美國的科學(xué)院雜志上發(fā)表,題目叫“Atom2Vec”。人類最偉大的科學(xué)發(fā)現(xiàn)之一,有相對論、量子力學(xué);而化學(xué)里最偉大的發(fā)現(xiàn)就是元素周期表。假定我們根本不知道元素周期表,今天的機器能不能自動發(fā)現(xiàn)元素周期表呢?也就是說,當(dāng)我們把所有存在的化學(xué)元素的名字輸入到算法里面,結(jié)果這個機器自然地發(fā)現(xiàn)了元素周期表,它可以做出人類認為最偉大的科學(xué)發(fā)現(xiàn)。這樣,機器才真的達到了人的水平,在這種意義上,這機器才可以幫助我們發(fā)現(xiàn)新藥,也可以用機器學(xué)習(xí)的辦法發(fā)現(xiàn)新的材料。
接下來我再跟大家分享最后一個題目——區(qū)塊鏈,人工智能在突飛猛進發(fā)展,但是人工智能最缺少的是數(shù)據(jù),恰恰今天數(shù)據(jù)是處在完全中心壟斷的狀態(tài)中,不能幫助機器合理地學(xué)習(xí)。
如同大家在此之前聽說的Facebook數(shù)據(jù)被盜事件一樣,很多數(shù)據(jù)在沒有被允許的情況下就被使用。在今天的世界,個人會產(chǎn)生很多的數(shù)據(jù),如基因數(shù)據(jù)、醫(yī)療數(shù)據(jù)、教育數(shù)據(jù)、行為數(shù)據(jù)等。而這些數(shù)據(jù)都是掌握在中心機構(gòu)里面,沒有達到真正的去中心化。區(qū)塊鏈的產(chǎn)生能夠產(chǎn)生一個數(shù)據(jù)市場。所以我理想的世界是未來每人擁有自己所有的數(shù)據(jù),這是完全去中心化的儲存,這樣黑客也不可能黑每個人的數(shù)據(jù)。然后再用一些加密算法,在區(qū)塊鏈上就真正能夠達到既保護個人的隱私,又能夠做出良好的計算。所以我把今后區(qū)塊鏈的整個理念用一句話來描寫,叫“In Math we trust”——我們的信念建筑在數(shù)學(xué)上。
我今天報告的題目有一個核心的理念,就是要使IT真正能夠發(fā)展,既需要物理學(xué)又需要數(shù)學(xué)。一旦我們建筑在區(qū)塊鏈的基礎(chǔ)上,再加上這些奇妙的數(shù)學(xué)算法,我們就能夠真正達到數(shù)據(jù)市場。這個數(shù)據(jù)市場的產(chǎn)生,能夠使得社會變得更加公平,現(xiàn)在社會最大的不公平是我們?nèi)菀灼缫曇恍┥贁?shù)派。但是在機器學(xué)習(xí)的過程中最需要的就是那些少數(shù)派所擁有的數(shù)據(jù)。如果今天機器學(xué)習(xí)的精準(zhǔn)率達到了90%,想要讓它再達到99%的話,它需要的不是已經(jīng)學(xué)過的數(shù)據(jù),而是需要跟以前最不一樣的數(shù)據(jù)。這樣的話我們才能夠把一只丑小鴨真正變成一只美天鵝,因為丑小鴨并不是丑,只是跟別人不一樣而已。
大家對區(qū)塊鏈的認識還不是最根本的第一性原理的認識。用最基本的物理學(xué)原理來講,達到共識就是大家都同意同一個賬本,就相當(dāng)于在物理學(xué)里面磁鐵本來是雜亂無章的,但是到了鐵磁態(tài)里面它們指向的方向都是同樣的。所以達到共識在自然世界里面有,在今天的人文世界里面也有。這種現(xiàn)象叫熵減,達到共識,大家都朝一個方向的話,這個狀態(tài)的熵遠遠比雜亂無章的熵要小。但達到這個共識是非常難的,因為熵總是在增的,今天你要把它減下去是很難的事情。在區(qū)塊鏈上能達到一個共識系統(tǒng)都是用一種算法,在這上面是需要消耗能量的。
大家可能一開始不太理解為什么這件事情聽起來不合理,一些賬戶為什么要耗費能量?從物理學(xué)第二定理來講,這是非常合理的一件事情,因為達到共識本身是熵減,但整個世界的熵一定要增加,所以在達到共識的同時一定要把另外一些熵排除出去。這種沒有中心化的機制跟自然世界里面磁鐵從雜亂無章的狀態(tài)達到有序的鐵磁狀態(tài)非常相像,付出的代價也是必然的趨勢。
我另外想講的是,我們在整個人工智能領(lǐng)域需要學(xué)界和產(chǎn)業(yè)界做緊密的聯(lián)系,在學(xué)界有最好的物理、最好的數(shù)學(xué)和算法的發(fā)現(xiàn)和發(fā)明。
2018年1月8日,我非常榮幸在人民大會堂被授予了中華人民共和國國際科技合作獎。在我們整個世界中,科學(xué)是最無止境、最沒有國界的,今天我們所要解決的人工智能、量子計算都是整個人類的問題。所以我們的眼光不要放在自己的局部,而是放眼全球。在這個過程中,中國也有一個非常大的機遇,中國除了把應(yīng)用科技做得好,能不能有真正原創(chuàng)科技的產(chǎn)生也是很關(guān)鍵的一點。
今天跟大家介紹的這些都是最基本的物理和最基本的數(shù)學(xué)原理,這些原理聽起來比較抽象,比如熵增原理、正負電子。但在最基本的層次上,這正是今天這個世界的奇妙所在,它能夠給整個IT行業(yè)提供最基本的科學(xué)技術(shù)發(fā)展的前景。