" 陳小平:中國科學(xué)技術(shù)大學(xué)教授,中國科學(xué)技術(shù)大學(xué)機(jī)器人實(shí)驗(yàn)室主任、廣東省科學(xué)院人工智能首席科學(xué)家、中國人工智能學(xué)會(huì)人工智能倫理與治理工委會(huì)主任、CAAI Fellow。獲中科大“杰出研究校長獎(jiǎng)”、機(jī)器人世界杯冠軍、最佳論文獎(jiǎng)、行業(yè)年度十大科技進(jìn)展及其他國內(nèi)外學(xué)術(shù)榮譽(yù)20余項(xiàng)。
回顧人工智能的發(fā)展,特別是考慮大型語言模型的出現(xiàn),盡管人工智能在過去70多年中取得了巨大的進(jìn)步,但它始終遵循著奠基者圖靈和其他先驅(qū)者所提出的基本原理,這就是機(jī)器智能的另類性。
到底什么是人工智能?怎么理解人工智能?人們通常將“人工”和“智能”這兩個(gè)概念的常識(shí)性理解結(jié)合起來,形成對(duì)人工智能的常識(shí)性理解。然而,圖靈在1950年發(fā)表的著名論文中第一個(gè)自然段,就否定了這種字面意義上的理解??梢哉J(rèn)為圖靈的一個(gè)重要理由是——任何科學(xué)技術(shù)不應(yīng)局限于常識(shí)概念。以牛頓力學(xué)為例,它并非基于物理常識(shí),而是基于四條基本原理,即牛頓運(yùn)動(dòng)三定律和萬有引力定律。通過數(shù)學(xué)和邏輯推理,從四條基本原理可以推導(dǎo)出牛頓力學(xué)的所有定理。
在圖靈的機(jī)器智能觀中,首先有一個(gè)潛在的假說,可以通過計(jì)算機(jī)即圖靈機(jī)來模仿人的智能行為,如推理、決策、學(xué)習(xí)等功能的組合。但是,他并沒有直接使用假說這個(gè)詞,為什么呢?因?yàn)?,如果把這句話當(dāng)作一個(gè)假說,就犯了一個(gè)錯(cuò)誤,也就是他一開始就否定的那個(gè)錯(cuò)誤,即用常識(shí)性概念來定義機(jī)器智能。因此,他通過圖靈測試來替代圖靈假說。圖靈測試本身包含許多內(nèi)容,但并沒有完全表達(dá)出圖靈的真實(shí)想法。圖靈的真實(shí)想法是通過圖靈測試來證明他的假說是否成立。在1948年的報(bào)告中,圖靈認(rèn)為,機(jī)器智能的工作原理可以與人類智能的工作原理相同,也可以不同。我將這種相同稱為“原理模擬”,而將不同稱為“功能模仿”。這是圖靈關(guān)于機(jī)器智能的一個(gè)基本觀點(diǎn),正是這個(gè)觀點(diǎn)決定了機(jī)器智能的另類性。
根據(jù)圖靈機(jī)器智能觀進(jìn)一步分析后,我認(rèn)為每一種智能原理都有其先天的局限性,因此是不同的智能,不同的智能不會(huì)完全等同。所以,不必焦慮機(jī)器智能完全取代人類智能。但是,機(jī)器智能能夠取代人類的大量工作,這才是真正值得重視的問題。
既然人工智能的原理與人類智能的原理不同,那么它的原理究竟是什么?每當(dāng)開發(fā)出一個(gè)人工智能系統(tǒng)比如大模型,它就有一套相應(yīng)的原理。這些原理是什么?是否突破了智能的傳統(tǒng)邊界?人們?cè)撊绾伟盐账鼈??這些問題非常重要。
根據(jù)對(duì)大模型底層原理的分析,我提出了一個(gè)科學(xué)假說,稱之為LC假說。當(dāng)時(shí)支持這一假說的證據(jù)較少,然而自從在學(xué)術(shù)期刊上發(fā)表后,深度測試越來越多,而且大部分深度測試結(jié)果都支持這一假說。大量深度測試結(jié)果表明,傳統(tǒng)的科學(xué)理論、數(shù)學(xué)、計(jì)算機(jī)科學(xué)以及傳統(tǒng)人工智能中的強(qiáng)力法,都是基于概括性和強(qiáng)共識(shí)性的。這表明,人工智能研究已經(jīng)超越了科學(xué)技術(shù)的傳統(tǒng)邊界,已經(jīng)步入了“無人區(qū)”。
大模型技術(shù)體系主要包括三大塊:一是預(yù)訓(xùn)練;二是后訓(xùn)練;三是激發(fā)(通常稱為提示)。通過分析,我發(fā)現(xiàn)這三個(gè)部分中有兩個(gè)部分共享一個(gè)共同的基礎(chǔ)設(shè)施或基本機(jī)制,即關(guān)聯(lián)度預(yù)測。
從類LC的三條公理出發(fā),經(jīng)過邏輯和數(shù)學(xué)推導(dǎo),可以得出關(guān)聯(lián)度預(yù)測的一些基本性質(zhì)。其中一個(gè)性質(zhì)被稱為實(shí)例性或語境糾纏性。這個(gè)性質(zhì)意味著,大模型的底層機(jī)制具有語境糾纏性。然而抽象運(yùn)算如計(jì)數(shù)和邏輯否定不是語境糾纏的,比如一個(gè)文本里有27個(gè)“~”,這個(gè)數(shù)目不受文本里其他符號(hào)的影響,不會(huì)由于文本里其他符號(hào)的改變而變多或變少。這是所有抽象運(yùn)算的一個(gè)基本特性。然而大模型卻無法確保正確地實(shí)現(xiàn)抽象運(yùn)算,因?yàn)樗臄?shù)學(xué)原理決定了它必然是語境糾纏的。此外,大模型在奇偶性、因果關(guān)系和反思能力等方面也存在同樣的問題。
事實(shí)上,圖靈在1948年的報(bào)告里就指出,機(jī)器的行為和這些行為給人的感覺都是“智能”的組成部分,這恰恰構(gòu)成了智能的復(fù)雜性。分析表明,大模型的這一表現(xiàn)證明了圖靈在1948年的判斷是正確的。
工業(yè)革命的核心是機(jī)器在許多特定領(lǐng)域中替代了人類的體力勞動(dòng)。這些機(jī)器的體力功能并不是通用的,而是專用的,但它們?nèi)〈巳祟惖拇罅矿w力工作,引發(fā)了工業(yè)革命。我在《企業(yè)改革與發(fā)展》2024年11期的文章中提出了一個(gè)觀察:工業(yè)革命之所以成功,依賴于熊彼特經(jīng)濟(jì)閉環(huán)。這個(gè)閉環(huán)的運(yùn)作機(jī)制是:隨著生產(chǎn)力的提升,機(jī)器數(shù)量增多,而機(jī)器的增多又需要更多的人來操作,這導(dǎo)致就業(yè)增加;就業(yè)增加后,工資隨之增長;工資增長又帶動(dòng)消費(fèi)增長;消費(fèi)增長創(chuàng)造了更大的市場;而更大的市場需求又刺激生產(chǎn)力進(jìn)一步提升。這樣就形成了熊彼特經(jīng)濟(jì)閉環(huán)。由此可見,工業(yè)革命的邏輯簡單明了。
那么,智能革命的特點(diǎn)又是什么呢?預(yù)期在許多特定的領(lǐng)域中,機(jī)器不僅在體力功能上超越人類,而且在智力功能上也超過人類,于是大多數(shù)機(jī)器不再需要人的操縱,這是根本性的不同。人們常常擔(dān)心通用人工智能帶來的問題,其實(shí)不必?fù)?dān)心,因?yàn)閷S玫娜斯ぶ悄軓?qiáng)大到一定程度之后,問題就已經(jīng)出現(xiàn)了。一旦大量專用智能機(jī)器超過多數(shù)人的能力,熊彼特經(jīng)濟(jì)閉環(huán)就不再成立,即生產(chǎn)力的提升不再帶來更多的就業(yè)機(jī)會(huì)。如果真是這樣,那么未來世界就會(huì)發(fā)生根本性變化。
人工智能將如何重塑人類的文明?我將這個(gè)想法表達(dá)在《企業(yè)改革與發(fā)展》文章的最后一段話中:“工業(yè)革命向智能革命的過渡將導(dǎo)致‘科技進(jìn)步’向‘科技重塑’的變遷。智能革命不是用更強(qiáng)大的技術(shù)手段,在舊世界里展開更殘酷的內(nèi)卷,而是顛覆舊世界、再造新世界。人類面臨的最大課題是:通過智能革命,重新塑造一個(gè)什么樣的新世界?”
近年來,中國在人工智能和大模型研究中進(jìn)步很快,取得了一大批成果,但主要集中在技術(shù)創(chuàng)新方面。對(duì)于大模型這樣的大型AI系統(tǒng),工程創(chuàng)新比技術(shù)創(chuàng)新的作用更大。工程創(chuàng)新需要以應(yīng)用為導(dǎo)向,組織實(shí)施大量技術(shù)創(chuàng)新并組合技術(shù)創(chuàng)新成果,以實(shí)現(xiàn)大模型性能的較大提升。在大模型的工程創(chuàng)新方面,國內(nèi)一些企業(yè)進(jìn)行了積極探索,取得了很好的進(jìn)展。
科學(xué)導(dǎo)報(bào)記者楊洋根據(jù)錄音整理