當(dāng)DeepSeek系列大模型實現(xiàn)了低成本機器自主反思能力時,我們正在見證一個劃時代的轉(zhuǎn)折點:理性思維,這項人類曾藉以凌駕于萬物之上的專有能力,這項某種程度上并非人人都擁有的稀缺能力,正在經(jīng)歷前所未有的大眾化進程。
人人都可以借助大模型實現(xiàn)專業(yè)性思維,進而獲得更加優(yōu)質(zhì)的決策與服務(wù),這樣的場景日益成為現(xiàn)實。AI的“思維工業(yè)化”正在將認知勞動的生產(chǎn)效率推向指數(shù)級增長。這種顛覆性變革不僅意味著全社會總體思維效率與品質(zhì)的提升,同時也在逼問人類思維的價值所在。
反思是人類思維的本質(zhì)。人類理性的集中體現(xiàn)就在于其反思能力——對思考本身的思考。這種自我指涉(self-reference,是一個邏輯學(xué)概念。通俗來說,一個主體在描述自己,叫做自我指涉)的認知結(jié)構(gòu)構(gòu)成了文明進步的基石:從柏拉圖洞穴隱喻到笛卡爾的“我思故我在”,從科學(xué)范式的轉(zhuǎn)換到技術(shù)革命的突破,每個關(guān)鍵躍遷都伴隨著對既有思維框架的深度反思。正是這種不斷自我質(zhì)疑、自我修正的能力,使人類突破生物本能局限,構(gòu)建出復(fù)雜社會系統(tǒng)與先進文明。
當(dāng)AI開始展現(xiàn)類似的反思特性時,我們實際上是可能在創(chuàng)造一種具備人類理性思維水平、能夠持續(xù)突破認知邊界的新型智能體,這種突破將重新校準人類在宇宙文明中的位置。
借助AI 所生成的思維過程,我們有機會進一步認清人類的認知與決策過程?!皩?,我就是像AI 這樣想的”,可能會成為未來人與人交流復(fù)雜問題求解思路的常態(tài)。
近期生成式AI的最新進展OpenAI o1以及Deepseek-R1(以下簡稱o1和R1)本質(zhì)上實現(xiàn)了機器主動反思能力,且達到甚至超越了部分行業(yè)人類專家思維的水平。尤其是在理工科的數(shù)學(xué)與代碼等領(lǐng)域,AI的思維水平已經(jīng)接近甚至超越了人類中頂尖專家水平。相較于此前生成式AI的系列進展,o1與R1的進展是又一次革命性的突破。人類的大多數(shù)智力活動,不僅僅是無意識的生成,更多的是有意識思考后的生成。
此前的大模型雖然也能一定程度上模擬人類的思維能力,但仍以被動思維為主——由人類將某項任務(wù)的思維過程以思維鏈的形式明確地提示給大模型以指導(dǎo)其生成過程。經(jīng)過思維鏈增強的大模型生成過程一定程度上實現(xiàn)了約翰·杜威筆下的機械性思維,也就是不假思索的直覺式、機械式思考。
但這種水平的思維在柏拉圖眼里看來只是一種工匠水平的思考。對一個技藝嫻熟的工匠而言,只需瞄上一眼原料,就能以近乎直覺的方式形成相應(yīng)的打磨方案。與工匠的思維方式相對立的是人類的反思性思維,是人類中的大師思維方式。大師和工匠的根本區(qū)別在于大師能夠借助人類語言進行有意識的、反思性的思考并且能清晰表達其思維過程,從而在人類文明傳承過程中扮演著傳播文明火種的角色。
因此,人類思維的難能可貴之處恰恰在于反思性思維。約翰·杜威甚至認為培養(yǎng)兒童的反思性思維正是人類教育的根本所在。當(dāng)AI實現(xiàn)了反思性思維,也就意味著AI向人類中的“精英”“大師”靠近了一步。
深度反思并非隨機發(fā)散的心理活動,而是遵循特定認知架構(gòu)的精密過程。人類的反思具有復(fù)雜結(jié)構(gòu)。針對不同的問題,人類往往需要借助不同的思維結(jié)構(gòu),比如決策樹、語義網(wǎng)絡(luò)、邏輯規(guī)則,并在這些思維結(jié)構(gòu)上進行思維的遍歷、跳轉(zhuǎn)、循環(huán)或分枝操作,對最優(yōu)方案進行搜索、評估、選擇,對探索過程進行剪枝、合并、壓縮,對歷史經(jīng)驗進行歸納、總結(jié)、提煉與升華。
此前的大模型只具備人類的直覺生成能力,而o1與R1在大模型生成能力基礎(chǔ)之上進一步植入了人類水平的結(jié)構(gòu)化思維能力。結(jié)構(gòu)化思維(或者說反思)的核心是評估,也就是評估當(dāng)前生成是否正確,是否需要嘗試新的思考路徑,可能方案中哪一個才是最為經(jīng)濟有效的,諸如此類等等。
我們看到R1已經(jīng)能夠做到對問題進行充分反思與評估以形成解題思路(或者回答策略),之后再行生成。這個過程中的關(guān)鍵之處都在于如何合理評估,對當(dāng)前生成內(nèi)容的質(zhì)量評估,對R1思維過程的評估。
如果反思很昂貴,這種能力就只能束之高閣,而R1則將機器的反思能力平民化。o1雖然率先實現(xiàn)了生成過程中的反思,但受限于高昂的算力成本,其產(chǎn)品價格昂貴,總體上只有極少數(shù)人能夠窺得機器反思能力的真實表現(xiàn)。R1則借助技術(shù)突破實現(xiàn)了AI反思的平民化,R1的API調(diào)用費用是o1的近1/30,DeepSeek基礎(chǔ)模型則完全開源。
我們曾擔(dān)心先進AI技術(shù)成為新型數(shù)字鴻溝,更擔(dān)心AI技術(shù)霸權(quán)的出現(xiàn)。DeepSeek先進大模型的開源無疑是對以商業(yè)閉源為主的技術(shù)模式的有力一擊;最為先進AI思維能力的平民化與普惠應(yīng)用,無疑對消弭AI時代的數(shù)字鴻溝產(chǎn)生巨大貢獻。這就不難解釋Deepseek短時間就引起全球關(guān)注,引發(fā)海嘯般的討論,并注定會對我國乃至全球AI產(chǎn)業(yè)發(fā)展進程產(chǎn)生深遠影響。
先進生產(chǎn)力的本質(zhì)是先進勞動力,而先進勞動力的關(guān)鍵是先進的思維能力。人與人之間的差異從根本上來講取決人的思維水平的差距,所謂“勞心者治人”就是道出古人對強大思維能力的追求。從古代神話思維到古希臘的邏輯思維,再到現(xiàn)代各種紛繁的科學(xué)思維,人類思維水平的提升是推動社會發(fā)展的重要動力。
從結(jié)繩記事,到文字發(fā)明,再到算盤,本質(zhì)上都是人類思維工具的進步。如今,AI成為了人類思維的新工具,AI本身直接就成為數(shù)字勞動力的大腦。所謂人類的進步,何嘗不是人類思維能力與思維工具的進步。所謂文明的繁榮,本質(zhì)就是思維產(chǎn)物——人類思想的繁榮。如果說ChatGPT成就了人類內(nèi)容生產(chǎn)能力的爆發(fā),那么R1則可能成就人類思想生產(chǎn)能力的爆發(fā)。
現(xiàn)代社會是建立在專業(yè)性思維基礎(chǔ)之上的。隨著社會分工的細化,隨著科技發(fā)展與深化,再也沒有亞里士多德似的通才人物?,F(xiàn)代社會早就是個代理型社會。兒童教育不再是私塾,而是從小學(xué)到大學(xué)門類眾多、分工明確的龐大教育體系。我們的身體需要來自不同??漆t(yī)生的診斷與建議。法律、金融、保險,甚至日常生活中的健身、美容、旅游都要各類專業(yè)代理忙碌在我們身邊。每一位專業(yè)代理憑借其出色的專業(yè)思維能力為我們提供專業(yè)的咨詢與服務(wù)。
如今,AI有望實現(xiàn)各行業(yè)的專業(yè)思維,或者說將專業(yè)思維這個較高的門檻拉低。每個人都可以擁有各行業(yè)的專業(yè)AI顧問。通過R1我們可以廉價地獲取各類專業(yè)咨詢與信息服務(wù)。已經(jīng)有越來越多的人在使用R1給出的個性化健康建議。R1對于千行百業(yè)的意義正在于實現(xiàn)各行業(yè)專家的專業(yè)思維,從而成為具備專業(yè)思維能力的AI智能代理。這為緩解專家資源稀缺帶來全新機遇。
當(dāng)思考變得透明,我們得以窺見那些原本只在腦海深處悄然運行的推理鏈條。人類的思維大部分隱藏在無意識之中,無數(shù)神經(jīng)元在瞬間通過腦神經(jīng)機制所發(fā)生連接傳遞著信息、運轉(zhuǎn)著思索。靈感往往就在于神經(jīng)突觸的一次電光火石般的偶然鏈接。人類無數(shù)偉大發(fā)明都有著相似的頓悟瞬間。人類思維本質(zhì)上是一種“直覺優(yōu)先+后天解釋”的思考。一個有經(jīng)驗的專家往往是在看到案例的瞬間,基于長期的經(jīng)驗與潛意識就已經(jīng)完成了決策,再從記憶中索取相關(guān)理論、框架、約束、案例,對決策結(jié)果進行理性的、反思性的、細致而緩慢的求證、解釋與驗證。在其做出直覺決策的瞬間,即便思考者本人,也難以完整追溯自己的思維路徑。
人類數(shù)千年的文化與哲學(xué)中,都曾無數(shù)次討論過“思維的隱秘性”與“靈魂的獨特性”。而當(dāng)R1的邏輯流程可以完整展現(xiàn)時,這種隱秘的魅力與神秘感似乎瞬間被剝離得一干二凈。當(dāng)思維變得透明,人類社會發(fā)展的一系列重大問題迎來新機遇。人類的很多努力與嘗試其實都是在應(yīng)對思維的隱性過程而帶來的麻煩。
如今,人與人之間的溝通與理解、人類文明的傳承,都將因為AI將人類思維過程顯性化而受到深遠影響。借助AI所生成的思維過程,我們有機會進一步認清人類的認知與決策過程?!皩Γ揖褪窍馎I這樣想的”,可能會成為未來人與人交流復(fù)雜問題求解思路的常態(tài)。
思維的透明性也會給人類帶來巨大挑戰(zhàn)。機器的思維是一種“解釋優(yōu)先”的形式,是一種“先思后行”的形式。而人類更多的則是反思,是對已經(jīng)做出的決策與行為的反思。所謂“知行合一”的前提就是對于“行”的持續(xù)性反思,是基于持續(xù)的實踐反饋而進行的思維持續(xù)提升。
我們需要清醒認識到機器生成的思維過程可能與人類的真實思維過程相去甚遠。人類的思維過程遠比機器當(dāng)前做到思維形式更復(fù)雜且隱秘。我們要小心,不要將機器的思維過程強加于人類。比如未來將機器思維應(yīng)用在法律審判輔助系統(tǒng)中,AI所提供的“透明思維”可能會掩蓋人類法官對文化、情感、倫理等隱性維度的考量。
更危險的是,當(dāng)人類開始用機器的解釋框架反哺自身思維時,可能引發(fā)機器對人類的“認知奴役”。我們要小心“AI思維”對直覺思維中所體現(xiàn)出的創(chuàng)造力的侵蝕。人類思維中的靈光乍現(xiàn)才是真正難能可貴的。
機器思維有著過度思考的傾向,不加節(jié)制的AI思考能力濫用只會帶來過度的理性社會。當(dāng)我們隨意一句提問“今晚吃什么”,機器則可能從營養(yǎng)學(xué)、個人健康狀況、本地生鮮市場、用餐場景、情感訴求生成包含十多個維度的決策矩陣。而事實上個人的本意可能只是螺螄粉與方便面之間的簡單二元選擇。
當(dāng)過度思考成為常態(tài),理性與邏輯的嚴苛要求不期然地侵入了每個日常場景。大多數(shù)時候,人們只需要一種帶有個體偏見、片段信息但又透露出某種獨特味道的回答。這樣的回答雖然并不完美,卻正是人類復(fù)雜情感、文化背景和主觀經(jīng)驗的結(jié)晶,構(gòu)成了所謂的“缺陷之美”。正是日常生活中那種散亂而富有溫度的思考,承載著個體經(jīng)驗的真實與鮮活。
當(dāng)R1系統(tǒng)被要求續(xù)寫《紅樓夢》后四十回時,其生成的文本雖然符合敘事邏輯與人物設(shè)定,卻終究缺少“寒塘渡鶴影,冷月葬花魂”的詩意留白。機器思維完美無瑕的嚴謹性在某種意義上卻剝奪了人們對那種“瑕疵美”的期待。它不再是那個因偶然錯誤、片段遺落而顯得獨特而可親的思考,而是成為一種機械、過于完美的“透明化”存在。
是絕對理性還是詩意生活,人類再次面臨關(guān)鍵抉擇?;蛟S人機協(xié)同、優(yōu)勢互補才是可取之道。人類可以繼續(xù)保留那種帶有偏見與不完美的思考方式,賦予情感和溫度;而AI則能在關(guān)鍵時刻以全局視角、無遺漏的信息整合來補充我們的短板,實現(xiàn)更加精準和深邃的判斷。絕對理性不應(yīng)該是人類未來,情感與溫度才是人性內(nèi)在的根本需求。
如果AI生成只是內(nèi)容完美,大多數(shù)人只會驚嘆其結(jié)果。但是當(dāng)R1將生成背后的思考過程也完美展示,則恐會強烈刺激人類的自信。AI內(nèi)容生成早已真假難辨,思維過程加強下的生成更是增加了其可信性。R1生成內(nèi)容已經(jīng)到了很多專家自嘆不如的地步。從其生成結(jié)果中識別問題與錯誤也越加困難。這種困難只會隨著AI的進步而與日俱增。相反,人類的評價與鑒賞能力即便在AI助力下也沒有得到顯著的進步。AI日益專業(yè)、全面、深入、嚴謹?shù)乃季S,只會使人類更多地陷入自我懷疑的漩渦。久而久之,不假思索地采納機器決策似乎會變成常態(tài)。這種常態(tài)注定蘊含著巨大風(fēng)險。我們必須預(yù)防此種風(fēng)險,我們必須提防在關(guān)鍵場景向AI讓渡人類自主決策權(quán)的危險傾向。
如果進一步深入R1 的實現(xiàn)細節(jié),可能會發(fā)現(xiàn)一些“ 細思恐極” 的真相。
AI的能力突飛猛進,人類如何在AI面前保持對人類能力的自信,而不是墮入日益沉重的“卑微”中呢?如果進一步深入R1的實現(xiàn)細節(jié),可能會發(fā)現(xiàn)一些“細思恐極”的真相。R1有一個版本叫做R1-zero,它擺脫了有監(jiān)督微調(diào)范式,而僅使用強化學(xué)習(xí)策略,僅根據(jù)生成結(jié)果是否最終正確等微弱的反饋信號,就能從自發(fā)枚舉生成的解題方案與回答策略中評估并選擇出最優(yōu)方案與策略。從R1所展示出的思維過程來看,這些思維過程是超越普通人甚至人類專家水平的。如果AI的思維能力依賴人類的監(jiān)督或者說指導(dǎo),我們尚可維持居高臨下的從容——終究是人類在把控AI的方向盤。但是,R1技術(shù)路線證明一個強大的基礎(chǔ)模型只需要強化學(xué)習(xí)策略就能實現(xiàn)AI強思維能力所需的自主評估與反思。似乎人類的監(jiān)督與指導(dǎo)越少,AI所習(xí)得的思維能力越是強大。要不了多久,AI有可能發(fā)現(xiàn)更多的新穎解題思路,越來越多的“神之一手”與“驚訝時刻”(即R1自主發(fā)現(xiàn)的所謂的aha moment)會在未來發(fā)生。
難道人類的全部意義只是在于啟動AGI(通用人工智能)這個注定到來的超級智能形態(tài)?AI技術(shù)越是發(fā)展、AI應(yīng)用越是普及,類似的困惑只會越加強烈。
當(dāng)AI學(xué)會了人類的思維,人的發(fā)展將日益凸顯而成為人類文明延續(xù)與發(fā)展的根本問題。迎接AI挑戰(zhàn)的關(guān)鍵在于重塑人類的心理學(xué)與教育學(xué)。唯有重建人類內(nèi)在強大的心理能力,才能應(yīng)對AI發(fā)展所帶來的巨大挑戰(zhàn)。所謂內(nèi)圣才能外王、根深才能葉茂,只有內(nèi)心世界的篤定與強大,才能抵御未來AI所營造的紛繁復(fù)雜的外部世界所帶來的不安與躁動。人類需要重塑價值體系,要為人重新定位其存在價值,要為人類文明重新校準其宇宙時間長河中的使命。或許就像AI所生成的,AI時代人類獨特價值應(yīng)該重新定位在“不完美之美”(缺陷創(chuàng)造可能性)、“必死之悟”(有限性催生意義)、“困惑之智”(不確定性孕育洞察)以及“無為之境”(留白蘊含無限),人類應(yīng)該認知升維,而不是與AI競速競效。
未來,我們要重塑為工業(yè)時代而生的傳統(tǒng)教育體系,我們需要培養(yǎng)“駕馭AI”“超越AI”的人才,要精心呵護人類所獨具的“不可計算的心智特性”,要培養(yǎng)能夠在AI時代保持獨立思考、創(chuàng)造力和人性光輝的新人類,要培養(yǎng)能夠在AI的狂飆突進中依然保持優(yōu)雅挺立姿態(tài)的新人類。我們要密切關(guān)注人的發(fā)展問題。隨著AI在教育中應(yīng)用的深入,人的學(xué)習(xí)效率前所未有的提升,每個個體都有了繼承全部人類過往知識與技藝的可能。
未來無處不在的AI勢必會改變傳統(tǒng)的需要獨立思考才能獲取答案的學(xué)習(xí)與成長環(huán)境。太過廉價的AI思考能力以及AI在教育中的盲目濫用,很可能導(dǎo)致學(xué)習(xí)者對AI思維與認知能力的依賴,從而阻礙個體獨立思考甚至整個心智能力的發(fā)展。或許在AI教育應(yīng)用中我們應(yīng)該堅持AI的最少干預(yù)原則,也就是在充分發(fā)揮AI在教育中提質(zhì)提效的正面作用的前提下,盡可能少地改變青少年的學(xué)習(xí)與成長環(huán)境。
如果說學(xué)校環(huán)境我們還可以通過立法或者行政手段進行有意控制,那么個體發(fā)展所依賴的社會環(huán)境被全面AI化似乎是個無法改變的趨勢。社會環(huán)境的核心內(nèi)涵是家庭與社會關(guān)系。同樣,AI的社會應(yīng)用也應(yīng)該堅持最少干預(yù)原則,在提升社會生產(chǎn)力的同時,盡可能少地干預(yù)家庭生活與社會事務(wù),以維持舊日的家庭與社會關(guān)系,也為社會包括教育的緩慢轉(zhuǎn)型與適應(yīng)留下充足時間。
機器能夠低成本地思考,注定是人類文明發(fā)展進程中的重大歷史事件之一,其影響必將伴隨著AI應(yīng)用的日益廣泛而在社會生產(chǎn)生活的方方面面逐漸釋放。或許正像DeepSeek對本文的總結(jié):機器思考的廉價化不是文明終章的前奏,而是人類認知的第二次直立行走。
(作者肖仰華系復(fù)旦大學(xué)計算機科學(xué)技術(shù)學(xué)院教授、博導(dǎo),上海市數(shù)據(jù)科學(xué)重點實驗室主任)
注釋:
洞穴隱喻, 古希臘哲學(xué)家柏拉圖的洞穴隱喻是他在《理想國》中提出的一個著名哲學(xué)概念,旨在闡述人類認識世界的局限性和追求真理的艱難過程。
約翰· 杜威(JohnDewey,1859 - 1952年),美國著名哲學(xué)家、教育家、心理學(xué)家。他認為人類的思維分為兩類: 一類是機械性思維,一類是反思性思維。