qiuyuanyang @ 126.com
2023年5月,紐約聯(lián)邦法院上演了戲劇性的一幕:律師提交的法律文書(shū)包含了6個(gè)由ChatGPT杜撰的法律判例。這個(gè)標(biāo)志性事件揭開(kāi)了人工智能發(fā)展歷程中的重要課題——A幻覺(jué)現(xiàn)象。
所謂A幻覺(jué)(AHallucination),指的是人工智能系統(tǒng)在生成內(nèi)容時(shí),產(chǎn)生的看似合理但實(shí)際上錯(cuò)誤、虛構(gòu)或不存在的信息。這些內(nèi)容可能表現(xiàn)為編造事實(shí)、虛構(gòu)數(shù)據(jù)、引用不存在的文獻(xiàn),甚至創(chuàng)造出邏輯矛盾的描述。
A幻覺(jué)在主流的各種問(wèn)答式A中都有表現(xiàn)。當(dāng)初ChatGPT震撼問(wèn)世時(shí),就曾出現(xiàn)過(guò)邏輯清晰地證明9是質(zhì)數(shù)的錯(cuò)誤,而被馬斯克稱(chēng)為“地球上最聰明的A”的Grok3也在“比較9.9和9.11大小”時(shí)出錯(cuò)。當(dāng)然,在這個(gè)經(jīng)典A陷阱面前翻車(chē)的還有大名鼎鼎的ChatGPT—4o和Gemini。“人類(lèi)認(rèn)為最容易的,恰是A最難實(shí)現(xiàn)的?!比粘?wèn)題也同樣面臨A的幻覺(jué):我向A詢(xún)問(wèn)一個(gè)不出名的地點(diǎn)如何到達(dá),查閱不到準(zhǔn)確資料的A竟然編造虛假信息,并信誓旦旦地為我導(dǎo)航;當(dāng)用一個(gè)截圖向三個(gè)A詢(xún)問(wèn)一個(gè)關(guān)于圖形旋轉(zhuǎn)的幾何問(wèn)題時(shí),其中一個(gè)給出了錯(cuò)誤結(jié)論,并在我的反駁中堅(jiān)持已見(jiàn),我不得不拿出另外兩個(gè)A的正確解法給它,它才承認(rèn)自己的錯(cuò)誤,并主動(dòng)分析出錯(cuò)的原因。當(dāng)我們注視著A聊天界面流暢輸出的文字時(shí),是否意識(shí)到在這些看似邏輯嚴(yán)密的回答中,可能暗藏著機(jī)器認(rèn)知的海市蜃樓呢?
圖靈獎(jiǎng)得主楊立昆今年3月在美國(guó)聯(lián)合數(shù)學(xué)會(huì)議上尖銳地指出:“自回歸大語(yǔ)言模型(LLM)注定淘汰!用預(yù)測(cè)下一個(gè)詞的方法造AG,就像用算盤(pán)登陸火星!”自回歸模型的核心邏輯是根據(jù)前文預(yù)測(cè)下一個(gè)詞(Token),這種機(jī)制的致命缺陷就是,每個(gè)預(yù)測(cè)的微小誤差都會(huì)隨著文本生成呈指數(shù)級(jí)爆炸。深度神經(jīng)網(wǎng)絡(luò)的數(shù)十億參數(shù)編織著獨(dú)特的認(rèn)知圖景,Transformer架構(gòu)的自注意力機(jī)制將訓(xùn)練數(shù)據(jù)中的語(yǔ)義碎片編織成連貫文本,在賦予A強(qiáng)大創(chuàng)造力的同時(shí),也埋下了幻覺(jué)的種子:當(dāng)上下文關(guān)聯(lián)超過(guò)模型理解閾值時(shí),系統(tǒng)會(huì)啟動(dòng)概率補(bǔ)償機(jī)制,用統(tǒng)計(jì)學(xué)最優(yōu)解填補(bǔ)認(rèn)知空白。
大語(yǔ)言模型通過(guò)上千億Token的語(yǔ)料庫(kù)學(xué)習(xí)人類(lèi)表達(dá)范式,但數(shù)據(jù)中的偏見(jiàn)、錯(cuò)誤與時(shí)代局限性都被編碼進(jìn)模型參數(shù),形成認(rèn)知烙印。若訓(xùn)練數(shù)據(jù)中類(lèi)似問(wèn)題未被充分覆蓋或標(biāo)注,模型可能無(wú)法正確歸納,從而強(qiáng)行拼圖,在語(yǔ)義補(bǔ)全沖動(dòng)下制造出邏輯自洽的合理虛構(gòu)。這也反映了當(dāng)前A模型的一個(gè)局限性,即依賴(lài)大量數(shù)據(jù)和特定訓(xùn)練,而缺乏真正的常識(shí)推理能力。類(lèi)似問(wèn)題還有A生成人物圖片時(shí)經(jīng)常出現(xiàn)的6根手指。
在醫(yī)療咨詢(xún)場(chǎng)景中,某A系統(tǒng)曾給出“糖尿病可用胰島素鼻腔噴霧治療”的虛假方案,這種專(zhuān)業(yè)領(lǐng)域的幻覺(jué)輸出可能造成嚴(yán)重后果。教育領(lǐng)域同樣面臨挑戰(zhàn),如學(xué)生提交的A生成論文中頻繁出現(xiàn)“幽靈引用”,這種現(xiàn)象會(huì)摧毀知識(shí)傳播的信任基礎(chǔ),增加A普及的隱性社會(huì)代價(jià)。
為了對(duì)抗A幻覺(jué),眾多A公司正努力構(gòu)建可信A的進(jìn)化圖景:DeepSeek的混合專(zhuān)家系統(tǒng)(MoE)通過(guò)動(dòng)態(tài)路由機(jī)制,將問(wèn)題分配給專(zhuān)業(yè)子模型處理,相比傳統(tǒng)Transformer架構(gòu)可將事實(shí)錯(cuò)誤率降低 40 % ;OpenAI的“過(guò)程監(jiān)督”系統(tǒng)對(duì)推理鏈進(jìn)行逐步驗(yàn)證,這種培養(yǎng)式訓(xùn)練使GPT-4的邏輯嚴(yán)謹(jǐn)性提升3倍;谷歌的PaL-X模型通過(guò)視頻幀序列分析驗(yàn)證文本描述的真實(shí)性,這種跨模態(tài)糾錯(cuò)機(jī)制將幻覺(jué)發(fā)生率壓縮至 0 . 3 % 以下;IBM的Neuro-SymbolicA將深度學(xué)習(xí)與知識(shí)推理分離又整合,在保持創(chuàng)造力的同時(shí)實(shí)現(xiàn)邏輯可驗(yàn)證。
在這場(chǎng)人機(jī)共生的認(rèn)知革命中,A迷之自信的幻覺(jué)正是技術(shù)黎明期的成長(zhǎng)陣痛,標(biāo)記著技術(shù)進(jìn)化的必經(jīng)階段,其最終將走向更可信、更具人文關(guān)懷的人工智能未來(lái)。