李偉
人工智能(AI)直接讀取思維已不再是科幻小說中的情節(jié),而是正在成為現(xiàn)實(shí)。AI“讀心”可以讓我們更好地了解大腦的工作原理,也可以為一些臨床診斷和治療提供新的手段。
據(jù)英國(guó)《自然》雜志報(bào)道,美國(guó)得克薩斯大學(xué)的科學(xué)家在大型語(yǔ)言模型(LLM)的助力下,開發(fā)出一種“讀心機(jī)”,雖然它不能直接讓人“說真話”,但可以將大腦活動(dòng)轉(zhuǎn)換成清晰的圖像或語(yǔ)句呈現(xiàn)出來。這種借助AI的“讀心機(jī)”打破了人們的認(rèn)知。
“讀心”即“思維解碼”,是指直接從大腦中提取和解析思維的過程。這個(gè)過程涉及神經(jīng)元活動(dòng)模式的識(shí)別,以及將這些模式與特定的思維或感知相關(guān)聯(lián)。
美國(guó)得克薩斯大學(xué)奧斯汀分校的研究人員開發(fā)的系統(tǒng),名為語(yǔ)義解碼器,它是一種新型AI系統(tǒng),只需分析功能磁共振成像(fMRI)數(shù)據(jù),就可以通過非侵入性方式將參與者大腦中所想的語(yǔ)句甚至圖像呈現(xiàn)出來。
fMRI設(shè)備
值得一提的是,該系統(tǒng)部分依賴于大型語(yǔ)言模型,而這種模型正是AI聊天軟件 ChatGPT 的基礎(chǔ)。AI可以利用機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等算法,從大量的訓(xùn)練數(shù)據(jù)中找到大腦活動(dòng)與思維內(nèi)容之間的關(guān)聯(lián)規(guī)律,并根據(jù)這些規(guī)律來預(yù)測(cè)或重建未知的思維內(nèi)容。假設(shè)我們想要從一個(gè)人的大腦活動(dòng)中重建他看到或想象的圖像,可以先讓這個(gè)人觀看一些圖像,同時(shí)記錄他的大腦活動(dòng)數(shù)據(jù)。然后讓AI學(xué)習(xí)這些圖像和受測(cè)者大腦活動(dòng)數(shù)據(jù)之間的對(duì)應(yīng)關(guān)系,從而建立一個(gè)模型。最后,AI可以用這個(gè)模型根據(jù)受測(cè)者新的大腦活動(dòng)數(shù)據(jù),生成與之匹配的圖像或語(yǔ)句。
在模型訓(xùn)練階段,科學(xué)家讓受測(cè)者躺在fMRI設(shè)備中,在接受fMRI掃描的同時(shí),從耳機(jī)中聽取播客故事。研究人員利用基于GPT-1的大型語(yǔ)言模型,將受測(cè)者fMRI數(shù)據(jù)顯示的大腦活動(dòng)與播客故事的語(yǔ)言特征聯(lián)系起來。
受測(cè)者分階段聽了十幾小時(shí)播客故事后,就進(jìn)入模型應(yīng)用階段。研究人員讓他聽一個(gè)全新的故事,然后讓語(yǔ)義解碼器根據(jù)受測(cè)者的大腦活動(dòng)輸出語(yǔ)句,描述其聽到的故事。實(shí)驗(yàn)結(jié)果顯示,該系統(tǒng)能夠根據(jù)受測(cè)者的fMRI數(shù)據(jù),描述出他聽到的故事。雖然準(zhǔn)確率達(dá)不到100%,但語(yǔ)義解碼器能讀出受測(cè)者大腦中思考的故事大意。
除了可以將語(yǔ)音解讀出來外,這個(gè)系統(tǒng)還能解碼視頻、圖像。研究人員讓受測(cè)者觀看一段沒有語(yǔ)音及文字的動(dòng)畫視頻,然后語(yǔ)義解碼器可以根據(jù)受測(cè)者的大腦活動(dòng)輸出語(yǔ)句,描述視頻的內(nèi)容。
這項(xiàng)研究的主導(dǎo)者,得克薩斯大學(xué)奧斯汀分校神經(jīng)科學(xué)和計(jì)算科學(xué)教授胡斯表示,語(yǔ)義解碼器須一對(duì)一量身定制。受測(cè)者要經(jīng)過一段時(shí)間的訓(xùn)練——既是訓(xùn)練自己,也是訓(xùn)練解碼系統(tǒng)。在接受解碼時(shí),受測(cè)者要保持靜止?fàn)顟B(tài),并將精神集中在他正在聽的故事上,這樣該系統(tǒng)才能真正發(fā)揮作用。研究團(tuán)隊(duì)曾對(duì)沒有接受過任何訓(xùn)練的受測(cè)者進(jìn)行測(cè)試,其解碼結(jié)果與實(shí)際情況相差甚遠(yuǎn)。
得克薩斯大學(xué)的這項(xiàng)研究并非全球首例。盡管還不能完全解碼人類的思維,但各國(guó)的研究人員在這方面持續(xù)發(fā)力,并不斷取得進(jìn)展。
2021年5月,瑞士洛桑聯(lián)邦理工學(xué)院(EPFL)的研究團(tuán)隊(duì)開發(fā)出利用AI從大腦信號(hào)中解碼視頻畫面的方法。首先,受測(cè)者觀看一些視頻片段,解碼系統(tǒng)記錄他們的大腦信號(hào)數(shù)據(jù)。然后,研究人員用一個(gè)基于卷積神經(jīng)網(wǎng)絡(luò)(CNN)的模型,將數(shù)據(jù)轉(zhuǎn)換成視頻畫面的特征向量。最后,由一種名為圖像生成網(wǎng)絡(luò)(IGN)的技術(shù),對(duì)這些特征向量進(jìn)行優(yōu)化和修復(fù),得到清晰的視頻畫面。
導(dǎo)出腦部信號(hào)
今年3月,日本京都大學(xué)的科學(xué)家使用AI成功解碼人們看到或在大腦中想象的圖像,以及他們正在聽或者想象的語(yǔ)句。京都大學(xué)的研究人員表示:“我們提出了一種新的圖像重建方法。圖像的像素被優(yōu)化,使其深層的神經(jīng)網(wǎng)絡(luò)特征與人類大腦活動(dòng)的多個(gè)層面相似?!?/p>
該技術(shù)的核心在于:當(dāng)人們觀察一幅圖像時(shí),會(huì)在腦海中復(fù)刻這幅圖像。AI通過特定的算法將受測(cè)者大腦中的fMRI信號(hào)和圖像的深度神經(jīng)網(wǎng)絡(luò)特征相關(guān)聯(lián),繼而訓(xùn)練出可以讀取人類思維的能力。
需要強(qiáng)調(diào)的是,目前的研究大多依賴于粗糙的大腦成像技術(shù)和有限的數(shù)據(jù)。因此,這類系統(tǒng)能解碼的思維種類和精確度都比較有限。此外,延時(shí)也是一個(gè)有待解決的問題。儀器與人的交互、讀取和處理信息都需要時(shí)間。而且,不同的人大腦活動(dòng)方式有差異,這對(duì)于系統(tǒng)的適應(yīng)能力也是一個(gè)不小的挑戰(zhàn)。
現(xiàn)有的解碼器工作時(shí),需要受測(cè)者躺在特定的儀器中,且保持靜止,這樣才能收集到可靠的數(shù)據(jù)。這種苛刻的要求是該系統(tǒng)推廣和應(yīng)用的障礙。
隨著大腦成像技術(shù)的發(fā)展和更多的數(shù)據(jù)可用,科學(xué)家有望訓(xùn)練出能解碼更復(fù)雜、更精細(xì)思維的AI。這不僅能使我們更深入地了解大腦和思維的運(yùn)作模式,也將開啟全新的交流方式。
不過,AI直接讀取思維還需要更多的科學(xué)依據(jù)和技術(shù)支持。目前,AI只能解碼一些簡(jiǎn)單的思維內(nèi)容,而對(duì)于復(fù)雜和抽象的內(nèi)容,則還沒有有效的解讀方法。此外,AI還需要更高效和精確的大腦監(jiān)測(cè)儀器,以及數(shù)據(jù)分析方法,以加快解碼的速度,并提高準(zhǔn)確度。
能讀取思維的AI必然帶來一系列道德和倫理問題。例如,誰有權(quán)“訪問”某個(gè)人的思維?如何保護(hù)“思維隱私”?這些都是在開發(fā)這項(xiàng)技術(shù)時(shí)必須面對(duì)和解決的問題。
解碼系統(tǒng)捕捉大腦中血液變化情況
胡斯教授表示,現(xiàn)階段不必?fù)?dān)心該技術(shù)會(huì)對(duì)人類隱私帶來威脅,因?yàn)槊看巍白x心”實(shí)驗(yàn)的成功都需要受測(cè)者高度配合。“如果你不想被機(jī)器讀取你的思維,那么可以通過‘走神來建立無懈可擊的屏障?!?/p>
“不斷評(píng)估大腦解碼器對(duì)人類心理隱私的影響,這是至關(guān)重要的。”研究者杰瑞·唐博士說。他指出,目前的研究結(jié)果顯示,該技術(shù)尚不能應(yīng)用于侵犯?jìng)€(gè)人心理隱私的活動(dòng)。
AI“讀心”在醫(yī)學(xué)領(lǐng)域的應(yīng)用更值得關(guān)注。例如,利用AI讀取思維,可以幫助失語(yǔ)癥患者恢復(fù)語(yǔ)言交流能力,給那些因疾病而喪失說話能力的患者帶來新的希望,甚至幫助植物人恢復(fù)意識(shí)。
編輯:姚志剛? winter-yao@163.com