■徐英瑾
人工智能專題【三篇】
【編者按】國務(wù)院不久前印發(fā)的《新一代人工智能發(fā)展規(guī)劃》,從戰(zhàn)略態(tài)勢、總體要求、重點任務(wù)、資源配置、保障措施和組織實施共六個方面,為我國人工智能的發(fā)展指出明確的方向并做出科學(xué)的規(guī)劃,在社會各界引起巨大反響和熱烈討論。為此,我刊組織三篇以人工智能為主題的文章,從不同角度闡發(fā)人工智能的發(fā)展已經(jīng)或可能出現(xiàn)的問題。徐英瑾指出當代人工智能主流算法存在的缺陷,應(yīng)該從伽達默爾對“成見”的理解中汲取思想資源,并主動吸納心理學(xué)關(guān)于捷思法的研究成果,這對具體的科學(xué)問題提供的哲學(xué)參考;蔡恒進長期從事軟件教學(xué)與研究,不僅指出人工智能發(fā)展的關(guān)鍵是找到“認知坎陷”,還對其必需的人文環(huán)境和教育模式給出了實質(zhì)性建議;高奇琦、張結(jié)斌則從政治學(xué)視角對人工智能可能帶來的失業(yè)問題提出前瞻性意見。三篇文章從微觀到宏觀,既有對現(xiàn)有科學(xué)問題的考察,又有對未來社會問題的關(guān)切,充分體現(xiàn)了人工智能的發(fā)展是一項復(fù)雜的系統(tǒng)工程,需要我們高度重視,并充分思考其對方方面面的深度影響。
伽達默爾的“成見”觀、捷思法與人工智能
■徐英瑾
伽達默爾;成見;捷思法;人工智能
按照通常人的理解,人類設(shè)計人工智能系統(tǒng)的初衷之一,就是利用這些系統(tǒng)運作的 “客觀性”,來消除人類決策過程中難以避免的種種偏見或者成見。譬如,根據(jù)大多數(shù)人的期望,人工智能系統(tǒng)應(yīng)當能夠幫助人類法官在審理案件的過程中更好地檢查證據(jù)鏈的融貫性,或者量刑的合適性,以免人類的主觀偏見使得判案出現(xiàn)偏差,等等。但是,從哲學(xué)角度看,這樣的俗常見解預(yù)先已在所謂“主觀成見”與所謂“客觀見解”之間劃下了楚河漢界,并在此基礎(chǔ)上賦予了前者以負面價值。然而,這樣的預(yù)設(shè)是否經(jīng)得起哲學(xué)的仔細推敲,則依然值得深入探討。
德國哲學(xué)家伽達默爾(Hans-Georg Gadamer)在其名著《真理與方法》中便明確地挑戰(zhàn)了上述預(yù)設(shè):
在理性的絕對自我構(gòu)造的觀念下,被表現(xiàn)為“有限制的前見”的東西,其實屬于歷史實在本身。如果我們想要正確地對待人類的有限的歷史的存在方式,那么我們就必須為“前見”概念根本恢復(fù)榮譽,并承認合理的前見的存在。[1](P355)
這里需要指出的是,伽達默爾在此所說的“前見”,就是平時我們所說的“成見”或者“偏見”。但為了肅清觀察賦予“成見”一詞的種種負面情緒,他寧可使用平時人們較少使用的“前見”一詞,其德文為“Vorurteil”,其中“vor”這個前綴表示“前”,而“Urteil”這個詞干表示“判斷”。不過,由于“Vorurteil”的拉丁文形式為“prae-judicium”,而后者的在英文中的對應(yīng)詞正好是“prejudice”(即漢語中所說的“成見”直接對應(yīng)的英文詞),因此,在下文的正面敘述中,筆者將不再區(qū)分“前見”與“成見”這兩個提法。
有的讀者或許會說,僅僅用不那么帶有貶義的“前見”來替換帶有更多貶義的“成見”,就想徹底“洗白”我們對于“成見”的種種負面看法,這樣的論證恐怕很難服人。然而,更為認真地閱讀《真理與方法》的文本,卻可以使我們確信,在伽達默爾的上述引文背后,其實至少有兩個論證來支持他的觀點。下面便是筆者根據(jù)自己的理解,對伽達默爾相關(guān)思想的重構(gòu)。
論證一:1.任何詮釋活動都必須依賴于一些自身不需要被反復(fù)檢驗的前提,否則相關(guān)的詮釋活動都無法避免“元語言層面上解釋資源不足”的困境;2.如果我們按照啟蒙主義者的要求,對所有詮釋活動的前提都按照理性的最高標準加以檢驗的話,那么我們就不得不陷入“元語言層面上解釋資源不足”的困境;3.所以,為了避免陷入上述困境,我們就不能認為所有的前見都是有問題的;4.但我們也必須承認:某些詮釋活動的結(jié)果的確是錯誤的,而其之所以錯誤,就是因為它所依賴的前提是錯誤的;5.所以,出于立論穩(wěn)妥性的考慮,我們就必須承認:至少有一部分所謂“成見”是豁免于理性檢驗程序的審查的。
論證二:1.個體理性是有局限性的(譬如,在知識范圍、推理能力與決策時間方面的種種局限);2.所以,“訴諸集體智慧”就是在個體理性遭遇“決策信息資源不足”問題時不可避免地采用的一種策略;3.集體智慧本身就往往是“歷史權(quán)威”的代名詞;4.因此,個體的社會人對于權(quán)威的接受本身,就是某種“認可集體智慧”的社會心理機制作用的結(jié)果,并且是為了應(yīng)對個體決策資源不足而不得不采取的措施——而并不像偏狹的啟蒙主義者認為的那樣,意味著對于理性的全面拋棄;5.這種對于權(quán)威的接受活動本身就意味著“前見—成見”的最根本來源;6.所以,對于“前見—成見”的采取,乃是個體為了應(yīng)對資源不足問題而不得不采取的措施。
在筆者看來,伽達默爾的上述觀點(嚴格來說,是筆者所重構(gòu)的伽氏觀點)雖然沒有直接涉及今日如火如荼的人工智能研究,卻在客觀上觸及了任何人工智能系統(tǒng)的設(shè)計都難以回避的兩個問題。
第一,系統(tǒng)運行的原始數(shù)據(jù)的來源問題。我們知道,任何計算系統(tǒng)的運作都需要人類社會“喂入”初始數(shù)據(jù),而這些數(shù)據(jù)很難不體現(xiàn)特定工作領(lǐng)域人類的“權(quán)威”或者“成見”。換言之,如果任何個體人類的詮釋活動都無法脫離“成見”而存在(這是前述“論證一”所指出的),那么,對于以任何一種技術(shù)路徑為依托的人工智能系統(tǒng)而言,其運作也無法脫離人類成見的預(yù)先介入,故而,從某種意義上說,人工智能系統(tǒng)只是人類成見的“自動加工器”而已。由此看來,向機器“喂入”怎樣的成見以使得其后續(xù)運作的產(chǎn)出能夠符合人類用戶的需求,也便成為所有的人工智能系統(tǒng)設(shè)計者都必須面對的一個重要課題。
第二,系統(tǒng)自身的運行資源有限性問題。具體而言,無論是運算能力如何強大的人工智能系統(tǒng),它依賴的信息資源與計算資源都是有限的,因此,一個足夠智慧的系統(tǒng)就應(yīng)當能夠根據(jù)某種既定的“捷思法”,以便從既有的歷史資源——即伽達默爾所說的“權(quán)威”——中獲得啟發(fā),以最終減少系統(tǒng)的計算負擔(關(guān)于“捷思法”的討論詳后)。從這個角度看,前述“論證二”對于人類個體之理性有限性的提示,就具有了一種兼及人造機器的普遍性意義。
不過,盡管伽達默爾對于“成見”重要性的辯護具有向人工智能系統(tǒng)設(shè)計的領(lǐng)域延伸的潛在價值,對于大多數(shù)的人工智能工作者來說,伽達默爾的詮釋學(xué)依然是一種相對陌生的思想資源。同時,由于伽達默爾本人的文本寫作方式過于依賴純粹人文領(lǐng)域內(nèi)的學(xué)術(shù)經(jīng)典,他對二戰(zhàn)后認知心理學(xué)對于其立論的某種潛在的“補充說明”作用,也缺乏相應(yīng)的自覺。而依據(jù)筆者淺見,伽達默爾立論中最為粗疏之處,便是忽略了:(甲)決策資源相對匱乏的社會個體在訴諸“集智”時,其實并不總是按照某種單一的路徑來紓解信息匱乏的問題的——相反,可能會導(dǎo)致具有不同算法特征的不同“捷思法”在不同語境中被激活;(乙)某種更為廣泛的“集智”也將包含單個的信息處理系統(tǒng)自身的微觀運行歷史,而伽達默爾的立論則過分強調(diào)來自社會共同體的集體權(quán)威與社會共同體的宏觀運作歷史。從這個角度看,要將伽達默爾的哲學(xué)洞見與人工智能研究的工程學(xué)實踐相互打通,我們還需要一個中介理論層面的介入,這就是認知心理學(xué)對于所謂“捷思法”的研究。這也就構(gòu)成了本文討論的基本路線圖:先通過深挖心理學(xué)界對于“捷思法”的研究的哲學(xué)意義來夯實伽達默爾的“成見”觀的經(jīng)驗內(nèi)容,再反過來“拷問”人工智能的現(xiàn)有研究路徑。
在專業(yè)的理論心理學(xué)研究中,“成見”并不是一個被廣泛使用的術(shù)語。一個與之密切相關(guān)的術(shù)語是“捷思法”,英文為“heuristic”,有“發(fā)現(xiàn)”、“找到”的意思。需要指出的是,盡管這個詞在中國現(xiàn)行的大多數(shù)心理學(xué)與人工智能文獻中都被譯為“啟發(fā)式算法”,但依據(jù)筆者淺見,這個譯法不如“捷思法”更能抓住英文原詞的真正含義。非常粗略地說,“捷思法”就是某些特定的推理竅門,以便幫助信息處理系統(tǒng)能夠在資源相對匱乏的情況下也可以給出問題的答案。雖然這些竅門一方面既不能保證其運作符合邏輯與概率論的要求,另一方面也并不保證輸出的解是“最優(yōu)解”,但在吉仁澤(Gerd Gigerenzer)等心理學(xué)家看來,“捷思法”的存在能夠使相關(guān)的信息處理系統(tǒng)以最節(jié)儉的方式輸出適應(yīng)性的行為,因此其存在是符合自然選擇的原理的(我們知道,自然選擇并不關(guān)心生物體的信念是否是精確的,而只關(guān)心其信念是否能夠滿足其生存的需要)。①
而“捷思法”之所以與我們前面討論的“前見—成見”相關(guān),也恰恰是因為它與“前見—成見”一樣,均由于強調(diào)“節(jié)儉性”而或多或少地違背了啟蒙主義者對理性思維的種種規(guī)范性要求(因為對于這些規(guī)范的全面落實,往往會逼迫智能體以更不“節(jié)儉”的方式付出更大的計算資源)。此外,種種“捷思法”的存在本身,也為個體在決策匱乏的情況下汲取“集智”或“社會權(quán)威見解”提供了具體的心理操作路徑。
為了更直觀地說明“捷思法”的特點,筆者將詳細討論三種經(jīng)常在心理學(xué)文獻里提到的“捷思法”,并分別提示它們各自與規(guī)范理性要求之間的張力。
錨定捷思法大體是指這樣一種心理現(xiàn)象:人們往往依賴對事物的第一印象來作出決策,卻對有關(guān)該事物的后續(xù)情報表示相對的麻木,或即使作出了某些偏離于被錨定印象的策略調(diào)整,調(diào)整的幅度也要小于正確決策所需要的幅度。站在啟蒙主義者的立場上看,“錨定效應(yīng)”顯然是種種不合理偏見的一個重要源泉,因為該效應(yīng)無法使決策者根據(jù)環(huán)境的變化迅速調(diào)整決策的方向,并由此陷入各種推理陷阱。比如,商家先將某種汽車的初始定價定得很高,以便為消費者設(shè)定某種“錨定效應(yīng)”,爾后再削價讓消費者更容易接受新價格——盡管新價格可能依然是超出了商品自身的價值。很顯然,正是因為錨定效應(yīng)的存在,才使得消費者更容易注意到離原價格較近的新標價,而不是離原價更遠的商品實際價格。更有甚者,心理學(xué)家特沃斯基(Amos Tversky)與卡內(nèi)門(Daniel Kahneman)還根據(jù)心理學(xué)測試的結(jié)果指出:“錨定效應(yīng)”使得被試者在計算長數(shù)列的乘積時,更容易注意到數(shù)列中的前幾個數(shù)字而忽略數(shù)列中的后幾個數(shù),并由此在估算乘積總數(shù)的測驗中獲得低分。[2]②
然而,只要我們調(diào)整一下自身的評價坐標系,啟蒙主義者對錨定效應(yīng)的這種批評意見就未必站得住腳了。我們不妨將問題反過來想:如果一個智能體不使用錨定捷思法,那么其信息處理進程又當是如何的呢?答案就只有一個了:在得到汽車的任何一次報價后,始終期待著下一次報價,并忽略每次報價之間的先后關(guān)系。但在筆者看來,在決策的時間資源不足的情況下,這樣的決策方式并不能帶來決策系統(tǒng)對于環(huán)境的“適應(yīng)性”。我們不妨再來假設(shè)這樣一種情況:汽車經(jīng)銷商的每次報價之間的時間間隔是1分鐘,而且總的報價次數(shù)是10次。這樣的話,一種不受錨定效應(yīng)影響的信息處理系統(tǒng),必須花費至少10分鐘才能夠完成關(guān)于“是否接受出價”的決策。但如果系統(tǒng)得到的決策時間只有5分鐘的話,這樣的系統(tǒng)顯然沒有辦法完成相關(guān)的決策任務(wù)。與之相對比,基于錨定捷思法而運作的決策系統(tǒng),卻完全可能在如此巨大的時間壓力下完成類似的任務(wù),盡管其輸出的解未必是最優(yōu)解,但這總比沒有任何輸出要好。
啟蒙主義者可能會辯駁說,對于錨定效應(yīng)的依賴,分明已經(jīng)讓不少人在市場上受到了奸商的誆騙,或在計算數(shù)列時給出了錯誤得離譜的答案。難道一種得到啟蒙精神滋養(yǎng)的成熟心靈,就應(yīng)當甘于受到種種基于錨定效應(yīng)的社會愚弄機制的操控嗎?
對此,筆者的意見是,在市場上受到虛假報價的愚弄當然不是什么好事,但考慮到如下兩個理由,筆者并不認為,對于這些愚弄的擺脫,需要我們付出拋棄以錨定效應(yīng)為代表的種種認知成見的代價。理由(甲):利用錨定效應(yīng)而去誤導(dǎo)受眾認知的社會機制,是在人類特定歷史發(fā)展階段而出現(xiàn)的新事物,而在此之前,在漫長的人類演化史中,錨定效應(yīng)已經(jīng)幫助人類解決了與生存有關(guān)的各種決策問題。因此,僅僅因為某種心理學(xué)效應(yīng)可能產(chǎn)生的負面效果而否認其產(chǎn)生的整體利益,乃是不明智的。理由(乙):在實際生活中,對于汽車實際價格的了解,其實并不是來自于啟蒙主義者看重的某種毫無成見滲入的客觀計算,而是依然來自于特定專業(yè)領(lǐng)域內(nèi)的“權(quán)威見解”。而對于這種權(quán)威見解的消化過程,很可能也帶有某種更深層次的錨定效應(yīng)。比如,某位汽車界業(yè)內(nèi)人士的對于某款汽車的內(nèi)部報價,也會在聽者那里產(chǎn)生錨定效應(yīng),并由此使得其從經(jīng)銷商那里聽到的報價造成的心理效應(yīng)被大大沖淡了。由此看來,那些在市場上能夠作出更多正確決策的成功人士之所以成功,很可能也并不是因為他們的決策過程并沒有受到錨定效應(yīng)的影響,而是因為,由于純粹的偶然原因,第一次進入他們心智的情報的確具有較高的情報價值。
大致而言,在這種捷思法的幫助下,如果心理主體被要求對兩個事件的發(fā)生概率進行評估的話,那個相關(guān)示例更容易在記憶中被喚起的事件,往往更容易受到心理主體的偏好。譬如前面所提到的特沃斯基與卡內(nèi)門,提出的另一個在認知心理學(xué)文獻中廣為引用的案例。如果懂英文的人被問及這樣一個問題:“在英文單詞中,以字母‘k’開頭的單詞多,還是以字母‘k’為第三個字母的單詞多?”大多數(shù)被試者都會認定“以字母‘k’開頭的單詞多”,盡管實際答案是“以字母‘k’為第三個字母的單詞多”。而大多數(shù)被試者之所以那么想,顯然是因為“以字母‘k’為第一個字母的單詞”更容易在記憶中被喚起。[3]而在新聞媒體的運作中,不少從業(yè)人員也利用這種捷思法設(shè)置思維陷阱,誘使公眾認為那些更具“新聞價值”的事件要比其實際上更具普遍性。
對于該捷思法的產(chǎn)生機制,不同的學(xué)者有不同的看法。譬如,特沃斯基與卡內(nèi)門就在前面引用的關(guān)于單詞數(shù)量估計的實驗報告中認為,“以字母‘k’開頭的單詞”的數(shù)量之所以被大多數(shù)被試者高估,就是因為在歷史上,他們實際調(diào)用此類單詞的頻率的確比較高。而施瓦茨(Robert Schwarz)等人則給出了不同的診斷意見。在他們看來,對于相關(guān)事項的信息提取的難易度才是使得“以字母‘k’開頭的單詞”勝出的關(guān)鍵因素:因為它們顯然要比“以字母‘k’為自身第三個字母的單詞”更容易被提取到工作記憶之中。[4]
不過,無論對這種捷思法的哪一種解釋是正確的,啟蒙主義者肯定不會在健全的理性思維方式中為基于“可獲取性”的心智算法預(yù)留空間。其理由也是非常明顯的:在他們看來,這樣的算法會引導(dǎo)我們對于事件發(fā)生的概率作出錯誤的估計,并由此配置錯資源。比如,醫(yī)療部門就可能由于受到此種捷思法的影響,低估某些不那么容易想到的疾病風(fēng)險,并由此作出對公眾整體健康前景不利的決策。啟蒙主義者或許還會補充說:哪些事項更容易在記憶中被喚起,乃是一個非常偶然的心理學(xué)現(xiàn)象,僅僅從這種偶然的線索出發(fā)就作出對于世界的實際狀態(tài)的評估,實在是太不負責了。
對于啟蒙主義者的這種見解,筆者的回應(yīng)是:“偶然性”并不是心智構(gòu)架中可以被完全排除的因素。具體而言,如果一個心智系統(tǒng)的長期記憶地址儲藏的信息數(shù)量已經(jīng)遠遠超出其工作記憶的最大容量,那么,這樣的智能系統(tǒng)就必須具有某種特定的算法,以便只把長期記憶庫中與當下任務(wù)有“相關(guān)性”的信息引入其工作記憶池。很顯然,在特定的時間壓力下,為了判斷長期記憶庫中的哪些信息與當下任務(wù)“相關(guān)”、哪些又“不相關(guān)”,系統(tǒng)就只能按照系統(tǒng)運作的內(nèi)部特征來確立相關(guān)的篩選標準。譬如,根據(jù)相關(guān)事項在歷史上被調(diào)用的頻率,或根據(jù)調(diào)用這些事項的簡易程度。但顯而易見的是,系統(tǒng)內(nèi)部的運作邏輯與外部世界的運作邏輯之間存在天然的差異,對于外部世界而言,這些經(jīng)由系統(tǒng)內(nèi)部運行歷史而形成的內(nèi)部參數(shù)的配置顯然帶有某種“偶然性”。但反過來看,若沒有任何一種武斷的、偶然的內(nèi)部信息篩選標準,系統(tǒng)也就無法在浩瀚的信息海洋中找到方向,進而也就無法對外界作出任何回應(yīng)。由此我們甚至可以設(shè)想:倘若我們?yōu)榱硕沤^各種偶然因素的“干擾”,而強制一個信息處理系統(tǒng)在不依賴“可獲取性”的捷思法的前提下去進行推理活動,那么,這個信息系統(tǒng)的工作進程又將如何呢?很顯然,在面對“在英文單詞中,以字母‘k’開頭的單詞多,還是以字母‘k’為第三個字母的單詞多”這樣的問題時,啟蒙主義者偏好的那類信息處理系統(tǒng),只能傻乎乎地將兩類字母從頭到尾都數(shù)一遍,此類工作需要的時間資源與信息資源,顯然都是驚人的。
當然,面對筆者的這種批評,啟蒙主義者或許會這樣繼續(xù)為自己辯白說:“這樣的信息處理過程固然耗時,但總比倉促地得出一個明顯的錯誤結(jié)論來得好。”但這里必須要提出的一個更深的問題是:對于面臨巨大生存壓力的先民而言,知道“以字母‘k’為第三個字母的單詞”的數(shù)量,的確多于“以字母‘k’為首的單詞”,到底有什么價值呢?從概率論角度看,這樣的問題顯然都涉及對于兩類對象的“基礎(chǔ)比率”的比對問題(所謂基礎(chǔ)比率,就是指一類對象在所有統(tǒng)計學(xué)對象中占據(jù)的百分比),因此它涉及的只是某種非常抽象的知識罷了。但生存斗爭首先是關(guān)于個體及其行動的,而上述這類抽象知識除非通過某些“中項”的過渡機制而進入實踐推理,否則就難以兌現(xiàn)為個體的實際行動,并由此增強其適應(yīng)性。
為了理解這一點,我們不妨再來思考一個與“估字母數(shù)”的案例平行,但更具演化論氣息的新案例:對于一個原始人的生存而言,他更需要獲知的是“被蚊子叮咬而死的原始人是否多于被劍齒虎攻擊的原始人”這一問題的答案,還是“到底是被劍齒虎攻擊更容易死,還是被蚊子叮咬更容易死”這一問題的答案呢?很明顯,前一問題采用了基本比率的格式后,后一問題則采用了后驗概率的格式,一個理智正常的原始人顯然應(yīng)該對后一個問題的答案更感興趣,因為對于前一個問題的知識,其實是無法指導(dǎo)原始人在面對真實的劍齒虎時該怎么做的(這又是因為:“劍齒虎所吃掉的人占據(jù)的基本比率”的高低,在數(shù)值上無涉于“在遇到劍齒虎攻擊后原始人的生存率”的高低)。從這個角度看,基于“可獲取性的”心智算法之所以會在面對“估單詞數(shù)量”這樣的任務(wù)時“出丑”,恐怕也是因為這樣的任務(wù)已經(jīng)脫離了自然選擇面對的原始環(huán)境,而不具有與人類生存的直接關(guān)聯(lián)性了。
根據(jù)該心智算法,如果兩個對象對主體而言,一個是比較熟悉,而另一個則難以辨識,那么,更容易被辨識者就會被估測為具有更高的價值。下面的心理學(xué)測驗,則為這種捷思法的運作提供了具體的案例。假設(shè)有這樣一張考卷,考卷上有一列由美國城市名字構(gòu)成的對子,如“史普林菲爾德—舊金山”、“芝加哥—小石城”,等等??忌娜蝿?wù),便是從每個對子里找出城市居民比較多的那個城市(在此期間任何考生不允許參考任何書籍以及網(wǎng)絡(luò)上的相關(guān)信息),考官則根據(jù)考生的答對率進行判分?,F(xiàn)在我們將考生的考卷分為兩組:中國學(xué)生的答卷與美國學(xué)生的答卷。你猜哪一組的平均分會更高一點呢?
很多人都會認為美國的學(xué)生考分會高一點,因為在他們看來,美國學(xué)生總要比中國學(xué)生更熟悉美國城市的情況。然而,這個看法其實是有失偏頗的。作為一個大國,美國的行政區(qū)劃以及相關(guān)的人口情況異常復(fù)雜,即使是一般的美國人,也僅僅是“聽說過”不少城市的名字而已,并不太清楚所有城市的人口規(guī)模。而作為中國學(xué)生,事情就要相對簡單一點。他們做題的時候遵循的是一條非常簡單的“捷思法”:凡是中國人容易辨識出的美國城市,一般都是大城市,而大城市一般人口就多??傊鎸蓚€城市的名字“二選一”的時候,選那個看起來眼熟的地名就是了。而或許讓人感到驚訝的是,這種看似“簡單粗暴”的解題思路,成功率卻相當了得。譬如,德國心理學(xué)家吉仁澤與其合作伙伴真做了這個實驗,由于他是德國人,他當然是以德國大學(xué)生——而不是中國大學(xué)生——作為美國大學(xué)生的對照組,結(jié)果發(fā)現(xiàn),德國學(xué)生的平均成績明顯要比美國學(xué)生好;而當別的研究者以“兩個英國足球隊中的哪一個會在聯(lián)賽中獲得更好的成績”為問題,分別測試土耳其的學(xué)生和英國本土的學(xué)生后,他們同樣驚訝地發(fā)現(xiàn):答案正確率高的,再一次是相對不熟悉英國本土情況的土耳其人。[5](P43-44)簡言之,將正面的屬性(如人口多、體育強等)指派給你相對熟悉的地名,便是在上面的實驗中德國學(xué)生與土耳其學(xué)生得以打敗其美英本土競爭者的“制勝捷思法”。
關(guān)于辨識的捷思法的存在,無疑對啟蒙主義者的理性觀提出了更大的挑戰(zhàn),因為與前幾種捷思法不同,人類對此類捷思法的運用,并沒有導(dǎo)致明顯的錯誤輸出。更值得玩味的是,對于此類捷思法的使用體現(xiàn)出某種“多即少”(more is less)的效應(yīng),即“知道的多,反而猜對的少”。啟蒙主義者的理性觀顯然是難以解釋這種“多即少”效應(yīng),因為在啟蒙主義者看來,“多獲取各方面的情報”恰恰就是避免主觀偏見的有效途徑。而依據(jù)基于個體信息處理資源之有限性的考量,這種“多即少”效應(yīng)卻很容易得到解釋:當一個人對某個對象O有比較豐富(但卻遠遠談不上完整的)知識的時候,“可辨識度”這一指標就會被淹沒在大量的其他指標中,而失去了“第一向?qū)А钡淖饔?。在這種情況下,被試者就不得不對大量指標與目標屬性之間的關(guān)聯(lián)進行逐一排查,由此即降低了信息處理的效率(這是由考慮的參數(shù)增多引起的),又降低了信息處理結(jié)果的品質(zhì)(這是由于考慮的參數(shù)彼此之間的沖突引起的)。
由于篇幅的限制,在本節(jié)中正面涉及的“捷思法”便主要是以上這些。③現(xiàn)在,我們有必要從一個更抽象的角度來評估這三種“捷思法”的共性,這就是:三者都是對系統(tǒng)內(nèi)部運行的歷史都有一種間接表征,并由此在一定程度上體現(xiàn)了系統(tǒng)的運行過程中的“歷史智慧”。具體而言,在錨定捷思法中,第一印象的時間優(yōu)先性本身就意味著某種微觀意義上的歷史權(quán)威;而在關(guān)于“可獲取性”的捷思法中,某種通過調(diào)用數(shù)據(jù)的既有習(xí)慣構(gòu)成的歷史路徑,則成為指導(dǎo)心理主體調(diào)取當下數(shù)據(jù)的隱蔽歷史權(quán)威;與之類似,在關(guān)于“辨識”的思捷法之中,心理主體對于被辨識對象的辨識歷史,則構(gòu)成了其猜測相關(guān)對象之內(nèi)在價值的主要依據(jù)。換言之,上述捷思法在人類思維中的廣泛運用,恰恰證明,人類是一種依據(jù)從歷史累積而成的思維習(xí)慣,從而與“未來之不確定性”進行戰(zhàn)斗的智慧存在者。
從一個更宏觀的角度來看,心理學(xué)界對上述這些捷思法的研究成果,既印證了前節(jié)提及的伽達默爾的“成見”觀,又對其作出了有力的補充,相互印證之處體現(xiàn)在,二者都對人類個體的理性有限性以及其對于歷史權(quán)威的依賴性,作出了重要的提示;而捷思法研究對于伽氏之論的補充價值,則又體現(xiàn)于此類研究揭示的一個要點:在人類共同體的集體智慧與個體的實時決策活動之間,決策個體的自身的心理史必然會起到某種重要的中介作用。譬如,在錨定捷思法中,來自社會群體一端的某種權(quán)威信息,很可能就是以“錨定印象”的方式進入個體的心理運作歷史,并對后繼的相關(guān)決策活動產(chǎn)生影響。從這個角度看,在伽氏的論述框架中初步呈現(xiàn)出來的“社會—個體”二元關(guān)系,還需要通過認知心理學(xué)話語框架的重述機制,而進一步細化為某種自上而下的四層結(jié)構(gòu):社會權(quán)威(群體歷史)、心理架構(gòu)對于社會信息的提取裝置、個體心理習(xí)慣(個體歷史)、當下決策活動。很明顯,在這種四層次結(jié)構(gòu)中,本節(jié)提到的種種“捷思法”,便為個體與集體智慧意義上的歷史權(quán)威之間的聯(lián)系管道提供了大量的實現(xiàn)手段,同時也為種種“成見”的產(chǎn)生,提供了一種具有初步技術(shù)細節(jié)的說明。
通過上面的分析,讀者很容易產(chǎn)生這樣一種期望:通過“對于捷思法的算法化”這一重要的環(huán)節(jié),我們就可以很容易地將伽氏的哲學(xué)洞見引入人工智能的工程設(shè)計。然而,真實的情況卻并沒有這么簡單。正如下節(jié)要揭示的那樣,目下人工智能發(fā)展的令人遺憾的現(xiàn)實便是,人工智能界的主流,并沒有主動地吸納心理學(xué)界關(guān)于捷思法的研究成果。
對于筆者在上節(jié)末尾給出的這番評論,熟悉人工智能發(fā)展情況的讀者或許會感到驚訝:難道“捷思法”(heuristic)不也正是在人工智能領(lǐng)域廣泛使用的一個術(shù)語嗎?憑什么說心理學(xué)家對于捷思法的研究成果,尚且沒有被人工智能學(xué)界所廣泛吸納呢?筆者的應(yīng)答是:人工智能領(lǐng)域內(nèi)的捷思法,雖然和心理學(xué)意義上的捷思法一樣,均具有“減少信息處理系統(tǒng)計算負擔”的功能,卻并沒有真正體現(xiàn)信息系統(tǒng)處理的個體運行歷史,并在這種意義上體現(xiàn)出足夠的“心理學(xué)”意味(遑論在此基礎(chǔ)上成為引續(xù)共同體之集體智慧的“引水渠”)。下面,筆者便將通過對于相關(guān)技術(shù)案例的詳細解釋,來闡明這一論點。
在計算機科學(xué)文獻里經(jīng)常提到的一個運用捷思法的案例,乃是所謂“行銷商旅行路徑擇優(yōu)問題”(travelling salesman problem),簡稱為“TSP問題”。④這個問題是說,如果我們已知地圖上有若干個城市,以及城市兩兩之間的距離,我們又如何能夠為一個行銷商找到最短的一條路徑,使他能以某個特定城市為出發(fā)點兼回歸點,并能夠經(jīng)過所有城市呢?從數(shù)學(xué)角度看,這樣的問題帶來的計算負擔是非常大的,而為了減少此類負擔,人工智能專家就會采用一種叫 “貪婪算法”(greedy algorithm)的捷思法。[6](P414-450)“貪婪算法”的基本技術(shù)思想是,首先不去尋找問題的全局最優(yōu)解(因為這帶來海量的計算負擔),而僅僅滿足于尋找局部最優(yōu)解,并期望局部最優(yōu)解的積累可以使系統(tǒng)慢慢接近全局最優(yōu)解。將這個思路運用到TSP問題上去,由此產(chǎn)生的問題解決思路就是:從當下的城市坐標出發(fā),訪問與之最接近的一個城市坐標,即至少保證在局域環(huán)境中旅行者的行程是最短的。然后通過迭代,使得由此產(chǎn)生的旅行距離可以被延伸到更遠的城市坐標去,最終完成全局路程規(guī)劃。
雖然有研究指出貪婪算法并不能導(dǎo)致系統(tǒng)得到全局最優(yōu)解[7],但筆者批評此類捷思法的著眼點并不在此。這里更需要提醒讀者注意的,乃是此類捷思法與心理學(xué)捷思法之間的重要差異。很明顯,執(zhí)行貪婪算法的系統(tǒng)是沒有長期記憶的,它只能關(guān)注到目下的坐標周圍的那些城市坐標,并基于這種觀察機械地丈量這些坐標之間的距離,由此再機械地移動到下一個觀察點上去。因此,貪婪算法的運作并不包含著對系統(tǒng)既有運作歷史的一種哪怕最弱意義上的表征(譬如,當系統(tǒng)像蠕蟲一樣爬到第八個城市時,它已經(jīng)不記得它在第一個城市時選擇的下一個城市了)。與之相對比,一個完整意義的人類心理主體,恐怕并不是按照這種愚蠢的捷思法來運作的。人類主體在面對此類問題時更可能采取的辦法,是回憶他上次進行此類路程規(guī)劃時給出的方案(此即“錨定捷思法”),或是去更偏好那些在視覺上更為直觀的路徑規(guī)劃(此即關(guān)于“可獲取性”的捷思法),或是去偏好那些首先經(jīng)過那些更有名的城市的路徑規(guī)劃(此即關(guān)于“辨識”的捷思法)。不難看出,人類主體對于上述這些捷思法的運用,顯然已經(jīng)預(yù)設(shè)了人類的認知架構(gòu)是能夠調(diào)取長期記憶中的信息,并能夠賦予每一個城市以相關(guān)的語義的。但這樣的能力顯然是“貪婪算法”所不具備的。
那么,為何預(yù)設(shè)了人類語義與記憶機制的人類捷思法,要比“貪婪算法”更優(yōu)異呢?道理很簡單:僅僅只能反映局域坐標點之間關(guān)系的“貪婪算法”,由于一開始就放棄了對于全局情況的把握,因此最終接近全局最優(yōu)解的機會本來也就不會太大。與之相比較,“錨定捷思法”、關(guān)于“可獲取性”的捷思法與關(guān)于“辨識”的捷思法都能夠幫助心理主體提取路徑規(guī)劃的整體特征,由此“自上而下”地進行路徑優(yōu)化選擇。不難想見,如果心理主體事先就獲得的關(guān)于路徑規(guī)劃的歷史信息的確比較有價值,那么,這種“自上而下”的規(guī)劃路徑顯然就更有希望幫助主體找到全局最優(yōu)解,或至少更接近之。
那么,為何現(xiàn)有的人工智能系統(tǒng)的設(shè)計者沒有首先去將人類心理的捷思法“算法化”,而是要另起爐灶,去構(gòu)建專為機器所用的捷思法呢?其道理其實也不難想見。很多從事人工智能研究的從業(yè)者都是數(shù)學(xué)專業(yè)(而不是心理學(xué)或語言學(xué))出身,因而習(xí)慣于將各種人工智能問題視為數(shù)學(xué)問題的變種。從純數(shù)學(xué)角度上看,在平面上擺放的各個城市的確就是一個個抽象的點,它們也的確并不承載任何文化或歷史的意義。因此,在他們看來,人類捷思法預(yù)設(shè)的意義、記憶、文化與權(quán)威,既然在數(shù)學(xué)上無法處理,故而一種“干凈”的人工智能之解法就應(yīng)該將它們“約分”掉。但從心理學(xué)哲學(xué)的角度看,這樣的處理卻恰恰丟失了捷思法存在的最基本意義,即在個體富有意義的當下的決策行為與同樣富有意義的歷史信息庫之間建立溝通管道。打個比方來說,抽離了意義的捷思法,就像切斷了與自來水廠聯(lián)系的水龍頭一樣,只能成為純粹的擺設(shè)。
熟悉人工智能發(fā)展歷史的讀者或許還會辯白說,在人工智能元老司馬賀(Herbert Simon)、肖(John Shaw)和紐艾爾(Allen Newell)對于“通用問題求解器”(General Problem Solver,簡稱GPS)的設(shè)想之中[8](P256-264),研究者們既設(shè)計了“長期記憶庫”,又在記憶庫中預(yù)存了大量的“捷思法”。同時,司馬賀與紐艾爾設(shè)計GPS的初衷,便是希望系統(tǒng)自身能夠在資源有限的前提下,通過更為經(jīng)濟的方式來獲得自己的推理目標。由此看來,通過GPS規(guī)劃,心理學(xué)家對于捷思法的種種設(shè)想,已經(jīng)得到了算法化的處理。
但在筆者看來,這樣的判斷依然是粗疏的。為了說明這一點,我們不妨先來查看一下,在GPS架構(gòu)通常具有的“手段—目標”進路(means-end-analysis approach)中,捷思法究竟扮演了怎樣的角色。筆者對“手段—目標”進路的流程概述如下:
(1)先確定系統(tǒng)希望達到的理想狀態(tài)B,然后再觀察系統(tǒng)目前所面對的現(xiàn)狀A(yù)。由此,系統(tǒng)就得到了對于當下目標的刻畫:把A轉(zhuǎn)變?yōu)锽。
(2)找出A和B之間的差距D,若D目前無法克服,便確立子目標:縮小差距D。
(3)在方法庫(method store)中,搜索可以滿足子目標的捷思法Q,具體手段是:找到一個備選的捷思法,若它能通過初步的可行性測試,就將它應(yīng)用于最初的狀態(tài)A,由此給出結(jié)果A*。若它無法通過最初的可行性測試,則系統(tǒng)開始尋找下一個備選的捷思法,直到找到為止(“可行性檢測”是指,面對表征這些備選操作手段的表達式,系統(tǒng)一一加以檢測,以判斷其中哪些可滿足一個合格的操作手段所應(yīng)滿足的語義限制)。
(4)找出A*與B之間的差距D*,爾后確立新的子目標:找到差距D*。若找不到D*,任務(wù)結(jié)束。
(5)在任務(wù)沒有結(jié)束的前提下,系統(tǒng)會搜索可以滿足新的子目標的操作手段Q*,具體手段是:找到一個備選的捷思法,若它能通過初步的可行性測試,就將其應(yīng)用于狀態(tài)A*,由此給出結(jié)果A**。若它無法通過最初的可行性測試,則系統(tǒng)開始尋找下一個備選的操作手段,直到找到為止。
(6)比照A**和B,若二者無差距,任務(wù)結(jié)束。若存在差距D**,則重復(fù)上述操作,直到系統(tǒng)找到一個操作手段,直至產(chǎn)生一個與B重合的結(jié)果。
在這里特別需要關(guān)注的乃是步驟(3)。不難看出,在這個步驟中,GPS設(shè)計者提到的那些捷思法,是作為一種僵死的對象現(xiàn)成地擺放在方法庫里,而系統(tǒng)對它們的提取過程本身則完全是隨機的。與之相比較,以“辨識捷思法”為代表的人類捷思法,則首先是用以提取長期記憶中相關(guān)信息的捷思法,也就是某種用以克服上述這種“純粹的隨機性”的信息流動捷徑。順便說一句,在人類的心智架構(gòu)中,這些捷徑的形成固然受到某些偶然性因素的影響,但這種偶然性畢竟是具有歷史維度的,因而并不能被消解為純粹的隨機性。從這個意義上說,在GPS中缺乏的,實際上就是某種用以調(diào)取既有捷思法的高階捷思法,而能夠與人類捷思法對應(yīng),并由此能夠與人類的集體智慧相聯(lián)系的,恰恰就是這種高階捷思法。此外,在我們評價GPS時還需要考慮的一個因素是,上文給出的“手段—目標”進路的五個計算步驟,每完成一次運行,整個系統(tǒng)就會歸零,這也就是說,在第一個輪回中,即使系統(tǒng)發(fā)現(xiàn)方法庫中的捷思法H對于解決問題P是非常有價值的,它也不會在未來解決一個與P非常類似的新問題時去優(yōu)先考慮H,因為GPS既缺乏對于問題之間的類似性關(guān)系的高階表征能力,也不包括對于自身運行歷史的“自傳式記憶”的表征能力。
有的讀者或許還會辯白說,人工智能界完全可以不顧心理學(xué)界對于捷思法的既有研究成果,而通過某種更為簡單、粗暴的方式,以使得人類的集體智慧與人工智能系統(tǒng)相互接駁。譬如,我們可以通過“人工神經(jīng)元網(wǎng)絡(luò)”(artificial neural network,深度學(xué)習(xí)技術(shù)的基本母型)或“聯(lián)接主義”(connectionism)的計算框架,把人類的權(quán)威見解順利地復(fù)制到計算系統(tǒng)中去。
那么,人類成見究竟是如何在人工神經(jīng)元網(wǎng)絡(luò)的框架中得到體現(xiàn)的呢?要說明這一點,我們還需要對人工神經(jīng)元網(wǎng)絡(luò)的運行有一番基本的了解。非常粗略地說,神經(jīng)元網(wǎng)絡(luò)技術(shù)的實質(zhì),就是利用統(tǒng)計學(xué)的方法,在某個層面模擬人腦神經(jīng)元網(wǎng)絡(luò)的工作方式,設(shè)置多層彼此勾聯(lián)成網(wǎng)絡(luò)的計算單位(如輸入層—隱藏單元層—輸出層等)。由此,全網(wǎng)便可以通過某種類似于“自然神經(jīng)元間的電脈沖傳遞,導(dǎo)致后續(xù)神經(jīng)元觸發(fā)”的方式,逐層對輸入材料進行信息加工,最終輸出某種帶有更高層面的語義屬性的計算結(jié)果。至于這樣的計算結(jié)果是否符合人類用戶的需要,則取決于人類編程員如何用訓(xùn)練樣本,去調(diào)整既有網(wǎng)絡(luò)各個計算單位之間的權(quán)重(參見圖1)。⑤
圖1 高度簡化的人工神經(jīng)元網(wǎng)絡(luò)結(jié)構(gòu)模型
大致而言,在人工神經(jīng)元網(wǎng)絡(luò)的上述運作流程中,人類成見主要有三個機會介入系統(tǒng)的運作:(甲)通過精心設(shè)計系統(tǒng)的訓(xùn)練樣本(尤其是通過對輸入添加大量標簽)來向系統(tǒng)“喂入”某些對于問題求解來說非常重要的先驗知識;(乙)通過預(yù)先給出的理想解規(guī)定系統(tǒng)的學(xué)習(xí)目標;(丙)通過預(yù)先給出的反饋算法來規(guī)定系統(tǒng)的權(quán)重調(diào)整方式。但是,雖然通過這些手段,人類設(shè)計者姑且能夠粗略地調(diào)整系統(tǒng)的性能,但人類設(shè)計者往往并不是特別清楚為何特定的系統(tǒng)參數(shù)變化能夠?qū)е孪到y(tǒng)運作性能的變化——這一點在人工神經(jīng)元網(wǎng)絡(luò)的內(nèi)部架構(gòu)已經(jīng)空前復(fù)雜的今天,則顯得尤其凸出,這也是人工神經(jīng)元網(wǎng)絡(luò)算法時常被稱為“黑箱算法”的原因。從這個角度看,一個得到充分訓(xùn)練的人工神經(jīng)元網(wǎng)絡(luò)固然在某種意義上可以說是“復(fù)制了人類的成見”,但富有諷刺意味的是,人類設(shè)計者自身也說不清它們是如何完成這種復(fù)制的。更重要的是,對人工元神經(jīng)網(wǎng)絡(luò)的初始輸入進行人工標注,往往會消耗人類程序大量的精力,同時,在隱藏計算層的數(shù)量激增的情況下,系統(tǒng)自身消耗的運算資源也是驚人的。換言之,與心理學(xué)意義的捷思法對于人類智能“節(jié)儉性”的彰顯構(gòu)成鮮明對比的是,目下的神經(jīng)元網(wǎng)絡(luò)—深度學(xué)習(xí)技術(shù)對于人類成見的復(fù)制機制,恰恰是建立在海量的數(shù)據(jù)輸入、強大的硬件配置與海量的計算量之上的。⑥因此,這種意義上的人類成見復(fù)制機制,在工作原理與工作目的上均與人類自身的心智架構(gòu)相去甚遠,或者說,比起前面提到的GPS對于捷思法的粗糙刻畫來說,這樣的人工智能設(shè)計思路其實顯得更不具有智慧性(如果我們將“智慧”或“智能”理解為在“系統(tǒng)相對匱乏的環(huán)境資源下對于環(huán)境的適應(yīng)能力”的話)。
綜合本節(jié)的討論,我們可以得出:目前的主流人工智能研究——無論是符號主義進路的還是聯(lián)接主義進路的——都沒有真正消化心理學(xué)界對于捷思法的研究成果,遑論在這種情況下落實伽達默爾關(guān)于“成見”的種種洞見。那么,路在何方呢?
通過上節(jié)的分析我們不難發(fā)現(xiàn),就目下的人工智能研究來說,將心理學(xué)研究的捷思法加以算法化的最大障礙,便是對于語義表征的算法化。而這一問題之所以成為問題,則又是因為:一方面,研究捷思法的心理學(xué)家總是預(yù)設(shè)人類心智是具有語義表征能力,而另一方面,人工智能專家又總是傾向于通過剝離語義的方式而將日常生活中的種種具體問題“純化”為形式問題(無論這種形式是數(shù)學(xué)的、邏輯學(xué)的還是統(tǒng)計學(xué)的)。兩類學(xué)者之間工作理念的這種反差,自然就為人工智能界汲取心理學(xué)界的思想營養(yǎng)制造了觀念上的障礙。不過,我們也應(yīng)當看到,在主流的人工智能研究路徑之外,將語義予以算法化的努力其實早就已經(jīng)出現(xiàn)了。譬如,在美國天普大學(xué)(Temple University)的計算機科學(xué)家王培發(fā)明的“納思系統(tǒng)”中,在長期記憶庫中出現(xiàn)的任何一個詞項的語義都可以通過某種可計算化的方式得到定義。⑦而且納思系統(tǒng)本身的運作也在相當程度上基于其自身的系統(tǒng)運作歷史,并因為這種依賴性而能夠模擬諸如“錨定捷思法”這樣的人類捷思法。不過,由于篇幅的限制,筆者在此無法充分解釋相關(guān)的技術(shù)細節(jié)。但不幸的是,盡管筆者在不少場合都提到納思系統(tǒng)的巨大潛力⑧,但它依然沒有得到主流人工智能界的足夠重視。而更令人擔憂的是,在當下的各種媒體平臺上,對于主流人工智能技術(shù)路徑(特別是深度學(xué)習(xí)路徑)的吹捧始終不絕于耳,同時,卻很少有人談及,主流人工智能進路搭建的計算框架,實際上只在一種很微弱的意義上關(guān)涉心理學(xué)家發(fā)現(xiàn)的人類智能架構(gòu)。簡言之,現(xiàn)有的人工智能系統(tǒng)其實還非常“不像人”。
面對這樣的批評,主流人工智能的辯護士或許會說:我們根本不用關(guān)心人工智能的架構(gòu)是否真像人,我們只關(guān)心它的輸出是否能夠滿足人類用戶的需要。但這里的問題便是,如果機器的“輸入端”與“輸出端”之間的“黑箱”即使在某種非常抽象的層面上都非常不類似于人類自身的心智架構(gòu),我們又可以在多大程度上擔保其“輸入—輸出”關(guān)系能夠與人類的“輸入—輸出”關(guān)系相互吻合呢?就拿前面討論的神經(jīng)元網(wǎng)絡(luò)系統(tǒng)來說,為何這種系統(tǒng)的良好運作,往往要以輸入數(shù)據(jù)的人工標注為先驗前提,而人類的心智架構(gòu)卻可以容忍那些缺乏人為標注的“粗糙輸入”呢?很顯然,除非人工智能專家低下頭來,認真向心理學(xué)家學(xué)習(xí),否則“人工智能”作為“人力智能”之裝飾品的本質(zhì)就不會改變。
主流人工智能的辯護士或許還會說,人工智能專家已經(jīng)向各行各業(yè)的人類專家虛心學(xué)習(xí)了——譬如“專家系統(tǒng)”對各種人類既有專業(yè)知識的學(xué)習(xí)——為何對心理學(xué)的學(xué)習(xí)就顯得格外重要呢?在筆者看來,在回答這個問題之前,復(fù)習(xí)伽達默爾的詮釋學(xué)資源便非常必要。從伽達默爾哲學(xué)的立場看,人類的集體智慧是通過某種隱蔽的說服機制而成為個體的“前見—成見”的,而個體與其歷史傳統(tǒng)的不同互動方式,也會為不同意義上的“成見—前見”結(jié)構(gòu)的形成預(yù)備了機緣。而在目下主流的符號人工研究智能中,特定專業(yè)學(xué)科領(lǐng)域內(nèi)的人類集體智慧,并不是通過對于個體操作系統(tǒng)的“說服”而進入長期記憶地址的,而是通過某種極為粗暴的“代碼寫入”方式而成為其先驗知識。同時,對于同一個型號的人工智能系統(tǒng)而言,批量產(chǎn)生的系統(tǒng)之間也分享完全相同的先驗知識,故而,在任何一個這樣的個體系統(tǒng)與人類的既有智慧之間,就不存在著進行任何一種意義上的互動的可能性,遑論在這類多重互動可能性的基礎(chǔ)上形成不同的“成見—前見”。這也就是說,個體與歷史之間相互影響而又相互創(chuàng)造的微妙關(guān)系,在現(xiàn)有的主流人工智能系統(tǒng)之中是無法被復(fù)制出來的,除非主流的人工智能專家能夠改弦易轍,轉(zhuǎn)而去嚴肅對待個體心理結(jié)構(gòu)用以獲取“集智”的、作為信息快捷道的種種“捷思法”。
主流人工智能進路的辯護者或許還會說,我們?yōu)楹我獜?fù)制出所謂的“個體與歷史之間相互影響而又相互創(chuàng)造的微妙關(guān)系”呢?為何不能始終讓人類開創(chuàng)知識前進的歷史,而始終讓機器去復(fù)制人類前進的腳步呢?對此,筆者的回答是:從定義上看,這種只能拓印人類前進腳步的“人工智能”系統(tǒng)是沒有資格去盜用“智能”的名義的,因為真正的“智能的”信息處理系統(tǒng)的“成見—前見”結(jié)構(gòu)應(yīng)當是具有自己的個性的(如果我們將“個性”視為“智能”或者“創(chuàng)造性”的題中應(yīng)有之義的話),而人類歷史自身,也恰恰是借由這些個性化的“成見—前見”結(jié)構(gòu)之間的彼此沖撞,才得以開創(chuàng)出種種新的局面。但在主流的人工智能的成見復(fù)制機制中,我們卻看不到任何得以創(chuàng)生出真正的新事物的機緣。而這又是因為,在主流的人工智能研究那里,前面提到的“歷史權(quán)威—捷思法—個體心理史—當下決策”的四層架構(gòu)關(guān)系的中間兩層已被抽空,并由此使整個結(jié)構(gòu)的動力學(xué)機制崩塌??梢院敛豢鋸埖卣f,未來對于任何一種真正意義上的人工智能系統(tǒng)的嚴肅研究,都必須以修復(fù)這個坍塌的層次結(jié)構(gòu)為前提。
注釋:
①吉仁澤表達類似觀點的文獻很多,較新的文獻為Gerd Gigerenzer:Simply Rational:Decision Making in the Real World.Oxford:Oxford University Press,2015.
②譬如,當被試者要求在5秒內(nèi)計算8個數(shù)字的乘積的時候,這些數(shù)字進入被試者視野的次序,就會對其估測結(jié)果產(chǎn)生致命影響。當數(shù)列是以“1×2×3×4×5×6×7×8”的形式出現(xiàn)的時候,被試者會傾向于大大低估算式的值(因為首先出現(xiàn)的都是小數(shù)),而當數(shù)列是以“8×7×6×5×4×3×2×1”的形式出現(xiàn)的時候,被試者則依然會傾向于低估算式的值,盡管低估的程度稍有緩解(順便說一句,這個式子的值為40,320,而被試者第一次估算的平均值是520,第二次估算的平均值是2,250)。
③關(guān)于捷思法問題更全面的心理學(xué)哲學(xué)討論,參見拙著《認知成見》,復(fù)旦大學(xué)出版社2015年版。
④對于該問題的討論文獻很多,綜合性的討論文獻參見David L.Applegateamp;Robert Bixby:The Traveling Salesman Problem:A Computational Study.Princeton:Princeton University Press,2007.
⑤對于神經(jīng)元網(wǎng)絡(luò)技術(shù)的更詳細介紹,請參看拙著《心智、語言和機器——維特根斯坦哲學(xué)和人工智能科學(xué)的對話》,人民出版社2013年版,第43—53頁。
⑥生物統(tǒng)計學(xué)家里克(Jeff Leek)最近撰文指出,除非具有海量的訓(xùn)練用數(shù)據(jù),否則深度學(xué)習(xí)技術(shù)就會成為 “屠龍之術(shù)”,參見Jeff Leek:Don't use deep learning,your data isn't that big,https://simplystatistics.org/2017/05/31/deeplearning-vs-leekasso/。
⑦“納思系統(tǒng)”的英文全稱為“Non-Axiomatic Reasoning System”(非公理推理系統(tǒng)),“NARS”為其縮寫,“納思”為該縮寫的漢語音譯。關(guān)于納思系統(tǒng)的文獻很多,其中最重要的是Pei Wang.Rigid Flexibility:The Logic of Intelligence.Netherlands:Springer,2006。
⑧相關(guān)成果主要集中于拙著 《心智、語言和機器——維特根斯坦哲學(xué)和人工智能科學(xué)的對話》,人民出版社2013年版。
[1](德)漢斯·伽達默爾.真理與方法——哲學(xué)詮釋學(xué)的基本特征(上卷)[M].洪漢鼎,譯.上海:上海譯文出版社,1999.
[2]Amos Tversky,Daniel Kahneman.Judgment under Uncertainty:Heuristics and Biases.Science,1974,(185).
[3]Amos Tversky,Daniel Kahneman.A v ailability:A heuristic for judging frequency and probability.Cognitive Psychology,1973,(2).
[4]Norbert Schwarz et al.Ease of retrieval as information:Another look at the availability heuristic.Journal of Personality and Social Psychology,1991,(2).
[5]Gerd Gigerenzer et al.Simple Heuristics that Make Us Smart.Oxford:Oxford University Press.
[6]Thomas Cormen et al.Introduction to Algorithms(the Third Edition).Cambridge,MA:The MIT Press,2009.
[7]G.Gutin,A.Yeo,A.Zverovich.Traveling Salesman should not be Greedy:Domination Analysis of Greedy-type Heuristics for the TSP.Discrete Applied Mathematics,2002,(117).
[8]A.Newell,J.C.Shaw,H.A.Simon.Report on a General Problem-Solving Program.Proceedings of the International Conference on Information Processing,1959.
【責任編輯:趙 偉】
根據(jù)伽達默爾的哲學(xué)詮釋學(xué)思想,“成見”是人類個體借以獲取集體智慧之結(jié)晶,以便彌補個體理性之不足的重要途徑,因此,俗常人們賦予“成見”的種種負面印象,在相當程度上是有所偏頗的。而當代心理學(xué)對于“捷思法”的研究,則可以被視為對于伽達默爾的“成見”觀的有益補充,因為所謂“捷思法”,在本質(zhì)上就可以被視為心理主體調(diào)取歷史信息資源的某些心理捷徑。然而,盡管人造的信息處理系統(tǒng)像人類心理結(jié)構(gòu)一樣,肯定也會遭遇到“決策資源不足”問題的困擾,伽達默爾的“成見”論與心理學(xué)界對于“捷思法”的研究成果的精髓,卻一直沒有被主流人工智能界所吸取。毋寧說,目前主流人工智能所運用的“捷思法”在運作機制上是與人類“捷思法”相去甚遠的,因為前者既不能像人類“捷思法”那樣表征語義,也不能像人類“捷思法”那樣體現(xiàn)心理系統(tǒng)自身的運行歷史。從這個角度看,目前的主流人工智能系統(tǒng)缺乏“在決策資源匱乏的情況下靈活應(yīng)對環(huán)境壓力”的能力。
B017
A
1004-518X(2017)10-0005-13
國家社科基金項目“自然語言的智能化處理與語言分析哲學(xué)研究”(13BZ X023)、國家社科基金重大項目“基于信息技術(shù)哲學(xué)的當代認識論研究”(15ZDB020)
徐英瑾,復(fù)旦大學(xué)哲學(xué)學(xué)院教授、博士生導(dǎo)師。(上海 200433)