黃培紅
(中國農(nóng)業(yè)銀行莆田分行,莆田351100)
?
自然語言加工中What-Why理解效應(yīng)
黃培紅
(中國農(nóng)業(yè)銀行莆田分行,莆田351100)
摘要:通過使用一種迫選范式發(fā)現(xiàn)語言加工中what-why因素引起的理解效應(yīng)。進一步研究發(fā)現(xiàn),what因素在語言理解效應(yīng)中首先被激活,然而,why因素對what理解效應(yīng)產(chǎn)生交互作用,對理解效應(yīng)也是必不可少的。what因素與why因素共同引發(fā)自然語言加工過程中的理解效應(yīng)。同時,通過理解效應(yīng)實驗,其輸出的結(jié)果進一步驗證what-why理解效應(yīng)規(guī)律的正確性。
關(guān)鍵詞:自然語言加工;what-why因素;理解效應(yīng)
無論融會貫通還是抽象思維,無不建立在理解之上,理解構(gòu)成了人類思維活動的基礎(chǔ),因而有必要把理解作為科學問題加以研究。對事物的理解,常常有這樣的經(jīng)驗:第一是要知道該事物是什么(稱為what因素);第二是凡事要問個為什么(稱為why因素),之后,該事物得以理解。what與why因素可能影響對事物的理解,需要實驗驗證。本研究將主要研究這個問題。
目前國內(nèi)外有些人在研究自然語言的理解問題,一種認為理解就是對語法、語義與語用的理解,例如系統(tǒng)語法、格語法[1-2]等。這種觀點與心理學觀點相一致。格語法認為句子由中心動詞與深層格組成,而深層格包括施事格、對象格等,當一個句子分析出深層格時,即理解了該句子。還有一種觀點認為理解即對概念的理解。美國Yale大學的R.Schank[3]及同事提出CD理論(概念依存關(guān)系理論),認為人腦中存在某種概念基礎(chǔ),語言理解就是對概念的映射過程。這是種具有影響力的思想。許多典型的語言理解理論都是基于概念理解基礎(chǔ)之上的。例如WordNet[4-8]、本體理論[9-11]等。這些理論對語義知識進行了表達,其中的知識由概念、屬性與關(guān)系組成,理論之間的不同之處在于對知識的表達形式不同,數(shù)據(jù)結(jié)構(gòu)不同引起有關(guān)的維護及操作使用的軟件流程也不盡相同。Winograd[12]完成的SHDRLU系統(tǒng)在狹小的積木世界中,在有限的詞匯上運用系統(tǒng)語法進行人機對話取得成功。
然而,這些建立在語法、語義、語用或概念理解之上的理論又不得不面對一個巨大的障礙,這就是語法、語義、語用、概念、信息等等刺激物的理解問題。對概念的再理解,才能在更深的層次上啟動演繹推理或歸納推理。而對概念的再問究,需要弄清楚某一個具體的概念是什么及涉及的為什么(即相關(guān)道理),從而認知系統(tǒng)對概念產(chǎn)生更加精細的便于理解的結(jié)構(gòu),這時它對現(xiàn)實世界的規(guī)律的認識與刻畫便更精細。概念的再理解是有意義的,然而也是相對復(fù)雜的。同樣,信息包羅萬象,包括事實、經(jīng)驗與知識等,對信息的理解并不比對概念的理解簡單。SHDRLU人機對話系統(tǒng)擴大到真實的現(xiàn)實世界時,由于現(xiàn)實世界充滿不確定性與模糊性,對文本的進一步處理無能無力,它很快就陷入困境。而相對于SHDRLU系統(tǒng),現(xiàn)實世界之所以會充滿了不確定性與模糊性,其根本原因是系統(tǒng)對現(xiàn)實世界的理解力不足,即并不知道文本及構(gòu)成文本的詞語的真實意思(語義),亦不具備在文本的深層語義上邏輯推理的能力。心理學認為理解是對意思的建構(gòu)過程,并使用信息加工的觀點對語言理解過程進行了一定的解釋,但對什么是意思(或語義)以及意思的理解還不清楚,對語言理解這個復(fù)雜問題還未達到闡述清楚的程度??傊?傳統(tǒng)的自然語言理解理論,對什么是理解的認識仍處于知其然而不知其所以然的狀態(tài)。理解到底是什么?有哪些規(guī)律?有關(guān)理解的因素及效應(yīng)關(guān)系需要進一步研究與驗證。
值得一提的是,物理學定律是從大量事實基礎(chǔ)上總結(jié)并經(jīng)實驗驗證而獲得的。歷史上,胡克定律先總結(jié)出受力與形變成正比,然后實驗驗證。牛頓三定律也采用同樣方法總結(jié)與驗證。本研究比照物理學定律的提出與驗證方法進行理解效應(yīng)的相關(guān)因素的研究驗證。本研究進一步驗證what與why因素是否與理解效應(yīng)構(gòu)成因果關(guān)系,采用理解效應(yīng)的一種迫選范式來研究語言材料的理解問題,實驗中包含what條件和why條件。為探討在語言材料理解中是否存在what-why理解效應(yīng)現(xiàn)象,在實驗中包括了一種非what-why條件對照。在這個對照組條件下,只呈現(xiàn)無關(guān)的背景音樂。當前的研究中還控制了what、why等因素,并且考察這些因素如何協(xié)同影響理解效應(yīng)。理解效應(yīng)是人類智能的基礎(chǔ)要素。無論是談話、作文還是閱讀思考,抑或是做事、決斷以及日常生活,人類天天在使用理解機制。理解問題的重要性可見一斑,理解效應(yīng)的規(guī)律研究無疑具有意義,它是類腦計算的重要內(nèi)容。
what因素與why因素對理解效應(yīng)的影響研究以前還沒有文獻報告過。本文報告詞、句、篇的理解效應(yīng)實驗,對理解的特性及其形成過程進行試驗,進而對what-why理解效應(yīng)的正確性進行實驗驗證。這些試驗采用被試不理解的實驗材料,本研究觀察被試使用這些實驗材料進行試驗中,從不解狀態(tài)到理解狀態(tài)轉(zhuǎn)變過程中所涉及的數(shù)據(jù)點,進而觀察what-why條件與理解效應(yīng)的關(guān)系,關(guān)鍵是要考察what因素與why因素對理解效應(yīng)的產(chǎn)生是否充分,以及這兩個因素是不是必要條件?本研究假設(shè)what-why變量可引發(fā)理解效應(yīng),那么當被試對刺激物進入不理解狀態(tài)時加入變量值,預(yù)期會引發(fā)被試對刺激物的理解效應(yīng);若未加入變量值,則預(yù)期被試無法產(chǎn)生理解效應(yīng)。
1.1被試
21人正常狀況下的學生自愿參加實驗,從17歲到24歲,平均年齡18.4歲。右利手,視力或矯正視力正常。實驗前不知道此次實驗的目的,實驗時給出被試相應(yīng)的實驗要求。
1.2實驗儀器
本實驗機器用IBM2780,CPU2.4GHz,操作系統(tǒng)Linux,軟件為understanding-soft軟件。機器與軟件均為正常狀態(tài)。
1.3實驗設(shè)計
本實驗采用迫選范式,實驗為被試內(nèi)設(shè)計,共有2個自變量,即what因素(刺激物的含義)、why因素(真值推理過程),其刺激類型為詞、句、篇語言材料。通過比較被試對語言刺激物詞、句、篇在輸入與非輸入what值條件,以及輸入與非輸入why值條件后,在迫選任務(wù)中是否理解目標語言材料的正確率,來考察what和why條件是如何影響認知系統(tǒng)對刺激物的理解。
對詞語等語言材料的理解過程通常都是從不理解到理解的過程,本設(shè)計就是考察不理解到理解的輸入量。對這些語言材料,本實驗先通過讓被試事先挑選,設(shè)法讓他們進入不理解狀態(tài)。如果認知系統(tǒng)從不理解狀態(tài)加上自變量賦值后,其狀態(tài)變?yōu)槔斫鉅顟B(tài),那么,該自變量的賦值就是理解效應(yīng)的原因。本文把該自變量設(shè)為語言材料的what與why因素,自變量賦值即給語言材料是什么及為什么賦予值。
定義1 what-why效應(yīng)是指當認知系統(tǒng)知道刺激物是什么及為什么時產(chǎn)生的心里反應(yīng)。
本文考察what-why的理解效應(yīng),即當給處于不理解狀態(tài)的被試輸入刺激物的what變量值及why變量值時是否產(chǎn)生理解效應(yīng),也就是當被試知道刺激物是什么及為什么時是否具有理解的感受或反應(yīng)。本文中what理解效應(yīng),即what條件下的理解效應(yīng);what(或why)值即賦予what(或why)變量的內(nèi)容,或稱what(或why)變量的值;what值即意思,why值即道理;what(或why)條件即給出what(或why)值條件,簡稱what(或why)條件。
1.4實驗材料
本文理解效應(yīng)實驗,其研究的是自然語言,它的實驗材料對應(yīng)為自然語言材料,包括詞語、句子以及篇章片段等。實驗共有3個條件,每個條件包括100個語言刺激材料。
詞語條件下的語言材料取自現(xiàn)代漢語詞典中全部的53000多個詞語。實驗過程中共取出難于理解的詞語4301個,這些詞匯相對于被試為罕見詞。詞語材料還包括真假詞,這些詞語用于詞的真假對理解效應(yīng)是否有影響的實驗,所以這些真假詞語包括一半的真詞與一半的假詞,以驗證真假詞對理解效應(yīng)是否產(chǎn)生影響。
句子條件的理解效應(yīng)實驗,其語言材料包括無法理解語句3503個,含歧義句子、不明事理命題、內(nèi)容抽象句子等。這些句子包括命題與非命題。篇章條件下的實驗,其研究對象包括2901個文章片段或數(shù)學證明題。相對于句子理解,篇章理解還涉及了句子間關(guān)系的理解。篇章理解實驗中,本研究略過各個句子的理解,單單考察被試對句子之間關(guān)系的理解。本節(jié)設(shè)計的涉及篇章的實驗對象,包括因果關(guān)系、并列關(guān)系、遞進關(guān)系、概括關(guān)系等。其關(guān)系的what-why值即關(guān)系的語義。例如,構(gòu)成因果關(guān)系的語句,其語義上構(gòu)成的因果關(guān)系,即因果關(guān)系的what-why值。
1.5實驗過程
本迫選范式是,實驗儀器給處于目標刺激物不解狀態(tài)的被試輸入有關(guān)條件之后,迫使被試根據(jù)是否理解目標語言材料,單選“理解”或“不解”答案。本實驗旨在通過此范式來考察中文中what與why值的輸入是如何影響認知系統(tǒng)對刺激物的理解的。
每人做11組測試,每組100個語言材料。做完1組測試后休息片刻。首先,被試隨機選擇出難理解的詞語、句子與篇章,標記不理解部分,并形成測試任務(wù)。被試坐在靜音室中并避免干擾。詞語呈現(xiàn)在計算機屏幕的正中央,眼睛距離屏幕70cm,視角24°×30°。左右手食指放在F、J鍵上。雙眼注視屏幕中央,刺激呈現(xiàn)與做反應(yīng)時盡量減少頭部運動,避免眨眼。每次實驗之前,在屏幕中心會呈現(xiàn)一個注視點(大小為4×4個像素),呈現(xiàn)大約1s后消失.然后在注視點會立即呈現(xiàn)1個語言材料,首先被試確認進入不理解狀態(tài),否則實驗材料無效,呈現(xiàn)下一語言材料。若是被試已進入不理解狀態(tài),則呈現(xiàn)該刺激物的含義與涉及邏輯,導(dǎo)引他/她注視屏幕中央的正確意思。刺激物的含義與涉及邏輯即給出語言材料涉及的what-why值,給出它的確切含義并呈現(xiàn),要求他/她根據(jù)這些語義數(shù)據(jù)提示來理解該詞語等語言材料。刺激項目的呈現(xiàn)時長由之后描述的方法確定。刺激項目呈現(xiàn)消失后,在原先呈現(xiàn)項目的位置會有理解與不理解的選項,被試通過按鍵從2個備選答案中做出選擇.電腦記錄相關(guān)實驗數(shù)據(jù)。例如,呈現(xiàn)項目是“嬛嬛”,被試若進入不理解狀態(tài),則屏幕會給出該詞語的含義,即呈現(xiàn)what值(“指女子舞蹈,動作柔美貌”)與含義的邏輯值后,呈現(xiàn)2個備選答案分別為“理解”和“不解”(圖1),軟件自動記錄理解反應(yīng)時。對句子的理解的例子,例如‘天有不測風云,人有旦夕禍?!睦斫?,初始條件若是被試無法理解該語句,則實驗程序呈現(xiàn)給出相應(yīng)的事實依據(jù)后,看被試的理解效應(yīng)情況,記錄相應(yīng)的理解實驗結(jié)果。當被試完成全部語言材料理解測試,則完成實驗。對抽象難解的命題,則給予充分的理由與解釋,看被試是否產(chǎn)生理解效應(yīng)。又如對“停止杯葛亞投行”的理解,初始狀態(tài)因?qū)Α氨稹辈焕斫舛鴮?dǎo)致被試的整個語句不理解狀態(tài),當給出杯葛的確切含義為“抵制”時,被試確切獲得了整個語句的含義,從而理解該語言材料,電腦記錄相關(guān)數(shù)據(jù)。對命題“碳酸飲料對牙齒的腐蝕作用”的理解,首先給出實驗過程及結(jié)果材料說明以確定它的真值性,用事實證明碳酸飲料確實會對牙齒產(chǎn)生腐蝕作用,并對反例給出原因說明,最后要求被試作出反應(yīng),系統(tǒng)記錄被試理解該命題的實驗結(jié)果。本實驗中,對語言材料的理解,若被試仍處于疑惑、不能確定、似是而非的狀態(tài),其實驗結(jié)果選擇為“不解”。
圖1 實驗過程流程圖
為讓被試熟悉實驗程序,實驗正式開始前有15個練習機會。本實驗通過90個調(diào)整試次來決定刺激的呈現(xiàn)時間。如果被試在不到10次實驗之內(nèi)做出2次錯誤反應(yīng),則刺激呈現(xiàn)時間就會增加一個幀大約120s.刺激材料呈現(xiàn)時間確定后,將呈現(xiàn)20個練習試次,練習試次中會包括所有實驗條件。
表1 真假詞條件下的理解率(%)a)
首先考察真假詞對語言材料理解效率的影響.把語言材料的what理解率作為因變量,將詞語真假、why變量作為被試內(nèi)因素進行了方差分析。結(jié)果顯示,給出語言材料刺激物what值條件下的正確率(70.64%)要顯著高于非what值情況(0.45%, F(1,20)=3781,P<0.001)。當給出why值時,反應(yīng)的正確率有越來越高的趨勢(F(1,20)=53700,P<0.001)。詞真假的主效應(yīng)不顯著(F<1),見表1。由于真詞與假詞條件下的正確率無差異,因而詞真假因素不作為一個參數(shù)參與以下的數(shù)據(jù)分析。從不理解到理解狀態(tài)與詞語是否真假無關(guān),可能詞語本身只是一種形式上的標識,其標識下的語義即what-why值才最重要,詞語本身僅僅為語義的標識而已。
2.1詞語和語句
將詞、句在輸入與非輸入what-why條件下理解率做方差分析。將what(輸入或非輸入值)和why(輸入或非輸入值)作為被試內(nèi)變量,對理解率進行了方差分析。假如存在what-why理解效應(yīng),期待存在自變量的主效應(yīng)或出現(xiàn)與理解效應(yīng)相關(guān)的交互作用.假如某個變量(what或why)對理解效應(yīng)的大小產(chǎn)生影響,期待變量之間產(chǎn)生交互作用。結(jié)果表明,what-why的主效應(yīng)邊緣顯著(F(1,20)=74907,P<0.001)。在what-why條件下(99.00%)正確理解率比在非輸入what-why條件(0.73%)下的正確率更高。本測試的有效率達到99%,其中不理解的情況是因為對含義中的有些詞不理解,當給出這些詞的含義后獲理解。這也是詞語理解僅當其語義被真正理解之后的印證。無論是詞語、語句,還是歧義句子、抽象句子,由于它們的初狀態(tài)都是不理解,只要賦給值,即知道了句子的具體的what-why值后,這些語言刺激物都從不解狀態(tài)順變?yōu)榭衫斫鉅顟B(tài)。表2還顯示非what條件或非why條件下,理解率都很低(<1%)。
表2 詞/句的what-why條件下的理解率(%)a)
更重要的是,在what條件和why條件之間發(fā)現(xiàn)了交互作用(F(1,20)= 40523,P<0.01)。當what條件時,why條件下的正確率比非why條件下高97.18%,但是當非what條件時,正確率下降了98%。事后檢驗表明, why條件下的這種差異是顯著的(F(1,20)=66027,P<0.01)。這一結(jié)果表明,在why條件時出現(xiàn)了what理解效應(yīng)。由表3可以看出, why-what序列條件下的理解效應(yīng)(1.00%)比what-why序列條件時要?。?7.64%)。事后檢驗表明,這個差異邊緣顯著(F(1,20)=56542,P <0.001)。結(jié)果顯示,理解效應(yīng)的大小還和what-why先后次序相關(guān),what-why序列時理解效應(yīng)更大。
2.2篇章
為了比較篇章條件下語言材料閱讀理解中whatwhy條件下的理解效應(yīng)是否比非what-why呈現(xiàn)時的理解率高,將what-why條件和非what-why條件下語言材料的理解率做方差分析。與上節(jié)的分析方法類似,將刺激類型(語句關(guān)系)的what因素(輸入或非輸入值)和why因素(輸入或非輸入值)作為被試內(nèi)變量。
句篇理解包括語句的理解及句子間關(guān)系的理解,關(guān)系的理解基于語句的理解之上,本節(jié)單獨考察句子間關(guān)系的理解效應(yīng)。假如存在what-why理解效應(yīng),本研究期待句子間的關(guān)系理解也存在自變量的主效應(yīng)或出現(xiàn)與理解效應(yīng)相關(guān)的交互作用。關(guān)系代詞僅僅是一種提示,既需要知道具體的關(guān)系是什么,還需要從這種提示中對實質(zhì)性的內(nèi)容進行驗證,即驗證其why值,以確認這些關(guān)系是否為真,若為真,則得到真正的理解。比較語句間關(guān)系的理解與不理解的情況,結(jié)果表明,語句間關(guān)系的what-why因素的主效應(yīng)顯著(F(1,20)= 76311,P<0.001), what與why條件同時呈現(xiàn)(98.73%)比非what-why(0.82%)時的正確率更高。表3顯示,與非what-why條件呈現(xiàn)時相比,當輸入what-why值時,出現(xiàn)了理解效應(yīng),而當what或why值不呈現(xiàn)時都沒有發(fā)現(xiàn)理解效應(yīng)。語句及其語句之間的關(guān)系,當且僅當what-why條件得到滿足時,被試對這些句群出現(xiàn)理解效應(yīng)(理解效應(yīng)量大于97.27)。少數(shù)不理解的原因是對賦值中的部分詞語不理解造成的,這些詞語理解后被試對句群集進入理解狀態(tài)。
表3 不同條件下的理解率與理解效應(yīng)大小(%)a)
另外, what與why條件的交互作用也顯著(F (1,20)= 46922, P<0.001)。在what條件時, why條件下的正確率比非why條件高出97.27%;雖然二者都知道連詞的意思,但前者還知道句子之間的連詞關(guān)系的why值,后者(非why條件)則不理解句子之間的連詞關(guān)系。結(jié)果表明,在懂得語句意思的條件下,當懂得關(guān)系的what-why值,被試則真正理解語句之間的關(guān)系,從而理解該句群。但是當what值不呈現(xiàn)時,理解率為0.45%。事后檢驗表明why條件下這些差異顯著(F (1,20)=82293,P<0.001)。表3顯示,語句間關(guān)系的what-why序列因素的主效應(yīng)邊緣顯著(F(1,20)= 55765, P<0.001)。若當不理解狀態(tài)加上知道what-why 值,并且加上what-why序列因素則處于理解狀態(tài);而當不理解狀態(tài)下,若被試不知道該句子關(guān)系的what-why值或what-why先后失序則還是處于不理解狀態(tài),這就證明what-why先后序列也參與導(dǎo)致句子關(guān)系的理解效應(yīng)。
通過比較what-why條件和非what-why條件下的語言材料理解效應(yīng)的正確率,發(fā)現(xiàn)了what-why理解效應(yīng)。與非what-why條件相比,在what-why條件下該刺激物被理解率更高,前者理解率接近100%后者理解率接近于0。從表3可以看出,當沒有輸入what值或why值時,理解率均很低,沒有出現(xiàn)理解效應(yīng),但輸入what值與why值后,被試出現(xiàn)理解效應(yīng),說明兩個因素都出現(xiàn)時產(chǎn)生理解效應(yīng),而少了任何一個條件,都不能出現(xiàn)理解效應(yīng)。這些結(jié)果表明對于理解效應(yīng)來說,what因素與why因素對理解加工都有影響,都是必不可少的,而且是充分的,即兩個因素決定了理解效應(yīng)。通俗地講,當認知系統(tǒng)知道了詞、句、篇是什么意思及為什么(即體會到語言材料及其含義的正確性)的時候,對這些語言材料的理解即可由不理解狀態(tài)進入理解狀態(tài),被試也就理解了該刺激物。語言材料獲得理解的充要條件是對應(yīng)的語義及其邏輯均獲得理解。這一點與平常的經(jīng)驗認識是一致的。理解是一種情感標識,當明白被測對象是什么并確認它的真值即知道為什么時疑惑消除,認知系統(tǒng)也就懂得了該對象,從而產(chǎn)生理解效應(yīng)。隨后,認知系統(tǒng)標識該刺激物及其what-why值,并記入認知系統(tǒng)之內(nèi)以備用??傊?,what條件與why條件結(jié)合起來協(xié)同產(chǎn)生對刺激物的理解效應(yīng)。
本研究還發(fā)現(xiàn)what條件與why條件對理解效應(yīng)的作用具有不同之處。在被試知道What值條件下,比較why與非why條件,發(fā)現(xiàn)只在why條件時產(chǎn)生了理解效應(yīng),而在非why條件或非what條件下均沒有發(fā)現(xiàn)類似的現(xiàn)象。這個結(jié)果表明,一是語言材料的理解加工除了受到what條件的加工的影響外,同樣具有why條件依賴性,并不是被what條件獨立理解的,以至于當非why條件時,語言材料的理解加工無法進行下去。說明除了知道what值外,還要道理理解,否則無法產(chǎn)生理解效應(yīng)。二是表明Why值對what理解效應(yīng)產(chǎn)生交互作用。認知系統(tǒng)知道了刺激物是什么后,why值還對該知道的內(nèi)容進行求證交互,只有該內(nèi)容全部是真值后,才能沒有疑惑,才能理解該理解對象。因此,如果沒有why值驗證或不符合道理的話,認知系統(tǒng)還是無法產(chǎn)生理解效應(yīng)。有了why值,才能確認內(nèi)容為真值,若非真值,則須通過why值調(diào)整,直到內(nèi)容確認為真值,從而產(chǎn)生理解效應(yīng)。
根據(jù)實驗結(jié)果,還發(fā)現(xiàn)如果非what條件下,why值是否提供,都無法對理解效應(yīng)產(chǎn)生作用。通過比較what-why條件與非what-why條件下的理解效應(yīng)正確率發(fā)現(xiàn)了理解效應(yīng),但這一效應(yīng)只有當what值首先提供時才出現(xiàn),同時why條件才表現(xiàn)出對理解效應(yīng)的影響。這個現(xiàn)象表明,一是認知系統(tǒng)對語言材料并不是同時地進行what與why水平加工的, what加工總是先,然后才能進行why加工,what條件是加工的起點,why值是以what值為基礎(chǔ)的。因為如果被試不知道what值,根本無法對語言對象進行why判斷,why判斷根本無從談起。所以,即使給了why值被試也無法發(fā)生理解效應(yīng),這個結(jié)論與以往的語言材料閱讀理解的日常經(jīng)驗相一致,即被試如若對被測對象是什么都不知道,就更談不上道理的理解了。根據(jù)這些情況,可以認為,認知系統(tǒng)對刺激物的理解首先要知道該刺激物是什么,然后才能去理解道理,看它是不是符合道理,然后產(chǎn)生理解效應(yīng)。二是這種現(xiàn)象表明,認知系統(tǒng)是根據(jù)意思對語言材料進行加工的。因為只有在what條件下觀察到了理解效應(yīng),而What值就是語言材料的意思。另一個可能原因是,詞匯通過what值即意思達成與現(xiàn)實世界的映射關(guān)系,只有在what值基礎(chǔ)上,現(xiàn)實世界規(guī)律知識才能通過why條件組織反饋,并根據(jù)真值性標準及時影響詞匯的what內(nèi)容的理解,最后認知系統(tǒng)才能有效使用現(xiàn)實世界的規(guī)律知識。
可以用交互理解模型來進一步解釋這個各層次交互理解效應(yīng)現(xiàn)象。對語言材料的理解而言,其在what水平首先被激活,同時,why條件也起著重要的作用。對語言材料而言,其相應(yīng)的理解模型可能不僅僅只包括what層次的加工,還存在一個why水平的加工確認,使得語言材料的加工會同時受到what水平的因素(如語義)和高水平why條件的影響。why水平的激活反饋會通過自上而下的通路影響what水平的加工。當前研究只在why條件下發(fā)現(xiàn)了理解效應(yīng),造成這個現(xiàn)象可能是由于加工的復(fù)雜性和中文閱讀中的歧義導(dǎo)致的,也可能是語言材料中, what內(nèi)容可能存在自相矛盾的狀況。與非why相比, why因素在內(nèi)容水平上和整體水平上的真值確認,反饋到達what水平之時, what水平加工將被調(diào)整,使得內(nèi)容更一致。what水平與why水平下相互作用從而產(chǎn)生理解效應(yīng)現(xiàn)象。這些現(xiàn)象進一步表明,語言材料的理解是一個多水平之間交互加工的過程,是并行地以一個整體進行加工調(diào)整的。這個理解模型可以推廣到對圖像的理解之中。因為圖像理解是語言理解的一部分,所以關(guān)于圖像的理解亦然,即若認知系統(tǒng)內(nèi)存在對應(yīng)的what-why值,作為刺激物的圖像與內(nèi)部的知覺模式集匹配時,也就獲取并知道該刺激物圖像的what值與置信度,從而理解該圖像。如若不知道該圖像的what值是什么,也沒有why水平上的認識,也就無法正確理解該圖像。
what-why理解效應(yīng)結(jié)論與以往的理論[1-17]與研究結(jié)果是沒有矛盾的,是相一致的,因為可以用what-why理解效應(yīng)來進一步理解概念、信息,并對語法、語義以及語用進行理解再加工。what-why理解效應(yīng)理論認為,當知道概念是什么及為什么時,也就理解了概念。同樣,當知道語用涵義是什么及為什么時,也就理解了它的語用,語義的理解也是一樣。對語法的理解,是通過語法與語義并行的整體加工來交互劃分語法的。因此用what-why理解效應(yīng)可以很好地解釋對語法、語義及語用的進一步理解現(xiàn)象。ALICE[18]對話聊天軟件是基于統(tǒng)計與關(guān)鍵字的,統(tǒng)計加規(guī)則方法的理解觀認為把語法切分出來就是一種理解,其統(tǒng)計方法只是一種手段,可以歸到語法、語義、語用理解觀上。陸汝占[19-20]提出概念、語義計算及內(nèi)涵邏輯表示方法,這是對蒙太古語義學的發(fā)展。該理論主張深入語義層面,將漢語表達式抽象成數(shù)學表達式恰當?shù)乇硎緝?nèi)涵與外延,然后把這些語義表示在計算機內(nèi)進行處理,這種理解方法以概念為基礎(chǔ),最終表達成無歧義的結(jié)果為目的,該方法可以歸結(jié)為概念理解學派。同樣,心理學理論[21]認為,理解是一種意思建構(gòu)的過程,what-why理解效應(yīng)可以完成對該理解觀的進一步解釋。
what-why理解效應(yīng)表明了當認知系統(tǒng)知道被試對象是什么及為什么時,該系統(tǒng)也理解了該刺激物,這正是文獻[22,23]中的理解定義的基礎(chǔ)。該理論提出,理解是刺激物與認知系統(tǒng)內(nèi)的知覺模式集匹配時析出的確信性感受。刺激物與認知系統(tǒng)內(nèi)的知覺模式集匹配時,也就獲取并知道了該刺激物是什么,析出確信性感受表明該內(nèi)容為真值,此時,認知系統(tǒng)即知道它是什么及為什么(即what-why值),可見,這個時候,該刺激物被理解,認知系統(tǒng)獲得了what-why理解效應(yīng)。what-why理解效應(yīng)規(guī)律是對文獻[22]結(jié)論的進一步驗證。Watson[24-25]在美國智力競猜節(jié)目《危險邊緣》中戰(zhàn)勝有史以來最出色的兩名人類選手,獲得冠軍。它們的理解觀側(cè)重點在于不通過模擬人類的理解機制,是對文本語義的淺層分析理解。本研究與該方法沒有矛盾,還可以通過理解效應(yīng)進行分析,對淺層分析再理解,以進行精細語義上的推理,從而增加問題解決的途徑,提高問題解決的可靠性與準確度。圖2表明,語言材料經(jīng)過what-why效應(yīng),認知系統(tǒng)產(chǎn)生對文本材料的語義的實質(zhì)理解,之后就可以在目標驅(qū)動之下,產(chǎn)生對應(yīng)的目的產(chǎn)品,這些產(chǎn)品既可以是方案,亦可以是答案。
圖2 理解在信息處理中的位置
總的來說,通過一種迫選范式,發(fā)現(xiàn)了語言加工中的what-why理解效應(yīng).同時,當比較what條件與非what條件時,只在what條件下,why條件才對理解效應(yīng)發(fā)揮作用,而且what條件下僅僅在why條件時,理解效應(yīng)才出現(xiàn),why條件對what理解效應(yīng)產(chǎn)生交互作用。這表明,自然語言的理解加工不僅受到what條件的影響,而且受到why條件的制約,二者共同促成理解效應(yīng)的產(chǎn)生。詞語與句篇理解實驗過程表明一個道理,即當認知系統(tǒng)知道作為被測對象的刺激物是什么(what值)及為什么(經(jīng)why水平檢測且why值為真)時,該刺激獲得理解。而把理解定義為當刺激物與知覺模式集匹配時的確信性感受,其基礎(chǔ)論據(jù)即為上述結(jié)論。從而該理解的定義的正確性獲得了實驗的驗證。理解是認知系統(tǒng)進行信息處理的基礎(chǔ),信息處理過程中,認知系統(tǒng)需要知道文本是什么(what因素),并需要懂得從抽象微觀層面(what水平)進行推斷與邏輯演繹(why水平)。可見,理解觀更擅長于處理需要微觀分析給出結(jié)果的問題。該理解觀直接研究人類的理解能力,覆蓋人類理解能力的全部,與人類的理解交流方式相一致。下一步,本研究將對理解效應(yīng)對信息處理的作用機制給出進一步的闡釋,而理解效應(yīng)的生物物理學基礎(chǔ)也是一個值得研究的課題。
參考文獻:
[1]Fillmore, C.J.(1971)‘Some Problems for Case Grammar.’In R. J. O’Brien, Editor,22nd Annual Round Table. Linguistics: Developments of the Sixties-Viewpoints of the Seventies. Volume 24 of Monograph Series on Language and Linguistics. Georgetown University Press, Washington, D.C., pp. 35-56.
[2]鄒崇理,崔佳悅.基于格語法思想的范疇類型邏輯研究[J].安徽大學學報:哲學社會科學版, 2014, 38(4):15-22. DOI:10.13796/j. cnki.1001-5019.2014.04.003.
[3]Schank,R.C.Conceptual Information Processing[M]. Amsterdam: North-Holland Publishng Company,1975.
[4]Miller G. A,Beckwith R,Fellbaum C,et al.Introduction to WordNet:An on_Line Lexical Database[R]. CSL Report, NJ: Princeton UniverSity,1993.
[5]Pan Y N, Teng H M. Word Sense Disambiguation of Tags in XML Documents Based on WordNet[J]. Information Science, 2014.
[6]Wei T, Zhou Q, Chang H, et al. A Semantic Approach for Rext Clustering Using WordNet and Lexical Chains[J]. Expert Systems with Applications, 2015, 42:2264–2275.
[7]Aditi Sharan A1 and Manju L. Joshi. An Algorithm for Finding Document Concepts Using Semantic Similarities from WordNet Ontology [A]. International Journal of Computational Vision and Robotics[C],2010(2):147-157.
[8]Ricardo Sotolongo, Fangyan Dong, Kaoru Hirota .Algorithm for Code Clone Refinement Based on Semantic Analysis of Multiple Detection Reports Using WordNet[A].Proceedings of the 4th International Symposium on Computational Intelligence and Industrial Applications(2010)[C].Publishing House of Electronics Industry, 2010:191-198.
[9]Janzen, S.,Maass, W.Ontology-Based Natural Language Processing for In-store Shopping Situations[A]. IEEE International Conference on ICSC '09[C].2009:361- 366.
[10]Minu R I, Thyagharajan K K. Semantic Rule Based Image Visual Feature Onto66logy Creation[J]. International Journal of Automation & Computing, 2014, 11(5):489-499.
[11]陸汝鈐.世紀之交的知識工程與科學[C].北京:清華出版社,2001.9.
[12]Winograd, T. Language as a Cognitive Process[M]. MA:Addison Wesley,1983.
[13]鐘義信.自然語言理解的全信息方法論[J].北京郵電大學學報,2004(04):1-12.
[14]劉松.基于全信息的問答系統(tǒng)研究[D].北京郵電大學, 2014.
[15]黃曾陽.HNC理論[M].清華大學出版社,1998.
[16]劉智穎.服務(wù)于漢英機器翻譯的HNC詞語知識庫建設(shè)[J].語言文字應(yīng)用, 2015,(1):117-126.
[17]賈玉祥,俞士汶,朱學鋒.隱喻自動處理研究進展.中文信息學報,2009(6):
[18]Wallace R S. The Anatomy of A.L.I.C.E. [M] //Parsing the Turing Test. Springer Netherlands, 2009:181-210.
[19]陸汝占. 2003.概念、語義計算及內(nèi)涵邏輯.見:中文信息處理若干重要問題.北京:科學出版社.第90-9
[20]李釗劍,陸汝占.用戶需求概念圖的生成方法研究[J].計算機應(yīng)用與軟件, 2012, 29(1):23-26. DOI:10.3969/j.issn.1000-386X. 2012.01.006.
[21]彭聃齡.普通心理學第二版[M].北京:北京師范大學出版社,2005.
[22]黃培紅.自然語言理解的機器認知形式系統(tǒng)[J].湖南:計算機工程與科學,2007,29(6):113-116.
[23]黃培紅.自然語言理解——一個關(guān)于機器感悟人類語言實質(zhì)的邏輯理論[J].四川兵工學報,2009,(1):138-142.
[24]David Ferrucci, Eric Brown, Jennifer Chu-Carroll,James Fan, David Gondek, Aditya A. Kalyanpur,Adam Lally, J. William Murdock, Eric Nyberg, John Prager,Nico Schlaefer, and Chris Welty.Building Watson:An Overview of the DeepQA Project[M].http://www.stanford.edu/class/cs124/AIMagzine-DeepQA.pdf,2011:59-79.
[25]Chandrasekar R. Elementary? Question answering, IBM's Watson, and the Jeopardy! Challenge[J]. Resonance, 2014, 19(3):222-241.
What-Why Effect on Natural Language Understanding
HUANG Pei-hong
(Agricultural Bank of China Putian Branch,F(xiàn)ujian 351100)
Abstract:Through the use of a forced-choice paradigm, finds the understanding effect caused by what-why factors in language processing. Further investigation reveals that, in language understanding what-factor effect is activated first, but why-factor interacts to what-understand-effect, is also essential to understanding effects. What and why factors together lead to understanding effects in natural language processing. Meanwhile, the output results of what-why understanding effect experiment confirm that earlier definition of understanding is correct.
Keywords:Natural Language Processing; What-Why Factor; Understanding Effect
收稿日期:2015-12-22修稿日期:2016-02-22
作者簡介:黃培紅(1968-),男,福建莆田人,高級工程師,研究方向為人工智能與軟件工程
文章編號:1007-1423(2016)10-0009-08
DOI:10.3969/j.issn.1007-1423.2016.10.003