• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      對(duì)抗與聯(lián)結(jié):生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)

      2018-08-28 09:44:16蔡穎瑩
      北方文學(xué) 2018年20期
      關(guān)鍵詞:聯(lián)結(jié)人工智能

      蔡穎瑩

      摘要:隨著1957年《句法結(jié)構(gòu)》的出版,語(yǔ)言學(xué)研究進(jìn)入了一個(gè)全新的時(shí)代,即喬姆斯基語(yǔ)言學(xué)革命。而語(yǔ)料庫(kù)語(yǔ)言學(xué)自上世紀(jì)50年代以來(lái)受到了質(zhì)疑與挑戰(zhàn)。隨后,由于計(jì)算機(jī)技術(shù)的快速發(fā)展,語(yǔ)料庫(kù)語(yǔ)言學(xué)又逐漸走向復(fù)蘇。本文旨在通過分析生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)在研究理念、研究范圍和研究方法等層面的差異,及其存在的局限,闡述二者的對(duì)抗關(guān)系。同時(shí),通過二者在人工智能領(lǐng)域的應(yīng)用,剖析生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)的聯(lián)結(jié)關(guān)系,從而挖掘其合作潛力。

      關(guān)鍵詞:語(yǔ)料庫(kù)語(yǔ)言學(xué);生成語(yǔ)法;人工智能;對(duì)抗;聯(lián)結(jié)

      20世紀(jì)50年代,隨著喬姆斯基理論改變了語(yǔ)言學(xué)研究的實(shí)證方向,語(yǔ)料庫(kù)語(yǔ)言學(xué)作為語(yǔ)言研究方法受到了普遍質(zhì)疑。長(zhǎng)久以來(lái),生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)被稱為兩種截然不同、相互對(duì)立的研究范式。生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展也伴隨著雙方的互相批判。本文首先通過分析生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在研究范圍、研究方法和研究思路上的差異,以及各自存在的優(yōu)勢(shì)和不足,闡述二者的對(duì)抗關(guān)系。同時(shí),本文借助生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在人工智能領(lǐng)域,尤其是自然語(yǔ)言處理層面的互補(bǔ),揭示兩者在一定程度上的聯(lián)結(jié)關(guān)系,從而挖掘生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)的合作潛力。

      一、生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)的對(duì)抗

      生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在研究范圍、研究方法和研究程序上有較大的差異。

      1957年喬姆斯基《句法結(jié)構(gòu)》的出版標(biāo)志著生成語(yǔ)法的誕生。生成語(yǔ)法采用數(shù)學(xué)模擬方式來(lái)進(jìn)行語(yǔ)言研究,使用符號(hào)和公式來(lái)規(guī)定概念,表達(dá)規(guī)則,以嚴(yán)密的方法把語(yǔ)言機(jī)制形式化,以達(dá)到用有限的公式來(lái)生成無(wú)限的句子的目的。生成語(yǔ)法認(rèn)為,語(yǔ)言學(xué)的目的就是要形式化地構(gòu)造出語(yǔ)法的公理系統(tǒng),用以精確地描寫人的語(yǔ)言能力(沈家煊,2004)。生成語(yǔ)法的研究范圍限于人的語(yǔ)言知識(shí)或語(yǔ)言能力,而不是語(yǔ)言的運(yùn)用(徐烈炯 1988)。在研究方法上,生成語(yǔ)法主要采用內(nèi)省法,即語(yǔ)言學(xué)家本人作為資料提供人,將自己的語(yǔ)感作為判斷語(yǔ)言現(xiàn)象歧義、正誤、可接受性等的依據(jù)。在研究程序上,生成語(yǔ)法的研究一般包括九個(gè)步驟:定向、選題、發(fā)現(xiàn)、描寫、解釋、推廣、論證、批評(píng)、反應(yīng)(Botha 1981)。

      語(yǔ)料庫(kù)語(yǔ)言學(xué)是當(dāng)代語(yǔ)言學(xué)與計(jì)算機(jī)科學(xué)交叉的一門新興學(xué)科。它用計(jì)算機(jī)手段對(duì)巨量的語(yǔ)料庫(kù)進(jìn)行高速檢索、統(tǒng)計(jì)和展示,以揭示真實(shí)語(yǔ)言使用的傾向性規(guī)律及其所傳遞的意義、功能乃至思想意識(shí)(何安平 2012)。Hunston(2002)曾指出,語(yǔ)料庫(kù)語(yǔ)言學(xué)無(wú)論對(duì)語(yǔ)言研究還是語(yǔ)言的應(yīng)用研究都具有革命性的作用。語(yǔ)料庫(kù)語(yǔ)言學(xué)研究自然語(yǔ)言的使用,在研究范圍上一般涉及語(yǔ)言定量分析、詞典編纂、自然語(yǔ)言理解等領(lǐng)域。在研究方法上,主要包括兩個(gè)步驟:對(duì)自然語(yǔ)言進(jìn)行加工、標(biāo)注;對(duì)已經(jīng)標(biāo)注好的語(yǔ)料,采用數(shù)理統(tǒng)計(jì)的方法進(jìn)行研究。在研究程序上,語(yǔ)料庫(kù)語(yǔ)言學(xué)內(nèi)部有兩個(gè)不同的取向:“基于語(yǔ)料庫(kù)”和“語(yǔ)料庫(kù)驅(qū)動(dòng)”,兩者在語(yǔ)料庫(kù)的性質(zhì)、語(yǔ)料庫(kù)建設(shè)以及語(yǔ)料庫(kù)分析方面有較大差異。

      生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在研究理念上的本質(zhì)差異造成了兩者的對(duì)抗關(guān)系。喬姆斯基強(qiáng)調(diào)區(qū)分語(yǔ)言能力和語(yǔ)言應(yīng)用兩個(gè)概念。他認(rèn)為,語(yǔ)言學(xué)研究的對(duì)象應(yīng)當(dāng)是人腦的語(yǔ)言能力而非語(yǔ)言應(yīng)用。喬姆斯基(1965)指出,“任何自然語(yǔ)料都是偏頗的”,由于自然語(yǔ)料會(huì)受到各種因素的影響,因而以自然語(yǔ)料為研究對(duì)象、對(duì)語(yǔ)言應(yīng)用進(jìn)行分析的語(yǔ)料庫(kù)語(yǔ)言學(xué)無(wú)法揭示語(yǔ)言本質(zhì)。然而,Sinclair(1991)認(rèn)為,語(yǔ)料庫(kù)的研究方法“能夠系統(tǒng)地對(duì)大數(shù)量的文本語(yǔ)料進(jìn)行審視,使我們有可能發(fā)現(xiàn)一些以前從未有機(jī)會(huì)發(fā)現(xiàn)的語(yǔ)言事實(shí)。”同時(shí),生成語(yǔ)法具有高度的抽象性復(fù)雜性。雖然喬姆斯基一再?gòu)?qiáng)調(diào)短語(yǔ)結(jié)構(gòu)規(guī)則和轉(zhuǎn)換的簡(jiǎn)單化,然而深層結(jié)構(gòu)自身顯得抽象和復(fù)雜。再者,生成語(yǔ)法只能揭示人類語(yǔ)言能力的某些比較狹窄的方面,無(wú)法進(jìn)行語(yǔ)言的歷時(shí)研究以及對(duì)創(chuàng)造性語(yǔ)言的研究(如詩(shī)歌)。最后,生成語(yǔ)法的研究語(yǔ)料存在先驗(yàn)論的特性。例如在《句法結(jié)構(gòu)》中,喬姆斯基分析了28個(gè)自造的例句,這樣的語(yǔ)言數(shù)據(jù)脫離了語(yǔ)境,而語(yǔ)境恰恰在判斷句子是否合乎語(yǔ)法或是否可接受上具有重要作用。

      二、生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)的聯(lián)結(jié):人工智能

      (一)人工智能的產(chǎn)生與發(fā)展

      對(duì)人工智能(Artificial Intelligence,簡(jiǎn)稱AI)的正式研究發(fā)軔于1956年的達(dá)特茅斯會(huì)議。在此次會(huì)議上,約翰·麥卡錫首次提出了“人工智能”這一概念。也是在這次會(huì)議上,模擬人的啟發(fā)式搜索問題解決的計(jì)算機(jī)程序“邏輯理論家”證明了《數(shù)學(xué)原理》中的38條邏輯推理。這一事件被認(rèn)為機(jī)器執(zhí)行認(rèn)知任務(wù)的第一個(gè)實(shí)例,因而1956年也被稱為“AI誕生年”。

      20世紀(jì)60年代,人工智能的研究活動(dòng)越來(lái)越受到重視,研究者對(duì)求解、博弈、機(jī)器視覺、自然語(yǔ)言理解等領(lǐng)域進(jìn)行了深入研究,人工智能進(jìn)入高速發(fā)展時(shí)期。從20世紀(jì)80年代開始,經(jīng)過六十余年的發(fā)展,原先作為計(jì)算機(jī)科學(xué)領(lǐng)域分支的人工智能已成為跨領(lǐng)域的交叉學(xué)科,甚至成為人類科技?xì)v史發(fā)展上的本質(zhì)奇點(diǎn)。

      (二)生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)的聯(lián)結(jié)

      人工智能的核心在于“智能”和“自動(dòng)化”,一般根據(jù)“智能”和“自動(dòng)化”程度將人工智能的發(fā)展分為三個(gè)階段即:機(jī)器學(xué)習(xí)、機(jī)器智能、機(jī)器意識(shí)。實(shí)現(xiàn)“智能”和“自動(dòng)化”的關(guān)鍵技術(shù)主要包括自然語(yǔ)言處理(Natural Language Processing,簡(jiǎn)稱NLP)、自動(dòng)推理(Automated Reasoning)、機(jī)器學(xué)習(xí)(Machine Learning)等。其中,NLP涉及對(duì)語(yǔ)言的處理能力,是人工智能的高級(jí)表現(xiàn)形式。NLP的實(shí)現(xiàn)離不開語(yǔ)言學(xué),尤其是生成語(yǔ)法與語(yǔ)料庫(kù)語(yǔ)言學(xué)。

      1.生成語(yǔ)法在AI領(lǐng)域的應(yīng)用

      在1956年達(dá)特茅斯會(huì)議召開的同時(shí),喬姆斯基也在同年提出了生成語(yǔ)法,后發(fā)表在1957年出版的《句法結(jié)構(gòu)》中。生成語(yǔ)法的要領(lǐng)是:某一語(yǔ)言的全部合乎語(yǔ)法的句子是從一組抽象的符號(hào)通過一套規(guī)則的操作而生成出來(lái)的。當(dāng)今大多數(shù)用計(jì)算機(jī)來(lái)模擬人類認(rèn)知過程的系統(tǒng)都是基于這種“符號(hào)操作”模式,整個(gè)人腦被視為一部按程序操作符號(hào)的巨型計(jì)算機(jī)??梢姡斯ぶ悄茉诎l(fā)展初期就吸收了生成語(yǔ)法的觀點(diǎn)。同時(shí),傳統(tǒng)NLP涉及一個(gè)重要的步驟,即句法分析。生成語(yǔ)法在這一層面發(fā)揮著無(wú)可替代的作用。對(duì)于如:“今天晚上去吃火鍋吧,不,去吃燒烤吧?!边@樣的句子,機(jī)器本身無(wú)法意識(shí)到句子中自我糾正這一環(huán)節(jié)。那么,利用句法樹便可以對(duì)句子成分之間的結(jié)構(gòu)進(jìn)行簡(jiǎn)化,幫助機(jī)器在識(shí)別和理解句子的過程中,對(duì)說(shuō)話人的真正意圖進(jìn)行識(shí)別。

      2.語(yǔ)料庫(kù)語(yǔ)言學(xué)在AI領(lǐng)域的應(yīng)用

      NLP實(shí)現(xiàn)的前提是對(duì)機(jī)器的大量訓(xùn)練。通過對(duì)自然語(yǔ)言進(jìn)行詞語(yǔ)解析、信息抽取、時(shí)間因果、情緒判斷等技術(shù)處理,最終達(dá)到讓計(jì)算機(jī)“懂得”人類語(yǔ)言認(rèn)知。在NLP的底層數(shù)據(jù)層,語(yǔ)料庫(kù)功不可沒。例如,作為NLP基本步驟之一的分詞就需要語(yǔ)料庫(kù)技術(shù)的支持:

      a.她憑她的才能得到了這份工作。

      b.她這樣的人才能夠留下來(lái),是我們的幸運(yùn)。

      在上述兩個(gè)句子中,a句中的“才能”明顯是一個(gè)詞,而b句中的“人才”和“能夠”卻應(yīng)該分開。在訓(xùn)練分詞模型的過程中,針對(duì)固定詞表進(jìn)行“一刀切”顯然不可取。這時(shí)就需要大量的語(yǔ)料輸入幫助模型達(dá)到更好的準(zhǔn)確率。與之類似,現(xiàn)行的聊天機(jī)器人、機(jī)器翻譯等基于NLP開發(fā)的人工智能,在建設(shè)初期都離不開語(yǔ)料庫(kù)作為語(yǔ)義識(shí)別的基礎(chǔ)。

      總而言之,生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在人工智能的發(fā)展過程中均發(fā)揮著重要作用。一方面,基于語(yǔ)料庫(kù)訓(xùn)練的機(jī)器,學(xué)到的是大概率下最可能的說(shuō)法,因而生成的語(yǔ)言常常令人感到乏善可陳,丟失了人類語(yǔ)言的創(chuàng)造性。另一方面,純粹依靠生成語(yǔ)法的人工智能,雖然能生成無(wú)限多的句子,卻無(wú)法保證句子的正確性。由此可見,生成語(yǔ)法和語(yǔ)料庫(kù)在人工智能領(lǐng)域,尤其是NLP技術(shù)層面,存在互補(bǔ)的作用。

      三、結(jié)論

      本文通過分析生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在研究范圍、研究方法和研究思路上的差異,解釋了生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)的對(duì)抗關(guān)系。同時(shí),本文以生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)在人工智能領(lǐng)域,尤其是自然語(yǔ)言處理層面的互補(bǔ)關(guān)系,厘清了兩者的聯(lián)結(jié)關(guān)系。因而,生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)并非傳統(tǒng)觀點(diǎn)中單純對(duì)立關(guān)系,而是既對(duì)立又統(tǒng)一的復(fù)雜關(guān)系,共同寓于語(yǔ)言學(xué)研究中。

      事實(shí)上,許多語(yǔ)料庫(kù)語(yǔ)言學(xué)家積極投入語(yǔ)言理論的研究,而許多生成語(yǔ)法學(xué)家也十分關(guān)注作為理論研究基礎(chǔ)的數(shù)據(jù)。而其在人工智能領(lǐng)域的聯(lián)結(jié)或?qū)㈩A(yù)示著生成語(yǔ)法和語(yǔ)料庫(kù)語(yǔ)言學(xué)將在更多領(lǐng)域碰撞出意想不到的火花。

      參考文獻(xiàn):

      [1]Botha,R.The Conduct of Linguistic Inquiry[M].The Hague:Mouton,1981.

      [2]Chomsky,N.Aspect of the Theory of Syntax[M].Massachusetts:The MIT Press,1965.

      [3]Hunston,S.Corpora in Applied Linguistics[M].Cambridge:Cambridge University Press,2002.

      [4]Sinclair,J.Corpus,Concordance,Collocation[M].Oxford:Oxford University Press,1991.

      [5]何安平.語(yǔ)料庫(kù)語(yǔ)言學(xué)[J].中國(guó)外語(yǔ),2012(5):19.

      [6]沈家煊.人工智能中的“聯(lián)結(jié)主義”和語(yǔ)法理論[J].外國(guó)語(yǔ),2004(3):2-9.

      [7]王琦.語(yǔ)料庫(kù)語(yǔ)言學(xué)的發(fā)展及其與生成語(yǔ)法的關(guān)系[J].西北師大學(xué)報(bào)(社會(huì)科學(xué)版),2007(6):110-114.

      [8]徐烈炯.生成語(yǔ)法理論[M].上海:上海外語(yǔ)教育出版社,1988.

      [9]徐愚.機(jī)器與語(yǔ)言——對(duì)人工智能語(yǔ)義問題的探尋[D].北京:中共中央黨校,2016.

      猜你喜歡
      聯(lián)結(jié)人工智能
      我校新增“人工智能”本科專業(yè)
      2019:人工智能
      商界(2019年12期)2019-01-03 06:59:05
      人工智能與就業(yè)
      試誤學(xué)說(shuō)在生物習(xí)題課的應(yīng)用
      聯(lián)結(jié)型微課程在知識(shí)展示與建構(gòu)中的作用分析
      數(shù)讀人工智能
      小康(2017年16期)2017-06-07 09:00:59
      下一幕,人工智能!
      下一幕,人工智能!
      運(yùn)用“聯(lián)結(jié)”策略 提升閱讀素養(yǎng)
      2014社會(huì)創(chuàng)新周:創(chuàng)變客在這里“聯(lián)結(jié)”
      德阳市| 保康县| 云梦县| 偏关县| 昌图县| 德格县| 射阳县| 厦门市| 合阳县| 凤城市| 天等县| 东乌珠穆沁旗| 贺州市| 宜兰县| 惠东县| 普定县| 石河子市| 大兴区| 睢宁县| 桂阳县| 凤翔县| 镶黄旗| 方正县| 嘉荫县| 黑山县| 汉川市| 前郭尔| 奇台县| 中宁县| 永登县| 金塔县| 通海县| 夹江县| 宁国市| 鸡东县| 五台县| 文成县| 南宫市| 康保县| 永仁县| 民县|