薛 平
(波音公司 技術(shù)研究院,美國 西雅圖 98124)
自然語言是人類表達(dá)和交流最自然的方式。但其復(fù)雜性和模糊性也常常給有效的表達(dá)和交流帶來困難和問題?,F(xiàn)代社會(huì),尤其在當(dāng)前信息時(shí)代,有不少領(lǐng)域?qū)ο嚓P(guān)專業(yè)信息的清晰性和精準(zhǔn)性有很高的要求,以確保工程技術(shù)人員能夠準(zhǔn)確有效地理解并交流信息。其中有兩大類領(lǐng)域。第一類為由于系統(tǒng)和相關(guān)程序的復(fù)雜性而涉及大量的專業(yè)技術(shù)信息。這些技術(shù)信息必須清晰、精準(zhǔn)并且易于專業(yè)人員閱讀,以確保他們正確地理解其原理和要求,執(zhí)行相關(guān)的程序,維持系統(tǒng)的正常運(yùn)行。在這些領(lǐng)域中,語言的規(guī)范化和標(biāo)準(zhǔn)化至關(guān)重要,民用飛機(jī)的設(shè)計(jì)、生產(chǎn)、營運(yùn)和維修就是個(gè)典型的例子。例如,歐洲航空航天和國防工業(yè)協(xié)會(huì)(AeroSpace and Defence Industries Association of Europe)的技術(shù)信息標(biāo)準(zhǔn)S1000D,包括ASD-STE100[1]。第二類涉及人機(jī)互動(dòng),要求相關(guān)的語言既便于人的使用又適合計(jì)算機(jī)自動(dòng)分析處理。典型的例子包括人工智能領(lǐng)域中的多種應(yīng)用,例如,自然語言界面。這些類型的規(guī)定和要求推動(dòng)了受控自然語言的產(chǎn)生和發(fā)展。嚴(yán)格定義的受控語言有助于人與人的有效交流以及人與機(jī)器之間的交互。受控自然語言企圖在自然和精準(zhǔn)之間找到平衡,在人的需求和機(jī)器的需求之間達(dá)到某種程度的妥協(xié)。受控自然語言使用受限制的自然語言語法規(guī)則和詞匯, 它通常是常規(guī)語言的子集是與常規(guī)語言重疊的。這給語言解析和處理帶來特有的挑戰(zhàn)。
本文討論受控自然語言及其性質(zhì)、分類和應(yīng)用,以及計(jì)算處理方法。本文的組織結(jié)構(gòu)如下: 第一節(jié)討論受控自然語言的類型和屬性,同時(shí)介紹幾個(gè)著名的受控英語的實(shí)例以及各自的特性。第二節(jié)以航空工業(yè)民用飛機(jī)所涉及的英語文本數(shù)據(jù)為例來表述受控自然語言在工業(yè)中的應(yīng)用及重要性,并介紹工業(yè)界的語言需求和規(guī)范。第三節(jié)討論實(shí)現(xiàn)簡化技術(shù)英語計(jì)算機(jī)軟件檢測系統(tǒng)的一種方法,以及受控自然語言廣泛的意義和價(jià)值。第四節(jié)將涉及其他領(lǐng)域,包括當(dāng)前熱門的人工智能等相關(guān)的課題。第五節(jié)總結(jié)本文提出的要點(diǎn), 同時(shí)簡要討論受控自然語言在語言解析和處理上存在的挑戰(zhàn)。
受控自然語言由于它的多樣性而沒有一個(gè)準(zhǔn)確且被大家共同接受的嚴(yán)謹(jǐn)?shù)亩x。綜合起來,受控自然語言可以被定義為[2]:
受控自然語言是基于某種自然語言人為定義的一種語言。在保留了自然語言大部分自然屬性的同時(shí),在詞匯、句法以及語義上都加上限制條件以控制自然語言的多樣性、復(fù)雜性和由此可能產(chǎn)生的歧義。
受控自然語言根據(jù)目標(biāo)和用途可分為兩大類:
(1) 第一類是受控自然語言的目標(biāo)在于提高語言表達(dá)的清晰性和精準(zhǔn)性。
① 提高文本的可讀性;
② 改善人與人之間的信息交流與溝通。
(2) 第二類是受控自然語言的目標(biāo)在于提供自然而直觀的形式語言表達(dá)式。
① 對(duì)該語言進(jìn)行可靠的機(jī)器分析和計(jì)算處理;
② 便于人機(jī)交流和互動(dòng)。
世界上有不少類似的語言都屬于受控自然語言范疇。其中,僅受控英語就約有100多種[2]。有記載的受控英語已有80多年的歷史[3]。由于起源、發(fā)展背景以及應(yīng)用環(huán)境和應(yīng)用目的不同,各種受控自然語言被賦予了不同的名字,例如,“可控英語”(controlled English)、“可處理英語”(processable English)、“簡化英語”(simplified English)、“基本英語”(basic English)等。這些語言雖都屬受控語言的范疇,但它們各自有不同的特點(diǎn)和性質(zhì),在詞匯、語法和語義上受限制的方式和程度也各不相同。有些受控語言有較強(qiáng)的表達(dá)力,與此同時(shí)對(duì)歧義的容忍度也相對(duì)較寬。有些受控語言被定義得相當(dāng)嚴(yán)密、準(zhǔn)確,猶如形式邏輯和計(jì)算機(jī)編程語言。以下簡要介紹四種著名的受控英語實(shí)例。
(1) 卡特彼勒基本英語
卡特彼勒基本英語(Caterpillar Fundamental English,CFE[4])被認(rèn)為是有史以來第一個(gè)基于行業(yè)的受控英語,屬于上文提到的第一類受控自然語言,其目標(biāo)是提高語言表達(dá)的清晰性和精準(zhǔn)性,以改善人與人之間的交流溝通??ㄌ乇死帐鞘澜缰墓こ虣C(jī)械公司,美國財(cái)富100家公司之一,主要開發(fā)、生產(chǎn)和銷售大型工程機(jī)械。隨著公司產(chǎn)品日益復(fù)雜,與顧客進(jìn)行順暢的技術(shù)交流變得非常關(guān)鍵和重要,但對(duì)于不少顧客,英語并非其母語,卡特彼勒大約有兩萬多種技術(shù)文件??ㄌ乇死盏某踔允窍M肅FE來書寫技術(shù)文件,并通過CFE的語言培訓(xùn)使專業(yè)技術(shù)人員不用翻譯就理解技術(shù)文件。最初的CFE的詞匯被限制在800~1 000個(gè)單詞,且規(guī)定了每個(gè)單詞有獨(dú)一無二的含義。CFE在語法上采用了一系列的限制,包括以下規(guī)則[5]:
① 采用陳述句;
② 避免冗長而復(fù)雜的句子;
③ 避免一個(gè)句子中的題目過多;
④ 避免過多的形容詞和名詞連用;
⑤ 使用統(tǒng)一的句子結(jié)構(gòu);
⑥ 避免用復(fù)雜的過去和將來時(shí)態(tài)。
而這些所謂的限制不過是一般的指南而已,很難說是真正的語法規(guī)則。因此,CFE的一大弱點(diǎn)是其不可強(qiáng)制執(zhí)行性。這些規(guī)則都比較模糊,仁者見仁,智者見智,用戶可根據(jù)自己的理解而執(zhí)行,因此也難以保證技術(shù)文件書寫的標(biāo)準(zhǔn)化和一致性。卡特彼勒隨后開發(fā)了卡特彼勒技術(shù)英語(Caterpillar Technical English,CTE[6]),在詞匯的用法和語義上采用了較為嚴(yán)格且具體的限制,在語法上也增加了清晰的限制規(guī)定。更為重要的是,卡特彼勒開發(fā)了配套的計(jì)算機(jī)軟件系統(tǒng)自動(dòng)分析句法和詞匯,通過人機(jī)互動(dòng)來進(jìn)一步加強(qiáng)和有效地執(zhí)行語法和詞匯的規(guī)則。雖然最初的CFE僅僅是感性的規(guī)則,但其基本理念產(chǎn)生的影響甚為深遠(yuǎn)。
(2) 簡化技術(shù)英語
簡化技術(shù)英語(The Simplified Technical English Specification,ASD-STE)[注]ASD-STE是European Aeronautics, Space, Defence and Security Industries—The Simplified Technical English Specification的縮寫。參看:http://www.trasportilogistica.ittvt.gov.it/PDF/ASD-STE100-ISSUE7.pdf.也屬于前文提到的第一類受控自然語言,由歐洲航空公司協(xié)會(huì)(The Association of European Airlines,AEA)發(fā)起,聯(lián)合歐洲航空和國防工業(yè)協(xié)會(huì)(European Aeronautics, Space, Defence and Security Industries,ASD)與美洲航天工業(yè)協(xié)會(huì)(The Aerospace Industries Association of America,AIA)共同研討開發(fā),于1986年推出了第一個(gè)版本。英語是航空航天和國防工業(yè)技術(shù)文件的世界通用語言。ASD-STE在常規(guī)英語的語法和詞匯上都加上了限制,其目標(biāo)是想要通過限制英語語法規(guī)則和詞匯用法規(guī)則來控制技術(shù)文檔中語言應(yīng)用的復(fù)雜性,減少可能出現(xiàn)的歧義,提高文檔表達(dá)的清晰度和精準(zhǔn)度,以便技術(shù)文檔的閱讀者特別是非英語母語的閱讀者能正確理解文件的內(nèi)容。由于航空系統(tǒng)本身的復(fù)雜性,航空技術(shù)文件及其內(nèi)容非常復(fù)雜,但航空系統(tǒng)的正確運(yùn)行和維護(hù)關(guān)系重大,因此航空技術(shù)文件精準(zhǔn)的表達(dá)和相關(guān)人員對(duì)技術(shù)文件正確的理解至關(guān)重要。美國聯(lián)邦航空管理局(Federal Aviation Administration of the United States,F(xiàn)AA)對(duì)航空技術(shù)信息特別是航空維修手冊以及技術(shù)服務(wù)公告(service bulletins)等文件的規(guī)范管理和審核十分嚴(yán)格。ASD-STE采用60多條語法規(guī)則限制,并發(fā)布了字典,明確羅列可以使用的英語詞匯以及這些詞匯相關(guān)的語義和用法。這些限制使ASD-STE的文本更清晰、精準(zhǔn)且易于閱讀。ASD-STE已成為國際航空和國防工業(yè)技術(shù)文件的書寫標(biāo)準(zhǔn)。近年來隨著國際化的推進(jìn),ASD-STE也被其他領(lǐng)域,例如,語言服務(wù)、專業(yè)英語翻譯以及學(xué)術(shù)界所采用。我們將在第二節(jié)“受控自然語言在工業(yè)場景中的應(yīng)用及重要性”中更為詳細(xì)地介紹ASD-STE的規(guī)則及特性。
(3) Attempto受控英語
Attempto受控英語(ACE[7])屬于第二類受控自然語言,在語法規(guī)則和語義解釋上都受到嚴(yán)格的限制,以致它的每個(gè)表達(dá)式都可無歧義地被自動(dòng)轉(zhuǎn)換為一階邏輯的表達(dá)式,因此它事實(shí)上是一種形式語言。ACE限制有明顯歧義的英語結(jié)構(gòu),并且通過使用一組無歧義的解釋規(guī)則對(duì)某些可能有歧義的句子進(jìn)行唯一而無歧義的解釋。當(dāng)仍有多種可能的解釋時(shí),ACE引擎讓用戶選擇其中之一。ACE有較為豐富的表達(dá)力,它不僅允許使用及物動(dòng)詞和不及物動(dòng)詞,還能用雙賓語動(dòng)詞。不僅可用簡單句,也可用簡單句以遞歸的方式構(gòu)建復(fù)合句。ACE保留了許多英語的自然屬性,又具有形式語言的特性,可作為統(tǒng)一建模語言(UML)的替換語言,描述軟件規(guī)范;也可替換網(wǎng)絡(luò)本體語言(OWL),描述各種信息以及信息之間的關(guān)系。因此,近年來ACE及其相關(guān)工具已用于書寫軟件規(guī)范、定理證明、知識(shí)和語義網(wǎng)表示、查詢語言和自然語言用戶界面等。更詳細(xì)的討論,參閱文獻(xiàn)[8]。
(4) 計(jì)算機(jī)可處理英語
計(jì)算機(jī)可處理英語(簡稱CPL[9])也屬于第二類受控自然語言,由波音公司研究院研發(fā)。其目標(biāo)是用來支持知識(shí)獲取收集,以及建立知識(shí)庫,特別是建立可推理的知識(shí)庫。CPL定義的基本句型是:
? 主語+動(dòng)詞+補(bǔ)語(+修飾語)
CPL規(guī)定一個(gè)完整的句子必須有主語、動(dòng)詞和補(bǔ)語,而修飾語則是可有可無??捎妹~、形容詞、介詞短語等做修飾語。其語法限制還包括:不允許用代詞;名詞的指向必須是特指的;簡單句子可用連接詞“and”連接構(gòu)成并列句。
CPL允許的句子可分為三類:基本事實(shí)陳述句、問句和推理規(guī)則句。問句包括兩種基本句型:
? What is NP?
? Is it true that Sentence?
推理規(guī)則句的基本句型為:
? IF Sentence 1 THENtypicallySentence 2.
在以上的句型中,Sentence 1和Sentence 2都必須是滿足以上CPL限制規(guī)則的句子,可以是帶連接詞“and”的復(fù)合句。CPL引擎使用啟發(fā)式規(guī)則和輔助的詞匯資源(如WordNet)來排除歧義、限定語義關(guān)系。我們將在第四節(jié)更為詳細(xì)地討論CPL的語法解析、語義解釋及其主要的應(yīng)用。
綜上所述,任何受控自然語言都是自然語言的受限版本,在語法、詞匯和語義上通過明確定義受到限制,使其減少了復(fù)雜性和可能產(chǎn)生的歧義,有助于人們的閱讀和理解,或便于計(jì)算機(jī)對(duì)其進(jìn)行處理。第一類和第二類受控自然語言的區(qū)別在于目標(biāo)不同,因此在詞匯、語法和語義上受限制的方式和程度不同。需要指出的是,雖然受控自然語言通常在很大程度上保留了原語言的自然性,但其語法規(guī)則和詞匯用法的限制是人為的,因此受控自然語言并不是自然衍生的語言,而是一種人造語言,一種構(gòu)建的語言,使用起來也不是完全自然的。
現(xiàn)代社會(huì)有不少場景要求清晰、精準(zhǔn)而又較為自然的表達(dá)和交流。民用航空領(lǐng)域是個(gè)典型的例子。大型民用飛機(jī)可能是當(dāng)今最為復(fù)雜的工程系統(tǒng)之一。從飛機(jī)的設(shè)計(jì)、生產(chǎn),到飛行營運(yùn),到日常的維護(hù),涉及海量的技術(shù)信息。以民用飛機(jī)日常的運(yùn)行維修所涉及的技術(shù)信息為例,其技術(shù)信息有三大特征。
(1) 技術(shù)信息量非常巨大
大型民用飛機(jī),如一架波音B747或者空客A380客機(jī)有大約300萬—600萬個(gè)零件。單架飛機(jī)維修手冊通常平均超過4萬頁。波音公司每年為大約13 000架正在服役的飛機(jī)共出版約3億頁的技術(shù)維修資料(包括增補(bǔ)、更新)。如果這些技術(shù)資料是紙質(zhì)的,把它們一頁一頁疊起來,相當(dāng)于十萬多英尺高[注]印刷用紙的厚度通常大約在0.003到 0.007英寸之間。,也就是相當(dāng)于三到四倍于珠穆朗瑪峰的高度,如圖1所示。
圖1 海量的維修信息
(2) 客戶特定的內(nèi)容和配置極為廣泛
即使相同類型的商用飛機(jī)也在很多方面會(huì)有差異。這常常是源于產(chǎn)品的不斷改進(jìn)以及客戶對(duì)定制飛機(jī)的需求。即使同一公司定制的相同類型的飛機(jī)也會(huì)如此。飛機(jī)這些差異可大可小,可以是用不同的發(fā)動(dòng)機(jī),也可以僅僅是某個(gè)斷路器位于飛機(jī)上不同的位置。這些差異意味著不同的飛機(jī)維護(hù)程序。因此每架飛機(jī)的維修技術(shù)資料都可以說是特定的, 不能與其他飛機(jī)的維修技術(shù)資料相混淆。
(3) 十分頻繁的技術(shù)資料修改和更新
技術(shù)信息需要持續(xù)和及時(shí)地修改更新才能有效。修改和更新的主要原因包括:
① 新的系統(tǒng)配置;
② 工程上的改動(dòng);
③ 工程技術(shù)程序的改進(jìn);
④ 客戶的要求和反饋。
因此,波音公司和空客公司都支持頻繁的技術(shù)文件更新,平均每90~120天就會(huì)有一次更新。如此龐大的信息數(shù)據(jù),加上廣泛的配置差異,導(dǎo)致修改和更新相關(guān)的部分并妥善管理,確保文件的準(zhǔn)確性和一致性成為一項(xiàng)極為繁瑣而重大的任務(wù)??紤]到這些因素,90天到120天實(shí)在不是一個(gè)太長的時(shí)間。
民用飛機(jī)技術(shù)資料的復(fù)雜性直接反映了飛機(jī)系統(tǒng)的復(fù)雜性。某種意義上說,飛機(jī)的技術(shù)資料以及各個(gè)部分之間在形式上(包括語言形式)和內(nèi)容上的關(guān)系與飛機(jī)系統(tǒng)同樣復(fù)雜。為了規(guī)范編寫、出版和管理民用飛機(jī)技術(shù)信息,美國航空運(yùn)輸協(xié)會(huì)(ATA)[注]ATA的全稱是Air Transport Association of America。與歐洲航空和國防工業(yè)協(xié)會(huì)分別頒布了信息標(biāo)準(zhǔn)、國際技術(shù)出版規(guī)范,如Spec100,iSpec 2200,S1000D,包括數(shù)據(jù)規(guī)范和數(shù)據(jù)模型。換句話說,飛機(jī)技術(shù)文件,例如,維修手冊雖然是文檔的形式,但已經(jīng)被看成是一種工程規(guī)范,要求信息的精準(zhǔn)和清晰,有助于準(zhǔn)確理解、正確維修,確保系統(tǒng)正常運(yùn)行和飛行安全[注]近年來,ASD規(guī)范S1000D以及ASD-STE也逐步被用于美國軍方陸地、海上和空中合同。但民用航空其他技術(shù)文件和工程文件,比如飛行機(jī)組操作手冊,根據(jù)目前的規(guī)定不必滿足ASD-STE規(guī)范。。作為技術(shù)信息標(biāo)準(zhǔn)S1000D的一個(gè)組成部分,ASD-STE 簡化技術(shù)英語成為技術(shù)文件的語言國際標(biāo)準(zhǔn)。雖然各國相關(guān)的法規(guī)并沒有硬性要求民用航空的技術(shù)文件必須用ASD-STE編寫,但在實(shí)踐中,航空公司幾乎都在購買飛機(jī)的合同中明確要求相關(guān)的技術(shù)文件,特別是飛機(jī)的維修技術(shù)手冊,包括服務(wù)公告(service bulletins)必須使用ASD-STE編寫。與此同時(shí),政府航空管理部門,如美國聯(lián)邦航空管理局,對(duì)關(guān)鍵的航空技術(shù)文件的清晰性、可讀性有相當(dāng)嚴(yán)格的規(guī)定和審核程序。事實(shí)上,提高技術(shù)文件的清晰性、可讀性和編寫質(zhì)量也符合飛機(jī)生產(chǎn)廠家的切身利益。技術(shù)文件若不明確清晰,不僅會(huì)造成難以想象的事故,而且客戶會(huì)不斷地提出問題,咨詢服務(wù)并解決這些問題也是不可低估的人力和資金的耗費(fèi)[注]據(jù)報(bào)道,波音和空客的技術(shù)文檔有關(guān)部門每年約耗費(fèi)20%的經(jīng)費(fèi)用于回應(yīng)、解決客戶提出的問題。。
第一節(jié)提到卡特彼勒公司希望通過CFE的語言培訓(xùn)使專業(yè)技術(shù)人員掌握CFE,不僅用于編寫技術(shù)文件,而且能準(zhǔn)確理解這些文件的內(nèi)容[注]我們把卡特彼勒受控英語通稱為CFE,實(shí)際包括CFE和CTE。。卡特彼勒公司認(rèn)識(shí)到僅僅依靠語言培訓(xùn)還不夠,還要有配套的計(jì)算機(jī)軟件協(xié)助相關(guān)人員使用CFE。實(shí)踐證明,計(jì)算機(jī)軟件直接關(guān)系到使用受控自然語言的有效性和成敗。事實(shí)上,絕大多數(shù)的受控自然語言都有相應(yīng)的語言處理系統(tǒng)。受控自然語言雖然基于自然語言,保留了自然語言的很多自然特性,但它畢竟是人為定義的語言,在使用時(shí)與自然語言是有沖突的。人們在使用語言時(shí)若沒有計(jì)算機(jī)軟件檢測和輔助,便會(huì)不自覺地使用自然語言。而且人工審校受控自然語言文件的合格程度十分有限,效率低,因?yàn)槭褂米匀徽Z言是人的本能。
為了更好地遵守、執(zhí)行國際技術(shù)語言規(guī)范,ASD-STE計(jì)算機(jī)軟件檢測系統(tǒng)應(yīng)運(yùn)而生。例如,波音公司研究院在20世紀(jì)80年代就著手研發(fā)了人機(jī)交互式語法檢查軟件系統(tǒng),被稱為波音簡化英語檢測器(Boeing Simplified English Checker)[注]參看:https://www.boeing.com/company/key-orgs/licensing/simplified-english-checker.page.。并且多年來一直在為完善計(jì)算機(jī)軟件工具而不斷努力。這一軟件系統(tǒng)自動(dòng)處理必須符合ASD-STE規(guī)范的技術(shù)文件資料,檢查發(fā)現(xiàn)不符合ASD-STE規(guī)則的用法并根據(jù)簡化技術(shù)英語標(biāo)準(zhǔn)提供相關(guān)的反饋,以協(xié)助文件作者提高文件的清晰度、精準(zhǔn)度,以及書寫質(zhì)量。第一節(jié)中提到,ASD-STE包含規(guī)則和詞典兩個(gè)組成部分。以下是ASD-STE規(guī)則的幾個(gè)例子:
? 規(guī)則1.2: 使用ASD-STE詞典中的ASD-STE認(rèn)可的單詞及相關(guān)的詞性;
Example: “test”只能用作名詞test(n),不能用作動(dòng)詞test(v)。
? 規(guī)則2.1: 復(fù)合名詞不可包括三個(gè)以上的名詞。
Example: (NON-STE)universitystudentadmissionmeeting
? 規(guī)則3.1: 不用動(dòng)詞“-ing”的形式,除非動(dòng)詞“-ing”的形式是專用名詞或?qū)S妹~的組成部分。
Example: (NON-STE)Theindicatoriswarningthepilot.
(STE)Theindicatorwarnsthepilot.
(STE)TheWarningIndicatorison.
? 規(guī)則3.7: 在書寫程序或者步驟時(shí),用主動(dòng)語態(tài)而不用被動(dòng)語態(tài)。在描述性語言中盡量不用被動(dòng)語態(tài)。
Example: (NON-STE)Oilandgreasearetoberemovedwithadegreasingagent.
(STE)Removeoilandgreasewithadegreasingagent.
? 規(guī)則3.8: 當(dāng)詞典中有STE認(rèn)可的表述相關(guān)動(dòng)作的動(dòng)詞時(shí),用這一動(dòng)詞來描述相關(guān)的動(dòng)作,而不能用這一詞的其他詞性。
Example: (NON-STE)Thisisanindicationofsystemfailure.
(STE)Thisindicatessystemfailure.
計(jì)算機(jī)自動(dòng)檢測ASD-STE規(guī)則軟件系統(tǒng)必須嚴(yán)格遵守ASD-STE規(guī)則,準(zhǔn)確識(shí)別任何違反ASD-STE規(guī)則的詞匯、短語和句子。ASD-STE的規(guī)則在常規(guī)英語規(guī)則的基礎(chǔ)上加上了額外的限制。凡是符合常規(guī)英語規(guī)則且不違背ASD-STE規(guī)則的語言都是ASD-STE。因此,ASD-STE檢測軟件系統(tǒng)要有實(shí)際的用處,不僅能對(duì)文本中不符合ASD-STE規(guī)范的錯(cuò)誤做出識(shí)別和反饋,還要識(shí)別不符合常規(guī)的英語語法用法等錯(cuò)誤。換言之,ASD-STE檢測系統(tǒng)既需要實(shí)現(xiàn)常規(guī)英語語法規(guī)范,還得實(shí)現(xiàn)ASD-STE的規(guī)范。我們在下文中介紹一種實(shí)現(xiàn)這一軟件系統(tǒng)的方法。這一方法基于常規(guī)英語語法規(guī)則和ASD-STE規(guī)則,詳細(xì)地表達(dá)詞匯、語法規(guī)則以及語法關(guān)系的信息,對(duì)輸入的語句進(jìn)行詞匯和句法解析。絕大多數(shù)語法解析系統(tǒng)的處理方法都是只受理符合語法的短語和句子,只能給符合語法的短語和句子作完整的解析。要識(shí)別不符合語法的短語和句子并指出相關(guān)的錯(cuò)誤,必須延伸擴(kuò)展語法解析系統(tǒng),使其能受理不符合語法的短語和句子,并能夠?qū)Σ环险Z法的短語和句子中的錯(cuò)誤進(jìn)行解析。
第一節(jié)中提到受控英語是建立在常規(guī)英語的基礎(chǔ)上,使用受限制的語法規(guī)則、詞匯和語義, 它通常是常規(guī)英語的子集,與常規(guī)英語重疊。違反英語語法、ASD-STE規(guī)范的常見錯(cuò)誤包括的錯(cuò)誤句型、錯(cuò)誤詞匯可以看成一個(gè)語言的模式集合,以“違規(guī)規(guī)則”(包括“違規(guī)詞條”)的形式分別概括每一類錯(cuò)誤,匯集起來以定義這個(gè)違規(guī)集合[注]關(guān)于“違規(guī)規(guī)則”的應(yīng)用,參看文獻(xiàn)[10-11]。。常規(guī)英語、ASD-STE、常見的語法及用法錯(cuò)誤各自體現(xiàn)的集合分別由三組規(guī)則來定義。三者之間的關(guān)系示意圖如圖2所示[注]ASD-STE在某些方面可能超越常規(guī)英語的允許范圍,比如在專業(yè)名詞的使用上。。如此延伸擴(kuò)展的語法解析系統(tǒng)體現(xiàn)了這三組規(guī)則的集合。
圖2 常規(guī)英語、ASD-STE和常見錯(cuò)誤的集合關(guān)系常規(guī)英語規(guī)則?常規(guī)英語常規(guī)英語規(guī)則和ASD-STE規(guī)則?ASD-STE簡化技術(shù)英語違規(guī)規(guī)則?常見錯(cuò)誤
常規(guī)英語語法詞法規(guī)則定義常規(guī)英語。ASD-STE語法詞法規(guī)則在常規(guī)英語的基礎(chǔ)上規(guī)定了額外的限制,定義簡化技術(shù)英語。因此凡是沒有違反ASD-STE規(guī)則、符合常規(guī)英語規(guī)則的語言現(xiàn)象都在ASD-STE范圍內(nèi)?!斑`規(guī)規(guī)則”定義常見錯(cuò)誤,即違反ASD-STE規(guī)則的語言現(xiàn)象。常見錯(cuò)誤包括符合常規(guī)英語語法、詞法規(guī)則但違反ASD-STE 規(guī)則的語言現(xiàn)象,比如包含三個(gè)以上名詞的復(fù)合名詞、被動(dòng)語態(tài)的句子等。圖2中違規(guī)規(guī)則雖然與常規(guī)英語規(guī)則部分重疊,但擴(kuò)展了常規(guī)英語規(guī)則定義的語言范圍,使?jié)M足違規(guī)規(guī)則的結(jié)構(gòu)得以編譯并生成解析樹圖。因?yàn)樗械倪`規(guī)規(guī)則都帶有違規(guī)特征標(biāo)志,語法檢測算法跟蹤記錄了使用違規(guī)規(guī)則在解析樹圖中的位置,這一信息正是診斷錯(cuò)誤的關(guān)鍵?;谝陨先M規(guī)則,軟件系統(tǒng)對(duì)輸入的語料進(jìn)行深度解析,對(duì)任何違反ASD-STE 規(guī)則的輸入語料給出相應(yīng)的反饋[注]波音簡化英語檢測器軟件系統(tǒng)采用了類似的違規(guī)規(guī)則方法。。
這一方法采用中心詞驅(qū)動(dòng)短語結(jié)構(gòu)語法理論框架[12]。語言模型采用特征結(jié)構(gòu),詳細(xì)地表達(dá)詞匯、語法規(guī)則以及語法關(guān)系的信息[13],并采用自下而上的圖表解析法對(duì)語料進(jìn)行表達(dá)、解析和處理。圖3是簡單的主謂關(guān)系的表達(dá)式[注]有關(guān)這一理論框架以及表達(dá)式的詳細(xì)信息, 請參閱本文應(yīng)用的參考資料文獻(xiàn)[13]。。
圖3 特征結(jié)構(gòu)表達(dá)式
特征結(jié)構(gòu)詳細(xì)地表達(dá)了有關(guān)詞匯、語法規(guī)則以及語法關(guān)系的信息,比如在以上結(jié)構(gòu)中中心詞(即動(dòng)詞)對(duì)主語的組合搭配的要求。這里以共享的索引標(biāo)記簡略表示相互搭配的關(guān)系。因此任何主謂不搭配的句子都將在該句的特征結(jié)構(gòu)中表達(dá)出來,而使系統(tǒng)能給出詳細(xì)而準(zhǔn)確的反饋。豐富的信息表達(dá)加上詳細(xì)的結(jié)構(gòu)解析使其能夠正確識(shí)別各種錯(cuò)誤的詞匯、復(fù)合名詞及其組成部分、動(dòng)詞特征和形態(tài)、詞語之間的關(guān)系等。
顯然,這一基于規(guī)則的方法并不是當(dāng)今流行的自然語言處理的方法。近30年來,絕大多數(shù)自然語言處理的研究和應(yīng)用注重統(tǒng)計(jì)模型及相關(guān)算法的研究和應(yīng)用。機(jī)器學(xué)習(xí),特別是深度學(xué)習(xí)(deep learning)的方法,被廣泛應(yīng)用在自然語言處理這一傳統(tǒng)領(lǐng)域中并取得了不少突破。我們這里采用基于規(guī)則方法的主要原因是由文本規(guī)則檢測這一問題的性質(zhì)和要求所決定。檢測發(fā)現(xiàn)不符合規(guī)則的用法并根據(jù)簡化技術(shù)英語標(biāo)準(zhǔn)提供相應(yīng)的反饋是一個(gè)精準(zhǔn)度要求極高的任務(wù),需要對(duì)詞匯、句子結(jié)構(gòu)以及語義做深度解析才能準(zhǔn)確地指出錯(cuò)誤。數(shù)據(jù)統(tǒng)計(jì)的方法能統(tǒng)計(jì)出詞匯、語串(包括短語),甚至語串之間的相關(guān)性,以及句子在日常語料中出現(xiàn)的頻率。問題是根據(jù)頻率特別是根據(jù)短語或句子出現(xiàn)的頻率難以準(zhǔn)確地判別這些短語或者句子是否符合語法、是否符合ASD-STE 規(guī)則、是否符合規(guī)范的語言標(biāo)準(zhǔn)。語言是有層級(jí)結(jié)構(gòu)的,句子中的某個(gè)組成部分,例如,詞或者短語使用得正確與否,常常與句子中的其他部分及其語法功能相互依賴,而且這些相互依賴的句子成分往往不是相互鄰接,他們相隔的距離可以是隨機(jī)任意的,比如上面提到的英語主語、謂語搭配的問題。主謂搭配涉及動(dòng)詞的形態(tài)與主語中心詞的特征之間的搭配,做主語的名詞短語可以任意地復(fù)合,比如帶多個(gè)修飾語和復(fù)合從句致使主語的中心詞與相搭配的動(dòng)詞相隔甚遠(yuǎn)。例如,“The university student admission meetings that we attended after the school had started was planned strictly according to the school tradition?!边@個(gè)句子有主謂搭配的語法錯(cuò)誤。主語的中心詞“meetings”是復(fù)數(shù)形式而動(dòng)詞卻錯(cuò)用了單數(shù)形式。雖然主語、謂語不相鄰接,但它們?nèi)孕枰趩螐?fù)數(shù)的形式上相互一致。
事實(shí)上,英語中類似的語言現(xiàn)象非常多。比如,英語疑問句中相關(guān)成分移位也常常造成句子成分不鄰接?;跀?shù)據(jù)統(tǒng)計(jì)的方法基本上是建立在線性序列基礎(chǔ)上,將字或者詞等線性符號(hào)串作為基本運(yùn)算單位,語言模型對(duì)基本語言單位的鄰接關(guān)系進(jìn)行統(tǒng)計(jì)和概率度量,不對(duì)句子的層級(jí)結(jié)構(gòu)及語法功能進(jìn)行深度的解析,而且也不具有豐富的詞匯、語法和語義表達(dá)式,因而難以準(zhǔn)確地識(shí)別句子成分之間的語法關(guān)系,特別是遠(yuǎn)距離的相互依賴關(guān)系,難以精準(zhǔn)地識(shí)別相關(guān)的錯(cuò)誤以及錯(cuò)誤在句子中的具體位置。需要指出的是,雖然我們主張采用這一基于語言規(guī)則的方法,但在整個(gè)處理過程中不少步驟采用統(tǒng)計(jì)的方法有明顯優(yōu)勢,特別是在某些預(yù)處理和后處理的步驟中,比如詞性標(biāo)記、解析排序、排除歧義及判斷習(xí)慣的用法傾向等。我們知道語言中有不少現(xiàn)象具有不確定性,取決于場景,例如,輸入的句子可能有多種合理的分析和解釋。這類具有不確定性的語言現(xiàn)象難以被固定的規(guī)則所概括。因此,基于規(guī)則的方法與統(tǒng)計(jì)方法相結(jié)合,在處理的過程中應(yīng)用了大數(shù)據(jù)及其相關(guān)的分析方法,這不僅對(duì)嚴(yán)格的語法規(guī)則以及違反詞匯、語法、語義和風(fēng)格規(guī)則的錯(cuò)誤能夠進(jìn)行準(zhǔn)確、清晰的識(shí)別,而且對(duì)習(xí)慣的用法傾向和具有不確定性的語言現(xiàn)象也能做出相應(yīng)的判斷和恰當(dāng)?shù)姆答?。這些功能在文件檢測、修訂中有多方面的應(yīng)用。
事實(shí)上,受控自然語言除工業(yè)技術(shù)文件的編寫出版的應(yīng)用外,還有非常廣泛的應(yīng)用。工業(yè)技術(shù)文件使用受控自然語言僅僅涉及第一類受控自然語言。其主要目標(biāo)在于加強(qiáng)語言表達(dá)的清晰性和精準(zhǔn)性,以提高文本的可讀性,改善人與人之間的交流溝通。下面我們簡要討論第二類受控自然語言的應(yīng)用,其應(yīng)用與一系列的人工智能的應(yīng)用相關(guān)。第二類受控自然語言被定義得相當(dāng)嚴(yán)密、準(zhǔn)確,提供了一種自然而直觀的語言表達(dá)式,既能實(shí)現(xiàn)受控語言自動(dòng)機(jī)器分析和處理,也便于人機(jī)交流和互動(dòng)。這就為很多應(yīng)用提供了可能性,也為很多人工智能的應(yīng)用提供了自然的交互手段。物聯(lián)網(wǎng)各種器件的人機(jī)自然語言交互、機(jī)器人或無人飛行器的自然語言控制,以及其他系統(tǒng)的自然語言界面等,都是大家熟悉的例子。這些領(lǐng)域都有特定的場景,其常用的指令是有限的,而且大部分指令不要求復(fù)雜而多樣化的語言形式,因?yàn)樘囟ǖ膱鼍跋薅丝赡艿膬?nèi)容,語義也相對(duì)直接而簡單明了,但這些應(yīng)用對(duì)語義的解釋都要求比較精準(zhǔn)。例如,亞馬遜的智能音箱Echo,它通過語音交互除播放音樂、新聞外,還能控制智能家居設(shè)備(例如,智能燈、空調(diào)、電視等)、叫出租車、從亞馬遜網(wǎng)站上訂購商品等。Echo似乎能理解自然語言,事實(shí)上它只是執(zhí)行十分有限的語言指令。這些基本指令語言都可以說是一組受控自然語言。采用受控自然語言是為了方便用戶,對(duì)用戶來說熟悉和使用這些指令十分輕松自如,因?yàn)檫@些語言指令本身就是他們熟悉的語言的一部分。由于它的有限性,使其處理起來也相對(duì)簡單,這里就不一一詳述了。
下面我們簡略討論受控自然語言在知識(shí)表達(dá)和機(jī)器推理中的應(yīng)用。知識(shí)表達(dá)和機(jī)器推理是人工智能領(lǐng)域十分重要的課題。近年來隨著計(jì)算能力的迅速增加(參見摩爾定律),人工智能的技術(shù)和應(yīng)用蓬勃發(fā)展,出現(xiàn)了一系列的技術(shù)進(jìn)步,其應(yīng)用深入到廣泛的工業(yè)自動(dòng)化領(lǐng)域和日常生活的各個(gè)方面。但是,這些技術(shù)和應(yīng)用以及被認(rèn)為是人工智能的現(xiàn)有系統(tǒng),絕大多數(shù)都不過屬于“弱人工智能”(weak artificial intelligence)的范疇,比如Siri和Netflix就是這類技術(shù)產(chǎn)品的典型例子。這些系統(tǒng)都是專注于一項(xiàng)特定的任務(wù),不具有類似人的認(rèn)知分析能力,及所謂“人工通用智能”(artificial general intelligence),不能根據(jù)情況進(jìn)行推理而解決問題。推理是人類智慧的核心,人工智能進(jìn)一步發(fā)展要求我們對(duì)人的智慧、知識(shí)以及認(rèn)知能力做更深入的研究。任何智能都與知識(shí)有關(guān),任何智能系統(tǒng)都離不開某種形式的知識(shí)集合的支持。知識(shí)獲取、表達(dá)以及建立知識(shí)庫,特別是建立可推理的知識(shí)庫,仍然是人工智能的進(jìn)一步發(fā)展中的主要瓶頸。知識(shí)的匯集和表達(dá)是建立自動(dòng)推理能力的基礎(chǔ),自然語言當(dāng)然是人類最具有表現(xiàn)力也最為自然的語言形式,但其復(fù)雜性使計(jì)算機(jī)的自動(dòng)處理十分困難。大型的知識(shí)庫,特別是能支持智能系統(tǒng)的知識(shí)庫,比如語義網(wǎng)(Semantic Web)和知識(shí)圖(Ontology or knowledge graph)通常是用形式語言(如RDF, DAML+OIL)描述定義的。形式語言有明確定義的語法和無歧義的語義,但是構(gòu)建特定領(lǐng)域知識(shí)庫的領(lǐng)域?qū)<页3?duì)這些形式語言并不熟悉,而且形式語言的表達(dá)能力很有限。特定領(lǐng)域中的知識(shí)概念用自然語言表達(dá)十分順當(dāng),但卻常常難以用形式語言表達(dá),以致造成理解上的距離甚至差錯(cuò)。正如相關(guān)文獻(xiàn)中已經(jīng)提到[14-16],受控自然語言是彌合自然語言和形式語言之間差距的一種方式。理想的受控自然語言應(yīng)該具有以下三個(gè)特征: ①具有明確、精準(zhǔn)定義的語法和語義,能夠被直接轉(zhuǎn)換成某種邏輯表達(dá)式,易于計(jì)算機(jī)自動(dòng)處理; ②基于某種自然語言,語言自然而直觀,易于人類理解和表達(dá); ③具有足夠的表達(dá)能力,能夠描述表達(dá)相關(guān)應(yīng)用領(lǐng)域中的摡念和關(guān)系。
以上提到的受控英語CPL[9]應(yīng)用受控自然語言表達(dá)知識(shí),建立知識(shí)庫。與其他語言以及相應(yīng)的知識(shí)庫系統(tǒng)相似,CPL配有一個(gè)推理引擎作為系統(tǒng)的一部分。CPL計(jì)算處理包括三個(gè)主要步驟: ①解析輸入的CPL句子; ②將解析的結(jié)果轉(zhuǎn)換成一種邏輯表達(dá)式; ③將邏輯表達(dá)式轉(zhuǎn)換成知識(shí)推理引擎系統(tǒng)KM的語句[注]KM全稱the Knowledge Machine,由德克薩斯大學(xué)研發(fā)。參看文獻(xiàn)[17]以及http://www.cs.utexas.edu/~mfkb/km/.。KM是具有一階語義基于框架理論的語言,其推理引擎使用了輔助的詞匯資源和相關(guān)的工具來限定語義關(guān)系排除歧義,以取得對(duì)輸入的語句進(jìn)行正確的解釋。KM系統(tǒng)并沒有采用CPL作為推理語言。事實(shí)上,受控自然語言可用于整個(gè)處理過程,包括推理的步驟。國際技術(shù)聯(lián)盟(International Technology Alliance, ITA)的受控英語ITA-CE就是個(gè)例子[注]國際技術(shù)聯(lián)盟(International Technology Alliance)是由英國國防部和美國陸軍研究院共同資助的科研聯(lián)盟。參看:https://en.wikipedia.org/wiki/NIS-ITA and http://nis-ita.org/.。ITA-CE定義了一組常用而簡單的句型來表示關(guān)于實(shí)體存在、屬性和關(guān)系的命題。同時(shí)還應(yīng)用邏輯規(guī)則句和理由陳述句[16]。因此,ITA-CE不僅用受控英語作為表達(dá)知識(shí)的語言,同時(shí)用受控英語作為邏輯語言表達(dá)各種事物間的邏輯關(guān)系,并且用受控英語作為推理語言。ITA的運(yùn)作環(huán)境是個(gè)動(dòng)態(tài)的環(huán)境,不斷面對(duì)大量的結(jié)構(gòu)化和非結(jié)構(gòu)化信息數(shù)據(jù)。環(huán)境中的成員包括人員和機(jī)器,人員只是整個(gè)網(wǎng)絡(luò)的一部分,團(tuán)隊(duì)之間和跨領(lǐng)域的合作需要不斷獲取知識(shí)、交流信息。ITA-CE的主要目標(biāo)是支持跨領(lǐng)域的團(tuán)隊(duì)之間的信息交換。團(tuán)隊(duì)成員通過人機(jī)互動(dòng)獲取知識(shí),共享相互之間的信息。關(guān)于ITA-CE具體的應(yīng)用,參考文獻(xiàn)[18]。
受控自然語言隨著社會(huì)的工業(yè)化和信息化的發(fā)展應(yīng)運(yùn)而生。工業(yè)化和信息化的高度發(fā)展帶來了一系列的場景,要求既精準(zhǔn)而又相對(duì)自然的信息表達(dá)和交流。ASD-STE以及類似的受控自然語言旨在加強(qiáng)語言表達(dá)的清晰性和精準(zhǔn)性,以促進(jìn)人與人之間有效的交流。CPL以及同類的受控自然語言的目的在于實(shí)現(xiàn)直觀而精準(zhǔn)的形式表達(dá)式,以便支持人機(jī)互動(dòng)和計(jì)算機(jī)自動(dòng)語言分析處理。人與人之間有效的交流和人機(jī)互動(dòng)都要求語言同時(shí)具有精準(zhǔn)性和自然性。自然語言和形式邏輯語言都不能同時(shí)滿足這兩點(diǎn)要求。受控自然語言是這兩者之間的一種折衷。同時(shí)要求精準(zhǔn)性和自然性是受控自然語言的產(chǎn)生和發(fā)展的主要?jiǎng)右颉?/p>
大型的復(fù)雜系統(tǒng)以及其復(fù)雜而大量的專業(yè)技術(shù)信息數(shù)據(jù)要求信息的標(biāo)準(zhǔn)化和規(guī)范化,要求技術(shù)信息表達(dá)得精準(zhǔn),便于閱讀和理解。2.1節(jié)中提到的民用航空的技術(shù)信息數(shù)據(jù)事實(shí)上與當(dāng)前大家熱論的大數(shù)據(jù)問題有非常類似的特點(diǎn)。大數(shù)據(jù)不僅僅是量大,還有其他重要的特征,所謂大數(shù)據(jù)三要素:數(shù)據(jù)量大、變化快、多樣化[注]大數(shù)據(jù)有三個(gè)維度,及所謂三個(gè)V:Volume (amount of data)數(shù)據(jù)量, Velocity (rate of change)變化率,Variety (range of data types and sources)多樣性。。民用航空的技術(shù)信息數(shù)據(jù)也同樣如此:數(shù)據(jù)量大,動(dòng)態(tài)和持續(xù)的修改更新,配置和信息多樣化。因此,毫不夸張地說,民用航空的技術(shù)信息數(shù)據(jù)問題是個(gè)實(shí)實(shí)在在的大數(shù)據(jù)問題。通常大數(shù)據(jù)的問題僅涉及數(shù)據(jù)分析,以及有用信息挖掘提取,對(duì)信息的精準(zhǔn)度沒有硬性要求。但民用航空的技術(shù)信息不僅涉及信息分析、信息挖掘提取,而且涉及信息數(shù)據(jù)編寫、出版和管理,對(duì)內(nèi)容的精準(zhǔn)度有極高的要求,需要滿足相關(guān)的規(guī)范標(biāo)準(zhǔn)。
受控自然語言使用受限制的語法規(guī)則和詞匯, 它通常是常規(guī)語言的子集。雖然它是基于某種自然語言,但它也是人為定義的語言。因此,任何受控自然語言的使用與人們使用自然語言的本能在多方面都有沖突,需要額外的努力。正因?yàn)槿绱耍芸刈匀徽Z言的培訓(xùn)必不可少。除此之外,研發(fā)和應(yīng)用受控自然語言軟件檢測工具十分重要,直接關(guān)系到使用受控自然語言的有效性。
本文討論了基于語法解析來實(shí)現(xiàn)ASD-STE軟件檢測系統(tǒng)。這一解析系統(tǒng)包括了定義常見錯(cuò)誤“違規(guī)規(guī)則”,延伸擴(kuò)展了常規(guī)語法解析系統(tǒng),使其不僅能解析符合語法規(guī)則的句子,也能受理并解析常見的違反規(guī)則的語言現(xiàn)象。有研究者指出:可能出現(xiàn)的錯(cuò)誤范圍太廣難以預(yù)測,用“違規(guī)規(guī)則”來定義每個(gè)可能的錯(cuò)誤組合不可行。他們提倡采用放松約束的方法進(jìn)行解析[19-20]。其他作者卻認(rèn)為雖然不可能用“違規(guī)規(guī)則”的方法概括所有可能出現(xiàn)的錯(cuò)誤,但“違規(guī)規(guī)則”的方法能針對(duì)常見錯(cuò)誤提供更為精確的反饋,而且能夠覆蓋常見的錯(cuò)誤類型[11,21][注]顯然,ASD-STE語法規(guī)則檢測在原理上與英文教學(xué)語法檢測批改極為相似。本文討論的基本方法也適合英文教學(xué)語法檢測批改的應(yīng)用。。事實(shí)上,兩種方法可以并用。需要分析不同的語言現(xiàn)象和錯(cuò)誤的類型,根據(jù)各類語言現(xiàn)象的特征,可分別使用“違規(guī)規(guī)則”或者“放松約束”的方法。
常規(guī)語法規(guī)則再加上“違規(guī)規(guī)則”自然會(huì)增加語法體系的復(fù)雜性,增加分析的歧義和多種選擇。而且,一個(gè)輸入的語句可能同時(shí)滿足“違規(guī)規(guī)則”的分析和“常規(guī)規(guī)則”的分析。換句話說,“違規(guī)規(guī)則”和“常規(guī)規(guī)則”可能競爭解析選擇。出現(xiàn)這種情況時(shí),就需要大量實(shí)際的語料統(tǒng)計(jì)數(shù)據(jù)來幫助解析排序。所以,雖然本文實(shí)現(xiàn)ASD-STE軟件檢測系統(tǒng)的基本方法是基于語法解析,大數(shù)據(jù)和統(tǒng)計(jì)方法始終極為重要。
知識(shí)和推理是人類智慧的核心。從現(xiàn)在的弱人工智能發(fā)展到通用人工智能迫切需要某種形式的知識(shí)庫的支持。這種知識(shí)庫采用的語言必須便于領(lǐng)域?qū)<覀儤?gòu)建、維護(hù)和擴(kuò)展知識(shí)庫,又得適合計(jì)算機(jī)的自動(dòng)分析處理。受控自然語言是連接人和機(jī)器理想的方式。
綜上所述,受控自然語言有極為廣闊的應(yīng)用前景,可以總結(jié)出三個(gè)要點(diǎn): ①作為技術(shù)語言標(biāo)準(zhǔn)來規(guī)范和改善技術(shù)信息的傳達(dá)和交流;②作為一種直觀的知識(shí)表達(dá)方式,不僅便利專業(yè)人員對(duì)相關(guān)內(nèi)容的正確閱讀理解,而且便于機(jī)器自動(dòng)分析和處理;③作為便利的人機(jī)交互的方式和手段,既便于人對(duì)設(shè)備的操控,又有助于人機(jī)互動(dòng),最大程度地利用人的智能和機(jī)器智能。隨著科學(xué)技術(shù)的不斷進(jìn)步,隨著中國進(jìn)一步走向世界,受控自然語言特別是受控漢語和受控英語的作用和需求會(huì)更加明顯,這方面的研究和開發(fā)也將變得更為重要。