黃青松,戴 丹,馮旭鵬,付曉東,劉 驪,劉利軍
?
面向微博可信度評(píng)估的辯論圖模型
黃青松1,2,戴 丹1,馮旭鵬3,付曉東1,劉 驪1,劉利軍1
(1. 昆明理工大學(xué)信息工程與自動(dòng)化學(xué)院 昆明 650500; 2. 云南省計(jì)算機(jī)技術(shù)應(yīng)用重點(diǎn)實(shí)驗(yàn)室 昆明 650500;3. 昆明理工大學(xué)教育技術(shù)與網(wǎng)絡(luò)中心 昆明 650500)
微博內(nèi)容具有信息混雜和不確定性等特點(diǎn),傳統(tǒng)可信度判別方法存在一定局限性。因此,該文提出一種面向微博可信度評(píng)估的辯論有向圖模型,從辯論的角度出發(fā),以圖模型直觀、形象化地描述了辯論推演過程。通過話題語料構(gòu)成爭(zhēng)議節(jié)點(diǎn),利用爭(zhēng)議間的主題情感和潛在邏輯關(guān)系定義規(guī)則可信度,并設(shè)置圖中邊的權(quán)值來代表爭(zhēng)議間的防衛(wèi)和攻擊強(qiáng)度。根據(jù)相關(guān)算法得出結(jié)論的可信度,遞歸進(jìn)行辯論圖演化,得到需判別信息的可信度。實(shí)驗(yàn)結(jié)果表明該模型比傳統(tǒng)方法綜合指標(biāo)值平均提升6%。
辯論; 爭(zhēng)議節(jié)點(diǎn); 有向圖; 可信度
隨著社交平臺(tái)的快速發(fā)展,微博憑借其短文本、低門檻、實(shí)時(shí)性和傳播迅速等特性吸引了大量忠實(shí)用戶。信息在微博上快速傳播與分享,但謠言也大量蔓延[1-2]。微博網(wǎng)絡(luò)的復(fù)雜性,使謠言信息在不同群體中通過多級(jí)節(jié)點(diǎn)大面積擴(kuò)散,頻繁匯聚轉(zhuǎn)發(fā)增加了其表面上的可信度。微博平臺(tái)每天發(fā)表大量微博,如何提高判定其可信度的準(zhǔn)確性成為亟待解決的問題。微博可信度研究在信息過濾、輿情監(jiān)控和信息傳播引導(dǎo)過程中發(fā)揮著積極的作用,且有助于微博社會(huì)化推薦、微博搜索引擎等方面的應(yīng)用研究[3]。
目前針對(duì)微博信息的可信研究,主要根據(jù)用戶行為特點(diǎn)進(jìn)行特征分析從而設(shè)計(jì)分類算法。基于特征分類方法對(duì)微博信任評(píng)估具有較好效果,文獻(xiàn)[1]通過2010年智利地震研究了Twitter用戶發(fā)布博文的特征和信息傳播的特點(diǎn),發(fā)現(xiàn)謠言與新聞的傳播方式不同,謠言在Twitter社區(qū)的討論會(huì)逐漸被懷疑。文獻(xiàn)[2]基于推文和轉(zhuǎn)發(fā)微博行為特征(內(nèi)容、用戶、話題和傳播特征)提出了自動(dòng)評(píng)估可信性的方法。文獻(xiàn)[4]通過大量調(diào)查發(fā)現(xiàn),用戶認(rèn)為可信的與確切可信的信息存在不同的特征,并對(duì)不同特征(用戶特征、話題信息、博文內(nèi)容)進(jìn)行比較實(shí)驗(yàn)。文獻(xiàn)[5]為解決謠言探測(cè)問題提出了3種特征:基于內(nèi)容、基于網(wǎng)絡(luò)和正確定義謠言的微博具體模型。文獻(xiàn)[6]通過半監(jiān)督的推文可信度排序模型(TweetCred)來實(shí)時(shí)評(píng)估其信任值。
辯論是智能主體間為了消除信念不一致的一種基于言語的交互行為。辯論模型是對(duì)辯論推演過程的形式化描述,其研究?jī)?nèi)容包括辯論空間構(gòu)造以及辯論結(jié)果生成算法[7]。辯論模型中影響力較大的有抽象辯論框架[8],Toulmin模型[9]IBIS(issue-based information system)模型[10]和基于以上擴(kuò)展的模型[11-12]。文獻(xiàn)[7]基于相關(guān)辯論模型的應(yīng)用方面對(duì)辯論建模時(shí)考慮了不確定信息處理因素,并提出一種基于可信度的辯論模型。
針對(duì)微博信息量大、不確定和混雜特性,特征提取方法需大量人工標(biāo)注,且都是靜態(tài)數(shù)據(jù)的特征統(tǒng)計(jì)[13],缺乏理論依據(jù)的推斷與支持,故本文提出基于辯論圖的微博信任評(píng)估模型,以辯論為基本思想,以爭(zhēng)議間的支持或攻擊強(qiáng)度為權(quán)值來構(gòu)建有向帶權(quán)圖,且遞歸辯論推演得到信息可信度。該模型更直觀地體現(xiàn)出判別可信的過程及辯論間的推演關(guān)系。
辯論圖框架主要描述辯論結(jié)構(gòu)間的關(guān)系。本文從爭(zhēng)議節(jié)點(diǎn)、爭(zhēng)議間的關(guān)系和最終結(jié)論出發(fā)構(gòu)建辯論圖模型。爭(zhēng)議節(jié)點(diǎn)和結(jié)論為辯論圖中的節(jié)點(diǎn),爭(zhēng)議間的主題情感和潛在邏輯關(guān)系為規(guī)則可信度,并將規(guī)則可信度設(shè)置為圖中邊上的權(quán)值。最后遞歸進(jìn)行辯論推演,直觀展示出可信度的判別過程。
1.1 框架基本表示
1.2 爭(zhēng)議節(jié)點(diǎn)產(chǎn)生
算法1:判別結(jié)論與證據(jù)間的聯(lián)系
輸出:爭(zhēng)議集
IF ( |RuleCentainty_Calulate()|>){
ELSE RETURN NULL}
算法2:爭(zhēng)議節(jié)點(diǎn)產(chǎn)生
輸出:爭(zhēng)議節(jié)點(diǎn)集
//種子節(jié)點(diǎn)和結(jié)論節(jié)點(diǎn)不存在關(guān)聯(lián)
IF(|RuleCentainty_Calulate()|>){
Continue
}ELSE{
} ELSE {
1.3 規(guī)則可信度
爭(zhēng)議前提對(duì)結(jié)論存在著支持或攻擊關(guān)系,此關(guān)系由規(guī)則可信度進(jìn)行強(qiáng)度量化。規(guī)則可信度計(jì)算分為:爭(zhēng)議間的主題情感相關(guān)度與潛在邏輯關(guān)系。主題情感相關(guān)度驗(yàn)證爭(zhēng)議存在是否合理,前提與結(jié)論是否存在主題和情感相關(guān)。潛在邏輯關(guān)系包含蘊(yùn)涵關(guān)系與矛盾關(guān)系,進(jìn)一步考核爭(zhēng)議內(nèi)部是否真實(shí)相關(guān),并體現(xiàn)出爭(zhēng)議間支持或攻擊關(guān)系強(qiáng)度。
1.3.1 主題情感相關(guān)度
微博的短文本性,故陳述也為短文本。本文模型采用潛在的狄利克雷分布(latent Dirichlet allocation, LDA)[14]和JS散度(Jensen-Shannon divergence)來計(jì)算爭(zhēng)議中主題是否相關(guān)。根據(jù)LDA模型獲得對(duì)應(yīng)的爭(zhēng)議主題概率分布和,其中,,為L(zhǎng)DA模型中的主題數(shù),和分別為第前提和結(jié)論的第個(gè)主題概率。則第個(gè)前提與結(jié)論的主題相似度計(jì)算為:
(2)
(3)
情感極性分析可以驗(yàn)證規(guī)則前提對(duì)結(jié)論是支持或攻擊。此時(shí),規(guī)則可信度隨著情感分析而改變,若爭(zhēng)議間情感為正極,規(guī)則可信度為正值,體現(xiàn)支持作用。若為負(fù)極,則為負(fù)值,表明攻擊作用。爭(zhēng)議前提的情感分析表示為。其變化如式(5)所示:
1.3.2 潛在邏輯關(guān)系
主題情感和潛在邏輯關(guān)系的綜合值作為辯論圖的權(quán)值,展示出爭(zhēng)議間的防衛(wèi)和攻擊強(qiáng)度。規(guī)則可信度計(jì)算描述如下:
算法3:規(guī)則可信度算法
輸入:爭(zhēng)議間各節(jié)點(diǎn)的主題概率值
輸出:爭(zhēng)議間的規(guī)則可信度
RuleCentainty_Calulate(){
1.4 辯論圖構(gòu)建與推演
辯論圖中,爭(zhēng)議的規(guī)則前提和結(jié)論作為節(jié)點(diǎn),規(guī)則可信度為它們間的聯(lián)系邊,通過以上的準(zhǔn)備工作,對(duì)辯論圖進(jìn)行舉例構(gòu)建。假設(shè)有如下爭(zhēng)議,,辯論框架由6個(gè)爭(zhēng)議組合,對(duì)話集有。辯論圖的初始構(gòu)造如圖1所示。
算法4:辯論圖推演算法
輸入:爭(zhēng)議集
輸出:遞歸推演的爭(zhēng)議集和相關(guān)節(jié)點(diǎn)的可信度
ArgumentGraph_Deduce(Args){
FOR EACH node in Args{
//node為爭(zhēng)議節(jié)點(diǎn)前提,Args為爭(zhēng)議
RuleCentainty_Calulate()
//計(jì)算爭(zhēng)議間的規(guī)則可信度
node is conclusion{
}ELSE {
ArgumentGraph_Deduce(node為結(jié)論的爭(zhēng)議)}}}
對(duì)于不同爭(zhēng)議的評(píng)價(jià)算法,分別根據(jù)文獻(xiàn)[7]中對(duì)爭(zhēng)議結(jié)論可信度計(jì)算、可信度合成、可信度傳遞情況來計(jì)算。辯論圖1經(jīng)爭(zhēng)議、、演化后得到結(jié)論的可信度度值,又因結(jié)論為下一個(gè)爭(zhēng)議的前提,故辯論推演過程如圖2所示。
本文將辯論模型引入到微博可信度評(píng)估過程中,通過辯論圖直觀地表示在微博數(shù)據(jù)爭(zhēng)議條件下信息可信度的推理過程,其流程如圖3所示。
從圖3可以看出,先由專家判定需要進(jìn)行可信度分析的信息主題,并在微博平臺(tái)上尋找相關(guān)主題的權(quán)威信息作為種子證據(jù)集,賦予對(duì)應(yīng)的可信度。然后,通過新浪微博的API接口獲得相關(guān)主題的微博作為論據(jù)庫,再通過爭(zhēng)議節(jié)點(diǎn)產(chǎn)生算法獲得過渡證據(jù)和爭(zhēng)議集,以爭(zhēng)議間的主題情感和潛在邏輯關(guān)系,即規(guī)則可信度作為防衛(wèi)或攻擊強(qiáng)度。最后,以爭(zhēng)議中的微博信息作為節(jié)點(diǎn),微博爭(zhēng)議數(shù)據(jù)間的規(guī)則可信度為邊,根據(jù)辯論推演算法遞歸展示出可信度的演化過程,最終得到結(jié)論的可接受性值。
為體現(xiàn)辯論圖模型對(duì)微博可信度評(píng)估的影響,實(shí)驗(yàn)總體設(shè)計(jì)分為以下3個(gè)部分:1) 實(shí)驗(yàn)數(shù)據(jù)準(zhǔn)備及預(yù)處理工作;2) 辯論圖模型中閾值、、主題數(shù)和不同潛在邏輯關(guān)系組合的設(shè)定實(shí)驗(yàn);3) 對(duì)比分析以驗(yàn)證辯論圖模型在可信度判別中具有較好的效果。
3.1 實(shí)驗(yàn)數(shù)據(jù)和預(yù)處理
本實(shí)驗(yàn)數(shù)據(jù)主要從微博開放API獲得,通過2015年6月~2015年8月中旬間隔地采集微博數(shù)據(jù),選取熱點(diǎn)話題和相關(guān)信息如表1所示。對(duì)抓取到的微博語料進(jìn)行清洗、去噪、分詞等預(yù)處理工作,并由3名工作人員進(jìn)行種子節(jié)點(diǎn)選取和人工標(biāo)注賦值,種子節(jié)點(diǎn)選取和可信度賦值流程如下。
1) 專家判定需要進(jìn)行可信度分析的信息主題。
2) 從微博平臺(tái)上獲取用戶權(quán)威度高且與該主題相關(guān)的博文。權(quán)威度判別條件為其是否被新浪微博認(rèn)證,如人民網(wǎng)、環(huán)球時(shí)報(bào)或華爾街日?qǐng)?bào)等新浪微博認(rèn)證公眾號(hào)。
3) 通過政府網(wǎng)站、媒介等渠道對(duì)所選取的微博信息進(jìn)行多方面求證,判斷其可信度。
4) 可信度區(qū)域依據(jù)文獻(xiàn)[18]分為非常可信、一般可信、不可信和不能決定,且依據(jù)克朗巴哈系數(shù)(Cronbach Alpha)給微博信息賦可信度值。若該微博非??尚?,則可信度值為[0.8,1],一般可信為[0.7,0.8),不可信則小于0.7。
5) 對(duì)于每1條與主題相關(guān)的微博語料,若有2名工作人員給出相近且在同一區(qū)域的分值則取其平均值為其可信度值,若3名工作人員給出差異較大的分值則舍棄該條微博。
6) 本實(shí)驗(yàn)選取非常可信的語料作為種子證據(jù)。
根據(jù)以上步驟選取非常可信的微博作為種子證據(jù)并依次賦可信度值。
表1 實(shí)驗(yàn)語料信息表
實(shí)驗(yàn)選用的第三方工具:中文分詞工具ICTCLAS、SVM算法工具包LibSVM、LDA主題建模工具M(jìn)allet。以上工具中,LibSVM設(shè)置使用徑向基核函數(shù)(radial basis function, RBF),其余采用缺省值。由于準(zhǔn)確率()、召回率()、值普遍作為分類實(shí)驗(yàn)評(píng)價(jià)的標(biāo)準(zhǔn)[5],所以本文也采用其作為試驗(yàn)標(biāo)準(zhǔn)。
3.2 參數(shù)設(shè)定與潛在邏輯關(guān)系影響
由于微博的短文本性,信息量少,所以設(shè)置不同主題數(shù)會(huì)對(duì)綜合指標(biāo)產(chǎn)生不同影響。實(shí)驗(yàn)在主題情感和潛在邏輯關(guān)系基礎(chǔ)上(TSEC模型)進(jìn)行不同主題數(shù)實(shí)驗(yàn)結(jié)果比較,主題數(shù)分別選取50、100、150和200,圖5顯示了準(zhǔn)確率、召回率和綜合指標(biāo)隨主題數(shù)的變化情況。
當(dāng)主題數(shù)不一樣時(shí),準(zhǔn)確率、召回率和綜合指標(biāo)也不相同,但能穩(wěn)定在一定的區(qū)域間。通過實(shí)驗(yàn)對(duì)比結(jié)果看出,主題數(shù)為100時(shí)整體性能最好,因此,本模型實(shí)驗(yàn)采用主題數(shù)為100。
潛在邏輯關(guān)系分為主題Theme、情感Sen、蘊(yùn)涵關(guān)系Entail和矛盾關(guān)系Contra這4個(gè)方面,主要考察潛在邏輯關(guān)系對(duì)辯論圖模型的影響。本節(jié)設(shè)計(jì)Theme+Sen(TS模型)、Theme+Sen+Entail(TSE模型)和Theme+Sen+Entail+Contra(TSEC模型)3個(gè)比較實(shí)驗(yàn),話題數(shù)設(shè)定為100,實(shí)驗(yàn)結(jié)果如圖6所示。
圖6展示出不同模型時(shí)得到的結(jié)果,可以看出辯論圖模型只考慮主題情感比既考慮了主題情感又包含潛在邏輯關(guān)系獲得的準(zhǔn)確率、召回率和綜合指標(biāo)實(shí)驗(yàn)結(jié)果都較低。從實(shí)驗(yàn)對(duì)比結(jié)果可知,辯論模型中爭(zhēng)議間的支持和攻擊強(qiáng)度對(duì)實(shí)驗(yàn)結(jié)果存在著較大的影響,爭(zhēng)議間的防衛(wèi)和攻擊強(qiáng)度不同,結(jié)論的可信度也不相同。
3.3 方法性能對(duì)比
為了驗(yàn)證辯論圖模型的有效性,本文將TSEC模型分別與基于SVM的特征分類方法(SVM),基于用戶特征、話題信息、博文內(nèi)容分類方法(MCP)[4]及謠言探測(cè)模型(RDM)[5]進(jìn)行實(shí)驗(yàn)對(duì)比,結(jié)果如表2所示。
表2 不同方法實(shí)驗(yàn)對(duì)比結(jié)果表
從表中可以看出,傳統(tǒng)SVM分類方法的準(zhǔn)確率、召回率和綜合指標(biāo)值約為0.70,而基于不同特征、謠言探測(cè)模型和辯論圖模型均能有效地判別微博內(nèi)容是否可信。由于文獻(xiàn)[4-5]采用英文語料進(jìn)行實(shí)驗(yàn),本實(shí)驗(yàn)采用的為中文語料,故實(shí)驗(yàn)結(jié)果在一定程度上與原文有所偏差。相比其他方法,辯論圖模型的3個(gè)指標(biāo)均有所提升,體現(xiàn)出此方法能更準(zhǔn)確地判別微博平臺(tái)信息的可信度,對(duì)于微博可信度判別有很好的應(yīng)用。
為了解決微博可信度評(píng)估問題,提出一種面向微博可信度評(píng)估的辯論圖模型。該模型基于辯論思想,且以圖來描述辯論推演過程。實(shí)驗(yàn)結(jié)果表明,本模型在準(zhǔn)確率、召回率和綜合指標(biāo)上都取得較好的結(jié)果,證明了此辯論圖模型的有效性。模型爭(zhēng)議前提中可能存在相互包含關(guān)系,故下一步將考慮前提間是否存在合取和析取關(guān)系,防止?fàn)幾h間支持和攻擊的重復(fù)化。
[1] MENDOZA M, POBLETE B, CASTILLO C. Twitter under crisis : Can we trust what we RT?[C]//Proceedings of the First Workshop on Social Media Analytics. New York: ACM, 2010: 71-79.
[2] CASTILLO C, MENDOZA M, POBLETE B. Information credibility on Twitter[C]//Proceedings of the 20th International Conference on World Wide Web. New York: ACM, 2011: 675-684.
[3] 蔣盛益, 陳東沂, 龐觀松, 等. 微博信息可信度分析研究綜[J]. 圖書情報(bào)工作, 2013, 57(12): 136-142.
JIANG Sheng-yi, CHEN Dong-yi, PANG Guan-song, et al. Research review of information credibility analysis on Microblog[J]. Library and Information Service, 2013, 57(12): 136-142.
[4] MORRIS M R, COUNTS S, ROSEWAY A, et al. Tweeting is believing? understanding micoroblog credibility perceptions[C]//Proc of the 15th ACM Conf on Computer Supported Cooperative Work(CSCW12). New York: ACM, 2012: 441-450.
[5] QAZVINIAN V, ROSENGREN E, RADEV D R, et al. Rumor has it: Indentifying misinformation in Microblogs [C]//Proceedings of the 2011 Conference on Empirical Methods in Natural Language Processing. Edinburgh: ACL, 2011: 1589-1599.
[6] GUPTA A, KUMARAGURU P, CASTILLO C, et al. Tweetcred: a real-time web-based system for assessing credibility of content on twitter[EB/OL]. [2015-07-25]. http://arxiv.org/abs/1405.5490.
[7] 熊才權(quán), 歐陽勇, 梅清. 基于可信度的辯論模型及爭(zhēng)議評(píng)價(jià)算法[J]. 軟件學(xué)報(bào), 2014, 25(6): 1225-1238.
XIONG Cai-quan, OUYANG Yong, MEI Qing. Argumentation model based on certainty-factor and algorithms of argumentevaluation[J]. Journal of Software, 2014, 25(6): 1225-1238.
[8] DANG P M. On the acceptability of arguments and its fundamental role in nonmonotonic reasoning logic programming and n-person games[J]. Artificial Intelligence, 1995, 77(2): 321-357.
[9] TOULMIN S E. The uses of argument[J]. Ethics, 1959,10(1): 251-252.
[10] KUNZ W, RITTEL H W J. Issues as elements of information systems[D]. Berkeley: University of California, 1970.
[11] 熊才權(quán), 李德華. 一種研討模型[J]. 軟件學(xué)報(bào), 2009, 20(8): 2181-2190.
XIONG Cai-quan, LI De-hua. Model of argumentation[J]. Journal of Software, 2009, 20(8): 2181-2190.
[12] 陳俊良, 王長(zhǎng)春, 陳超. 一種擴(kuò)展雙極辯論模型[J]. 軟件學(xué)報(bào), 2012, 23(6): 1444-1457.
CHEN Jun-liang, WANG Chang-chun, CHEN Chao. Extended bipolar argumentation model[J]. Journal of Software, 2012, 23(6): 1444-1457.
[13] 苑衛(wèi)國, 劉云, 程軍軍, 等. 微博網(wǎng)絡(luò)中用戶特征量和增長(zhǎng)率分布的研究[J]. 計(jì)算機(jī)學(xué)報(bào), 2014, (4): 767-778.
YUAN Wei-guo, LIU Yun, CHENG Jun-jun, et al. Research on the user characteristics and growth rates distribution in microblog[J]. Chinese Journal of Computers. 2014, 37(4): 767-778.
[14] BLEI D M, NG A Y, JORDAN M I. Latent dirichlet allocation[J]. Journal of Machine Research, 2003, 3(3): 993-1022.
[15] 賀飛艷, 何炎祥, 劉楠, 等. 面向微博短文本的細(xì)粒度情感特征抽取方法[J]. 北京大學(xué)學(xué)報(bào)(自然科學(xué)版), 2014, 50(1): 48-54.
HE Fei-yan, HE Yan-xiang, LIU Nan, et al. A microblog short text oriented multi-class feature extraction method of fine-grained sentiment analysis[J]. Acta Scientiarum Naturalium Universitaits Pekinensis, 2014, 50(1): 48-54.
[16] DAGAN I, GLICKMAN O. Probabilistic textual entailment: Generic applied modeling of language variability[C]// PASAL Workshop on Learning Methods for Text Understanding and Mining. Grenoble France: [s.n.], 2004.
[17] 劉茂福, 王月, 顧進(jìn)廣. 基于語義規(guī)則的中文矛盾關(guān)系識(shí)別方法[J]. 計(jì)算機(jī)工程與科學(xué), 2015, 37(4): 806-812.
LIU Mao-fu, WANG Yue, GU Jin-guang. Chinese textual contradiction recognition based on semantic rules[J]. Computer Engineering& Science, 2015, 37(4): 806-812.
[18] GUPTA A, KUMARAGURU P. Credibility ranking of tweets duringhigh impact events[EB/OL]. [2015-07-25]. http://precog.iiitd.edu.in/Publicationsfiles/a2-gupta.pdf.2012.
編 輯 蔣 曉
Argumentation Graphical Model for Microblog Credibility Assessment
HUANG Qing-song1,2, DAI Dan1, FENG Xu-peng3, FU Xiao-dong1, LIU Li1, and LIU Li-jun1
(1. Faculty of Information Engineering and Automation, Kunming University of Scienceand Technology Kunming 650500; 2. Yunnan Key Laboratory of Computer Technology Applications Kunming 650500; 3. Educational Technology and Network Center, Kunming University of Science and Technology Kunming 650500)
Due to the mix and uncertainty of the microblog information data, the credibility assessment has difficulty to distinguish. An argumentation directedgraphical model for microblog credibility assessment is presented. From the point of view of argumentation, the model, the argument deduction process is described intuitively by graphical model. In the credibility assessment process, we create the argument node based on the relevant topic corpus, define the rule credibility by the thematic sentiment and potential logical relationship, set the weights on the edges, and represent the defense and attack strength between arguments for this reason. The conclusion credibility is achieved and the argumentation graphical with recursion is evolved according to the relevant algorithm. At last the distinguish information could get the credibility. Experimental results show that this model obtains an accuracy up to 6% in comprehensive indexmeasure compared to the traditional methods.
argumentation; argument node; directed graphs; reliability
TP391
A
10.3969/j.issn.1001-0548.2017.02.013
2015-08-26;
2015-12-24
國家自然科學(xué)基金(81360230,81560296,61462056, 61462051)
黃青松(1962-),男,教授,主要從事數(shù)據(jù)挖掘、自然語言處理等方面的研究.