石 佼,李 茹,2,王智強(qiáng)
(1. 山西大學(xué) 計(jì)算機(jī)與信息技術(shù)學(xué)院,山西 太原 030006;2. 山西大學(xué) 計(jì)算智能與中文信息處理教育部重點(diǎn)實(shí)驗(yàn)室,山西 太原 030006)
漢語核心框架語義分析[1]是以框架語義學(xué)[2]為理論基礎(chǔ),基于漢語框架網(wǎng)(Chinese FrameNet,CFN)[3-4]的語義表示與標(biāo)注資源,通過抽取句子中的核心目標(biāo)詞及其所激起的核心框架語義場景,達(dá)到漢語句子級(jí)核心語義分析的目的。如對于例句“20年后,他回到了出生時(shí)的老家。”在不區(qū)分句中核心語義的情況下,對其進(jìn)行框架語義分析的結(jié)果如圖1所示。圖中①和②是分別以“出生”和“回到”為目標(biāo)詞進(jìn)行框架語義分析的結(jié)果。其中,“回到”和“出生”分別能夠激起“到達(dá)”和“出生”框架,“他”和“老家”分別填充“出生”框架下的“agent”和“place”框架元素,“20年后”、“他”和“出生時(shí)的老家”分別填充“到達(dá)”框架下的“time”、“thm”和“goal”框架元素。顯然,基于“到達(dá)”框架的語義分析結(jié)果能夠獲得句子的核心語義,而基于“出生”框架的語義分析結(jié)果只能獲取句子部分語義信息,前者即為本文研究的主要內(nèi)容。核心框架語義分析能夠有效獲取句子的核心語義,為自然語言處理領(lǐng)域提供了一種新的語義分析方法。
與核心框架語義分析相關(guān)的研究主要是SemEval-2007國際語義評(píng)測會(huì)議中基于FrameNet[5]語料庫的“框架語義結(jié)構(gòu)抽取”任務(wù)[6]。Cosmin Adrian Bejan等[7]利用支持向量機(jī)模型和最大熵模型,實(shí)現(xiàn)了一個(gè)線性框架語義結(jié)構(gòu)抽取系統(tǒng),系統(tǒng)整體抽取結(jié)果F值為39.25%;Richard Johansson等[8]提出了一種基于依存句法分析的框架語義結(jié)構(gòu)抽取方法,通過擴(kuò)充FrameNet詞元庫,來提高系統(tǒng)性能,最終抽取結(jié)果F值達(dá)到48.8%;Dipanjan Das等[9]針對目標(biāo)詞識(shí)別、框架分配和框架元素標(biāo)注任務(wù),分別使用半監(jiān)督學(xué)習(xí)方法和快速對偶分解算法構(gòu)建模型,F(xiàn)值達(dá)到68.45%。隨著FrameNet語料庫資源不斷豐富,針對英文語料的框架語義結(jié)構(gòu)分析已取得一定成果。
目前,漢語語義分析的主要手段仍集中在基于“謂詞—論元”結(jié)構(gòu)的語義角色標(biāo)注任務(wù)上,使用不同的機(jī)器學(xué)習(xí)方法,針對基本特征及其組合特征,對語義角色標(biāo)注任務(wù)進(jìn)行了研究。Xue 等[10]使用漢語PropBank語料庫語料,運(yùn)用最大熵分類器,在自動(dòng)句法分析的基礎(chǔ)上進(jìn)行語義角色標(biāo)注,準(zhǔn)確率達(dá)到71.9%;李濟(jì)洪[11]通過IOB策略將語義角色標(biāo)注問題轉(zhuǎn)化為詞序列標(biāo)注問題,采用條件隨機(jī)場模型,基于統(tǒng)計(jì)學(xué)中的正交表,挑選最優(yōu)特征模板,在給定句子中的目標(biāo)詞以及目標(biāo)詞所屬的框架的情況下,F(xiàn)值達(dá)到61.62%。語義角色標(biāo)注雖能達(dá)到淺層語義分析的目的,但由于其只針對句中給定的謂詞標(biāo)注語義角色,因此并不能對整個(gè)句子進(jìn)行詳細(xì)的語義分析。核心框架語義分析以“框架語義學(xué)”為理論基礎(chǔ),從框架語義角度刻畫句子的語義,通過抽取句子的核心框架語義結(jié)構(gòu),達(dá)到分析句子完整語義的目的。
本文將漢語的核心框架語義分析任務(wù)拆分為核心目標(biāo)詞識(shí)別、框架選擇和框架元素標(biāo)注三個(gè)子任務(wù),結(jié)合同義詞詞林資源[12],使用基于貪心策略的特征選擇算法,分別建立不同任務(wù)的機(jī)器學(xué)習(xí)模型。第2節(jié)對漢語核心框架語義分析的相關(guān)概念和問題進(jìn)行描述;第3節(jié)介紹任務(wù)的特征選擇算法;第4節(jié)為實(shí)驗(yàn)及結(jié)果分析;最后是結(jié)論與展望。
定義1[13]漢語框架網(wǎng)
漢語框架網(wǎng)(Chinese FrameNet,CFN)是以Charles J. Fillmore的框架語義學(xué)為理論基礎(chǔ),參照加州大學(xué)伯克利分校的FrameNet工程,構(gòu)建的以漢語真實(shí)語料為依據(jù),可供計(jì)算機(jī)使用的漢語詞匯語義知識(shí)庫。
漢語框架網(wǎng)由框架庫、句子庫和詞元庫三部分組成??蚣軒煲钥蚣転閱挝?,對詞語進(jìn)行分類描述,明確給出框架的定義和這些詞語共有的框架元素,并描述該框架和其他框架之間的概念關(guān)系;句子庫包含帶有框架語義標(biāo)注信息的句子,即按照框架庫所提供的框架和框架元素類型,標(biāo)注句子的框架語義信息和句法信息;詞元庫記錄詞元的語義搭配模式和框架元素的句法實(shí)現(xiàn)方式。為了易于理解框架語義分析任務(wù),以下給出“框架”的概念。
定義2[13]框架
框架是指與一些激活性語境相一致的結(jié)構(gòu)化范疇系統(tǒng),它是儲(chǔ)存在人類認(rèn)知經(jīng)驗(yàn)中的圖式化情境,是理解詞語的背景和動(dòng)因。
以“到達(dá)”框架為例,在框架庫中的簡略描述如表1所示。
定義3核心目標(biāo)詞
在一條包含多個(gè)目標(biāo)詞的句子中,如果某個(gè)目標(biāo)詞激起的框架及其在句中所支配的框架元素依存項(xiàng)相比其他框架更能完整表達(dá)該句的核心語義,該目標(biāo)詞即為核心目標(biāo)詞。
如引言圖1所示的例句中,“回到”和“出生”均為目標(biāo)詞,核心目標(biāo)詞是“回到”。
定義4[13]框架元素
框架元素又稱框架語義角色,體現(xiàn)一個(gè)框架的語義參與者??蚣茉匕ê诵呐c非核心框架元素,其中核心框架元素顯示框架的個(gè)性,而非核心框架元素表達(dá)框架中的一些通用語義成分,如時(shí)間、地點(diǎn)等。
如表1“到達(dá)”框架中的“目標(biāo)”、“轉(zhuǎn)移體”是“到達(dá)”框架的核心框架元素;“伴隨者”、“方法”、“路徑”、“源點(diǎn)”、“時(shí)間”等屬于非核心框架元素。
表1 “到達(dá)”框架簡表
核心框架語義分析任務(wù)是根據(jù)句中的核心目標(biāo)詞元及其激起的框架,確定該框架在句中支配的框架元素。
漢語框架核心語義分析任務(wù)問題可形式化定義為:
核心目標(biāo)詞識(shí)別給定句子S={w1,w2,…,ws},對于句中能夠激起框架的目標(biāo)詞元集合T={t1,t2,…,tn},識(shí)別出核心目標(biāo)詞ti,形式化表示為:
(1)
框架選擇根據(jù)當(dāng)前上下文場景S,為核心目標(biāo)詞ti分配一個(gè)合適的語義框架fi。若ti能夠激起多個(gè)框架,即為歧義詞元,設(shè)ti激起的框架記為f={f1,f2,…,fm},則框架選擇任務(wù)可形式化地表示為:
(2)
框架元素標(biāo)注給定目標(biāo)詞ti及其所屬框架fi,設(shè)fi支配的框架元素集合為Rfi={r1,r2,…,rj},為語義場景S中的連續(xù)子集Xfi={wi+1,wi+2,…,wi+t}填充其對應(yīng)的框架元素rR,設(shè)Δq(ri)是語義場景S中的框架元素的集合,則框架元素標(biāo)注任務(wù)可形式化表示為:
(3)
核心框架語義分析的研究目的是抽取句子的核心語義表示,本文將核心框架語義分析研究拆分為核心目標(biāo)詞識(shí)別、框架選擇、框架元素標(biāo)注三個(gè)子任務(wù),根據(jù)各子任務(wù)的不同特點(diǎn),分別建模。
3.1.1 核心目標(biāo)詞識(shí)別與框架選擇模型
核心目標(biāo)詞識(shí)別和框架選擇任務(wù)的標(biāo)注著眼點(diǎn)是句中的一個(gè)詞,識(shí)別該詞是否是核心目標(biāo)詞或該詞所屬框架。因此,本文將這兩項(xiàng)任務(wù)看作分類問題來解決,使用最大熵思想構(gòu)建分類模型。
在本實(shí)驗(yàn)中,用向量X表示候選詞是否為核心目標(biāo)詞或其所屬框架,用y表示候選目標(biāo)詞是否為核心目標(biāo)詞或者其所屬框架,p(y|X)為預(yù)測X為y的概率,熵定義為:
(4)
采用拉格朗日乘數(shù)法求解最大熵,計(jì)算公式為:
其中,fi表示每個(gè)特征,n代表特征總數(shù),λi為特征的權(quán)重,每個(gè)特征對詞性選擇的影響大小由特征權(quán)重λi決定。
3.1.2 框架元素標(biāo)注模型
框架元素標(biāo)注是給定目標(biāo)詞及其所屬語義框架,根據(jù)該框架在CFN框架庫中的定義,對該框架支配的相應(yīng)框架元素進(jìn)行標(biāo)注。本文使用IOB[14]策略,選擇詞作為標(biāo)注單元,把框架元素看作一個(gè)詞序列的集合,將框架元素標(biāo)注任務(wù)轉(zhuǎn)化為句子層面的詞序列標(biāo)注問題,用{B-X,I-X,O}標(biāo)記角色標(biāo)注集合,標(biāo)注示例如下。
20|B-time 年|I-time 后|I-time ,|O 他|B-thm 回到|O 了|O 出生|B-goal 時(shí)|I-goal 的|I-goal 老家|I-goal 。|O
其中,“回到”是目標(biāo)詞,激起“到達(dá)”框架。B-time代表“到達(dá)”框架中角色“time”的開始;I-time表示“到達(dá)”框架中角色“time”的延續(xù);非框架角色元素用O標(biāo)記。
用隨機(jī)變量X表示待標(biāo)注的數(shù)據(jù)序列,隨機(jī)變量Y表示相應(yīng)的標(biāo)注序列,對Y中的每一個(gè)Yi在有限狀態(tài)標(biāo)記中取值。設(shè)輸入的序列標(biāo)記為X=x1x2…xn,輸出的序列標(biāo)記為Y=y1y2…yn,則在已知輸入序列X的條件下,輸出為Y的概率為:
(7)
其中,x代表句中的詞,y代表詞x填充的框架元素,fk(·)表示輸出序列Y中位置為i和i-1的轉(zhuǎn)移特征,gk(·)為輸入序列X與輸出序列Y在i位置的特征yi之間的特征,λk和μk是權(quán)重。
特征選擇的目的是從候選特征中選出與任務(wù)最相關(guān)的特征子集。本文針對核心框架語義分析任務(wù),設(shè)置基本特征和同義詞詞林五層編碼信息兩類特征,特征描述如表2所示。
特征選擇的關(guān)鍵是挑選出包含盡可能多的與目標(biāo)類相關(guān)的特征信息。本文采用基于貪心策略的特征選擇算法,通過打分策略,選出最優(yōu)特征模板。主要思想是: 在給定的特征候選集中,每次從中選出一個(gè)特征加入基本特征模板中,對其預(yù)測結(jié)果打分,選取最好結(jié)果加入基本特征模板中,直到相鄰兩次打分不再增加。
表2 特征描述
輸入:預(yù)處理語料,特征集合f={f1,f2,…,fn},訓(xùn)練集train_i,測試集test_i輸出:最優(yōu)特征模板F1:初始化F=?,Score[1]=0,Num=02:forj=1ton //將f中的特征依次加入特征模板中進(jìn)行訓(xùn)練3: fori=1to5//5?fold交叉驗(yàn)證4: Rj+=Rj5: endfor6: Rj=Rj/5//將F∪fj作為特征模板,用模型訓(xùn)練得到結(jié)果評(píng)分Rj7: ifRj>Score[1]{//如果評(píng)分Rj高于前一輪,則將第j個(gè)特征加入集合F8: Score[1]=Rj9: F=F∪fj}10: elseifRj=Score[1]{//如果評(píng)分Rj與前一輪相同,比較特征j和j-1的優(yōu)先級(jí),確定是否加入特征集合F中11: fmax=compare(fj,fj-1)12: F=F∪fmax}13: elseifRj 實(shí)驗(yàn)語料構(gòu)建源于CFN的例句庫,共10 831條標(biāo)注例句。本文使用哈爾濱工業(yè)大學(xué)社會(huì)計(jì)算與信息檢索研究中心的語言處理集成平臺(tái)LTP[15]對語料進(jìn)行預(yù)處理。實(shí)驗(yàn)語料統(tǒng)計(jì)結(jié)果如表3所示: 表3 實(shí)驗(yàn)語料統(tǒng)計(jì)結(jié)果 本文使用準(zhǔn)確率、召回率和F值三個(gè)評(píng)價(jià)指標(biāo)對實(shí)驗(yàn)結(jié)果進(jìn)行評(píng)價(jià)。設(shè)A為實(shí)驗(yàn)?zāi)P皖A(yù)測正確的數(shù)據(jù)個(gè)數(shù),B為實(shí)驗(yàn)預(yù)測出的實(shí)驗(yàn)數(shù)據(jù)個(gè)數(shù)總和,C為測試集中正確標(biāo)注的數(shù)據(jù)個(gè)數(shù),則: 其中,P表示準(zhǔn)確率,R表示召回率,F(xiàn)表示準(zhǔn)確率和召回率的加權(quán)平均值。 針對核心目標(biāo)詞識(shí)別任務(wù),設(shè)置三組特征模板T1、T2、T3,分別測試窗口大小和基本特征設(shè)置對核心目標(biāo)詞識(shí)別模型的影響,實(shí)驗(yàn)結(jié)果如表4所示: 表4 核心目標(biāo)詞識(shí)別窗口大小實(shí)驗(yàn)結(jié)果 由表4可知,當(dāng)以T3為模板,且窗口大小設(shè)為1時(shí),核心目標(biāo)詞識(shí)別效果最好。因此,以T3為基線模板,構(gòu)建最優(yōu)核心目標(biāo)詞識(shí)別模型。 選取表2中的基本特征,使用3.2節(jié)提出的特征選擇算法,構(gòu)建最優(yōu)特征模板,實(shí)驗(yàn)結(jié)果如表5所示。從表中可以看出,特征模板選擇最優(yōu)模型F值為99.50%。在最優(yōu)特征模板上分別增加同義詞詞林編碼信息,由表5的數(shù)據(jù)可以看出,F(xiàn)值并沒有升高,反而下降。經(jīng)分析,其原因可能是核心目標(biāo)詞識(shí)別任務(wù)主要與目標(biāo)詞元的屬性特征相關(guān),在已有最優(yōu)特征模板中加入同義詞詞林編碼信息后,造成特征信息冗余,導(dǎo)致模型性能下降。 表5 核心目標(biāo)詞識(shí)別實(shí)驗(yàn)結(jié)果 目前,CFN詞元庫中共332個(gè)歧義詞元,本文選取47個(gè)常見歧義詞元作為研究對象構(gòu)建實(shí)驗(yàn)例句集。由于測試集中有些句子包含多個(gè)歧義目標(biāo)詞,因此只使用準(zhǔn)確率而不使用召回率來評(píng)價(jià)該實(shí)驗(yàn)?zāi)P?。設(shè)置開窗口范圍內(nèi)的詞形和詞性為基本特征,對所有詞元構(gòu)建統(tǒng)一特征模板,測試窗口大小對模型效率的影響。實(shí)驗(yàn)結(jié)果如表6所示: 表6 框架選擇窗口大小選擇結(jié)果 由表6可知,窗口大小設(shè)為1時(shí),框架選擇準(zhǔn)確率最高,為77.72%。選取表2中的基本特征,使用3.2節(jié)提出的特征選擇算法,得到的最優(yōu)特征模板準(zhǔn)確率為78.44%。在最優(yōu)特征模板上依次增加同義詞詞林編碼信息,實(shí)驗(yàn)結(jié)果如表7所示。 加入同義詞詞林4級(jí)和5級(jí)編碼后,框架選擇模型性能都有明顯提升,且加入4級(jí)特征,模型效率最佳,原因如下: 表7 框架選擇統(tǒng)一特征模板選擇結(jié)果 (1) 框架選擇任務(wù)主要是根據(jù)當(dāng)前歧義詞所處的上下文語義場景判斷其所屬的框架,因此,特征選擇中,能否獲得有效的上下文特征信息至關(guān)重要。同義詞詞林通過對詞語編碼,將詞語概念抽象,能夠表達(dá)另一層面的語義場景關(guān)系,為框架判別提供詞元特征層面更豐富的信息。 (2) 加入同義詞詞林4級(jí)編碼相比加入其他級(jí)的詞林編碼具有更好的框架選擇效果,因?yàn)?級(jí)、2級(jí)、3級(jí)信息都是類別特征,對概括上下文信息并沒有起到突出表達(dá)的作用,4級(jí)信息為詞群信息,能夠很好地抽象當(dāng)前歧義詞開窗口范圍內(nèi)詞群特征。 文獻(xiàn)[16]提出,針對每個(gè)歧義詞元分別構(gòu)建特征模板,使用詞、詞性、命名體和依存關(guān)系能達(dá)到更好的排歧效果。本文針對每個(gè)詞元,在候選特征集中加入同義詞詞林資源4級(jí)編碼信息,實(shí)驗(yàn)結(jié)果如表8所示: 表8 各詞元單獨(dú)設(shè)置特征模板準(zhǔn)確率結(jié)果 續(xù)表 針對每個(gè)歧義詞元分別構(gòu)建特征模板,最終得到的平均準(zhǔn)確率為84.73%,特征平均長度為2.7。相比文獻(xiàn)[16],平均準(zhǔn)確率提高了2.24%,平均特征長度縮短了1.2。 針對框架元素標(biāo)注任務(wù),設(shè)置7組特征模板,開大小三種窗口,分別實(shí)驗(yàn),并計(jì)算語料平均F值,實(shí)驗(yàn)結(jié)果如表9所示: 表9 框架元素標(biāo)注模板實(shí)驗(yàn)結(jié)果 在三個(gè)大小不同的窗口下,F(xiàn)值的折線圖如圖2所示: 圖2 框架元素標(biāo)注F值對比折線圖 根據(jù)上圖,可以得出以下結(jié)論: (1) 實(shí)驗(yàn)F值在58%左右,究其原因可能與實(shí)驗(yàn)數(shù)據(jù)稀疏相關(guān); (2) 窗口大小設(shè)為1時(shí),實(shí)驗(yàn)效果最佳。因?yàn)榭蚣苷Z義分析與其目標(biāo)詞所處的位置及其緊鄰上下文信息密切相關(guān),遠(yuǎn)距離信息可能會(huì)加入冗余信息,造成模型性能下降; (3) 2號(hào)實(shí)驗(yàn),加入特征F3和F4后,模型性能大幅提高。由此可見,詞形和詞性雖然對框架元素標(biāo)注有較好的效果,但加入豐富的語義特征能更好地提高模型性能,后續(xù)實(shí)驗(yàn)可在這方面進(jìn)行深入研究; (4) 加入同義詞詞林信息后,從實(shí)驗(yàn)結(jié)果對比可以看出,加入1級(jí)詞林信息相比其他實(shí)驗(yàn),效果更突出。因?yàn)?級(jí)同義詞詞林信息是詞語的大類表示,對當(dāng)前語義場景有更強(qiáng)的概括性。因此更適合做框架元素標(biāo)注的特征。 為測試本文核心框架語義分析方法的有效性,本文從《人民日報(bào)》中構(gòu)建300條測試?yán)洌⑷斯?biāo)注正確答案。分別在人工標(biāo)注和自動(dòng)標(biāo)注下,測試依存結(jié)構(gòu)抽取的性能,實(shí)驗(yàn)結(jié)果如表10所示: 表10 自動(dòng)抽取實(shí)驗(yàn)結(jié)果 經(jīng)過分析,自動(dòng)抽取結(jié)果偏低有以下原因: (1) 在開放測試集上的核心目標(biāo)詞識(shí)別準(zhǔn)確率下降,其主要原因是訓(xùn)練語料中并未涉及所有詞元,存在大量未登錄目標(biāo)詞,導(dǎo)致模型無法識(shí)別; (2) 框架選擇模型訓(xùn)練時(shí),由于實(shí)驗(yàn)只對常見的47個(gè)歧義詞元構(gòu)建了識(shí)別模型,使得有些歧義詞無法被識(shí)別。例如,“地鐵口那位靠乞討為生的老太太已經(jīng)不在了。”和“他靠在沙發(fā)上看著我的作業(yè)不說話?!边@兩個(gè)句子中,詞元“靠”分別有“依靠”和“身體姿勢”兩種框架語義。由于已構(gòu)建模型的47個(gè)歧義詞元并不包括“靠”,如果待識(shí)別例句中含有目標(biāo)詞“靠”,則將導(dǎo)致框架分配不準(zhǔn)確,進(jìn)而影響框架元素標(biāo)注結(jié)果; (3) 框架元素自動(dòng)標(biāo)注結(jié)果低,主要原因是實(shí)驗(yàn)訓(xùn)練語料較少,模型涵蓋范圍較小,召回率不高,有些元素?zé)o法自動(dòng)標(biāo)注;其次,前兩個(gè)階段的錯(cuò)誤積累,降低了模型的整體性能。 漢語核心框架語義分析是基于CFN,從框架語義角度,獲取句子的核心語義。本文將漢語核心框架語義分析任務(wù)分成核心目標(biāo)詞識(shí)別、框架選擇和框架元素標(biāo)注三個(gè)子任務(wù),針對各個(gè)子任務(wù)的不同特點(diǎn),結(jié)合同義詞詞林編碼信息,使用基于貪心策略的特征選擇算法,分別建立了標(biāo)注模型,在CFN現(xiàn)有數(shù)據(jù)集中驗(yàn)證了本文方法的有效性。 核心框架語義分析子任務(wù)中的未登錄目標(biāo)詞識(shí)別與框架元素標(biāo)注仍然是制約最終分析結(jié)果的關(guān)鍵環(huán)節(jié)。而數(shù)據(jù)稀疏是影響未登錄目標(biāo)詞識(shí)別與框架元素標(biāo)注的主要因素,下一步將在不斷擴(kuò)大CFN基礎(chǔ)標(biāo)注資源的同時(shí),結(jié)合相關(guān)詞匯語義資源來提高未登錄詞元識(shí)別的準(zhǔn)確率,并通過引入半監(jiān)督機(jī)器學(xué)習(xí)模型提高框架元素標(biāo)注的召回率,從而改善CFN核心框架語義分析的整體結(jié)果,為框架語義分析技術(shù)進(jìn)一步應(yīng)用于自動(dòng)問答、文摘等領(lǐng)域奠定基礎(chǔ)。 [1] 李茹.漢語句子框架語義結(jié)構(gòu)分析技術(shù)研究[D].山西大學(xué)博士學(xué)位論文,2012. [2] Fillmore C. Frame semantics [J]. Linguistics in the morning calm, 1982: 111-137. [3] 劉開瑛.漢語框架語義網(wǎng)(CFN)構(gòu)建現(xiàn)狀[C].第四屆全國學(xué)生計(jì)算語言學(xué)研討會(huì)會(huì)議論文集.2008: 1-7. [4] 劉開瑛,由麗萍.漢語框架語義知識(shí)庫構(gòu)建工程[C]//中國中文信息學(xué)會(huì)二十五周年學(xué)術(shù)會(huì)議論文集.北京. 2006: 64-71. [5] Collin F Baker, Charles J Fillmore, John B Lowe. The Berkeley FrameNet project[C]//Proceedings of COLING/ACL. Montreal, Canada. 1998: 86-90. [6] Baker C,Ellsworth M,Erk K.SemEval’07 task 19: frame semantic structure extraction[C]//Proceedings of the 4th International Workshop on Semantic Evaluations. Association for Computational Linguistics, 2007: 99-104. [7] Bejan C A, Hathaway C. UTD-SRL: a pipeline architecture for extracting frame semantic structures[C]//Proceedings of the 4th International Workshop on Semantic Evaluations. Association for Computational Linguistics, 2007: 460-463. [8] Johansson R, Nugues P. LTH: semantic structure extraction using nonprojective dependency trees[C]//Proceedings of the 4th International Workshop on Semantic Evaluations. Association for Computational Linguistics, 2007: 227-230. [9] Dipanjan Das, Desai Chen, André F. T. Martins,etc.Frame-semantic parsing[J].Computational Linguistics,2013, 40(1): 9-56. [10] N Xue, M Palmer. Automatic semantic role labeling for Chinese verbs[C]//Proceedings of IJCAI.2005, 5: 1160-1165. [11] 李濟(jì)洪.漢語框架語義角色的自動(dòng)標(biāo)注技術(shù)研究[D].山西大學(xué)博士學(xué)位論文,2010. [12] 梅家駒,竺一鳴,高蘊(yùn)琦等編.同義詞詞林[M].上海: 上海辭書出版社,1983. [13] 郝曉燕,劉偉,李茹,等.漢語框架語義知識(shí)庫及軟件描述體系[J].中文信息學(xué)報(bào),2007,21(5): 96-100. [14] Ramshaw L A, Marcus M P. Text chunking using transformation-based learning[C]//Proceedings of Natural language processing using very large corpora. Springer Netherlands, 1999: 157-176. [15] Che W, Li Z, Liu T. Ltp: A chinese language technology platform[C]//Proceedings of the 23rd International Conference on Computational Linguistics: Demonstrations. Association for Computational Linguistics, 2010: 13-16. [16] 李國臣,張立凡,李茹,等.基于詞元語義特征的漢語框架排歧研究[J].中文信息學(xué)報(bào),2013(4): 44-51.4 實(shí)驗(yàn)設(shè)置及分析
4.1 實(shí)驗(yàn)語料
4.2 評(píng)價(jià)指標(biāo)
4.3 核心目標(biāo)詞識(shí)別實(shí)驗(yàn)設(shè)置及結(jié)果分析
4.4 框架選擇實(shí)驗(yàn)設(shè)置及結(jié)果分析
4.5 框架元素標(biāo)注實(shí)驗(yàn)設(shè)置及結(jié)果分析
4.6 自動(dòng)抽取實(shí)驗(yàn)
5 結(jié)論與展望