• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    漢語學(xué)術(shù)口語語料庫的創(chuàng)建與應(yīng)用研究

    2021-01-22 06:04:12同濟(jì)大學(xué)劉運(yùn)同
    語料庫語言學(xué) 2020年2期
    關(guān)鍵詞:詞頻音節(jié)語料

    同濟(jì)大學(xué) 韓 毅 劉運(yùn)同

    提要:在漢語國際教育的理論研究和教學(xué)實踐中,漢語學(xué)術(shù)口語是一個重要的組成部分,然而目前該領(lǐng)域的研究和探索十分有限。本文使用LancsBox平臺搭建了規(guī)模達(dá)86,395字的試驗性漢語學(xué)術(shù)口語語料庫。在語料采寫的過程中,通過運(yùn)用語音識別技術(shù),再結(jié)合文本人工校對,大幅提高了采寫的工作效率。語料處理方面,在參考各類標(biāo)注系統(tǒng)的基礎(chǔ)上,研究采用XML格式,標(biāo)注了停頓、重復(fù)、口誤、填充詞、未完句和替換等口語現(xiàn)象。同時,利用所搭建的漢語學(xué)術(shù)口語語料庫,本文對漢語學(xué)術(shù)口語的一些典型特征開展了初步研究。在詞頻統(tǒng)計和詞語分布分析的基礎(chǔ)上,本文還完成了漢語學(xué)術(shù)口語中的自然停頓單位分析及其分布統(tǒng)計,發(fā)現(xiàn)自然停頓單位的長度集中在1—15個音節(jié)的區(qū)間上。

    1.引言

    在漢語國際教育的研究與教學(xué)實踐中,生活漢語、通用漢語的教學(xué)與研究較多,學(xué)術(shù)漢語的教學(xué)與研究較少,漢語學(xué)術(shù)口語的教學(xué)與研究更少。無論是在英語作為第二語言還是漢語作為第二語言的研究領(lǐng)域,目前語料庫的建設(shè)都呈現(xiàn)出書面語語料庫較多、口語語料庫較少的局面。

    本文希望通過創(chuàng)建小型試驗性漢語學(xué)術(shù)口語語料庫,為進(jìn)一步創(chuàng)建大型口語語料庫,特別是學(xué)術(shù)口語語料庫的探索提供工具和方法方面的支持。利用所搭建的漢語學(xué)術(shù)口語語料庫,初步統(tǒng)計分析所選取語料的停頓單位、詞頻分布、語義關(guān)聯(lián)以及特殊句式等研究課題,為漢語學(xué)術(shù)口語研究、口語研究提供語料基礎(chǔ)和方法借鑒。

    2.漢語學(xué)術(shù)口語語料庫的設(shè)計和研制

    2.1 語料的采集和轉(zhuǎn)寫

    語料的采集是搭建任一類型語料庫的基礎(chǔ)工作。本文所進(jìn)行的漢語學(xué)術(shù)口語語料庫的搭建是一項試驗性的、先導(dǎo)性的研究,并未按照隨機(jī)抽樣或一定規(guī)則的分類抽樣選擇語料,而是依據(jù)便利性原則,選取了網(wǎng)易公開課平臺上的“南昌大學(xué)公開課:現(xiàn)代漢語與社會生活”1的視頻作為語料的主要來源。該課程由徐陽春教授主講,視頻音質(zhì)較高,普通話相對標(biāo)準(zhǔn),雜音較少,有利于提高轉(zhuǎn)寫效率,減少轉(zhuǎn)寫錯誤。

    相較于規(guī)范的書面語語料來說,口語語料的采寫過程更為繁瑣。本研究的采寫流程為:

    (1)轉(zhuǎn)錄。使用虛擬聲卡工具Virtual Audio Cable配合聲音處理工具Adobe Audition CS6對視頻聲音進(jìn)行轉(zhuǎn)錄并處理保存。其中,采用內(nèi)錄的方式是為了保證聲音質(zhì)量的穩(wěn)定,不摻雜外界噪聲。

    (2)轉(zhuǎn)寫。將處理過的音頻文件導(dǎo)入“訊飛聽見”平臺,使用“語音轉(zhuǎn)文字——中文機(jī)器快轉(zhuǎn)”功能,利用語音識別技術(shù),對聲音文本進(jìn)行前期處理。該步驟的識別準(zhǔn)確率可保證在90%以上,能夠較好地提升轉(zhuǎn)寫效率。

    (3)加工存檔。對轉(zhuǎn)寫后的語料進(jìn)行精細(xì)加工,對照音頻文件逐字逐句校對修正,標(biāo)注停頓等符號,并儲存為文本文檔。

    2.2 語料的標(biāo)注

    語料的標(biāo)注分為兩個層面:第一是語料基本性質(zhì)的標(biāo)注,以及語料的采集時間、分類等方面的標(biāo)注。在這一層面上,漢語學(xué)術(shù)口語語料庫對每一篇語料的標(biāo)注包括以下6個方面。

    (1)類型,包括課堂(這是本研究的試驗性語料庫的主要語料類型)、學(xué)術(shù)會議、學(xué)術(shù)報告等;

    (2)學(xué)科,分為語言學(xué)、金融、計算機(jī)科學(xué)等;

    (3)時間,指語言行為發(fā)生的時間,精確至月;

    (4)地點(diǎn),指語言行為發(fā)生的地點(diǎn),精確至單位、組織和場合,如南昌大學(xué)、XX學(xué)術(shù)研討會;

    (5)說話人性別;

    (6)說話人年齡,以10歲為單位進(jìn)行分段分類,如20—29歲、30—39歲等。

    語料標(biāo)注的另一個層面為對具體的詞、句子、段落進(jìn)行標(biāo)注。如上所述,進(jìn)行語料標(biāo)注的目的是研究語言現(xiàn)象,因此語料標(biāo)注需要有較強(qiáng)的可拓展性和靈活性。本文認(rèn)為這一層面的標(biāo)注應(yīng)堅持以下4個原則。

    (1)標(biāo)注分類明確可辨;

    (2)標(biāo)注符號可以全部或按照分類快速移除;

    (3)可以通過標(biāo)注符號快速提取相應(yīng)分類的語料;

    (4)標(biāo)注系統(tǒng)具有較強(qiáng)的適配性和拓展性。

    在口語話語標(biāo)注時,通常會從以下4種標(biāo)注系統(tǒng)中進(jìn)行選取,包括:Bois的TD、Konrad Ehlich的HIAT、會話分析(CA)傳統(tǒng)的轉(zhuǎn)寫系統(tǒng)和Brian MacWhinney的CHAT(劉運(yùn)同 2016)。本文在參考上述標(biāo)注系統(tǒng)的基礎(chǔ)上,結(jié)合XML語言的形式與格式,同時以本文重點(diǎn)研究的課題為出發(fā)點(diǎn),對以下口語特征進(jìn)行標(biāo)注。

    (1)停頓,即口語表達(dá)中的自然停頓。在判斷停頓時不僅依靠聽力辨別,還依靠音頻聲波圖中的靜音時長輔助判斷,在停頓處插入符號[P]表示。

    (2)重復(fù),即口語表達(dá)中的語言重復(fù)。用“”符號表示,例如:“連不起來有點(diǎn)雜糅[P]。”此處需要對標(biāo)注符號的形式做一點(diǎn)簡單的說明:在“”中,“df”表示一種標(biāo)注的大類,此處“df”定義的是“口語中的不流暢”現(xiàn)象,也是本文主要標(biāo)注的類別?!皌ype='repeat'”中的“'repeat'”表示“口語中的不流暢”這一上層類別中的子類別“重復(fù)”,下文還會分別介紹其他次級子類。正如例句所示,標(biāo)注時將需要標(biāo)注的文本放置與兩個尖括號中間,“”表示該標(biāo)注的完成,“/”是結(jié)束的主要標(biāo)記,在分析時用于提取和定位標(biāo)注內(nèi)容。

    (3)口誤,即在話語中表達(dá)錯誤,但沒有進(jìn)行修改或修改為其他不相關(guān)的內(nèi)容。用“”符號表示,例如:“那么我們的課大學(xué)的課呢[P]跟高中那個時候呢[P]不同點(diǎn)在哪里呢[P]?!?/p>

    (4)填充詞,即用于語段間的停頓和過渡的內(nèi)容。用“”符號表示。這類現(xiàn)象出現(xiàn)的次數(shù)較多,例如:“然后[P]那么A怎么怎么樣就可以報考是這樣的[P]?!?/p>

    (5)未完句,即當(dāng)前句子沒有說完,重新說或轉(zhuǎn)說其他句子。用“”符號表示。例如:“跟動作的關(guān)系最為[P]密切唉你同學(xué)們注意第一句沒有[P]啊last year in May[P]。”

    (6)替換,即在說話時覺得表達(dá)不夠清晰完整,從而選擇快速替換為意思相同或相近的內(nèi)容。用“”符號表示,例如:“接著往下看[P]成分贅余[P]那就多余了[P]校門前是一條[P]很筆直的大道唉那不就這個很是多余的啦[P]”。

    2.3 語料庫的搭建

    選擇以LancsBox作為語料庫的搭載平臺開展相應(yīng)研究。LancsBox是由英國蘭卡斯特大學(xué)的學(xué)者們開發(fā)的用于語料數(shù)據(jù)收集、儲存和分析的軟件系統(tǒng)2。選取LancsBox作為搭載平臺的理由包括以下幾點(diǎn)。

    (1)本地化處理自有語料;

    (2)內(nèi)置算法可以幫助開展分詞、詞頻統(tǒng)計、關(guān)鍵詞檢索等語料分析的基礎(chǔ)性工作;

    (3)可將語料分析結(jié)果進(jìn)行可視化展示;

    (4)支持中文。

    2.4 語料庫的檢索

    2.4.1 語料庫基本數(shù)據(jù)

    語料規(guī)模:口語音頻長度約200 分鐘,轉(zhuǎn)寫文本(除各類符號)約10萬字;

    語料類型:高校課堂;

    學(xué)科細(xì)分:語言學(xué);

    時間:2013 年4 月(根據(jù)網(wǎng)易公開課網(wǎng)站信息推算);

    地點(diǎn):南昌大學(xué);

    說話人性別:男;

    說話人年齡:50—60歲(根據(jù)南昌大學(xué)公開資料推算)。

    2.4.2 語料關(guān)鍵詞檢索

    語料關(guān)鍵詞檢索功能通過LancsBox提供的前后文關(guān)鍵字工具KWIC(key word in context)實現(xiàn)。其具體功能包括以下幾點(diǎn)。

    (1)查詢一個詞或短語在語料中出現(xiàn)的頻率;

    (2)檢索特殊的語言結(jié)構(gòu),例如關(guān)聯(lián)詞語、口語詞、被動句等在語料中的分布情況;

    (3)對檢索出的語料條目根據(jù)具體需求進(jìn)行分類、篩選和排序;

    (4)在兩個語料庫中對檢索數(shù)據(jù)進(jìn)行對比分析。

    在進(jìn)行語料關(guān)鍵詞檢索的過程中,常用的檢索方式包括以下4種。

    (1)直接輸入詞或短語進(jìn)行檢索;(2)使用通配符“*”進(jìn)行檢索;(3)使用正則表達(dá)式;(4)復(fù)雜度更高的方法就是將通配符與正則表達(dá)式相結(jié)合。

    在進(jìn)行關(guān)鍵詞檢索時,語料庫可以為研究者提供一些自定義的配置選項,下文詳細(xì)介紹了幾種常用的配置。

    (1)對關(guān)鍵詞左右顯示詞語數(shù)量的配置:默認(rèn)顯示7個詞語,可通過自定義配置的方式更改該數(shù)值。

    (2)初級篩選:研究者在得到相應(yīng)檢索結(jié)果后,如得到非常多的信息條目,可據(jù)此使用初級篩選配置,定位需要保留的信息條目或者排除帶有干擾的信息條目。

    (3)高級篩選:若研究者需要進(jìn)行更為具體的研究工作,則需要限定更多的篩選條件,KWIC tools提供了高級篩選功能,可以對關(guān)鍵詞及其左、右的各個詞語進(jìn)行條件設(shè)定,同時可進(jìn)行正則運(yùn)算。

    3.漢語學(xué)術(shù)口語的詞頻統(tǒng)計分布與語義關(guān)聯(lián)研究

    3.1 詞頻統(tǒng)計分析

    詞頻統(tǒng)計分析是詞匯研究的重要方法,也是語料庫研究中分析文本特點(diǎn)的重要方法。漢語詞與詞之間沒有空格等符號標(biāo)識詞的邊界,在做詞頻統(tǒng)計之前需要對漢語文本進(jìn)行分詞處理。本研究結(jié)合LancsBox自帶的分詞模型和Jieba分詞模型對語料進(jìn)行了分詞處理。經(jīng)過兩種分詞結(jié)果的詞匯對照,在Jieba分詞的基礎(chǔ)上,添加自定義詞典,并啟用HMM模型3,將“是吧”“對不對”等詞語準(zhǔn)確地切分出來。本文使用Python程序語言引入Jieba模塊進(jìn)行相關(guān)的切詞處理,在切詞前已經(jīng)將少量英文、阿拉伯?dāng)?shù)字等先行去除。

    經(jīng)過中文分詞處理,相關(guān)語料總共被切出了25,902個詞,本文對詞頻在前100的詞進(jìn)行分析研究。按照詞頻降序排列后的結(jié)果如表1所示。

    表1 詞頻前100的詞降序排列結(jié)果

    (續(xù)表)

    從統(tǒng)計結(jié)果看,詞頻最高的是“的”“啊”“是”“呢”“了”這些詞語。眾所周知,“的”在通用漢語中的詞頻本身就很高?!鞍 薄澳亍钡忍撛~在LCMC(Lancaster Corpus of Mandarin Chinese)漢語書面語語料庫中的詞頻都在200以上4,語料庫中“啊”和“呢”等詞的高頻使用,可視為漢語口語語料庫的特征之一。

    3.2 詞語搭配網(wǎng)絡(luò)分析

    任何一個詞語都不是孤立的。在不同的場景下,詞語之間存在著某種特定的關(guān)系,這種關(guān)系很難通過只言片語或少量的文本發(fā)現(xiàn),而運(yùn)用語料庫數(shù)據(jù),語料的規(guī)模越大,越容易發(fā)現(xiàn)特定背景下的語言中詞與詞之間的特定關(guān)系,稱之為詞語搭配。

    我們可以使用兩種方法衡量語料庫中詞語間的關(guān)聯(lián)程度:互信息(MI)和T值(T-score)。MI值可展示語料庫中詞語的共現(xiàn)頻率與預(yù)期值的差異。用統(tǒng)計學(xué)術(shù)語說,這種方法可用來測量詞x 和y 之間的關(guān)聯(lián)強(qiáng)度。

    但是,在詞頻非常低的情況下,用MI值測量詞語之間關(guān)聯(lián)強(qiáng)度的效果難以盡如人意。T值則可以避免這一問題,這種方法也將詞頻因素納入了考慮范圍。T值測量的不是關(guān)聯(lián)強(qiáng)度,而是分析可以斷言存在關(guān)聯(lián)的置信度(confidence)。從實際的操作情況出發(fā),MI值更可能賦予完全固定的短語以較高的分值,而T值則會產(chǎn)生出現(xiàn)頻率相對較高的、特征鮮明的搭配詞。

    從本次搭建的漢語口語語料庫情況來看,詞語的出現(xiàn)頻率并不低,并且本研究主要關(guān)注詞語之間的關(guān)聯(lián)強(qiáng)度而非置信度。同時,作者對兩種計算方法進(jìn)行了應(yīng)用試驗,發(fā)現(xiàn)MI值更為準(zhǔn)確,因此本文選擇使用MI值來測算詞語之間的關(guān)聯(lián)強(qiáng)度。

    LancsBox支持的GraphColl能夠便捷地提供MI值與T值的計算,GraphColl是由蘭卡斯特大學(xué)社會科學(xué)語料庫研究中心開發(fā)的跨平臺工具,用于分析搭配網(wǎng)絡(luò),建立和研究詞語搭配網(wǎng)絡(luò),MI值的計算方法如下。

    MI=log((AB * sizeCorpus)/(A * B * span))/log(2)

    試以“語言”這個詞作為關(guān)鍵節(jié)點(diǎn),將參數(shù)span(跨距)的取值設(shè)置為10(即到關(guān)鍵節(jié)點(diǎn)詞的左邊5個詞和右邊5個詞,可以對這個參數(shù)進(jìn)行調(diào)節(jié)),“語言”這個詞語、與其相關(guān)的詞語及關(guān)聯(lián)強(qiáng)度可見于表2。

    表2 “語言”及相關(guān)詞語的關(guān)聯(lián)強(qiáng)度

    在“位置”一欄中,“L”表示該詞出現(xiàn)在關(guān)鍵節(jié)點(diǎn)詞左邊的頻率更高,“R”表示該詞出現(xiàn)在關(guān)鍵節(jié)點(diǎn)詞右邊的頻率更高,“M”表示該詞出現(xiàn)在關(guān)鍵節(jié)點(diǎn)詞的左邊和右邊的頻率一樣高。MI值越大,表示與詞語“語言”的關(guān)聯(lián)強(qiáng)度越大。

    從分析結(jié)果中可以看出,與“詞語”關(guān)聯(lián)度最強(qiáng)的詞是“功能”,常出現(xiàn)在“詞語”的右邊,即在當(dāng)前語料中,“語言”和“功能”的關(guān)系緊密且順序常為“語言”在前,“功能”在后。與“語言”關(guān)聯(lián)關(guān)系緊密的詞還有“形式(R)”“網(wǎng)絡(luò)(L)”“民族(R)”“環(huán)境(R)”“規(guī)范(M)”和“交際(M)”等。

    詞語關(guān)聯(lián)強(qiáng)度的結(jié)果可以通過GraphColl繪制成可視化網(wǎng)絡(luò)圖表,距離關(guān)鍵節(jié)點(diǎn)越近,則表示關(guān)聯(lián)強(qiáng)度越高;節(jié)點(diǎn)顏色越深,代表該詞的詞頻越高,詳見圖1。

    圖1 詞語關(guān)聯(lián)強(qiáng)度可視化網(wǎng)絡(luò)

    4.學(xué)術(shù)漢語口語的停頓單位分析

    經(jīng)過梳理,研究根據(jù)口語中的停頓將目標(biāo)文本切分成5,739個停頓單位。需要特別注明的是,一些句子包含英文,英文在統(tǒng)計時會計算構(gòu)成單詞的字母數(shù)。例如句子“那么last year in May he went to Hong Kong”統(tǒng)計結(jié)果為38個字符。依據(jù)這一規(guī)則得到的計算結(jié)果不盡合理,因此在按停頓單位長度排序時,去除了包含較多英文單詞的停頓單位,未將其納入排序。

    4.1 停頓單位長度分析

    停頓單位的長度是指一個口語停頓單位所包含的音節(jié)數(shù),用正整數(shù)表示。依據(jù)對當(dāng)前語料進(jìn)行的相關(guān)統(tǒng)計和排序6,最長的停頓單位包含72個音節(jié),在11秒鐘說完,每秒平均說出6.5個音節(jié),其中有較多語言重復(fù)。長度在前20的停頓單位包含的音節(jié)數(shù)以及對應(yīng)文本如表3所示。

    表3 長度前20停頓單位的音節(jié)數(shù)及文本

    (待續(xù))

    (續(xù)表)

    從表3中可以看出,口語中的停頓越長,其話語中的重復(fù)、更正等不流暢的語言現(xiàn)象就越多、越明顯。

    當(dāng)前語料的平均停頓單位長度為7.57個音節(jié),據(jù)此將停頓單位長度分為1—3個音節(jié)、4—6個音節(jié)、7—9個音節(jié)、10—15個音節(jié)、16—20個音節(jié)、21—30個音節(jié)、31—40個音節(jié)、41—50個音節(jié)、51—60個音節(jié)、61—70個音節(jié)及71個音節(jié)及以上,共計11個停頓單位進(jìn)行分段統(tǒng)計,其具體分布情況見表4。

    表4 語料停頓單位長度分布情況

    根據(jù)表4的統(tǒng)計分析可以看出,長度在1—15的停頓單位數(shù)量占絕對優(yōu)勢,占比達(dá)到91.3%以上??梢娫趯W(xué)術(shù)口語中,長度在1—15的停頓單位更為常見。在這一區(qū)間中,長度為1—3和4—6兩個區(qū)間段的停頓單位又相對較多,由此可以得出,短句在漢語學(xué)術(shù)口語或課堂語言中較為常見。

    4.2 幾種長度的停頓單位特點(diǎn)分析

    根據(jù)表4可以看到停頓單位的長度集中在1—15這一區(qū)間上,若再進(jìn)行一次細(xì)分統(tǒng)計,則可得到如表5所示的結(jié)果。

    表5 停頓單位為1—15的細(xì)分統(tǒng)計情況

    下面以停頓單位長度為3個音節(jié)的表達(dá)單位為例,具體從文本、頻次和排序三個方面進(jìn)行觀察。

    長度為3個音節(jié)的停頓單位共有441個,其中出現(xiàn)頻率最高的為“對不對”,在441個句子中出現(xiàn)了45次,占比為10.2%。表6展示了按照頻次降序排列的前20個停頓單位及其頻次。

    在長度為3個音節(jié)的停頓單位中,首先,高頻使用的是用來進(jìn)行發(fā)問的“對不對”“為什么”“是不是”等;其次,是用于引出解釋和說明的“所以呢”“比如說”“可見呢”和“那就是”,也有用來引起聽話者注意的“同學(xué)們”和“你看看”等,同時也不乏與學(xué)術(shù)內(nèi)容相關(guān)的專業(yè)詞語,如“普通話”和“共同語”等。

    表6 頻次降序前20個長度為3的停頓單位及其頻次

    5.小結(jié)

    漢語學(xué)術(shù)口語語料庫的創(chuàng)建和分析是一項充滿挑戰(zhàn)的研究。本研究參考了國外已建成的學(xué)術(shù)口語語料庫的搭建邏輯,如英國學(xué)術(shù)英語語料庫(British Academic Spoken English,簡稱BASE),并參照了國內(nèi)部分口語語料庫的轉(zhuǎn)寫和標(biāo)注規(guī)范,搭建了試驗性的學(xué)術(shù)漢語口語語料庫。從語料的收集、音視頻的轉(zhuǎn)碼、文字的轉(zhuǎn)寫到語料標(biāo)注和入庫,搭建語料庫的主體環(huán)節(jié)基本完成。同時,還通過使用相關(guān)技術(shù)手段,提升了部分流程的效率,例如使用語音識別技術(shù)輔助聲音轉(zhuǎn)為文本,以及使用程序進(jìn)行漢語自動分詞等。所搭建的漢語學(xué)術(shù)口語語料庫,能夠執(zhí)行檢索、分析等研究功能。這項先導(dǎo)研究為大規(guī)模學(xué)術(shù)口語語料庫的創(chuàng)建積累了寶貴的經(jīng)驗。

    語料庫的創(chuàng)建是一項復(fù)雜的工程,本研究也存在一些不足。第一,轉(zhuǎn)寫與標(biāo)注的嚴(yán)密性有待加強(qiáng)。嚴(yán)格意義上說,轉(zhuǎn)寫文本和標(biāo)注文本需要多人多層校對審核,以保證較高的準(zhǔn)確率。第二,語料庫的規(guī)模雖然已經(jīng)超過8 萬字(86,395),但對語料庫來說規(guī)模仍然較小,在進(jìn)行分析時一些偶然因素可能會導(dǎo)致結(jié)果存在較大的誤差。

    我們發(fā)現(xiàn),即使是一個小規(guī)模的學(xué)術(shù)口語語料庫,仍然可以為學(xué)術(shù)口語研究和教學(xué)提供許多有益的參考,例如通過對當(dāng)前語料庫的統(tǒng)計分析,發(fā)現(xiàn)漢語學(xué)術(shù)口語的句長以1—15個音節(jié)居多。另外,通過對停頓間的言語單位開展研究,本文發(fā)現(xiàn)了大量常用的固定表達(dá)方式,如“對不對”“就是說”“為什么”“所以呢”“是不是”等。上述信息不僅能夠深化我們對學(xué)術(shù)口語的認(rèn)識,也將為學(xué)術(shù)口語的教學(xué)提供真實而有效的素材,以幫助學(xué)習(xí)者更高效地掌握漢語學(xué)術(shù)口語。

    注 釋

    1.見http://open.163.com newview/movie/courseintro? newurl=M8s7 JDCEP。

    2.見http://corpora.lancs.ac.uk/lancsbox/index.php。

    3.HMM模型,即隱馬爾可夫模型(Hidden Markov Model,簡稱HMM),是一種基于概率的統(tǒng)計分析模型,用來描述一個系統(tǒng)隱性狀態(tài)的轉(zhuǎn)移和隱性狀態(tài)的表現(xiàn)概率。在Jieba中,對于未登錄到詞庫的詞,使用了基于漢字成詞能力的HMM模型和Viterbi算法。

    4.LCMC語料庫是一個100萬詞次(按每1.6個漢字對應(yīng)一個英文單詞折算)的現(xiàn)代漢語書面語通用型平衡語料庫。

    5.標(biāo)準(zhǔn)離差率越小,偏離程度越小,詞語在整個語料庫中的分布更為廣泛;反之,標(biāo)準(zhǔn)離差率越大,偏離程度越大,詞語在整個語料庫中出現(xiàn)更為集中。

    6.音頻鏈接https://pan.baidu.com/s/1BvrZDgk5Gcd_Wg3Dg2w1Yw,提取碼:h7vt。

    猜你喜歡
    詞頻音節(jié)語料
    基于詞頻分析法的社區(qū)公園歸屬感營建要素研究
    園林科技(2021年3期)2022-01-19 03:17:48
    拼拼 讀讀 寫寫
    基于語料調(diào)查的“連……都(也)……”出現(xiàn)的語義背景分析
    藏文音節(jié)字的頻次統(tǒng)計
    華語電影作為真實語料在翻譯教學(xué)中的應(yīng)用
    詞頻,一部隱秘的歷史
    快樂拼音
    云存儲中支持詞頻和用戶喜好的密文模糊檢索
    《苗防備覽》中的湘西語料
    國內(nèi)外語用學(xué)實證研究比較:語料類型與收集方法
    视频在线观看一区二区三区| 精品少妇内射三级| 亚洲天堂av无毛| 首页视频小说图片口味搜索 | 最新在线观看一区二区三区 | 黑人巨大精品欧美一区二区蜜桃| 久久久国产欧美日韩av| 中文字幕亚洲精品专区| 无遮挡黄片免费观看| 女人高潮潮喷娇喘18禁视频| 免费在线观看影片大全网站 | 国产色视频综合| 天堂中文最新版在线下载| 超色免费av| 伊人亚洲综合成人网| 后天国语完整版免费观看| 香蕉国产在线看| 99热国产这里只有精品6| 国产男人的电影天堂91| 两个人看的免费小视频| 热99国产精品久久久久久7| 啦啦啦啦在线视频资源| 国产精品麻豆人妻色哟哟久久| 亚洲第一青青草原| 纯流量卡能插随身wifi吗| 久久狼人影院| 女性生殖器流出的白浆| 国产免费福利视频在线观看| 亚洲国产精品一区二区三区在线| 国产精品成人在线| 国产成人精品久久二区二区91| 在线观看免费日韩欧美大片| 成年人黄色毛片网站| 久久精品久久久久久噜噜老黄| 国产97色在线日韩免费| 亚洲伊人久久精品综合| 国产精品 国内视频| 日本av免费视频播放| 精品一区二区三区四区五区乱码 | 成人影院久久| 国产精品一区二区免费欧美 | 久久久久网色| 97人妻天天添夜夜摸| 国产爽快片一区二区三区| 国产精品久久久人人做人人爽| 国产精品一区二区在线观看99| 亚洲精品日韩在线中文字幕| 亚洲国产av新网站| 欧美日韩视频高清一区二区三区二| 夜夜骑夜夜射夜夜干| 蜜桃国产av成人99| 久久亚洲精品不卡| 老汉色av国产亚洲站长工具| 国产亚洲精品久久久久5区| 久久鲁丝午夜福利片| 91精品三级在线观看| 国产熟女欧美一区二区| 亚洲人成77777在线视频| 国产亚洲精品久久久久5区| 国产免费现黄频在线看| 99精国产麻豆久久婷婷| 国产真人三级小视频在线观看| 亚洲国产毛片av蜜桃av| 欧美97在线视频| 赤兔流量卡办理| 午夜影院在线不卡| 欧美人与善性xxx| 国产有黄有色有爽视频| 大话2 男鬼变身卡| 欧美精品一区二区免费开放| 精品熟女少妇八av免费久了| 男女高潮啪啪啪动态图| 丰满少妇做爰视频| 一边摸一边做爽爽视频免费| 国产又爽黄色视频| 亚洲av电影在线进入| 日韩大码丰满熟妇| 国产成人av教育| 一级片'在线观看视频| 在线观看国产h片| 欧美乱码精品一区二区三区| 一级a爱视频在线免费观看| 在线亚洲精品国产二区图片欧美| 午夜福利乱码中文字幕| 国产免费现黄频在线看| 久久久久精品人妻al黑| 亚洲九九香蕉| 国产一区二区三区av在线| 久久久久视频综合| 国产日韩一区二区三区精品不卡| 久久 成人 亚洲| 久久国产精品影院| videos熟女内射| 日本欧美视频一区| 国产精品.久久久| 欧美日韩亚洲综合一区二区三区_| 麻豆av在线久日| 日韩,欧美,国产一区二区三区| 欧美激情高清一区二区三区| 国产精品国产三级专区第一集| 亚洲国产av影院在线观看| 大码成人一级视频| 午夜免费鲁丝| 精品国产国语对白av| 亚洲五月色婷婷综合| 嫩草影视91久久| 无遮挡黄片免费观看| 国产在线视频一区二区| 男女免费视频国产| av片东京热男人的天堂| 久久综合国产亚洲精品| 国产精品熟女久久久久浪| 午夜两性在线视频| 亚洲 国产 在线| 一个人免费看片子| 老熟女久久久| 精品一品国产午夜福利视频| 熟女av电影| 最近中文字幕2019免费版| 18在线观看网站| 可以免费在线观看a视频的电影网站| 国产99久久九九免费精品| 亚洲午夜精品一区,二区,三区| 国产片特级美女逼逼视频| 欧美乱码精品一区二区三区| 国产1区2区3区精品| 亚洲欧美精品综合一区二区三区| 精品人妻1区二区| 男人添女人高潮全过程视频| 国产欧美日韩精品亚洲av| 老汉色av国产亚洲站长工具| 国产男女内射视频| 日本wwww免费看| 精品欧美一区二区三区在线| 王馨瑶露胸无遮挡在线观看| 女人被躁到高潮嗷嗷叫费观| www.999成人在线观看| 久9热在线精品视频| 人人澡人人妻人| 亚洲精品av麻豆狂野| 亚洲国产欧美日韩在线播放| 亚洲第一青青草原| 大型av网站在线播放| 成年人黄色毛片网站| 国产视频首页在线观看| 一级黄色大片毛片| 国产精品99久久99久久久不卡| 黄色 视频免费看| 亚洲精品美女久久av网站| 久久性视频一级片| 黄片播放在线免费| 国产精品一二三区在线看| 赤兔流量卡办理| 大话2 男鬼变身卡| 国产精品人妻久久久影院| www日本在线高清视频| 欧美在线黄色| 欧美xxⅹ黑人| 伦理电影免费视频| 啦啦啦在线免费观看视频4| 国产熟女午夜一区二区三区| av网站免费在线观看视频| 久久99精品国语久久久| av又黄又爽大尺度在线免费看| 99久久综合免费| 国产1区2区3区精品| 久久久久久久精品精品| 国产日韩一区二区三区精品不卡| 国产精品免费视频内射| 成人午夜精彩视频在线观看| 黑丝袜美女国产一区| 母亲3免费完整高清在线观看| 免费高清在线观看视频在线观看| 又紧又爽又黄一区二区| 国产精品熟女久久久久浪| 久久精品久久久久久久性| 男人添女人高潮全过程视频| 国产亚洲精品久久久久5区| 国产国语露脸激情在线看| 久久青草综合色| 午夜激情av网站| 亚洲图色成人| 亚洲视频免费观看视频| videosex国产| 成年美女黄网站色视频大全免费| 高清欧美精品videossex| 国产精品一区二区免费欧美 | 亚洲精品一区蜜桃| 亚洲精品久久成人aⅴ小说| 亚洲欧美一区二区三区黑人| 欧美日韩亚洲国产一区二区在线观看 | 成年人免费黄色播放视频| 香蕉丝袜av| 中文字幕人妻熟女乱码| 两个人看的免费小视频| 美女国产高潮福利片在线看| 精品一区二区三卡| 大陆偷拍与自拍| 中文字幕人妻熟女乱码| 久久国产精品人妻蜜桃| 丰满饥渴人妻一区二区三| kizo精华| 亚洲成av片中文字幕在线观看| 伊人久久大香线蕉亚洲五| 啦啦啦啦在线视频资源| 国产淫语在线视频| 国产熟女欧美一区二区| 成人三级做爰电影| 97人妻天天添夜夜摸| h视频一区二区三区| 欧美精品一区二区大全| 日韩中文字幕视频在线看片| 亚洲精品av麻豆狂野| 国产高清视频在线播放一区 | 赤兔流量卡办理| 在线观看免费日韩欧美大片| 国产高清国产精品国产三级| 麻豆乱淫一区二区| 久久精品国产亚洲av涩爱| 亚洲色图 男人天堂 中文字幕| 精品一区二区三区av网在线观看 | 国产三级黄色录像| 日韩伦理黄色片| 50天的宝宝边吃奶边哭怎么回事| 国产亚洲av高清不卡| 久久狼人影院| 亚洲精品自拍成人| 2018国产大陆天天弄谢| 亚洲精品国产av成人精品| 日韩制服丝袜自拍偷拍| 亚洲成人国产一区在线观看 | 国产精品人妻久久久影院| 91老司机精品| 亚洲第一青青草原| 国产福利在线免费观看视频| 久久这里只有精品19| 色视频在线一区二区三区| 国产无遮挡羞羞视频在线观看| 国产精品二区激情视频| 亚洲一区二区三区欧美精品| 国产成人免费观看mmmm| 欧美大码av| 99国产精品一区二区三区| 激情视频va一区二区三区| 国产免费视频播放在线视频| 侵犯人妻中文字幕一二三四区| 国产午夜精品一二区理论片| 欧美精品一区二区免费开放| 久久久久精品国产欧美久久久 | 久久国产精品人妻蜜桃| 欧美成人精品欧美一级黄| 成人亚洲欧美一区二区av| 国产精品亚洲av一区麻豆| 夜夜骑夜夜射夜夜干| 亚洲av在线观看美女高潮| 91精品三级在线观看| 99香蕉大伊视频| 欧美乱码精品一区二区三区| 亚洲精品中文字幕在线视频| 久久毛片免费看一区二区三区| 亚洲av日韩在线播放| 高清av免费在线| 精品高清国产在线一区| 少妇粗大呻吟视频| 美女高潮到喷水免费观看| 国产伦人伦偷精品视频| 各种免费的搞黄视频| 亚洲成人手机| 好男人电影高清在线观看| 久久精品人人爽人人爽视色| 日本午夜av视频| 黑人欧美特级aaaaaa片| 中文字幕精品免费在线观看视频| 三上悠亚av全集在线观看| 午夜福利免费观看在线| 女警被强在线播放| 久久热在线av| 精品少妇一区二区三区视频日本电影| 欧美+亚洲+日韩+国产| 国产精品九九99| a级毛片在线看网站| 黑人猛操日本美女一级片| 日本欧美国产在线视频| 人妻一区二区av| 精品一区二区三区四区五区乱码 | 国产一区有黄有色的免费视频| 国产精品 国内视频| 别揉我奶头~嗯~啊~动态视频 | 中文乱码字字幕精品一区二区三区| 伊人久久大香线蕉亚洲五| 久久久欧美国产精品| 国产精品 国内视频| 18禁裸乳无遮挡动漫免费视频| 激情五月婷婷亚洲| 精品少妇一区二区三区视频日本电影| 久久av网站| 两性夫妻黄色片| 黑人欧美特级aaaaaa片| 三上悠亚av全集在线观看| 精品国产一区二区三区久久久樱花| 久久久久国产一级毛片高清牌| 一边摸一边抽搐一进一出视频| 999久久久国产精品视频| 亚洲国产毛片av蜜桃av| 80岁老熟妇乱子伦牲交| 黄色一级大片看看| 色94色欧美一区二区| 女性生殖器流出的白浆| 女性生殖器流出的白浆| 亚洲人成77777在线视频| 精品国产一区二区三区久久久樱花| 人体艺术视频欧美日本| 国产有黄有色有爽视频| 国产亚洲精品久久久久5区| 中文字幕色久视频| 亚洲精品成人av观看孕妇| 国产在线免费精品| 成人手机av| 99九九在线精品视频| 久久精品久久久久久久性| 国产伦理片在线播放av一区| 国产在线视频一区二区| 纵有疾风起免费观看全集完整版| 久久精品亚洲av国产电影网| 少妇的丰满在线观看| 国产成人av激情在线播放| 午夜福利影视在线免费观看| 国产精品国产三级国产专区5o| 亚洲成av片中文字幕在线观看| 国产国语露脸激情在线看| 一边摸一边抽搐一进一出视频| 在线精品无人区一区二区三| bbb黄色大片| 天堂8中文在线网| 黄网站色视频无遮挡免费观看| 热99久久久久精品小说推荐| 满18在线观看网站| 久久久久久亚洲精品国产蜜桃av| 日日爽夜夜爽网站| 999精品在线视频| 午夜福利乱码中文字幕| 亚洲国产日韩一区二区| 99国产综合亚洲精品| 日韩av在线免费看完整版不卡| 黄色片一级片一级黄色片| 国产成人啪精品午夜网站| 看免费av毛片| 一边摸一边抽搐一进一出视频| 国产一区有黄有色的免费视频| 亚洲欧美精品自产自拍| 制服人妻中文乱码| 亚洲欧美精品综合一区二区三区| 女人高潮潮喷娇喘18禁视频| 婷婷丁香在线五月| 色婷婷av一区二区三区视频| www.熟女人妻精品国产| 亚洲欧美清纯卡通| 秋霞在线观看毛片| 久久久国产欧美日韩av| 国产一区二区激情短视频 | 中文乱码字字幕精品一区二区三区| 一区二区三区激情视频| 精品国产一区二区三区四区第35| www.av在线官网国产| 人成视频在线观看免费观看| 免费不卡黄色视频| 人人妻人人添人人爽欧美一区卜| 9热在线视频观看99| 丝瓜视频免费看黄片| 亚洲成av片中文字幕在线观看| 亚洲国产精品一区二区三区在线| 日本一区二区免费在线视频| 少妇的丰满在线观看| 免费一级毛片在线播放高清视频 | 日本黄色日本黄色录像| 国产精品偷伦视频观看了| 久久午夜综合久久蜜桃| 精品少妇一区二区三区视频日本电影| av欧美777| 电影成人av| 黑人猛操日本美女一级片| 9热在线视频观看99| 久久精品熟女亚洲av麻豆精品| 天堂中文最新版在线下载| 成人国语在线视频| 一本大道久久a久久精品| 精品亚洲成a人片在线观看| 国产av精品麻豆| av片东京热男人的天堂| 亚洲国产最新在线播放| 好男人电影高清在线观看| videosex国产| 精品久久久久久电影网| 午夜91福利影院| 国产亚洲av片在线观看秒播厂| 久久人妻福利社区极品人妻图片 | 三上悠亚av全集在线观看| www.av在线官网国产| 99热国产这里只有精品6| 91精品国产国语对白视频| 国产爽快片一区二区三区| 日韩中文字幕欧美一区二区 | 亚洲自偷自拍图片 自拍| 少妇精品久久久久久久| 国产熟女欧美一区二区| 日韩大片免费观看网站| 老司机亚洲免费影院| 少妇精品久久久久久久| 亚洲一码二码三码区别大吗| 一边亲一边摸免费视频| 一级a爱视频在线免费观看| 1024香蕉在线观看| 啦啦啦在线观看免费高清www| 精品少妇久久久久久888优播| 少妇被粗大的猛进出69影院| 亚洲色图 男人天堂 中文字幕| 咕卡用的链子| 看免费成人av毛片| 久久久久精品国产欧美久久久 | 一级毛片电影观看| 麻豆乱淫一区二区| 日本黄色日本黄色录像| 国产成人av教育| 国产在视频线精品| 一区福利在线观看| 国产精品国产三级专区第一集| 午夜免费鲁丝| 男人舔女人的私密视频| 色网站视频免费| 爱豆传媒免费全集在线观看| a 毛片基地| 欧美激情 高清一区二区三区| 免费观看a级毛片全部| 欧美亚洲日本最大视频资源| 韩国高清视频一区二区三区| 国产一区二区三区综合在线观看| 视频区图区小说| 日韩免费高清中文字幕av| 男女无遮挡免费网站观看| 又大又爽又粗| 久久 成人 亚洲| 亚洲国产毛片av蜜桃av| 亚洲国产欧美一区二区综合| 久久人人爽av亚洲精品天堂| 天天躁夜夜躁狠狠躁躁| 欧美日韩亚洲综合一区二区三区_| 高清av免费在线| 午夜精品国产一区二区电影| 黄频高清免费视频| 99香蕉大伊视频| 黄片播放在线免费| 亚洲 国产 在线| 免费观看人在逋| 熟女少妇亚洲综合色aaa.| 日韩一区二区三区影片| 捣出白浆h1v1| svipshipincom国产片| 一个人免费看片子| av福利片在线| 久久久久久久大尺度免费视频| 超色免费av| 一级黄片播放器| 日韩一本色道免费dvd| 亚洲自偷自拍图片 自拍| 夫妻性生交免费视频一级片| 少妇猛男粗大的猛烈进出视频| 在线天堂中文资源库| 日日夜夜操网爽| 欧美人与善性xxx| 激情五月婷婷亚洲| 欧美97在线视频| 首页视频小说图片口味搜索 | 成年人免费黄色播放视频| 亚洲欧洲精品一区二区精品久久久| 少妇被粗大的猛进出69影院| 国产精品亚洲av一区麻豆| 黑人巨大精品欧美一区二区蜜桃| 国产色视频综合| 精品福利观看| 欧美日韩亚洲综合一区二区三区_| 亚洲av电影在线观看一区二区三区| 亚洲成人免费电影在线观看 | 国产亚洲欧美精品永久| 秋霞在线观看毛片| www.999成人在线观看| 亚洲欧洲国产日韩| 最近手机中文字幕大全| 赤兔流量卡办理| 精品熟女少妇八av免费久了| 又黄又粗又硬又大视频| av欧美777| 国产熟女午夜一区二区三区| 国产亚洲av高清不卡| 大话2 男鬼变身卡| 久久精品国产综合久久久| 成人亚洲精品一区在线观看| 免费在线观看日本一区| www.999成人在线观看| 国产99久久九九免费精品| 午夜免费男女啪啪视频观看| 中文字幕色久视频| 老熟女久久久| 亚洲一卡2卡3卡4卡5卡精品中文| 欧美日韩精品网址| 成在线人永久免费视频| 热re99久久国产66热| 午夜福利在线免费观看网站| 国产男女内射视频| h视频一区二区三区| 成人影院久久| 午夜免费男女啪啪视频观看| 国产高清国产精品国产三级| av视频免费观看在线观看| 久久影院123| 亚洲国产日韩一区二区| 午夜福利视频精品| 亚洲av电影在线进入| 精品国产国语对白av| 美女脱内裤让男人舔精品视频| 亚洲色图综合在线观看| 欧美老熟妇乱子伦牲交| 两人在一起打扑克的视频| 国产一级毛片在线| 99精品久久久久人妻精品| 美女国产高潮福利片在线看| 久久久久久久久久久久大奶| 久热爱精品视频在线9| 青草久久国产| 999久久久国产精品视频| 性少妇av在线| 一区福利在线观看| 在线观看国产h片| www.av在线官网国产| 好男人视频免费观看在线| 免费观看av网站的网址| 欧美精品亚洲一区二区| 嫁个100分男人电影在线观看 | 制服诱惑二区| 欧美日韩亚洲高清精品| 人人妻人人澡人人看| 精品亚洲成a人片在线观看| 最新在线观看一区二区三区 | 欧美精品一区二区大全| netflix在线观看网站| 亚洲欧美一区二区三区黑人| 一级黄色大片毛片| 亚洲熟女精品中文字幕| 成人国产一区最新在线观看 | 中文字幕亚洲精品专区| 黄色片一级片一级黄色片| 日本91视频免费播放| 狂野欧美激情性xxxx| 两个人免费观看高清视频| av一本久久久久| 一区福利在线观看| av片东京热男人的天堂| 嫩草影视91久久| 69精品国产乱码久久久| 亚洲精品中文字幕在线视频| 69精品国产乱码久久久| 国产欧美日韩一区二区三区在线| 日韩伦理黄色片| 国产日韩欧美亚洲二区| 国产成人啪精品午夜网站| 国产成人一区二区在线| 男男h啪啪无遮挡| 最近最新中文字幕大全免费视频 | 亚洲av国产av综合av卡| 超碰97精品在线观看| 国产国语露脸激情在线看| 一个人免费看片子| 国产人伦9x9x在线观看| www.av在线官网国产| 中文字幕精品免费在线观看视频| 欧美在线一区亚洲| 久久久久久免费高清国产稀缺| 国产精品秋霞免费鲁丝片| 精品一区二区三卡| 一级片'在线观看视频| 免费看不卡的av| 高潮久久久久久久久久久不卡| 色94色欧美一区二区| 咕卡用的链子| 大陆偷拍与自拍| 亚洲中文日韩欧美视频| 国产亚洲欧美在线一区二区| 精品卡一卡二卡四卡免费| 免费女性裸体啪啪无遮挡网站| 侵犯人妻中文字幕一二三四区| 男女边摸边吃奶| 一级黄色大片毛片| 亚洲av国产av综合av卡| 免费在线观看影片大全网站 | 亚洲精品久久久久久婷婷小说| 啦啦啦啦在线视频资源| 国产成人一区二区三区免费视频网站 | 中文字幕色久视频| 久久毛片免费看一区二区三区| 色综合欧美亚洲国产小说| 国产精品久久久av美女十八| 色综合欧美亚洲国产小说| 亚洲久久久国产精品| 桃花免费在线播放| 午夜福利一区二区在线看| 色视频在线一区二区三区| 国产男女超爽视频在线观看| 欧美日韩av久久| 波多野结衣一区麻豆| 无遮挡黄片免费观看| 久久热在线av| 一级毛片黄色毛片免费观看视频| 天天躁日日躁夜夜躁夜夜| 天天躁夜夜躁狠狠久久av| 纯流量卡能插随身wifi吗| 中文精品一卡2卡3卡4更新|