• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    語料庫間多特征相似性比較的統(tǒng)計方法研究

    2010-12-31 00:00:00韓金龍
    現(xiàn)代教育技術(shù) 2010年8期

    【摘要】語料庫間多特征相似性比較可采用的統(tǒng)計方法包括卡方檢驗、秩相關(guān)檢驗和卡方相似性檢驗。以350個常用詞匯為例的語料庫統(tǒng)計實驗研究表明,在較大樣本的多特征語言研究中,卡方檢驗很容易得出語料庫之間具有顯著性差異的結(jié)論,秩相關(guān)檢驗同樣容易得出參與比較的文體具有顯著相關(guān)的結(jié)論,而卡方相似性檢驗采用統(tǒng)計量相對值作為推斷的根據(jù),可得到較為細致的語料庫之間相似程度的研究結(jié)果。

    【關(guān)鍵詞】語料庫;多特征相似性比較;卡方相似性檢驗

    【中圖分類號】G420【文獻標識碼】A 【論文編號】1009—8097(2010)08—0083—05

    “語料庫語言學是一種方法論,它幾乎可以應(yīng)用于語言學研究的所有領(lǐng)域”[1],而語料庫研究離不開統(tǒng)計方法。目前,國內(nèi)基于語料庫的語言研究大多是對某一項特征或者多個特征中的每一項在不同語料庫之間的比較研究,采用的統(tǒng)計方法主要是卡方檢驗[2][3],很少涉及多個特征或者說一組特征作為一個整體在不同語料庫之間的比較。單項特征的分析可以發(fā)掘出不同語體中某個語言點的異同,但只有把多項特征作為一個整體來研究,才可能發(fā)現(xiàn)不同語體在某一個較大方面的總體差異,從而在更宏觀的層次上進行語言研究。本研究通過語料庫統(tǒng)計的實驗研究,探討語料庫之間多特征相似性比較的不同統(tǒng)計方法,并分析其各自的優(yōu)勢和不足。

    一 文獻綜述

    語料庫之間多個特征的比較,首先可用的是通過卡方檢驗(Chi-square test),觀察數(shù)據(jù)之間分布的擬合狀況,從而判斷是否存在差異;第二個可選方案是Spearman秩相關(guān)檢驗(Rank correlation analysis),觀察兩組數(shù)據(jù)間的相關(guān)性如何,高相關(guān)意味著兩組數(shù)據(jù)分布相似度較高;另外一個方法是Kilgarriff[11]在語料庫比較研究中提出的卡方相似性檢驗,即CBDF(chi by degrees of freedom)檢驗,結(jié)合語料庫中的詞頻信息比較多特征之間的相似度[4]。

    1 卡方檢驗

    卡方檢驗是利用隨機樣本對總體分布與某種特定分布擬合程度的檢驗,也就是檢驗測量值與理論值之間的緊密程度[5]。語料庫研究中經(jīng)常采用的是兩語料庫中某特征是否存在差異的2×2列聯(lián)表檢驗。2×2列聯(lián)表可推廣到具有r行c列的列聯(lián)表,即r×c列聯(lián)表,用以檢驗不同語料庫中多項特征總體分布是否具有顯著性差異。

    但卡方檢驗用于語言研究存在一個問題,就是隨著樣本量的增大,零假設(shè)會越來越容易推翻,即卡方檢驗的樣本量相關(guān)性[4]。一個比較極端的例子就是,兩個對比的語料庫容量加倍,如果所研究的詞匯數(shù)量在兩個庫中同時加倍,得到的統(tǒng)計量就近乎加倍。這樣,原來不具有顯著性差異的可能就有差異了,原來差距較小的變得顯著了,但實際上該詞匯在兩個語料庫中的使用并沒有變化。雖然真實語料中的詞匯數(shù)量并不會隨語料量的增長而同比增長,但二者之間確實是有聯(lián)系的,研究[6]表明,某個詞匯一旦在文檔中出現(xiàn),那么它再次在該文檔中出現(xiàn)的可能性就較大,即詞匯的出現(xiàn)并不是完全隨機或者是獨立的,而觀察獨立性是卡方檢驗必要的前提條件之一[7][8]。由于該條件的違反,我們應(yīng)該對卡方檢驗結(jié)果的解釋持謹慎態(tài)度。

    2 Spearman秩相關(guān)檢驗

    相關(guān)檢驗用于發(fā)掘數(shù)據(jù)中的關(guān)系模式[9],是一種應(yīng)用廣泛的測定變量關(guān)聯(lián)程度的方法。最常用的相關(guān)系數(shù)是簡單相關(guān)系數(shù),即Pearson相關(guān)系數(shù),其計算需要變量為定距或定比變量[10],而且變量中的所有特征值均需獨立,并呈正態(tài)分布[4]。雖然語言研究中以計數(shù)數(shù)據(jù)為多,能夠符合定距數(shù)據(jù)的標準,但詞匯等語言現(xiàn)象出現(xiàn)卻并不是獨立的;另外,語言中很多特征的分布不符合正態(tài)分布,這都會對相關(guān)系數(shù)的計算產(chǎn)生一定的影響。Pearson相關(guān)系數(shù)在語言研究應(yīng)用中的另外一個比較嚴重的問題就是極端值的影響,一個嚴重的極端值甚至能夠改變整個相關(guān)的方向,對Pearson相關(guān)系數(shù)產(chǎn)生極強的破壞力。

    因此,在語言現(xiàn)象研究中,往往不能直接使用簡單相關(guān)系數(shù),而是使用秩相關(guān)檢驗,即Spearman相關(guān)系數(shù)rs,通過把變量進行排序,然后利用變量的秩次大小作線性相關(guān)分析。該檢驗可以較好地解決極端值影響的問題,因為原始數(shù)據(jù)轉(zhuǎn)換為秩以后,其影響就小得多。一個變量中的最大值可能比第二大的值要高很多,但從秩而言,只不過高一個等級而已。另外,秩相關(guān)檢驗對原始變量的分布不作要求,屬于非參數(shù)統(tǒng)計方法,更適用于語言研究。

    McEnery[1]利用Spearman秩相關(guān)系數(shù)研究了一定時間段內(nèi)人工標注詞性的速度與準確率的關(guān)系,表1是其研究數(shù)據(jù)的一個片段,X欄是每個研究對象在2小時內(nèi)標注詞性的詞匯數(shù)量,Y欄是準確率(%)。

    利用公式或者統(tǒng)計軟件計算可得到Spearman相關(guān)系數(shù)rs為0.26。該結(jié)果顯示兩個變量存在較弱的正相關(guān)。但這僅是樣本的相關(guān)系數(shù),要據(jù)此判斷抽樣總體中兩個變量之間的相關(guān)關(guān)系,需要在確定的顯著性水平上,以樣本容量n查找統(tǒng)計表格,確定關(guān)鍵值。在5%的顯著性水平上,n=6時,關(guān)鍵值為0.886。由于樣本相關(guān)系數(shù)遠小于該關(guān)鍵值,因此,在5%的顯著性水平上,目前的數(shù)據(jù)難以說明詞性標注速度與標注準確率有相關(guān)關(guān)系。

    Spearman相關(guān)系數(shù)的計算簡單,對樣本量沒有要求。但是,有研究者指出,該方法用于多詞匯特征相似性研究存在一定的問題。Kilgarriff[11]認為,對于非常高頻的詞匯,如在不同文本間有著不同的秩,這個差異就是非常顯著的。比如the在語料庫X中是用得最多的詞匯,但在語料庫Y中排第3,這表明了兩種體裁的高度差異。但是對于尺度的另一端,情況卻完全相反。比如bread在語料庫X中排號為400,在Y中為500,從中看不出文體的差異。然而,Spearman相關(guān)系數(shù)中后者的分量遠大于前者。因此,Kilgarriff[11]提出了基于卡方和語料庫詞匯信息的相似性檢驗(CBDF)方法,用以檢驗語料庫之間的相似性。該方法同樣可用于語料庫間多特征相似性比較研究。

    3 CBDF檢驗

    CBDF的提出是為了比較語料庫的異同,而語料庫之間的相似程度是相對的,參照的標準就是語料庫自身的情況。因此,Kilgarriff[11]首先界定了語料庫的相似性(similarity)和一致性(homogeneity)兩個概念,并指出相似性的度量只能通過一致性來解釋,而且這兩個概念都是通過語料庫距離來衡量的。表2(Kilgarriff [11)列出了相似性和一致性的關(guān)系。

    在表2中,“高”分意味著某語料庫內(nèi)部距離較大或者兩語料庫之間的距離較大,因此,某語料庫是異質(zhì)的或者兩語料庫不相似;“低”分意味著距離較小,因此,某語料庫是同質(zhì)的或者兩語料庫是相似的?!案摺?、“低”和“相等”是相對于同一行其他列來說的。如在第一行,所有三個分值都是“相等”,意味著兩個語料庫是同一文本類型。第二行,前兩列的“相等”說明語料庫1的內(nèi)部距離(一致性)與語料庫2的內(nèi)部距離大致相等,而“距離”一列的“高”說明兩個語料庫之間的距離顯著地高于兩個語料庫的內(nèi)部距離。因此,兩個語料庫之間的對比可以得到很直觀的解釋:由于兩個語料庫各自在內(nèi)部一致性方面沒有根本性的差異,而二者比較的結(jié)果說明它們之間明顯屬于不同的語言變體。

    第3和第4行展示了一個相對異質(zhì)的語料庫(語料庫1)與一個相對同質(zhì)的語料庫(語料庫2)比較的兩種可能的結(jié)果。兩個語料庫之間的距離不可能比相對異質(zhì)的語料庫1的內(nèi)部距離低很多。如果這個距離(兩語料庫之間的距離)大致等于語料庫1的內(nèi)部距離,其解釋就是語料庫2居于語料庫1的范圍內(nèi);如果這個距離較大,(語料庫2)就居于(語料庫1的范圍)之外。

    最后兩行展示了通用語料庫與專用語料庫之間的差異。前兩列中高和低的分值是相對于語言規(guī)范來解釋的。特別是語料庫內(nèi)部距離的高分值表示了包括多種語言變體的通用語料庫。通用語料庫之間的相似性展示的實際上是各自語料庫所代表的語言變體是否相同,以及在多大程度上相同。語料庫內(nèi)部距離分值較低的比較典型的情況是:語料庫只包含單獨一種語言變體。因此這里的分值可以解釋為兩種語言變體之間距離的度量。

    Kilgarriff的距離度量是通過計算兩個語料庫中N個詞匯特征的卡方值,然后除以自由度得到的。因為自由度等于所研究詞匯的數(shù)量N加上剩余詞匯(reminder)減一,因此,實際上就等于要研究的詞匯特征數(shù)量N。Kilgarriff[11]的實驗表明,采用320個到640個詞匯特征,比較的效果較為理想。語料庫一致性度量步驟如下:1)語料庫切分成“塊”;2)把所有的塊隨機地分派到兩個集合,構(gòu)成兩個子語料庫;3)測量兩個子語料庫的相似性;4)重復2和3;5)計算所有測量的均值和標準差。語料庫相似性的計算方法類似,只是第2)步的兩個子語料庫分別由語料庫1隨機分出的一半和語料庫2隨機分出的一半構(gòu)成。

    Kilgarriff[11]通過相似度已知的語料庫集合的比較證明,該方法比其他方法都更適用于語料庫差異性的比較。這里所謂的“語料庫差異性”比較的實際上就是代表語料庫性質(zhì)的特征集合的差異性,因此,可以直接用以衡量語料庫之間的多個特征的相似程度。

    二 研究設(shè)計

    1 研究問題

    本研究以詞匯特征為研究對象,力圖回答下列兩個問題:

    (1)卡方檢驗、秩相關(guān)檢驗和CBDF檢驗對語料庫之間多特征差異的統(tǒng)計結(jié)果有什么區(qū)別?

    (2)在語料庫之間多詞匯特征差異比較方面,三種方法哪一種更適合?其優(yōu)勢是什么?各種方法的局限性有哪些?

    2語料來源及預(yù)處理

    本研究使用的語料庫是中國學習者語料庫CLEC(Chinese Learners English Corpus)[12]。為了確保統(tǒng)計方法評測的準確性,本研究僅統(tǒng)計文本中的詞形(token),不對詞匯做任何變換,所有縮寫都保持原形。編程過濾掉所有標注和標點(保留縮寫標點)之后,統(tǒng)計語料庫詞匯數(shù)量列于表3。

    桂詩春、楊惠中[12]對CLEC詞匯的統(tǒng)計數(shù)量為1,070,602個,與本研究稍有差別,其原因可能是本研究對漢語拼音和英語縮寫詞的處理不夠精細,但這些詞匯顯然不屬于常用詞匯,數(shù)量也較少,對本研究不會構(gòu)成較大的負面影響。

    為了采用CBDF方法,編程對五個子語料庫進行切塊處理,每塊包含2000至2100個詞匯。切塊首先以每篇作文為單位,但如果加入一篇作文超過上限,不加入又低于下限,則拆散該篇作文,以句子為單位加入,剩下的句子加入下一個切塊。最后得到527個切塊。各子語料庫的切塊情況見表4。

    3 統(tǒng)計數(shù)據(jù)收集

    根據(jù)Kilgarriff[11]的研究和本研究所用語料庫的情況,確定選取的詞匯特征為350個,即選取CLEC中最常用,并且在各子庫中的出現(xiàn)均不低于5次的詞匯350個,作為本研究中的高頻詞匯,其他詞匯作為非高頻詞匯。

    對于卡方統(tǒng)計,編程統(tǒng)計5個子語料庫中高頻詞匯各自出現(xiàn)的次數(shù),并結(jié)合子語料庫詞匯總數(shù),計算非高頻詞匯總數(shù),最后計算5個子語料庫兩兩之間的卡方擬合統(tǒng)計量。

    秩相關(guān)統(tǒng)計所需數(shù)據(jù)與卡方檢驗基本相同,只是不需要非高頻詞匯數(shù)量。編程計算5個子語料庫兩兩之間的秩相關(guān)統(tǒng)計量。

    對于CBDF統(tǒng)計方法,按照Kilgarriff[11]的算法,編程進行計算。首先把每個子庫的所有切塊隨機分為兩部分,然后計算兩部分之間的卡方相似度,最后每個子庫各取一部分計算兩兩之間的卡方相似度。該過程進行30次,得到的結(jié)果計算均值和標準差。

    三 結(jié)果與討論

    對CLEC五個子庫兩兩之間的350個常用詞匯的卡方擬合統(tǒng)計數(shù)據(jù)列于表5。

    表5中所有檢驗的自由度均為350,經(jīng)估算,在p為0.95時,關(guān)鍵值為394.34,在p為0.99時,關(guān)鍵值為413.70。表中所有數(shù)值均遠遠超過這兩個關(guān)鍵值。這說明由卡方統(tǒng)計量來看,所有CLEC的5個子庫在350個常用詞的使用上,在0.99的顯著性水平上均存在差異。但各個子庫之間差異的大小卻是不盡相同,這可以從卡方統(tǒng)計量的數(shù)值大小看出。這其中最明顯的如st6與其他幾個子庫之間的統(tǒng)計數(shù)據(jù)。st6與st5之間的卡方統(tǒng)計量最小,與st4、st3、st2之間的統(tǒng)計量逐漸增大。這從一定程度上說明了英語專業(yè)高年級英語的代表子庫st6在這350個基本詞匯的使用上與英語專業(yè)低年級子庫st5最相像,盡管它們之間也存在顯著性差異,而與高中英語的st2差異最大,非專業(yè)的大學英語子庫居于二者之間。st3和st4有著同樣的規(guī)律,即與其相鄰的子庫間卡方統(tǒng)計量較小,距離越遠,統(tǒng)計量逐漸增大。這說明st3和st4與其相鄰子庫較為相像,距離越遠,差異越大。這都比較符合人們的預(yù)期。

    但是到了st2和st5情況就復雜的多了。對于st5,它與st6和st4的統(tǒng)計量差異不大,說明英語專業(yè)低年級子庫在這350個詞匯的使用上可能居于非英語專業(yè)高年級與英語專業(yè)高年級之間,而與非英語專業(yè)低年級的st3子庫差異較大。這都比較容易理解。但是st5與st2之間的統(tǒng)計量卻是所有卡方統(tǒng)計量中的最小值,該統(tǒng)計量的解釋就需要對語料庫進行詳細的探究。對于st2,它與st5有著最小的卡方統(tǒng)計量,但與其他3個子庫有著最大的三個卡方統(tǒng)計量。這說明在這350個常用詞匯的使用上,高中英語子庫st2與英語專業(yè)低年級子庫st5最是相近,但與其他子庫差距甚遠。對CLEC語料庫的深入檢索發(fā)現(xiàn),st2和st5主要是以學生日常寫作,如日記和信件為多,而其他子庫均以議論文為主。這也從一個側(cè)面說明,雖然有研究[13]表明,英語學習者書面語存在較強的口語化傾向,但這些書面語之間語體差異在一定程度上存在的。

    雖然從表5可以得到更多結(jié)論,但如上所述,由于詞匯特征并非隨機出現(xiàn),卡方檢驗應(yīng)用于語言現(xiàn)象的統(tǒng)計檢驗時,具有一定的局限性,所以對表5中的統(tǒng)計結(jié)果的解釋需持謹慎態(tài)度。為確保檢驗的科學性,以下是其他統(tǒng)計方法進行同樣的檢驗的結(jié)果。首先是秩相關(guān)檢驗結(jié)果,列于表6。

    表6列出的是CLEC中5個子庫之間350個常用詞匯的秩相關(guān)統(tǒng)計量rs(350),并且檢驗結(jié)果顯示,在0.01的顯著性水平上,所有統(tǒng)計量均具有顯著性。即所有5個子庫之間在這350個詞匯的使用上都具有顯著相關(guān)。這里是對350個常用詞匯的統(tǒng)計,即特征量為350。由于大特征量使得相關(guān)性統(tǒng)計更容易變得顯著,即使統(tǒng)計量的絕對值并不是很大(Cohen 2008:271),所以對這種相關(guān)性的解釋,意義不是很大。然而,我們可以通過不同子庫間相關(guān)性的比較,看出哪些子庫之間在常用詞匯的使用上更加相近。

    在這一點上,秩相關(guān)檢驗結(jié)果與卡方檢驗結(jié)果較為類似,即除了最明顯的st2和st5之間,各子庫基本上都是與其相鄰的子庫較為相似,距離越遠,相關(guān)性越低。當然,這其中還存在一個特例就是st4與st6比st4與st5更為相近,但是其差異的絕對值(0.05)并不是很大,所以這個反例不能夠否定總體的趨勢。

    最后再看CBDF的檢驗結(jié)果。

    表7是采用Kilgarriff[11]的方法對CLEC的5個子庫一致性和相似性的比較。比較進行了30次,表中所列結(jié)果為30次的平均值,括號中的數(shù)字是30個測量結(jié)果的標準差。參照表2可以看出,所有測量結(jié)果基本都屬于表2第二行的情況,即各子語料庫的內(nèi)部距離大致相等,各子庫之間的距離顯著地高于各子庫的內(nèi)部距離。因此,各子庫之間的對比可以得到很直觀的解釋:由于各子庫在常用詞匯的使用上,各自在內(nèi)部一致性方面沒有根本性的差異,而相互之間比較的結(jié)果說明它們之間在這些詞匯的使用上明顯屬于不同的語言變體。

    當然,這種相同或不同存在程度上的差異。在內(nèi)部一致性方面,5個子庫中,st2最高,st6、st5、st4逐漸降低,st3內(nèi)部一致性最低。但所有子庫的內(nèi)部一致性均屬于一個數(shù)量級,并且與各個子庫之間對比,差異不大,所以我們認為各個子庫內(nèi)部一致性沒有根本性的差異。但是各子庫之間的相似性度量差異較大,差異最小的st2與st5CBDF統(tǒng)計量為24.90,差異最大的st2與st6高達62.93。

    表7的總體趨勢類似于表5和表6,都是子語料庫與其相鄰的子庫較為相近或相似,距離越遠,相似度越低,而且st2與st5的關(guān)系較為特殊。仔細觀察表7可以發(fā)現(xiàn),各子庫與其相鄰子庫的CBDF統(tǒng)計量基本上都是30多,每隔一個子庫,統(tǒng)計量會增加10點左右。這種變化較為符合我們的預(yù)期,即中國英語學習者在350個常用詞匯的使用上,在各個學習階段有所不同,并且這種不同會隨著學習階段的提高有所增加。但是這里也有例外,即st2與st3和st2與st4。按照規(guī)律,前者應(yīng)該是30余點,后者應(yīng)該是40余點,但實際上后者超過50點,前者更是高達60點。對這個例外的解釋一方面涉及到語體的差異,其原因類似于st2與st5的較高相似度,即st2主要是日常寫作,以日記和信件為主,而st3和st4的大部分文章都是考試作文,這就使得口語化詞匯,如I、was、my、the等在st2中更為頻繁地出現(xiàn)。另一個更重要的方面是st3和st4兩個子庫的作文題目較為集中,使得涉及作文題目的常用詞使用頻度極高,但卻很少在st2中出現(xiàn)。

    四 結(jié)論與建議

    采用3種不同統(tǒng)計方法對中國學習者語料庫(CLEC)中5個子庫在350個常用詞匯使用差異的統(tǒng)計分析得到以下結(jié)論:

    1)傾向于測量樣本間差異的統(tǒng)計方法,如卡方檢驗,對于多特征差異性檢驗,由于特征數(shù)量較大,以及詞匯特征獨立性要求難以滿足,統(tǒng)計量很容易超過較高顯著性標準上的關(guān)鍵值,從而得出樣本所代表的語言變體之間在這些特征方面存在顯著性差異。

    2)傾向于測量樣本間相關(guān)性的統(tǒng)計方法,如秩相關(guān)檢驗,對于多特征差異性檢驗,同樣由于特征數(shù)量較大,統(tǒng)計量很容易超過較高顯著性標準上的關(guān)鍵值,從而得出樣本所代表的語言變體之間在這些特征方面存在顯著相關(guān)。

    3)由于多特征差異性檢驗的特殊性,上述兩種統(tǒng)計方法所得到的統(tǒng)計量相對于關(guān)鍵值的解釋(即在某一顯著性水平上存在差異)意義不大,而統(tǒng)計量之間相對數(shù)量差異的解釋卻能夠說明一定的問題。這也是CBDF統(tǒng)計檢驗所采用的策略。

    4)CBDF檢驗實際上是卡方檢驗的變形,去除了統(tǒng)計量絕對值與關(guān)鍵值的比較,代之以樣本內(nèi)部和樣本之間統(tǒng)計量的相對值比較得出統(tǒng)計結(jié)論。該方法從設(shè)計上就比較符合樣本間多特征差異性比較。但卡方和秩相關(guān)檢驗統(tǒng)計量的相對解釋基本也可以達到同樣的檢驗效果。

    對比卡方、秩相關(guān)和CBDF檢驗的結(jié)果可以看出,前兩者統(tǒng)計量的相對解釋與CBDF檢驗結(jié)果非常相似,只是后者得到的數(shù)據(jù)更為整齊,規(guī)律性更強,從而能夠揭示樣本間較為細微的差異。這主要是由于CBDF檢驗需要拆散樣本、隨機組合、多次檢驗,所以其結(jié)果更細致。其代價就是設(shè)計更復雜、操作難度較大,而前兩者都屬于常用統(tǒng)計方法,可以利用很多統(tǒng)計軟件包,如SPSS,輕易地實現(xiàn)。因此,在語言研究中,可視情況采用不同的統(tǒng)計方法。如果樣本量足夠大,并且要求的檢驗結(jié)果較為細致,研究人員有編程實現(xiàn)文本操作的能力,采用CBDF檢驗效果較好;如果粗略的檢驗即可達到要求,或者研究人員不具有這方面的能力,常用統(tǒng)計方法基本上也可以達到研究目標。

    參考文獻

    [1] McEnery, T. Wilson, A. Corpus Linguistics [M]. Britain: Edinburgh University Press, 1996.

    [2] 王春艷. 基于語料庫的中國學習者英語近義詞區(qū)分探討[J].

    外語與外語教學,2009(6): 27-31.

    [3] 王立非,錢娟. 我國學生英語演講中的語塊特點:基于語料庫的考察[J]. 外語學刊,2009(2):115-120.

    [4] Oakes, M.P. Statistics for Corpus Linguistics Edinburgh Textbooks in Empirical Linguistics [M]. Edinburgh: Edinburgh University Press, 1998.

    [5] 劉漢良. 統(tǒng)計學教程[M].上海:上海財經(jīng)大學出版社,1999.

    [6] Church, K. and Gale, W. Poisson mixtures [J]. Journal of Natural Language Engineering, 1995, 1(2): 163–190.

    [7] Larson, R Farber, B. 基礎(chǔ)統(tǒng)計學[M]. 北京:清華大學出版社,2003.

    [8] Cohen, B.H. Explaining Psychological Statistics [M]. NJ: John Wiley Sons, 2008.

    [9] Larson-Hall, J. A Guide to Doing Statistics in Second Language Research Using SPSS [M]. New York: Taylor Francis, 2009.

    [10] Boslaugh, S. Watters, P.A. Statistics in a Nutshell: A Desktop Quick Reference [M]. CA: O’Reilly Media, Inc., 2008.

    [11] Kilgarriff, A. Comparing Corpora [J]. International Journal of Corpus Linguistics, 2001, 6(1): 97–133.

    [12] 桂詩春,楊惠中. 中國學習者英語語料庫[M]. 上海:上海外語教育出版社,2002.

    [13] 文秋芳,丁言仁,王文宇. 中國大學生英語書面語中的口語化傾向—高水平英語學習者語料對比分析[J]. 外語教學與研究,2003,35(4): 268-274.

    中文字幕高清在线视频| 中文字幕av在线有码专区| 亚洲第一电影网av| 免费观看精品视频网站| netflix在线观看网站| 亚洲经典国产精华液单| 黄色日韩在线| 国产精品98久久久久久宅男小说| 国内少妇人妻偷人精品xxx网站| 亚洲精品一区av在线观看| av国产免费在线观看| 草草在线视频免费看| 精品久久国产蜜桃| 免费搜索国产男女视频| 久久九九热精品免费| 国产精品美女特级片免费视频播放器| 如何舔出高潮| 国产色爽女视频免费观看| 国产伦在线观看视频一区| 少妇高潮的动态图| 亚洲成av人片在线播放无| 亚洲av美国av| 精品人妻1区二区| 91午夜精品亚洲一区二区三区 | 免费看a级黄色片| av天堂在线播放| 黄色日韩在线| 中文亚洲av片在线观看爽| 久久久久久久久久久丰满 | 免费av毛片视频| 88av欧美| 欧美日韩乱码在线| 一本一本综合久久| 亚洲美女搞黄在线观看 | 国产亚洲精品av在线| h日本视频在线播放| 两个人的视频大全免费| 亚洲精品一区av在线观看| 亚洲av美国av| 国产精品久久视频播放| 国产成人aa在线观看| 日韩欧美国产在线观看| 精品久久久久久久人妻蜜臀av| 不卡视频在线观看欧美| 日韩欧美 国产精品| 久久精品国产亚洲av香蕉五月| 亚洲av中文av极速乱 | 国产午夜精品论理片| 男人的好看免费观看在线视频| 两个人视频免费观看高清| 久久亚洲真实| 国产精华一区二区三区| 国产欧美日韩一区二区精品| 毛片女人毛片| 亚洲成人久久爱视频| 91精品国产九色| 99久久精品热视频| 欧美激情久久久久久爽电影| 天天一区二区日本电影三级| 老司机深夜福利视频在线观看| 熟女电影av网| 国内揄拍国产精品人妻在线| a级毛片a级免费在线| 俺也久久电影网| 99久国产av精品| 99热这里只有是精品50| 国产精品乱码一区二三区的特点| 国语自产精品视频在线第100页| 日韩人妻高清精品专区| 一进一出好大好爽视频| 搡老妇女老女人老熟妇| 日韩亚洲欧美综合| 国产成人a区在线观看| 白带黄色成豆腐渣| 午夜福利18| 婷婷六月久久综合丁香| 偷拍熟女少妇极品色| 精品无人区乱码1区二区| av在线老鸭窝| 天堂网av新在线| 我的女老师完整版在线观看| 黄片wwwwww| 国产女主播在线喷水免费视频网站 | 国产精品电影一区二区三区| 又黄又爽又刺激的免费视频.| 真人做人爱边吃奶动态| 午夜精品一区二区三区免费看| 国产激情偷乱视频一区二区| 国内精品久久久久久久电影| 小说图片视频综合网站| 亚洲一区二区三区色噜噜| 少妇丰满av| 91麻豆精品激情在线观看国产| 九色成人免费人妻av| 日韩高清综合在线| 午夜激情福利司机影院| 特大巨黑吊av在线直播| 日韩一区二区视频免费看| 三级男女做爰猛烈吃奶摸视频| 真人做人爱边吃奶动态| 国产av麻豆久久久久久久| 看免费成人av毛片| 精品人妻偷拍中文字幕| 午夜福利在线观看免费完整高清在 | 99久久中文字幕三级久久日本| 最近视频中文字幕2019在线8| 美女xxoo啪啪120秒动态图| 狂野欧美白嫩少妇大欣赏| 午夜免费男女啪啪视频观看 | 少妇裸体淫交视频免费看高清| 久久久国产成人精品二区| 亚洲va日本ⅴa欧美va伊人久久| 国产一区二区在线观看日韩| 国产亚洲精品久久久com| 亚洲天堂国产精品一区在线| 色综合色国产| 九九在线视频观看精品| 全区人妻精品视频| 久久久午夜欧美精品| 此物有八面人人有两片| 午夜a级毛片| 精品久久国产蜜桃| 一边摸一边抽搐一进一小说| xxxwww97欧美| 久久久久久久久久成人| 黄色女人牲交| 男插女下体视频免费在线播放| 精品久久久噜噜| 国产乱人视频| 韩国av在线不卡| 国产精品嫩草影院av在线观看 | 日本黄色视频三级网站网址| 国产一区二区在线观看日韩| 狠狠狠狠99中文字幕| 美女 人体艺术 gogo| 国内久久婷婷六月综合欲色啪| 两性午夜刺激爽爽歪歪视频在线观看| 国内精品美女久久久久久| 91麻豆精品激情在线观看国产| 亚洲黑人精品在线| aaaaa片日本免费| 最近最新中文字幕大全电影3| 老司机深夜福利视频在线观看| 中文字幕av成人在线电影| 国产高清视频在线观看网站| 毛片一级片免费看久久久久 | 国产精品无大码| 色播亚洲综合网| 国产高清三级在线| av国产免费在线观看| 久久久久国内视频| 成人精品一区二区免费| 久久精品国产亚洲av香蕉五月| 国产精品嫩草影院av在线观看 | 亚洲精品粉嫩美女一区| 国产亚洲欧美98| 99久久九九国产精品国产免费| 丰满人妻一区二区三区视频av| av女优亚洲男人天堂| 亚洲图色成人| 亚洲av免费在线观看| 亚洲自偷自拍三级| 久久精品综合一区二区三区| 日本 欧美在线| 99热6这里只有精品| 淫妇啪啪啪对白视频| 亚洲性久久影院| 日韩精品青青久久久久久| 97超视频在线观看视频| 日韩 亚洲 欧美在线| 搞女人的毛片| 国产精品人妻久久久影院| bbb黄色大片| 伊人久久精品亚洲午夜| 天堂动漫精品| 欧美高清性xxxxhd video| 永久网站在线| 欧美zozozo另类| 成人美女网站在线观看视频| 午夜a级毛片| 成人av在线播放网站| 搞女人的毛片| 亚洲av免费在线观看| 两人在一起打扑克的视频| 国产黄片美女视频| av在线天堂中文字幕| 欧美国产日韩亚洲一区| 亚洲自拍偷在线| 男插女下体视频免费在线播放| netflix在线观看网站| 国产精品av视频在线免费观看| av女优亚洲男人天堂| 成人高潮视频无遮挡免费网站| 精品乱码久久久久久99久播| 夜夜夜夜夜久久久久| 又紧又爽又黄一区二区| 欧美一区二区国产精品久久精品| 精品人妻一区二区三区麻豆 | 国产高清不卡午夜福利| 国产精品爽爽va在线观看网站| 国产久久久一区二区三区| 国产高清视频在线播放一区| 亚洲精品影视一区二区三区av| 国产精品电影一区二区三区| 国产私拍福利视频在线观看| 成熟少妇高潮喷水视频| 亚洲av中文av极速乱 | 日本免费一区二区三区高清不卡| a在线观看视频网站| 麻豆成人av在线观看| 日本精品一区二区三区蜜桃| 亚洲人成网站在线播| 国产爱豆传媒在线观看| 男插女下体视频免费在线播放| 欧美日韩国产亚洲二区| 五月玫瑰六月丁香| 高清在线国产一区| 久久国产乱子免费精品| 一进一出抽搐动态| 永久网站在线| 欧美成人一区二区免费高清观看| 两性午夜刺激爽爽歪歪视频在线观看| 欧美黑人欧美精品刺激| 免费黄网站久久成人精品| 国产精品综合久久久久久久免费| 亚洲精华国产精华精| 日日摸夜夜添夜夜添小说| avwww免费| 午夜激情欧美在线| 精品一区二区三区人妻视频| 嫩草影院入口| 黄色配什么色好看| 我要看日韩黄色一级片| 老女人水多毛片| 少妇人妻一区二区三区视频| 中文字幕精品亚洲无线码一区| 国产视频一区二区在线看| 乱人视频在线观看| 国产精品野战在线观看| 91麻豆精品激情在线观看国产| 麻豆av噜噜一区二区三区| 亚洲第一区二区三区不卡| av视频在线观看入口| 欧美潮喷喷水| 99久久中文字幕三级久久日本| 欧美中文日本在线观看视频| 日韩欧美国产一区二区入口| 亚洲四区av| 日韩精品中文字幕看吧| 极品教师在线免费播放| av专区在线播放| 国产精品久久久久久精品电影| 国产视频内射| 亚洲一区二区三区色噜噜| 亚洲国产精品成人综合色| 国产伦精品一区二区三区四那| 草草在线视频免费看| 桃色一区二区三区在线观看| 午夜福利高清视频| 亚洲最大成人手机在线| 国产老妇女一区| 欧美性猛交黑人性爽| 真实男女啪啪啪动态图| 五月伊人婷婷丁香| 免费看av在线观看网站| 人人妻,人人澡人人爽秒播| 久久九九热精品免费| 成年版毛片免费区| 狠狠狠狠99中文字幕| 看黄色毛片网站| 97超视频在线观看视频| 中文字幕人妻熟人妻熟丝袜美| 深夜a级毛片| 久99久视频精品免费| 国产老妇女一区| 欧美成人性av电影在线观看| 一个人看视频在线观看www免费| 琪琪午夜伦伦电影理论片6080| 精品久久久久久久久久久久久| 国产一区二区三区av在线 | 日本一二三区视频观看| 一级黄色大片毛片| 日本 欧美在线| 特级一级黄色大片| 俄罗斯特黄特色一大片| 久久久久久久久中文| 天堂动漫精品| 天堂网av新在线| 色综合亚洲欧美另类图片| 成年女人毛片免费观看观看9| 欧美+亚洲+日韩+国产| 亚洲最大成人手机在线| 波野结衣二区三区在线| 日韩av在线大香蕉| 看免费成人av毛片| 狠狠狠狠99中文字幕| 91在线观看av| 中文字幕熟女人妻在线| 中文字幕av在线有码专区| 国产精品一区二区三区四区久久| 国产aⅴ精品一区二区三区波| 国产 一区精品| 一级黄片播放器| 亚洲一区二区三区色噜噜| 成人无遮挡网站| 色综合色国产| 少妇猛男粗大的猛烈进出视频 | 国产激情偷乱视频一区二区| 精品久久久久久久久av| 啦啦啦观看免费观看视频高清| 国产精品一及| 精品久久久久久久久久久久久| 一a级毛片在线观看| 成年免费大片在线观看| av天堂在线播放| 国产美女午夜福利| 亚洲一区二区三区色噜噜| 最后的刺客免费高清国语| 免费无遮挡裸体视频| 欧美一区二区亚洲| 亚洲性久久影院| 国产一区二区三区在线臀色熟女| 日韩欧美在线乱码| 我要看日韩黄色一级片| 国产午夜精品论理片| 九九热线精品视视频播放| 欧美最黄视频在线播放免费| 少妇的逼好多水| 99热这里只有是精品50| 亚洲熟妇中文字幕五十中出| 成人综合一区亚洲| 国产国拍精品亚洲av在线观看| 国产色爽女视频免费观看| 国产精品久久久久久精品电影| 蜜桃久久精品国产亚洲av| 亚洲国产精品sss在线观看| 日本撒尿小便嘘嘘汇集6| 嫩草影视91久久| 久久久国产成人免费| 不卡一级毛片| av女优亚洲男人天堂| 不卡一级毛片| 麻豆成人午夜福利视频| 日韩人妻高清精品专区| 免费在线观看成人毛片| 国产三级中文精品| 久久久久性生活片| 亚洲成人精品中文字幕电影| 成人二区视频| 欧美日韩精品成人综合77777| 中出人妻视频一区二区| 五月伊人婷婷丁香| 免费黄网站久久成人精品| 少妇被粗大猛烈的视频| 亚洲人成网站在线播| 久久精品国产自在天天线| 国产v大片淫在线免费观看| 深夜a级毛片| 桃色一区二区三区在线观看| 97人妻精品一区二区三区麻豆| 日本黄色片子视频| 国产精品无大码| 欧美中文日本在线观看视频| 精品久久久久久久久亚洲 | 欧美黑人欧美精品刺激| 联通29元200g的流量卡| 成年女人永久免费观看视频| netflix在线观看网站| 噜噜噜噜噜久久久久久91| 中文字幕av在线有码专区| a级毛片a级免费在线| 日韩欧美在线乱码| 制服丝袜大香蕉在线| 色5月婷婷丁香| 欧美性猛交╳xxx乱大交人| 午夜日韩欧美国产| 99九九线精品视频在线观看视频| 两性午夜刺激爽爽歪歪视频在线观看| 欧美在线一区亚洲| 日本成人三级电影网站| 国产亚洲av嫩草精品影院| 欧美三级亚洲精品| 在线免费十八禁| 久久热精品热| 99热这里只有是精品在线观看| 自拍偷自拍亚洲精品老妇| 麻豆av噜噜一区二区三区| 精品人妻视频免费看| 日韩欧美免费精品| 欧美日韩瑟瑟在线播放| 性插视频无遮挡在线免费观看| 亚洲av二区三区四区| 午夜福利在线观看吧| 在线a可以看的网站| 俺也久久电影网| 国产午夜福利久久久久久| 国产精华一区二区三区| 欧美一区二区精品小视频在线| 乱系列少妇在线播放| 男女啪啪激烈高潮av片| 两人在一起打扑克的视频| 日韩欧美精品v在线| 婷婷丁香在线五月| 国产蜜桃级精品一区二区三区| 国产大屁股一区二区在线视频| 91麻豆精品激情在线观看国产| 又黄又爽又刺激的免费视频.| 亚洲熟妇中文字幕五十中出| 人人妻人人看人人澡| 深爱激情五月婷婷| 日韩精品中文字幕看吧| 俺也久久电影网| 色哟哟哟哟哟哟| 狂野欧美白嫩少妇大欣赏| 人人妻人人澡欧美一区二区| 国产精品久久久久久久久免| 他把我摸到了高潮在线观看| 中文字幕久久专区| 亚洲无线在线观看| 一个人看视频在线观看www免费| 丝袜美腿在线中文| 亚洲国产高清在线一区二区三| 国产欧美日韩一区二区精品| 人人妻,人人澡人人爽秒播| 干丝袜人妻中文字幕| 搡老岳熟女国产| 一卡2卡三卡四卡精品乱码亚洲| 婷婷六月久久综合丁香| 亚洲在线观看片| 亚洲精品粉嫩美女一区| 国产精品亚洲美女久久久| 精品免费久久久久久久清纯| 女同久久另类99精品国产91| 欧美色视频一区免费| 欧美+亚洲+日韩+国产| 亚洲一区高清亚洲精品| 精品国产三级普通话版| 欧美一级a爱片免费观看看| 男女边吃奶边做爰视频| 两性午夜刺激爽爽歪歪视频在线观看| 一边摸一边抽搐一进一小说| 日韩欧美 国产精品| 亚洲成a人片在线一区二区| 91av网一区二区| 欧美国产日韩亚洲一区| 亚洲熟妇熟女久久| 亚洲性久久影院| 99久久无色码亚洲精品果冻| 国内精品美女久久久久久| 在线免费观看不下载黄p国产 | 黄色配什么色好看| 男女边吃奶边做爰视频| 亚洲va日本ⅴa欧美va伊人久久| 久久天躁狠狠躁夜夜2o2o| 亚洲成人免费电影在线观看| 乱系列少妇在线播放| 久久人人精品亚洲av| 亚洲男人的天堂狠狠| 亚洲一级一片aⅴ在线观看| 联通29元200g的流量卡| 在线观看美女被高潮喷水网站| 婷婷亚洲欧美| 日韩亚洲欧美综合| 国产午夜精品久久久久久一区二区三区 | 日韩亚洲欧美综合| 人人妻人人澡欧美一区二区| 日本三级黄在线观看| 十八禁网站免费在线| 中文字幕av在线有码专区| 69人妻影院| 欧美日韩综合久久久久久 | 成人特级黄色片久久久久久久| 国产精品美女特级片免费视频播放器| 18禁黄网站禁片免费观看直播| 天堂影院成人在线观看| 亚洲内射少妇av| 欧美绝顶高潮抽搐喷水| 春色校园在线视频观看| av在线观看视频网站免费| 老司机福利观看| 国产精品国产三级国产av玫瑰| 中文字幕av在线有码专区| 欧美激情在线99| 999久久久精品免费观看国产| 免费在线观看成人毛片| 久久精品国产亚洲av香蕉五月| 免费在线观看日本一区| 欧美日韩乱码在线| 一区二区三区激情视频| 一级黄片播放器| 成人国产麻豆网| 亚洲av成人精品一区久久| 久久久久久大精品| 免费无遮挡裸体视频| 1024手机看黄色片| 国产精品无大码| 国产大屁股一区二区在线视频| 亚洲无线在线观看| 婷婷精品国产亚洲av| 久9热在线精品视频| 午夜影院日韩av| 高清在线国产一区| 九九热线精品视视频播放| 99久久九九国产精品国产免费| 亚洲欧美日韩高清专用| 一级a爱片免费观看的视频| 亚洲天堂国产精品一区在线| 久久久精品欧美日韩精品| h日本视频在线播放| 简卡轻食公司| 日韩精品有码人妻一区| 国产探花在线观看一区二区| 岛国在线免费视频观看| 麻豆久久精品国产亚洲av| 最新在线观看一区二区三区| 久久久久久久久大av| 午夜免费男女啪啪视频观看 | 真人一进一出gif抽搐免费| 不卡一级毛片| 亚洲无线在线观看| 啦啦啦啦在线视频资源| 精品人妻视频免费看| 亚洲av不卡在线观看| 97人妻精品一区二区三区麻豆| 日本撒尿小便嘘嘘汇集6| 色在线成人网| 亚洲男人的天堂狠狠| 国产免费av片在线观看野外av| 又爽又黄a免费视频| 精品乱码久久久久久99久播| 真实男女啪啪啪动态图| 色吧在线观看| 淫妇啪啪啪对白视频| 99在线人妻在线中文字幕| 真人做人爱边吃奶动态| 亚洲精品国产成人久久av| 小蜜桃在线观看免费完整版高清| 国产精品爽爽va在线观看网站| 小蜜桃在线观看免费完整版高清| 国产精品自产拍在线观看55亚洲| 成人永久免费在线观看视频| 舔av片在线| 国产精品不卡视频一区二区| 欧美一区二区亚洲| 国产精品99久久久久久久久| 日韩欧美免费精品| 成人高潮视频无遮挡免费网站| 天天躁日日操中文字幕| 国产老妇女一区| 久久久色成人| 午夜福利高清视频| 国产日本99.免费观看| 色在线成人网| 特大巨黑吊av在线直播| 日本 av在线| 乱码一卡2卡4卡精品| 精品午夜福利在线看| 可以在线观看毛片的网站| 最近视频中文字幕2019在线8| 搞女人的毛片| 精品久久久久久久末码| 日本黄色视频三级网站网址| 久久久国产成人免费| 亚洲成人中文字幕在线播放| 亚洲三级黄色毛片| 91在线精品国自产拍蜜月| 国产女主播在线喷水免费视频网站 | 一级黄片播放器| 国产91精品成人一区二区三区| 久久久久久久久久成人| 99在线视频只有这里精品首页| 一区福利在线观看| 小蜜桃在线观看免费完整版高清| 性色avwww在线观看| 国产真实伦视频高清在线观看 | 校园人妻丝袜中文字幕| 一进一出抽搐gif免费好疼| 国产久久久一区二区三区| 乱人视频在线观看| 国产一区二区三区视频了| 亚洲av不卡在线观看| 成人特级av手机在线观看| 熟女电影av网| 亚洲欧美精品综合久久99| 亚洲国产欧美人成| 女同久久另类99精品国产91| 一个人看视频在线观看www免费| 国产精华一区二区三区| eeuss影院久久| a级一级毛片免费在线观看| 一边摸一边抽搐一进一小说| 国产一区二区三区av在线 | 又黄又爽又刺激的免费视频.| 欧美成人性av电影在线观看| 嫩草影视91久久| 十八禁国产超污无遮挡网站| 一区二区三区四区激情视频 | 欧美日韩黄片免| 亚洲人成网站在线播| 国产精品自产拍在线观看55亚洲| 不卡一级毛片| 别揉我奶头 嗯啊视频| 极品教师在线免费播放| 亚洲成人久久性| 在线播放国产精品三级| 亚洲av一区综合| 22中文网久久字幕| 国产又黄又爽又无遮挡在线| 亚洲七黄色美女视频| 久久欧美精品欧美久久欧美| 久久久精品大字幕| 日本 欧美在线| 国产 一区精品| 亚洲中文日韩欧美视频| 成年人黄色毛片网站|