劉 輝
(黑龍江大學(xué)俄羅斯語(yǔ)言文學(xué)與文化研究中心,哈爾濱 150080)
提 要:本文選取Coh-Metrix 3.0系統(tǒng)中指稱性銜接Z值1個(gè)指標(biāo),從自建學(xué)術(shù)期刊方法部分語(yǔ)料庫(kù)隨機(jī)抽取600個(gè)語(yǔ)料樣本進(jìn)行分析。研究結(jié)果顯示不同學(xué)科群與學(xué)科對(duì)銜接手段的使用具有明顯的傾向性。其中,人文科學(xué)中較多采用指稱性銜接,生命科學(xué)與應(yīng)用科學(xué)各學(xué)科中指稱性銜運(yùn)用較少,純科學(xué)與社會(huì)科學(xué)中指稱性銜接運(yùn)用較為均衡,沒(méi)有明顯的傾向性。這些發(fā)現(xiàn)表明不同學(xué)科期刊論文方法部分的銜接特征存在顯著差異,而造成上述差異的主要原因在于學(xué)科性和學(xué)科間性的相互作用。
韓禮德曾經(jīng)指出,“重要的是動(dòng)態(tài)地看待語(yǔ)篇,將其視為意義生成的過(guò)程,并將語(yǔ)篇銜接視為這個(gè)過(guò)程的一個(gè)方面,通過(guò)這一過(guò)程意義流(the flow of meaning)被導(dǎo)向可追溯的話語(yǔ)流(a trackable current),而不是任其隨意的流淌”(Halliday 2010:311)。銜接是文本建構(gòu)的一種重要手段,是由句子向語(yǔ)篇過(guò)渡的重要環(huán)節(jié),是語(yǔ)篇研究過(guò)程中不可缺少的環(huán)節(jié)(謝群 2017:28)。傳統(tǒng)的銜接研究大多通過(guò)人工方式分析不同體裁銜接手段的分布特征。受到準(zhǔn)確性與效率的制約,這些研究的樣本較小,其結(jié)果的代表性不高。隨著文本自動(dòng)化分析技術(shù)的發(fā)展,計(jì)算機(jī)輔助的語(yǔ)篇分析逐漸成為學(xué)界研究的主流。
孟菲斯大學(xué)開(kāi)發(fā)的Coh-Metrix軟件以系統(tǒng)功能語(yǔ)言學(xué)的理論框架為基礎(chǔ),融合計(jì)算語(yǔ)言學(xué)、心理語(yǔ)言學(xué)、認(rèn)知語(yǔ)言學(xué)和語(yǔ)料庫(kù)語(yǔ)言學(xué)等相關(guān)學(xué)科的最新研究成果。該軟件能夠有效檢測(cè)文本的詞匯、句法和語(yǔ)篇特征,被廣泛用于語(yǔ)篇分析的各個(gè)領(lǐng)域。2012年9月該軟件推出3.0版本,可從11個(gè)維度分析語(yǔ)篇,總計(jì)觀察變量106個(gè)。筆者選取文本易讀性主成分指數(shù)(text easability principal component scores)中的指稱性銜接Z值(text easability PC referential cohesion, Z score)1個(gè)變量進(jìn)行統(tǒng)計(jì)與分析,旨在了解從句子到語(yǔ)篇的文本建構(gòu)規(guī)律,從而進(jìn)一步明確各學(xué)科群與學(xué)科之間的相互聯(lián)系與區(qū)別。須要指出,Z值是在平均值被設(shè)定為0的情況下,用來(lái)表明被觀察變量或數(shù)據(jù)距離平均值上下的標(biāo)準(zhǔn)偏差(McNamara et al. 2014:84)。
本文語(yǔ)料來(lái)自筆者自建的學(xué)術(shù)期刊方法部分語(yǔ)料庫(kù)。該語(yǔ)料庫(kù)選取2008-2014年間被SCI,SSCI和A&HCI學(xué)術(shù)文獻(xiàn)檢索系統(tǒng)收錄的200種期刊發(fā)表的論文,樣本總量為3,000個(gè),總計(jì)2,728,583詞次(token)。這些樣本來(lái)自20個(gè)學(xué)科,涵蓋純科學(xué)、應(yīng)用科學(xué)、生命科學(xué)、社會(huì)科學(xué)和人文科學(xué)5個(gè)學(xué)科群。
本研究中,筆者首先用隨機(jī)化的方法取得30個(gè)隨機(jī)序數(shù),隨后根據(jù)這些序數(shù)提取每個(gè)學(xué)科對(duì)應(yīng)的語(yǔ)料樣本,20個(gè)學(xué)科共收集樣本600個(gè)。最后利用Coh-Metrix 3.0在線分析工具分析所有樣本并回收分析結(jié)果。
根據(jù)本文的研究問(wèn)題,筆者利用SPSS 22.0首先對(duì)變量進(jìn)行描述性統(tǒng)計(jì),并采用三線表呈現(xiàn)結(jié)果,隨后檢驗(yàn)各變量間的差異顯著性。對(duì)于符合參數(shù)檢驗(yàn)條件的變量將匯報(bào)正態(tài)性及方差齊性檢驗(yàn)結(jié)果,不符合條件的變量將直接采用非參數(shù)檢驗(yàn)。本研究中分組的最小樣本為30,因此在參數(shù)檢驗(yàn)時(shí)僅匯報(bào)Shapiro-Wilk檢驗(yàn)結(jié)果。
文本中具有較多的指稱性銜接成分時(shí),表明句際之間或整個(gè)文本內(nèi)部存在更多的詞匯或語(yǔ)義重疊。這些指稱性成分是讀者理解語(yǔ)篇的顯性線索。當(dāng)文本中的指稱性成分較少時(shí),語(yǔ)義連接的線索也相應(yīng)地減少,讀者理解語(yǔ)篇的難度則會(huì)相應(yīng)地增加(同上:85)。實(shí)際上,Coh-Metrix統(tǒng)計(jì)的指稱性銜接變量包括名詞重疊、論元重疊、詞干重疊和實(shí)詞重疊等多種類型。而指稱性銜接Z值和百分比是在整體上對(duì)這些銜接手段的衡量,是區(qū)分文本難度及語(yǔ)篇建構(gòu)方式的重要變量。因此,本文分別比較學(xué)科群和學(xué)科之間的指稱性銜接變量旨在揭示其中的聯(lián)系與區(qū)別。
描述結(jié)果顯示,人文科學(xué)的指稱性銜接Z值最高,為0.20,生命科學(xué)的指稱性銜接Z值最低,為-0.65,具體結(jié)果見(jiàn)表1。
表1 學(xué)科群指稱性銜接統(tǒng)計(jì)與檢驗(yàn)
顯示漸進(jìn)顯著性。 顯著性水平為.05。
檢驗(yàn)結(jié)果顯示,指稱性銜接Z值在各學(xué)科群中分布的P值為0.000,小于0.05(卡方值為60.729),表明它們?cè)诟鱾€(gè)學(xué)科群中的分布具有顯著差異。組間成對(duì)比較結(jié)果顯示,在這個(gè)變量上,生命科學(xué)與純科學(xué)、生命科學(xué)與社會(huì)科學(xué)、生命科學(xué)與人文科學(xué)、人文科學(xué)與應(yīng)用科學(xué)以及人文科學(xué)與純科學(xué)之間均存在顯著差異,其它學(xué)科群相互之間則沒(méi)有明顯區(qū)別。統(tǒng)計(jì)結(jié)果表明,人文科學(xué)使用指稱性銜接手段的頻率最高,文本難度最低;社會(huì)科學(xué)、純科學(xué)與應(yīng)用科學(xué)的使用頻率較低,文本難度居中;生命科學(xué)的使用頻率最低,文本難度最高。筆者對(duì)學(xué)科群詞匯密度的分析顯示,生命科學(xué)的詞匯密度最高,人文科學(xué)的詞匯密度最低。而指稱性銜接中的名詞重疊和論元重疊等均同實(shí)詞有關(guān)。因此,詞匯密度同指稱性銜接之間存在關(guān)聯(lián),詞匯密度的檢驗(yàn)結(jié)果在一定程度上驗(yàn)證此處的檢驗(yàn)結(jié)果。
SPSS分析結(jié)果顯示,指稱性銜接Z值正態(tài)分布,Shapiro-Wilk檢驗(yàn)的P值分別為0.958、0.218、0.667和0.454,均大于0.05,方差齊性檢驗(yàn)P值為0.404,大于0.05,符合參數(shù)檢驗(yàn)的要求,見(jiàn)表2。
表2 純科學(xué)指稱性銜接Z值單因素方差分析
方差同質(zhì)性檢驗(yàn)
ANOVA
表2顯示,數(shù)學(xué)指稱性銜接Z值最高,為0.31,化學(xué)最低,為-1.03;檢驗(yàn)結(jié)果顯示,該變量分布的P值為0.000,小于0.05(F值為28.929),表明該變量在4個(gè)學(xué)科間的分布具有統(tǒng)計(jì)學(xué)意義上的顯著差異。組間多重比較結(jié)果顯示,除統(tǒng)計(jì)學(xué)與數(shù)學(xué)外,其它學(xué)科相互之間均存在統(tǒng)計(jì)學(xué)意義的顯著差異。
組間成對(duì)比較結(jié)果顯示,除物理學(xué)與統(tǒng)計(jì)學(xué)、數(shù)學(xué)與統(tǒng)計(jì)學(xué)外,該變量在其它學(xué)科之間的分布均具有顯著差異。本文的統(tǒng)計(jì)結(jié)果與筆者針對(duì)本學(xué)科群詞匯密度的統(tǒng)計(jì)結(jié)果相一致,同學(xué)科群可讀性分析的結(jié)果也基本一致。而針對(duì)純科學(xué)句法相似度的分析表明,除主要?jiǎng)釉~前詞匯數(shù)量外,4個(gè)學(xué)科在名詞短語(yǔ)修飾語(yǔ)數(shù)量、相鄰句句法相似度和全部句子句法相似度3個(gè)維度上均存在顯著區(qū)別。綜合這些檢驗(yàn)結(jié)果,4個(gè)學(xué)科在建構(gòu)文本的過(guò)程中絕大多數(shù)變量的分布均呈現(xiàn)較為穩(wěn)定的變化,從而保證學(xué)科之間的相互聯(lián)系與區(qū)別。
SPSS分析結(jié)果顯示,指稱性銜接Z值正態(tài)分布,Shapiro-Wilk檢驗(yàn)的P值分別為0.376、0.065、0.848和0.610,均大于0.05,方差齊性檢驗(yàn)的P值為0.204,大于0.05,符合進(jìn)行參數(shù)檢驗(yàn)的條件,詳情見(jiàn)表3。
表3的統(tǒng)計(jì)結(jié)果顯示,計(jì)算機(jī)指稱性銜接Z值最高,為0.82,材料學(xué)最低,為0.50;分析結(jié)果顯示,指稱性銜接Z值分布的P值為0.000,小于0.05(F值為15.414),表明該變量在4個(gè)學(xué)科間的分布具有統(tǒng)計(jì)學(xué)意義上的顯著差異。組間多重比較結(jié)果顯示,除工程學(xué)與應(yīng)用機(jī)械外,其它學(xué)科相互之間均存在統(tǒng)計(jì)學(xué)意義上的顯著差異。
表3 應(yīng)用科學(xué)指稱性銜接Z值單因素方差分析
方差同質(zhì)性檢驗(yàn)
ANOVA
組間成對(duì)比較結(jié)果顯示,材料學(xué)與工程學(xué)、材料學(xué)與計(jì)算機(jī)、應(yīng)用機(jī)械與計(jì)算機(jī)之間存在顯著差異,其它學(xué)科相互之間無(wú)明顯差別。前文詞匯密度與句法復(fù)雜度的分析表明,計(jì)算機(jī)科學(xué)的詞匯密度最高,材料學(xué)的詞匯難度最低,計(jì)算機(jī)科學(xué)的句法復(fù)雜度高于材料學(xué)??勺x性與指稱性銜接的分析結(jié)果顯示,計(jì)算機(jī)科學(xué)的文本難度又低于材料學(xué)。由此可見(jiàn),在詞匯、句子和語(yǔ)篇3個(gè)層面上,兩個(gè)學(xué)科的文本難度始終處于一種此消彼長(zhǎng)的狀態(tài)。
SPSS分析結(jié)果顯示,指稱性銜接Z值正態(tài)分布,Shapiro-Wilk檢驗(yàn)P值分別為0.104、0.864、0.065和0.201,均大于0.05,方差齊性檢驗(yàn)P值為0.253,大于0.05,符合參數(shù)檢驗(yàn)的條件,見(jiàn)表4。
表4顯示,農(nóng)學(xué)指稱性銜接Z值最高,為-0.40,醫(yī)學(xué)最低,為-0.92;檢驗(yàn)結(jié)果顯示,該變量分布的P值為0.015,小于0.05(F值為3.613),表明該變量在各學(xué)科間的分布差異具有統(tǒng)計(jì)學(xué)意義的顯著性;組間多重比較結(jié)果顯示,除醫(yī)學(xué)與農(nóng)學(xué)外,其它學(xué)科相互之間均不存在顯著差異。組間成對(duì)比較結(jié)果顯示,除農(nóng)學(xué)和醫(yī)學(xué)外,其它學(xué)科相互之間不存在明顯區(qū)別。作為接近學(xué)科連續(xù)統(tǒng)中央的成員,醫(yī)學(xué)、公共健康、生物學(xué)和農(nóng)學(xué)在已經(jīng)分析過(guò)的變量中均表現(xiàn)出較高的一致性。該學(xué)科群的詞匯密度最高,句子數(shù)量和段落最多,句法復(fù)雜度高于學(xué)科群平均水平,可讀性低于學(xué)科群平均水平,指稱性銜接指數(shù)最低,表明生命科學(xué)方法部分的文本難度在詞匯、句子和語(yǔ)篇層面始終維持在較高難度。雖然學(xué)科群內(nèi)部各成員之間在一些變量的分析中表現(xiàn)出明顯差異,但是它們作為接近學(xué)科原型的成員,均表現(xiàn)出明顯的集中傾向。
表4 生命科學(xué)指稱性銜接Z值單因素方差分析
方差同質(zhì)性檢驗(yàn)
ANOVA
統(tǒng)計(jì)結(jié)果顯示,商務(wù)與經(jīng)濟(jì)學(xué)的指稱性銜接Z值最高,為0.23,法學(xué)最低,為-0.17,詳情如表5所示。
表5 社會(huì)科學(xué)指稱性銜接特征描述
顯示漸進(jìn)顯著性。 顯著性水平為.05。
檢驗(yàn)結(jié)果顯示,上述指稱性銜接Z值分布的P值為0.018,小于0.05(卡方值分別為10.042),表明它在各個(gè)學(xué)科中的分布具有顯著差異。組間成對(duì)比較結(jié)果顯示,兩個(gè)變量?jī)H在心理學(xué)同商務(wù)與經(jīng)濟(jì)學(xué)之間存在顯著差別,其它學(xué)科相互之間不存在明顯區(qū)別。針對(duì)社會(huì)科學(xué)各個(gè)變量的分析結(jié)果顯示,社會(huì)科學(xué)的詞匯密度最高,各個(gè)學(xué)科之間的詞匯密度十分接近,表明該學(xué)科群在詞匯層面上的難度最高,而在句子和語(yǔ)篇層面該學(xué)科的文本難度卻呈現(xiàn)明顯的下降趨勢(shì)。這種整體的變化規(guī)律表明,社會(huì)科學(xué)方法部分文本建構(gòu)時(shí),更傾向于在詞匯層面上體現(xiàn)其學(xué)科復(fù)雜性,而在句際之間及語(yǔ)篇銜接上則傾向使用較為簡(jiǎn)單的建構(gòu)策略。(嚴(yán)明 2017:77) 就學(xué)科群內(nèi)部的成員而言,心理學(xué)始終在不同程度上保持著自身的邊緣性學(xué)科的特征,在很多變量中均呈現(xiàn)出與其它學(xué)科之間的顯著區(qū)別。而不同變量在社會(huì)學(xué)、商務(wù)與經(jīng)濟(jì)學(xué)和法學(xué)中的分布卻始終保持著較高的一致性,說(shuō)明它們的學(xué)科特征和語(yǔ)篇建構(gòu)策略比較相似。
統(tǒng)計(jì)結(jié)果顯示,文學(xué)指稱性銜接Z值最高,為0.64,語(yǔ)言學(xué)最低,為-0.45,具體見(jiàn)表6。
表6 人文科學(xué)指稱性銜接特征統(tǒng)計(jì)與檢驗(yàn)
顯示漸進(jìn)顯著性。 顯著性水平為.05。
檢驗(yàn)結(jié)果顯示,指稱性銜接Z值分布的P值為0.000,小于0.05(卡方值分別為19.417),表明它在各學(xué)科中的分布具有顯著差異。組間成對(duì)比較結(jié)果顯示,此變量在語(yǔ)言學(xué)同其它3個(gè)學(xué)科之間的分布均存在顯著差異,而其它3個(gè)學(xué)科相互之間則沒(méi)有明顯差別。這一檢驗(yàn)結(jié)果再次說(shuō)明,語(yǔ)言學(xué)作為人文學(xué)科的非典型成員同哲學(xué)、歷史和文學(xué)3個(gè)學(xué)科之間在語(yǔ)篇特征上存在明顯不同。須要指出,本節(jié)的檢驗(yàn)結(jié)果表明歷史與哲學(xué)兩個(gè)學(xué)科的文本難度存在一定的變化。筆者已經(jīng)分析過(guò)的相關(guān)變量中,歷史在詞匯密度、句子數(shù)量、平均句長(zhǎng)和平均段長(zhǎng)等變量的統(tǒng)計(jì)結(jié)果均高于哲學(xué),說(shuō)明它在詞匯和句子層面的文本難度高于哲學(xué)。但是,歷史的指稱性銜接Z值卻低于哲學(xué),表明在語(yǔ)篇層面上二者的文本難度發(fā)生轉(zhuǎn)變,歷史的文本難度低于哲學(xué),體現(xiàn)出與此前不同的難度變化趨勢(shì)。這種變化趨勢(shì)表明,不同學(xué)科會(huì)根據(jù)交際目的的不同調(diào)整文本建構(gòu)的策略運(yùn)用及重心。綜合本學(xué)科群的統(tǒng)計(jì)與分析結(jié)果,人文學(xué)科在建構(gòu)方法部分的文本時(shí)傾向于使用更多的指稱性銜接手段,從而提高文本的可讀性,降低文本的整體難度。
銜接手段是文本建構(gòu)的重要方式,靈活組合有效運(yùn)用不同的銜接手段是建構(gòu)方法部分的核心策略之一。本文研究表明,不同學(xué)科群與學(xué)科對(duì)銜接手段的使用具有明顯的傾向性。這些傾向性既是學(xué)科特征的體現(xiàn),也是銜接手段運(yùn)用的基本規(guī)律。其中,人文科學(xué)較多采用指稱性銜接,生命科學(xué)與應(yīng)用科學(xué)各學(xué)科中指稱性銜運(yùn)用較少,純科學(xué)與社會(huì)科學(xué)中指稱性銜接運(yùn)用較為均衡,沒(méi)有明顯的傾向性。因此,合理運(yùn)用銜接手段既要符合學(xué)科群或?qū)W科的基本特點(diǎn),又要體現(xiàn)主體對(duì)文本建構(gòu)的有效掌控。畢竟期刊論文的規(guī)范性與規(guī)約性對(duì)研究者均具有較強(qiáng)的約束力,銜接手段的組合與運(yùn)用也須要適當(dāng)考慮這些因素。