南京師范大學(xué) 馬江濤 馬廣惠
提 要: 本研究按照時(shí)間脈絡(luò)和研究領(lǐng)域梳理了現(xiàn)有書面語(yǔ)句長(zhǎng)研究,并對(duì)未來(lái)研究進(jìn)行了展望?,F(xiàn)有書面語(yǔ)句長(zhǎng)研究主要領(lǐng)域包括文體風(fēng)格研究、文本分類研究、語(yǔ)言屬性研究和可讀性研究?,F(xiàn)有研究尚存一定局限性。未來(lái)研究應(yīng)擴(kuò)大研究領(lǐng)域,避免單一研究模式所具有的內(nèi)在缺陷。根據(jù)三角驗(yàn)證法原則,從不同的理論視角,協(xié)調(diào)不同學(xué)科領(lǐng)域研究者收集的數(shù)據(jù),以不同的研究方法系統(tǒng)揭示與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)這一語(yǔ)言現(xiàn)象的全貌。
現(xiàn)有書面語(yǔ)句長(zhǎng)研究主要涵蓋四個(gè)研究領(lǐng)域: 文體風(fēng)格、語(yǔ)言屬性、文本分類和可讀性。
1) 文體風(fēng)格
文體風(fēng)格研究可分為三類。
第一類是作者文體風(fēng)格研究及基于此的作者身份考辨研究。根據(jù)某階段研究所采用的主要測(cè)量量度,作者文體風(fēng)格及其作者身份考辨研究先后經(jīng)歷了無(wú)分布句長(zhǎng)統(tǒng)計(jì)量階段、句長(zhǎng)分布階段和句長(zhǎng)分布建模三個(gè)階段。無(wú)分布句長(zhǎng)指的是以簡(jiǎn)化數(shù)據(jù)(例如均值、標(biāo)準(zhǔn)差等)所表征的句長(zhǎng);句長(zhǎng)分布是指將全部句長(zhǎng)(或者句長(zhǎng)對(duì)數(shù))進(jìn)行分組后,各句長(zhǎng)組(或者句長(zhǎng)對(duì)數(shù)組)由小到大排列時(shí)所呈現(xiàn)出來(lái)的各個(gè)句長(zhǎng)組(或者句長(zhǎng)對(duì)數(shù)組)的頻數(shù)特征;句長(zhǎng)分布建模是指用數(shù)學(xué)函數(shù)對(duì)句長(zhǎng)分布的規(guī)律進(jìn)行表征。
無(wú)分布句長(zhǎng)統(tǒng)計(jì)量階段研究所采用的句長(zhǎng)量度包括均值、中位數(shù)、四分位數(shù)(quartiles)和十分位數(shù)(deciles)等。該階段研究通常所采用的研究方法為: 首先,比較某一位作者作品之間的無(wú)分布句長(zhǎng)統(tǒng)計(jì)量,如果其結(jié)果一致,則表明無(wú)分布句長(zhǎng)統(tǒng)計(jì)量可用作該作者風(fēng)格指標(biāo);之后,比較不同作者之間作品的無(wú)分布句長(zhǎng)統(tǒng)計(jì)量,如果結(jié)果有差異,則表明無(wú)分布句長(zhǎng)統(tǒng)計(jì)量可用于表征不同作者文體風(fēng)格。該階段研究結(jié)果一致認(rèn)為,無(wú)分布句長(zhǎng)統(tǒng)計(jì)量可用作作者文體風(fēng)格指標(biāo)。在此基礎(chǔ)之上,一些學(xué)者對(duì)作者身份存疑的作品進(jìn)行了作者身份考辨,將作者身份存疑的作品與被懷疑為其作者的作品的句長(zhǎng)量度進(jìn)行比較,如果二者結(jié)果一致,則作者身份相同;反之,作者身份不同。Scudder(1923)通過比較10位作者英語(yǔ)作品的句長(zhǎng)均值,發(fā)現(xiàn)不同作者其作品的句長(zhǎng)均值不同,從而開始思考句長(zhǎng)與作者文體風(fēng)格之間的關(guān)系。Yule(1939)是第一位正式將句長(zhǎng)用作作者文體風(fēng)格指標(biāo)的學(xué)者(Barr, 2001: 375; Sichel, 1974: 25; Tayade, 2009: 34)。他所研究的語(yǔ)料為Bacon、Coleridge和Lamb的英文作品。其研究結(jié)果證實(shí)了無(wú)分布句長(zhǎng)統(tǒng)計(jì)量(均值、中位數(shù)、四分位數(shù)和十分位數(shù)等)是作者文體風(fēng)格的指標(biāo)?;诖?,該研究考辨了法語(yǔ)散文Imitatio和英語(yǔ)散文ObservationsupontheBillsofMortality的作者身份,其結(jié)果表明:Imitatio的作者為ThomasKempis而非Gerson;ObservationsupontheBillsofMortality的作者并非Sir Williams Petty。Morton(1965)的研究語(yǔ)料為兩位散文家(Herodotus和Thucydides)和三位口述作者(Lysias、Isocrates和Demosthenes)的希臘語(yǔ)書面語(yǔ)作品,其研究結(jié)果也表明無(wú)分布句長(zhǎng)統(tǒng)計(jì)量(均值、中位數(shù)、四分位數(shù)和十分位數(shù)等)能夠確定并比較不同作者的文體風(fēng)格。該研究以此為基礎(chǔ)考辨了希臘語(yǔ)《新約全書》中被認(rèn)為Apostle Paul為其作者的14封信。其研究結(jié)果表明,Romans、1stCorinthians、2ndCorinthians、Catatians這四封信的無(wú)分布句長(zhǎng)統(tǒng)計(jì)量總體一致,并且這四封信的無(wú)分布句長(zhǎng)統(tǒng)計(jì)量與其余十封信的無(wú)分布句長(zhǎng)統(tǒng)計(jì)量之間具有顯著差異。也就是說,這四封信的作者相同。如果這四封信的作者為Apostle Paul的話,其余十封信至少分別為六位作者所寫。
句長(zhǎng)分布階段所采用的量度為句長(zhǎng)頻數(shù)分布或句長(zhǎng)對(duì)數(shù)頻數(shù)分布。該階段研究得出相同結(jié)論: 句長(zhǎng)分布可用以表征作者寫作風(fēng)格;句長(zhǎng)對(duì)數(shù)頻數(shù)分布為正態(tài)分布,而句長(zhǎng)頻數(shù)分布為偏態(tài)分布,且該階段的某些學(xué)者可據(jù)此通過句長(zhǎng)分布來(lái)考辨作者身份。Williams(1940)研究發(fā)現(xiàn)Chesterton、Wells和Bernard Shaw三位作者英語(yǔ)作品的句長(zhǎng)對(duì)數(shù)頻數(shù)分布為正態(tài)分布,且三位作者的句長(zhǎng)對(duì)數(shù)頻數(shù)分布曲線形態(tài)不同,可以籍此區(qū)分三位作者。與Williams(1940)所持觀點(diǎn)不同,Wake(1957: 333)認(rèn)為盡管句長(zhǎng)對(duì)數(shù)頻數(shù)分布為正態(tài)分布或者接近正態(tài)分布,但其極端分布(極長(zhǎng)句一端的句長(zhǎng)分布)不具有區(qū)分性;而句長(zhǎng)頻數(shù)分布雖為偏態(tài)分布,但其極端分布具有顯著特征,可以籍此來(lái)區(qū)分作者?;趯?duì)Xenophon、Aristotle和Plato三位作者作品的研究,Wake(1957)認(rèn)為句長(zhǎng)頻數(shù)分布(偏態(tài)分布)是作者文體風(fēng)格的客觀評(píng)判標(biāo)準(zhǔn)?;诖?,該研究考辨了希臘語(yǔ)作品Cynegeticus、HistoriaAnimalium、NicomacheanEthics、EudemianEthics和SeventhLetter的作者。其研究結(jié)果表明,Cynegeticus的作者不是Xenophon;HistoriaAnimalium的作者不是Aristotle;NicomacheanEthics和EudemianEthics兩個(gè)作品的共同部分作者為Aristotle,其余部分分別為不同作者所書寫;Plato是SeventhLetter的作者等。類似Wake(1957)的研究結(jié)論,Barr(2001)認(rèn)為同一作者作品中不同類型句子的句長(zhǎng)頻數(shù)分布具有區(qū)別性特征。Mannion & Dixon(2004)也以Goldsmith及其同時(shí)期的9位作者作品證實(shí)了句長(zhǎng)頻數(shù)分布對(duì)于不同作者文體風(fēng)格所具有的區(qū)分作用?;诖耍撗芯靠急媪俗髡呱矸荽嬉傻氖畟€(gè)英語(yǔ)作品的作者是否為Oliver Goldsmith。其所采用的兩種研究方法為x2擬合優(yōu)度檢驗(yàn)(x2goodness-of-fit test)和相關(guān)圖分析(correspondence analysis)。其研究結(jié)果表明,10篇作者身份存疑的英語(yǔ)作品中有四篇(TheRevolutioninLowLife,ATrueHistoryfortheLadies,SomeThoughtsPreliminarytoaGeneralPeace和OnPublicRejoicingsforVictory)的作者確定無(wú)疑為Goldsmith。
句長(zhǎng)分布建模階段以數(shù)學(xué)模型來(lái)表征作者文體風(fēng)格。該階段研究結(jié)果并不一致,不同學(xué)者所得出的句長(zhǎng)分布模型各異,在該階段中僅有個(gè)別學(xué)者依據(jù)其研究結(jié)果考辨了作者身份,Sichel(1974)提出以數(shù)學(xué)模型來(lái)表征句長(zhǎng)分布具有重大意義。基于Yule(1939)、Williams(1940)、Wake(1957)和Morton(1965)研究中的數(shù)據(jù),Sichel(1974)發(fā)現(xiàn)復(fù)合泊松分布(compound Poisson distribution)可以表征不同作者文體風(fēng)格,其數(shù)學(xué)函數(shù)如公式1所示。該研究同時(shí)以其所構(gòu)建的數(shù)學(xué)模型考辨了Imitatio的作者身份,并得出與Yule(1939)相同的研究結(jié)論,即Gerson不是該作品作者。Tayade & Prabhuajgaonkar(2009)研究結(jié)果表明Pandit Jawaharlal Nehru的英語(yǔ)作品句長(zhǎng)分布為Pearsonian Type-I概率分布(Pearsonian Type-I probability distribution),其數(shù)學(xué)函數(shù)如公式2所示。Furuhashi & Hayakawa(2012)研究結(jié)果表明日本作者的句長(zhǎng)分布為對(duì)數(shù)正態(tài)分布(lognormal distribution)(見公式3)或?qū)?shù)正態(tài)分布與正態(tài)分布的疊加(見公式4)。Pande & Dhami(2015)研究表明Rabindranath Tagore、Pandey Bechan Sharma、Premchand和Mohan Rakesh四位作者的印地語(yǔ)作品句長(zhǎng)分布為單位移型EPNB分布(one-displaced form of EPNB distribution),其數(shù)學(xué)函數(shù)如公式5所示。
公式1:
公式2:
公式3:
公式4:
公式5:
第二類是體裁文體風(fēng)格研究?,F(xiàn)有書面語(yǔ)句長(zhǎng)研究較少涉及體裁分析,該領(lǐng)域所采用的句長(zhǎng)量度也包括無(wú)分布句長(zhǎng)統(tǒng)計(jì)量、句長(zhǎng)分布和句長(zhǎng)分布數(shù)學(xué)模型三類。Gani(2013)研究發(fā)現(xiàn)英語(yǔ)散文句長(zhǎng)均值小于小說的句長(zhǎng)均值。Clayman(1981)研究發(fā)現(xiàn),基于單詞的希臘六步格詩(shī)句長(zhǎng)分布類似于希臘散文句長(zhǎng)分布,其只有一個(gè)峰值;而基于音位的希臘六步格詩(shī)句長(zhǎng)分布有多個(gè)峰值,并且能夠靈敏反映出風(fēng)格和主題內(nèi)容的變化。Yasumoto(1965,1966)和Sasaki(1976)的研究結(jié)果表明日語(yǔ)小說句長(zhǎng)分布或?yàn)閷?duì)數(shù)正態(tài)分布(lognormal distribution)或?yàn)棣梅植?gamma distribution),而Ishida & Ishida(2007)研究結(jié)果表明日語(yǔ)散文和短篇小說句長(zhǎng)分布為超帕斯卡分布(Hyperpascal distribution),其數(shù)學(xué)模型如公式6所示。Sigurd et al.(2004)研究結(jié)果表明英語(yǔ)句長(zhǎng)和其頻數(shù)之間關(guān)系符合γ分布(見公式7),且該公式可用于體裁區(qū)分。
公式6:
公式7:
fexp=a*Lb*cL
第三類是文體風(fēng)格演變研究。句長(zhǎng)是文體風(fēng)格(Barr, 2001; Furuhashi & Hayakawa, 2012; Mannion & Dixon, 2004; Morton, 1965; Pande & Dhami, 2015; Sichel, 1974; Wake, 1957; Williams, 1940; Yule, 1939),句長(zhǎng)的改變即為文體風(fēng)格的演變。文體風(fēng)格演變研究所采用的句長(zhǎng)量度主要為句長(zhǎng)均值。該領(lǐng)域研究結(jié)果一致認(rèn)為,句長(zhǎng)隨著時(shí)間的發(fā)展而變短。Scudder(1923)研究發(fā)現(xiàn),十九世紀(jì)作者英語(yǔ)作品句長(zhǎng)大于二十世紀(jì)作者英語(yǔ)作品句長(zhǎng)。Fan(2007)研究結(jié)果表明,二十世紀(jì)50—60年代LOB語(yǔ)料庫(kù)(Lancaster-Oslo /Bergen Corpus)的句長(zhǎng)均值大于二十世紀(jì)80—90年代BNC語(yǔ)料庫(kù)(British National Corpus)的句長(zhǎng)均值。也就是說,標(biāo)準(zhǔn)英式英語(yǔ)書面語(yǔ)句長(zhǎng)在30年間變短了。Savoy(2017)研究結(jié)果發(fā)現(xiàn),從Washington到Trump共45位美國(guó)總統(tǒng)在200年間的英語(yǔ)演講辭句長(zhǎng)均值呈現(xiàn)出下降趨勢(shì)。
2) 語(yǔ)言屬性
語(yǔ)言共性與特性研究較少。從句長(zhǎng)視角對(duì)其進(jìn)行探索的代表人物為Jiang & Liu(2015)。Jiang & Liu(2015)研究發(fā)現(xiàn)英漢兩種語(yǔ)言具有共性,英語(yǔ)和漢語(yǔ)的不同句長(zhǎng)的依存距離(dependency distance)分布模型具有極大的相似性。該研究同時(shí)發(fā)現(xiàn)英漢兩種語(yǔ)言各自具有其特性,漢語(yǔ)的相鄰依存(adjacent dependencies)百分比隨著句長(zhǎng)的增加在一定范圍內(nèi)波動(dòng),英語(yǔ)的相鄰依存百分比隨著句長(zhǎng)的增長(zhǎng)具有下降趨勢(shì),21組漢語(yǔ)句長(zhǎng)的依存距離均值全部高于相應(yīng)的21組英語(yǔ)句長(zhǎng)的依存距離均值。
3) 文本分類
文本分類研究由通用文本分類研究轉(zhuǎn)向具體學(xué)科領(lǐng)域文本分類研究。該領(lǐng)域常用的研究方法包括句長(zhǎng)比較、句長(zhǎng)均值比較、多元判別分析和聚類分析等。
通用文本分類研究結(jié)果一致表明,句長(zhǎng)可用于文本類型分類。Kelih et al.(2006)以斯羅維尼亞語(yǔ)文本為語(yǔ)料證實(shí),僅僅基于句長(zhǎng)的文本分類是有可能成立的。該研究以多元判別分析(multivariate discriminant analysis)得出基于句長(zhǎng)的新文本分類,即口語(yǔ)語(yǔ)篇、技術(shù)語(yǔ)篇、日常敘述、科學(xué)語(yǔ)篇、新聞?wù)Z篇和私人信件。新文本分類既不同于功能類型分類也有別于交際—情景文本分類。Grzybek et al.(2007)研究結(jié)果表明句長(zhǎng)能夠很好地區(qū)分小說、短篇小說、私人信件、戲劇、評(píng)論和科學(xué)文本六類俄語(yǔ)文本。Hou et al.(2014)對(duì)文本句長(zhǎng)進(jìn)行聚類分析和句長(zhǎng)分布比較,結(jié)果表明句長(zhǎng)能夠清晰地區(qū)分書面語(yǔ)文本、口語(yǔ)文本和對(duì)話文本。
具體學(xué)科領(lǐng)域文本分類研究所采用的研究方法主要為句長(zhǎng)比較和 /或句長(zhǎng)均值比較,其研究結(jié)果并不一致。Dhar et al.(2016)研究結(jié)果表明,句長(zhǎng)不能被用作將孟加拉語(yǔ)醫(yī)學(xué)文本與另外4個(gè)領(lǐng)域文本(商業(yè)文本、運(yùn)動(dòng)文本、法律文本和政治文本)區(qū)分開來(lái)的參數(shù)。Zorita & Sandoval(2016)研究結(jié)果表明句長(zhǎng)可以用于文本分類研究,句長(zhǎng)可以區(qū)分西班牙語(yǔ)書面語(yǔ)媒體文本(報(bào)紙媒體文本和醫(yī)學(xué)媒體文本)和書面語(yǔ)醫(yī)學(xué)學(xué)術(shù)文本。
4) 可讀性
根據(jù)測(cè)量書面語(yǔ)文本可讀性所采用的量度發(fā)現(xiàn),可讀性研究經(jīng)歷了從依托簡(jiǎn)單量度階段到依托可讀性測(cè)評(píng)公式階段的轉(zhuǎn)變。
依托簡(jiǎn)單量度研究階段所采用的可讀性量度為句長(zhǎng)、句長(zhǎng)均值、句長(zhǎng)中位數(shù)等簡(jiǎn)單句長(zhǎng)量度,所針對(duì)的目標(biāo)受眾為大眾讀者,通常由權(quán)威機(jī)構(gòu)、出版商或研究者來(lái)評(píng)判書面語(yǔ)文本可讀性等級(jí)。該階段的研究結(jié)果一致表明句長(zhǎng)與可讀性之間成反比。Kearney(1945)分析比較了三類英語(yǔ)一級(jí)讀物的句長(zhǎng): 學(xué)齡前兒童讀物、啟蒙書和初級(jí)讀物。該研究發(fā)現(xiàn)英語(yǔ)讀物句長(zhǎng)的增加可能代表著閱讀難度的增加,學(xué)齡前兒童讀物中短句數(shù)量多于啟蒙書,啟蒙書中短句數(shù)量多于初級(jí)讀物,三類讀物中長(zhǎng)句比例極少。Huxtable(1977)研究發(fā)現(xiàn),以句長(zhǎng)來(lái)測(cè)評(píng)英語(yǔ)作品的可讀性具有客觀性,且句長(zhǎng)和可讀性成反比。其中: a) Faulkner的早期著作LightinAugust句長(zhǎng)均值為19個(gè)單詞;Fitzgerald的著作TenderistheNight句長(zhǎng)均值為33個(gè)單詞;James的著作TheGoldenBowl句長(zhǎng)均值為37個(gè)單詞;Dickens的著作MartinChuzzlewit句長(zhǎng)均值為39個(gè)單詞;Eliot的著作Middlemarch句長(zhǎng)均值為42個(gè)單詞;Boswell的著作LifeofJohnson句長(zhǎng)均值為64個(gè)單詞;Sterne的著作TristramShandy句長(zhǎng)均值為68個(gè)單詞;Faulkner的晚年著作RequiemforaNun句長(zhǎng)均值為116個(gè)單詞。b)英語(yǔ)作品句長(zhǎng)均值越高,其可讀性越低。c)與LightinAugust(1932)相比,F(xiàn)aulkner的老年作品RequiemforaNun(1951)的可讀性急劇下降。Stapler(1985)研究發(fā)現(xiàn),12家美國(guó)都市報(bào)新聞報(bào)道中導(dǎo)語(yǔ)段落閱讀難度遠(yuǎn)大于其2—4段部分的閱讀難度,12家英語(yǔ)都市報(bào)導(dǎo)語(yǔ)段落的句長(zhǎng)均值(26.1個(gè)單詞)和句長(zhǎng)中位數(shù)(28.1個(gè)單詞)大于隨后的2—4段的句長(zhǎng)均值(21.7個(gè)單詞)和句長(zhǎng)中位數(shù)(23.1個(gè)單詞),導(dǎo)語(yǔ)段落為獨(dú)句段的百分比(83.6%)大約是2—4段獨(dú)句段百分比(45.9%)的2倍。根據(jù)Gunning(1952)和Flesch(1962)所建議的可讀性標(biāo)準(zhǔn)等級(jí)來(lái)看,導(dǎo)語(yǔ)段落歸屬于“難以閱讀”等級(jí),隨后的2—4段歸類于“較難閱讀”等級(jí)。
依托可讀性測(cè)評(píng)公式研究階段所采用的可讀性量度為各類內(nèi)含句長(zhǎng)的可讀性測(cè)評(píng)公式,其研究受眾為特定領(lǐng)域讀者(以醫(yī)學(xué)領(lǐng)域讀者為主),其文本可讀性等級(jí)主要由權(quán)威機(jī)構(gòu)或研究者評(píng)判,極少數(shù)研究根據(jù)讀者所感受到的難易度對(duì)可讀性進(jìn)行分析。該階段主要關(guān)注兩類研究。第一類研究描述書面語(yǔ)文本的可讀性等級(jí)。該類研究的語(yǔ)料涉及外科雜志中的英語(yǔ)文章(Hall, 2006)、足踝患者在線醫(yī)患英語(yǔ)閱讀材料(Sheppard et al., 2014)、乳房X光照相術(shù)在線病患英語(yǔ)閱讀材料(AlKhalili et al., 2015)、在線髖關(guān)節(jié)內(nèi)鏡檢查相關(guān)信息英語(yǔ)文本(Mehta et al., 2018)和臨床試驗(yàn)在線描述英語(yǔ)文本、在線健康主題英語(yǔ)文章和在線臨床醫(yī)生英語(yǔ)筆記(Wu et al., 2015)等。該類研究結(jié)果一致表明醫(yī)學(xué)領(lǐng)域的英語(yǔ)文本難以閱讀,其閱讀難度顯著高于美國(guó)權(quán)威機(jī)構(gòu)所規(guī)定的可讀性等級(jí)(6—7級(jí))。通常閱讀難度源自于長(zhǎng)句(Hall, 2006; Wu et al., 2015),可采取將長(zhǎng)句拆分成短句等措施來(lái)促進(jìn)可讀性(Sheppard et al., 2014; Wu et al., 2015)。第二類研究側(cè)重于可讀性測(cè)評(píng)工具比較或新測(cè)評(píng)工具的研發(fā)。該類研究并未取得一致的研究結(jié)果。Holster et al.(2017)建議根據(jù)Yomiyasusa可讀性級(jí)別來(lái)選擇英語(yǔ)讀物,該研究結(jié)果發(fā)現(xiàn)Lexile句長(zhǎng)均值對(duì)于日本大學(xué)生所感知到的英語(yǔ)讀物可讀性等級(jí)僅具有中等水平的預(yù)測(cè)力(40%的方差),而Yomiyasusa可讀性級(jí)別可預(yù)測(cè)68%的方差。Cunningham et al.(2018)研究發(fā)現(xiàn)Lexile測(cè)評(píng)系統(tǒng)(Lexile Framework)和Flesch-Kincaid分級(jí)公式(Flesch-Kincaid Grade-Level formula)這兩個(gè)可讀性測(cè)試工具在教育背景中使用的效度不足。Eika & Sandnes(2016)嘗試依托計(jì)算機(jī)技術(shù)實(shí)現(xiàn)自動(dòng)測(cè)量網(wǎng)絡(luò)英語(yǔ)文本可讀性級(jí)別的可能性。他們提出三個(gè)新的可讀性量度: 語(yǔ)言問題特征(language problem signature)、詞性特征(part-of-speech signature)和詞性熵(part of speech entropy)。其研究結(jié)果表明這三個(gè)量度的可讀性測(cè)評(píng)精確度低于傳統(tǒng)可讀性測(cè)評(píng)工具(依托句長(zhǎng)的可讀性測(cè)評(píng)公式)。
層次分析法主要是將復(fù)雜的問題分解后簡(jiǎn)單化,并將對(duì)量化指標(biāo)構(gòu)造成遞階層次結(jié)構(gòu)。將量化指標(biāo)進(jìn)行兩兩對(duì)比分析,確定指標(biāo)相對(duì)重要性,由相關(guān)專家進(jìn)行判斷,從而對(duì)要決策的方案進(jìn)行排序。應(yīng)用AHP方法分析問題時(shí),主要分為4個(gè)關(guān)鍵的步驟[8-9]:
現(xiàn)有書面語(yǔ)句長(zhǎng)研究涵蓋眾多語(yǔ)言(英語(yǔ)、希臘語(yǔ)、俄語(yǔ)、西班牙語(yǔ)、日語(yǔ)、拉丁語(yǔ)、漢語(yǔ)、斯羅維尼亞語(yǔ)、孟加拉語(yǔ)、德語(yǔ)和印地語(yǔ)等),涉及廣泛體裁(散文、小說、戲劇、詩(shī)歌、新聞媒體文本、書信、評(píng)論和演講辭等),取得了豐碩成果,為未來(lái)研究奠定了堅(jiān)實(shí)的理論根基和方法論基礎(chǔ)。然而,縱觀書面語(yǔ)句長(zhǎng)現(xiàn)有研究,其尚存在兩方面的不足。其一,研究對(duì)象涵蓋面不足?,F(xiàn)有書面語(yǔ)句長(zhǎng)分布研究所采用的研究語(yǔ)料絕大部分為專業(yè)寫作者的書面語(yǔ)文本,極少涉及二語(yǔ)學(xué)習(xí)者所產(chǎn)出二語(yǔ)書面語(yǔ)文本;現(xiàn)有可讀性研究多基于權(quán)威機(jī)構(gòu)或者研究者所判定的可讀性級(jí)別,甚少有研究依據(jù)二語(yǔ)學(xué)習(xí)者所感受到的書面語(yǔ)進(jìn)行可讀性探索。其二,研究模式單一?,F(xiàn)有研究往往依靠單一數(shù)據(jù)類型(定量數(shù)據(jù))來(lái)取得研究結(jié)果;其研究方法側(cè)重定量研究而忽視定性研究(例如,各類句長(zhǎng)的搭配規(guī)律)?,F(xiàn)有研究往往從單一理論視角探討書面語(yǔ)句長(zhǎng)這一語(yǔ)言現(xiàn)象,且絕大多數(shù)研究的共同研究者源自于單一學(xué)科領(lǐng)域。單一研究模式具有內(nèi)在缺陷性,其導(dǎo)致研究信度和效度不足,也同時(shí)導(dǎo)致眾多研究無(wú)法取得一致研究結(jié)果。未來(lái)研究可以以二語(yǔ)學(xué)習(xí)者為研究對(duì)象,同時(shí)打破單一研究模式,采用三角驗(yàn)證法來(lái)研究與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)。
1) 與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)現(xiàn)象研究
寫作和閱讀是二語(yǔ)學(xué)習(xí)者所必須掌握的兩項(xiàng)語(yǔ)言技能。二語(yǔ)學(xué)習(xí)者所產(chǎn)出的書面語(yǔ)文本和其所閱讀的書面語(yǔ)文本和二語(yǔ)學(xué)習(xí)者緊密相關(guān)。研究二語(yǔ)學(xué)習(xí)者所產(chǎn)出書面語(yǔ)的句長(zhǎng)和依據(jù)二語(yǔ)學(xué)習(xí)者所感受到的難度研究可讀性,能夠?yàn)榇龠M(jìn)二語(yǔ)學(xué)習(xí)者語(yǔ)言能力的發(fā)展提供啟示。
寫作文本是二語(yǔ)學(xué)習(xí)者語(yǔ)言能力的重要產(chǎn)出成果。句長(zhǎng)是二語(yǔ)學(xué)習(xí)者所產(chǎn)出書面語(yǔ)文本的外在顯性特征。籍由句長(zhǎng)可對(duì)二語(yǔ)學(xué)習(xí)者書面語(yǔ)文本進(jìn)行兩方面的探查。一方面,二語(yǔ)學(xué)習(xí)者書面語(yǔ)的文體風(fēng)格和體裁差異可據(jù)句長(zhǎng)而知。語(yǔ)言是思維和文化的雙重載體,思維差異和文化差異終將導(dǎo)致語(yǔ)言表達(dá)方式的差異。與此同時(shí),語(yǔ)言學(xué)習(xí)也會(huì)導(dǎo)致學(xué)習(xí)者思維和文化人格的形成。二語(yǔ)學(xué)習(xí)者母語(yǔ)和二語(yǔ)之間的差異致使其形成新的思維方式和文化人格,其二語(yǔ)寫作也因此而具有其獨(dú)特的文體風(fēng)格。而體裁的理論基礎(chǔ)決定語(yǔ)篇的圖式結(jié)構(gòu),影響限定該語(yǔ)篇對(duì)內(nèi)容和風(fēng)格所做的選擇(Swales, 1990: 58)。句長(zhǎng)和其分布是作者寫作風(fēng)格的指標(biāo)(e.g. Morton, 1965; Wake, 1957; Williams, 1940; Yule, 1939),并可被用以體裁區(qū)分(Gani, 2013)。二語(yǔ)學(xué)習(xí)者書面語(yǔ)總的文體風(fēng)格和體裁差異可以籍由句長(zhǎng)和句長(zhǎng)分布而得以分析。另一方面,學(xué)習(xí)者的二語(yǔ)發(fā)展水平可據(jù)其書面語(yǔ)的句長(zhǎng)分布而得以探知。二語(yǔ)寫作是二語(yǔ)學(xué)習(xí)者對(duì)于二語(yǔ)進(jìn)行綜合運(yùn)用能力的體現(xiàn)。寫作能力是判斷學(xué)習(xí)者水平的最重要因素(嚴(yán)明,2014: 10),二語(yǔ)學(xué)習(xí)者書面語(yǔ)句長(zhǎng)量度可映射出其二語(yǔ)發(fā)展?fàn)顟B(tài)。
閱讀文本是二語(yǔ)學(xué)習(xí)者提升語(yǔ)言能力的重要輸入資料。閱讀文本的可讀性是由輸入轉(zhuǎn)化為吸收的一個(gè)有力影響因素。依據(jù)二語(yǔ)學(xué)習(xí)者所感受到的難度,可探索三個(gè)方面的供二語(yǔ)學(xué)習(xí)者閱讀學(xué)習(xí)所用的書面語(yǔ)文本的可讀性: 二語(yǔ)學(xué)習(xí)者所用教材的可讀性、二語(yǔ)學(xué)習(xí)者所用課外紙質(zhì)讀物的可讀性和二語(yǔ)學(xué)習(xí)者所用網(wǎng)絡(luò)文本的可讀性。首先,二語(yǔ)學(xué)習(xí)者所用教材的可讀性研究。教材是二語(yǔ)教學(xué)和二語(yǔ)學(xué)習(xí)者學(xué)習(xí)賴以存在的基本工具和重要元素。良好可讀性是高質(zhì)量教材所必備的重要條件。一綱多本的現(xiàn)象給二語(yǔ)教學(xué)和學(xué)習(xí)帶來(lái)困惑。依據(jù)二語(yǔ)學(xué)習(xí)者所感受到的難度,對(duì)教材可讀性進(jìn)行基于句長(zhǎng)的多元探索和三角驗(yàn)證,通過比較分析而選取真正難度適宜的教材,更加有利于為二語(yǔ)學(xué)習(xí)者系統(tǒng)學(xué)習(xí)并掌握二語(yǔ)語(yǔ)言知識(shí)技能打下良好基礎(chǔ)。其次,二語(yǔ)學(xué)習(xí)者所用課外紙質(zhì)讀物的可讀性研究。扎實(shí)的二語(yǔ)語(yǔ)言功底不僅僅依賴于二語(yǔ)課堂教學(xué),也依賴于學(xué)習(xí)者課外廣泛閱讀。選擇在二語(yǔ)學(xué)習(xí)者可讀性最近發(fā)展區(qū)內(nèi)的紙質(zhì)課外讀物對(duì)于促進(jìn)學(xué)習(xí)者二語(yǔ)水平的提高具有重要意義。因此,基于二語(yǔ)學(xué)習(xí)者所感受到的難度,著手探索二語(yǔ)學(xué)習(xí)者所用課外讀物的基于句長(zhǎng)的可讀性工具的開發(fā),或?qū)υ擃愓n外讀物進(jìn)行可讀性分析,能夠幫助二語(yǔ)學(xué)習(xí)者選擇具有適讀性的讀物以助其快速提升。最后,二語(yǔ)學(xué)習(xí)者所用網(wǎng)絡(luò)文本的可讀性研究。在當(dāng)今信息化時(shí)代背景之下,泛在學(xué)習(xí)和移動(dòng)學(xué)習(xí)成為主流學(xué)習(xí)方式之一。豐富多樣的網(wǎng)絡(luò)書面語(yǔ)文本成為學(xué)習(xí)者觸手可及的學(xué)習(xí)資源。網(wǎng)絡(luò)語(yǔ)言具有多樣性、混合性和動(dòng)態(tài)性特征(張穎煒,2015),其可讀性不一。探測(cè)二語(yǔ)學(xué)習(xí)者所用網(wǎng)絡(luò)書面語(yǔ)文本的可讀性(尤其是二語(yǔ)學(xué)習(xí)者所感觸到的可讀性),可為二語(yǔ)學(xué)習(xí)和教學(xué)選擇難度水平適宜的在線資料提供借鑒,以助其選擇豐富且有針對(duì)性的閱讀資料,促進(jìn)二語(yǔ)教學(xué)和學(xué)習(xí)效果。
2) 三角驗(yàn)證法的實(shí)施
堅(jiān)實(shí)的研究需要三角驗(yàn)證。采用三角驗(yàn)證法可以增強(qiáng)研究的信度和效度,產(chǎn)生更為客觀的研究結(jié)果。三角驗(yàn)證法指的是“在某一現(xiàn)象研究中綜合采用兩種及以上理論、數(shù)據(jù)源、方法或研究者”(Denzin, 1989: 25)。據(jù)其定義可知,未來(lái)研究可以采用三角驗(yàn)證法對(duì)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)文本進(jìn)行四個(gè)方面的三角驗(yàn)證: 理論三角驗(yàn)證、數(shù)據(jù)三角驗(yàn)證、研究方法三角驗(yàn)證和研究者三角驗(yàn)證。
理論三角驗(yàn)證有助于全面詮釋與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)文本的句長(zhǎng)研究結(jié)果。理論三角驗(yàn)證是指根據(jù)不同的理論或觀點(diǎn)對(duì)同一現(xiàn)象進(jìn)行探討分析。采用理論三角驗(yàn)證,從不同的理論角度或觀點(diǎn)視角(語(yǔ)言學(xué)、文體風(fēng)格統(tǒng)計(jì)學(xué)和認(rèn)知語(yǔ)言學(xué)視角等)著手,對(duì)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)進(jìn)行研究,可以避免單一理論或視角所帶來(lái)的局限性。研究者籍此能夠從多個(gè)角度證明一個(gè)觀點(diǎn),從而對(duì)研究結(jié)果進(jìn)行全面而又真實(shí)的詮釋。
數(shù)據(jù)三角驗(yàn)證能夠增強(qiáng)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)研究的效度。數(shù)據(jù)三角驗(yàn)證是指從研究語(yǔ)料中匯聚多種數(shù)據(jù)。對(duì)于與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)研究而言,任何單獨(dú)統(tǒng)計(jì)分析都不足以構(gòu)建科學(xué)合理的效度,因?yàn)檠芯啃枰醋杂诙喾矫孀C據(jù)的多組數(shù)據(jù)(Tong, 2019: 246)。聚集兩種及以上數(shù)據(jù)(數(shù)字或非數(shù)字),讓多種數(shù)據(jù)之間進(jìn)行交叉驗(yàn)證和對(duì)話,使其相互佐證和相互補(bǔ)充,并以不同方式對(duì)數(shù)據(jù)進(jìn)行詮釋解讀,可以使與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)現(xiàn)象更加清晰,以增強(qiáng)研究的說服力。
研究方法三角驗(yàn)證有利于揭示與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)這一現(xiàn)象的全貌。研究方法三角驗(yàn)證指利用不同研究方法來(lái)研究某一現(xiàn)象。對(duì)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)研究來(lái)說,研究方法三角驗(yàn)證可以在兩個(gè)層面上進(jìn)行: 方法內(nèi)三角驗(yàn)證和方法間三角驗(yàn)證。首先,方法內(nèi)三角驗(yàn)證。在同一研究范式內(nèi)部,可采用兩種或以上具體研究方法來(lái)研究二語(yǔ)學(xué)習(xí)者書面語(yǔ)句長(zhǎng)這一語(yǔ)言現(xiàn)象。其次,方法間三角驗(yàn)證。研究者可結(jié)合不同研究范式(定性研究和定量研究)來(lái)探索與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)。通過歸屬于不同研究范式的研究方法三角驗(yàn)證,透過多個(gè)角度進(jìn)行數(shù)據(jù)分析處理,可以勾畫出研究對(duì)象的完整圖畫(張僑平等,2015: 34),能夠窺得與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)現(xiàn)象的全貌。
研究者三角驗(yàn)證有益于增強(qiáng)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)研究結(jié)果的可靠洞見。研究者三角驗(yàn)證指由不同研究者對(duì)同一研究問題進(jìn)行研究。不同研究者既可來(lái)自相同的學(xué)科領(lǐng)域,也可源自不同的學(xué)科領(lǐng)域。尤其是不同學(xué)科領(lǐng)域的學(xué)者可對(duì)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)這一語(yǔ)言現(xiàn)象進(jìn)行多學(xué)科領(lǐng)域合作探討,各自運(yùn)用其最擅長(zhǎng)的研究方法和研究工具,各自做出其貢獻(xiàn)。最終,通過不同學(xué)科領(lǐng)域視角所提供的證據(jù),協(xié)調(diào)來(lái)自不同學(xué)科領(lǐng)域的研究結(jié)果,從而增強(qiáng)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)現(xiàn)象這一領(lǐng)域研究的可靠洞見。
現(xiàn)有書面語(yǔ)句長(zhǎng)研究主要集中在四個(gè)領(lǐng)域: 文體風(fēng)格研究、文本分類研究、語(yǔ)言屬性研究和可讀性研究?,F(xiàn)有研究為未來(lái)研究打下堅(jiān)實(shí)基礎(chǔ),但其尚存研究對(duì)象涵蓋面不足和研究模式單一的局限。未來(lái)研究應(yīng)擴(kuò)大研究領(lǐng)域,避免單一研究模式所具有的內(nèi)在缺陷,根據(jù)三角驗(yàn)證法原則,從不同的理論視角協(xié)調(diào)不同學(xué)科領(lǐng)域的研究者,收集更為充足的數(shù)據(jù),以不同的研究方法對(duì)與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)進(jìn)行探索。借助相互補(bǔ)充、相互參照又互相兼容的研究結(jié)果可以獲得更為真實(shí)全面的研究結(jié)論,以便系統(tǒng)地揭示與二語(yǔ)學(xué)習(xí)者相關(guān)的書面語(yǔ)句長(zhǎng)這一語(yǔ)言現(xiàn)象的全貌,深化對(duì)書面語(yǔ)句長(zhǎng)的認(rèn)識(shí),并為二語(yǔ)學(xué)習(xí)和教學(xué)提供啟示。
外語(yǔ)教學(xué)理論與實(shí)踐2021年4期