李小亞
(廣西民族大學(xué)相思湖學(xué)院,廣西南寧 530001)
法律語言學(xué)本身是一項(xiàng)交叉性較強(qiáng)的學(xué)科,自誕生成為獨(dú)立的學(xué)科以來它便由于實(shí)用性和實(shí)踐性較強(qiáng)而成為備受關(guān)注和使用的應(yīng)用工具之一。從我國現(xiàn)階段的發(fā)展?fàn)顩r來看,我國相關(guān)專業(yè)領(lǐng)域?qū)τ诜烧Z言學(xué)的研究已經(jīng)從傳統(tǒng)的理論研究轉(zhuǎn)向?qū)嵱眯愿鼜?qiáng)的應(yīng)用研究當(dāng)中,由于從理論向?qū)嵺`的跨越本身需要很多改變,因此主觀性較強(qiáng)的研究手法便不適用于這類研究,法律實(shí)踐應(yīng)用性目的的實(shí)現(xiàn)還要依靠現(xiàn)實(shí)證明和量化當(dāng)中去,更多依靠的是理性主義和客觀的精神,結(jié)合過往實(shí)踐中所積累的經(jīng)驗(yàn)來對法律語言學(xué)進(jìn)行有效探究。結(jié)合語料庫的建設(shè)特點(diǎn),該文通過對其構(gòu)建的理論基礎(chǔ)、使用方法、技術(shù)使用、分類特點(diǎn)這4 個(gè)角度進(jìn)行探討。
由于法律語言學(xué)具有一定的社會(huì)實(shí)用性,因此在漢語語料庫的構(gòu)建中其理論基礎(chǔ)必不可少的會(huì)涉及對社會(huì)語言的使用。語料庫的實(shí)際研究過程中,它更加側(cè)重于一種按照從上到下的方法來研究,將語言對象作為一種社會(huì)類型的現(xiàn)象來分析,通過社會(huì)交際和實(shí)際發(fā)生的語言進(jìn)行綜合分析,因而法律語言在這一基礎(chǔ)上也具有一定的社會(huì)屬性,漢語語料庫在構(gòu)建過程中也應(yīng)當(dāng)貼合法律的語言交際,將其的形成與改變進(jìn)行綜合。
語言已經(jīng)從傳統(tǒng)的理論層面的研究轉(zhuǎn)向了應(yīng)用層面的研究,研究者也更加關(guān)注語言知識(shí)和相關(guān)成果對現(xiàn)實(shí)問題的解決作用性。法律語言作為應(yīng)用屬性較強(qiáng)的項(xiàng)目,其發(fā)展過程要充分立足于實(shí)際,并將其的應(yīng)用發(fā)展過程上升到理論的認(rèn)識(shí)和總結(jié),并回歸于法律實(shí)踐的過程中,讓法律語言在實(shí)踐中不斷完善自身的建設(shè),保證語言的事實(shí)性、理論性、客觀性。語料庫在實(shí)際的運(yùn)用中也應(yīng)當(dāng)通過結(jié)合現(xiàn)實(shí)的方法和描寫來對語言現(xiàn)象進(jìn)行總結(jié),并應(yīng)用于法律語言之中。
法律本身的客觀性、科學(xué)性、公正性等要求不同的司法環(huán)節(jié)必須樹立嚴(yán)格的工作態(tài)度,法律語言學(xué)亦不例外。因此,在語料庫的構(gòu)建時(shí)期,必須對語言的運(yùn)用和解釋等工作進(jìn)行科學(xué)性的研究,在涉及文本、語音、語言的使用過程中,也必須對語料的運(yùn)用和發(fā)展奠定基礎(chǔ),在引用科學(xué)的數(shù)據(jù)分析上來對歸納性進(jìn)行總結(jié),使其更具科學(xué)性和客觀性。
漢語語料庫針對法律部分的建庫是基礎(chǔ)性的工作。在該過程中,前期的語料素材采集、規(guī)劃存儲(chǔ)、分類構(gòu)建、管理歸屬等都是根據(jù)不同的語言特點(diǎn)來進(jìn)行的。從實(shí)際的法律語言特點(diǎn)來看,語料庫的建庫要采取語料附碼、對原始文本的理論構(gòu)建,并嚴(yán)格遵循語料采集的原則,在分類處理的前提下對取料原則進(jìn)行分析,并保持其時(shí)效性和平衡性。
對法律語料的加工重在對語料整體的分析當(dāng)中。從實(shí)際的加工程序和步驟來看,主要有檢索、統(tǒng)計(jì)、標(biāo)注、語義分析等,在這一過程中要充分對語料進(jìn)行索引分析,在語法、詞匯的充分運(yùn)用的基礎(chǔ)上來對語篇資料進(jìn)行整體的加工編著[4]。除此以外,語料庫語言的研究充分利用區(qū)分法和驅(qū)動(dòng)法,在附碼軟件的使用下來對法律語言中出現(xiàn)的詞匯和語義等的詞表使用頻率進(jìn)行表示,并進(jìn)行延伸的詞匯檢索、索引、排除歧義等的調(diào)查使用。
在語料庫的分析過程中,其語料的使用合理性在于對語境和功能的調(diào)查分析。在不同的分析條件下,通過定量分析和定性分析進(jìn)行有效檢驗(yàn),從而保證法律語料分析的事實(shí)性和客觀性[5]。在分析技術(shù)的使用過程中,數(shù)據(jù)挖掘技術(shù)的使用對于語料分析來說有著十分重要的作用,在海量的離散數(shù)據(jù)經(jīng)過技術(shù)分析后將知識(shí)進(jìn)行精煉化。由于語料本身具有一定的脫離性,它們遠(yuǎn)離原有的語境,因此在研究過程中必須正視其客觀性、事實(shí)性。
法律語料庫在構(gòu)建過程中不可忽視地具有一定的局限性。從其本身的使用特征來看,主要有時(shí)間上的局限性和建庫方式的局限性。從時(shí)間上來看,由于本身建庫的側(cè)重點(diǎn)的目的不同,法律語料庫在不同的時(shí)代特征上有著不同的特點(diǎn),因此在時(shí)間上很難把握實(shí)際的度量;從建庫方式來看,由于法律語料獲取的方式較為單一,法律語料庫在實(shí)際的庭審過程中的運(yùn)用缺失精準(zhǔn)性,這就是因?yàn)槠滢D(zhuǎn)錄和標(biāo)注的技術(shù)不夠精準(zhǔn)。
法律語料的加工困難重重。首先就是對語料本身所具有的含義的理解,由于語料庫上的語言脫離原本的語境容易引起歧義,因此在國家標(biāo)準(zhǔn)的分詞規(guī)范下這一加工過程得到了一定的緩解。在對檢索平臺(tái)和標(biāo)準(zhǔn)的使用基礎(chǔ)上能夠?qū)ψ衷~和句子進(jìn)行檢索,平臺(tái)搭建的困難性也正是體現(xiàn)在此。
法律語料在實(shí)際的運(yùn)用當(dāng)中會(huì)考慮到很多分析因素,諸如對不同統(tǒng)計(jì)方式的思考,對原有語境的思考,對語料的離散程度的思考等,這些都是影響法律語料在實(shí)際應(yīng)用中的精準(zhǔn)性和科學(xué)的因素[7]。基于此,在實(shí)際的應(yīng)用分析中應(yīng)采取不同的方法來對其進(jìn)行檢驗(yàn),對不同的變量因素和程度進(jìn)行綜合考量,在研究的基礎(chǔ)上通過實(shí)踐來驗(yàn)證其正確性和可行性,由此來提高信息的正確度和可信度。從根本上來看,法律語料庫所提供的應(yīng)用類型是對語言事實(shí)的反映,缺少對社會(huì)語境信息的分析。在這一基礎(chǔ)上,必須對社會(huì)語言學(xué)等學(xué)科進(jìn)行充分利用。
法律法規(guī)的語料庫構(gòu)建是針對不同國家的法律法規(guī)、國際社會(huì)上所使用國際條約、不同行政區(qū)域所使用的規(guī)章制度和各級地方的司法解釋等的文件。法律法規(guī)語料庫的應(yīng)用在這一類別具有法律效力,因此在分類構(gòu)建中必須正視不同語句使用的科學(xué)性和標(biāo)準(zhǔn)化,盡量減少因語料庫使用不當(dāng)或者因法律條文語句的歧義、漏洞等所產(chǎn)生的語言不規(guī)范的現(xiàn)象。
專用文書也是司法文書語料庫。在該類型的語料庫構(gòu)建過程中是具有特定語言領(lǐng)域的,這類文書的使用主要針對案件處理的不同環(huán)節(jié)進(jìn)行使用的,比如:偵查階段、檢察機(jī)關(guān)使用階段、審判環(huán)節(jié)過程中等都會(huì)運(yùn)用到的專用文書語料庫。在該類型的語料庫中,主要運(yùn)用到的是以句子和篇章為主,司法文書的使用對于語言結(jié)構(gòu)和語體等都有嚴(yán)格的要求,根據(jù)不同的刑事案件、民事案件、行政案件等都有不同的用途。
司法鑒定語料庫的構(gòu)建主要應(yīng)用在口語和文本的鑒定識(shí)別過程中。在實(shí)際的實(shí)踐過程中,由于語料庫本身是針對文本作者識(shí)別使用,因此在搜集和整理的基礎(chǔ)上語料庫的特征更加注重對詞語長短、語句長短、詞語使用頻率、語法結(jié)構(gòu)等進(jìn)行整理統(tǒng)計(jì)分析,并在通過統(tǒng)計(jì)和檢索來對文本作者本身的個(gè)人特征進(jìn)行有效調(diào)查。從我國現(xiàn)階段來看,法律語料庫的分析在司法鑒定當(dāng)中的使用案例很少,而口頭的言語分析在其中卻有著較強(qiáng)的實(shí)踐特征。該類語料庫能為司法鑒定提供真實(shí)可靠的有效信息。
由于法庭審判本身涉及的案件較多,因此其應(yīng)用范圍也更加廣闊。在不同案件類型的語料庫中,民事案件、刑事案件等各有不同點(diǎn),前者側(cè)重于對離婚財(cái)產(chǎn)糾紛等的語料庫搜集,后者更加側(cè)重于對走私、毒品、洗錢等的語料庫進(jìn)行搜集,并應(yīng)用于實(shí)際的法庭審判中,根據(jù)不同案件的事實(shí)分析和心理分析,對犯罪嫌疑人的思想、身份群體、社交關(guān)系等進(jìn)行有效調(diào)查。庭審語料庫的使用對陪審團(tuán)和案件記錄有著重要的影響作用。
綜上所述,在法律語言學(xué)下的漢語語料庫的構(gòu)建應(yīng)用前景較好,其應(yīng)用范圍較廣,根據(jù)現(xiàn)階段發(fā)展?fàn)顩r和對未來的趨勢所見來看,漢語語料庫的發(fā)展方向?qū)?huì)向更加多元化的方向發(fā)展。在時(shí)代的不斷進(jìn)步和發(fā)展過程中,信息科技不斷突破原有的發(fā)展水平,順勢而衍生出的還有多語種語料庫、網(wǎng)絡(luò)語料庫和其他的信息處理語料庫等,這些使用的技術(shù)也更加先進(jìn),對于法律語言學(xué)的研究提供客觀辯證發(fā)展的應(yīng)用幫助。
創(chuàng)新創(chuàng)業(yè)理論研究與實(shí)踐2019年22期