【關鍵詞】古文字;“字料庫”;語料庫語言學【中圖分類號】H162 【文獻標識碼】A【DOI】10.20024/j.cnki.CN42-1911/I.2025.22.037【文章編號】2096-8264(2025)22-0124-04
考釋古文字是一項極其復雜而精細的工作,它不僅要求研究者有深厚的學識和極大的耐心,而且還需要詳細地對比分析眾多的字形結構。在此過程中,研究者需要通過這種對比研究,將已知的字形與尚未完全認識的字形相互對照,相互關聯(lián),從而對其字義進行推斷和鑒別。這不僅要求研究者全面深入地了解古文字在不同歷史時期、不同地域、不同文化背景下的字形變化和字義演變,而且要求其邏輯思維能力和判斷能力都要達到一定水準,這樣才能對尚未完全認識的古文字有一個準確的解讀。古文字資料的廣泛性和復雜性,無疑是影響古文字研究向縱深發(fā)展方面的重難點。構建一個內容廣泛全面的“字料庫”,可以幫助研究人員對字形進行更高效的檢索、分析和比對,使研究的效率和準確度得到很大的提高。
在近幾年的語料建設和開發(fā)實踐中,不斷探索,不斷創(chuàng)新,逐步積累了一些行之有效的方法和經(jīng)驗,初步提出了一系列具有指導意義的語料建設和語料開發(fā)等方面的成果,這些成果不僅促進了語料庫技術的不斷進步,同時也催生了語料庫語言學這一新的學科。這一新興學科是通過對某一特定語言的各種語料的大規(guī)模收集和分析,揭示出語言的內在規(guī)律和特性,是語言學與計算機科學相互融合、相互滲透的產(chǎn)物。
雖然語料庫語言學主要側重于現(xiàn)代語言的研究,但鑒于文字與語言之間存在著千絲萬縷的緊密聯(lián)系,古文字研究者可以從語料庫語言學中汲取靈感,借鑒其有益的方法和技術,從而推動古文字研究的不斷深入和發(fā)展,從資料收集、處理、分析等方面積累方法和經(jīng)驗。這樣,對古代文字的解讀才能更加高效、準確,對其背后的歷史文化內涵也才能更好地揭示出來。
一、古文字\"字料庫”構建現(xiàn)狀
古文字“字料庫”建設進展顯著。從古文字研究初期開始,就陸續(xù)推出了許多具有“字料庫”性質的辭書,其中最早也最有代表性的著作是東漢許慎編纂的《說文解字》。這本辭書詳細記載了作為古文字的小篆字形及其含義,為后來編纂辭書打下了堅實的基礎?!墩f文解字》雖然在編纂上有所欠缺,如釋義不夠精當,分類略顯混亂,但無疑開創(chuàng)了古文字辭典編纂的一條新路。
古文字辭典進入近現(xiàn)代以后,數(shù)量明顯增多,學者們按照歷史時期、地域的不同,對辭典的整理和編纂更加重視。如劉釗編著的《新金文匯編》、董蓮池編著的《新金文匯編》以及涵蓋甲骨文到戰(zhàn)國文字范圍較廣的《古文字類編》等多部辭書、字表。這些作品通過集合或歸類的方式呈現(xiàn),使得古文字研究者的工作效率得到了很大的提升。但由于這樣的工作要投入大量的時間和精力,而且是在手工整理的基礎上進行編纂,難免有些疏漏。隨著古文字研究的不斷深入,一些已經(jīng)被證實的字義可能會被新的研究結果推翻,而一些還沒有被辨識出來的字義,也有可能逐漸被破解出來。因此,詞典內容的及時更新需要不斷收集整合最新研究成果,這是一項
長期而艱巨的任務。
電子“字庫”建設也初見成效,目前已有“小學堂”“殷契文淵”“武大簡帛網(wǎng)”“古音小鏡”等網(wǎng)站上線運行。這些網(wǎng)站為研究者快速獲取所需古文字資料提供了便捷的檢索功能。同時,為了保證材料的新鮮、準確,他們還會定期更新。盡管如此,如何對海量古文字資料進行高效整合和分類、如何確保資料的準確性和完整性、如何為研究者提供一個方便使用的友好用戶界面等,電子“字料庫”仍面臨諸多挑戰(zhàn)。此外,如何對這些“字料庫”進行及時的更新和完善,也成為新的考古發(fā)現(xiàn)和研究成果不斷涌現(xiàn)的迫切需要解決的問題。
二、語料庫語言學與古文字學的相似性
語料庫語言學和古文字學的相似性體現(xiàn)在研究路徑和目標上,語料庫語言學和古文字學是相通的。第一,二者都需要對語言現(xiàn)象進行分析,并借助豐富的數(shù)據(jù)和實例,語料庫語言學探究語言的運用模式和規(guī)律,靠的是積累的大量語言素材一語料庫,它廣泛收集了口語和書面語言等多種語言樣本,例如,為了研究“GET”在英語中的用法,學者會構建一個涵蓋數(shù)百萬詞匯的英語語料庫,對含有“GET”的所有句子進行檢索和分析,從而歸納出“GET”在“取得”“改變”“促使他人行動”等多種語境下的意義。這種以大數(shù)據(jù)為基礎的研究方法,使得語料庫語言學可以將語言使用的面貌和規(guī)律真實地反映出來。
古文字學則以搜集、闡釋古文字材料為主,并由此探求古文字字形演變軌跡及其特征。為了揭示文字的歷史變遷,學者經(jīng)常研究不同的古文字類型,如甲骨文、金文、戰(zhàn)國時期文字等。如:古文學者對甲骨文的材料進行了深入的研究,對其行文特點進行了細致的歸納,發(fā)現(xiàn)其通常由前辭、貞辭、占辭及驗辭等幾部分組成甲骨卜辭的行文特征。這些研究不僅幫助學者對甲骨文卜辭的結構有所了解,而且對包括祭祀品種類、規(guī)格、具體祭祀方式、程序等在內的商代祭祀文化也有了進一步的揭露。
兩者在研究方法上的又一共性在實證研究方面的共通之處。
語料庫語言學作為語言學的一個分支,在揭示語言使用模式和走向的作用方面,高度重視統(tǒng)計和量化分析的作用。這種分析不是僅僅停留在表面層次上的詞匯或短語的使用頻率,而是對語言的結構、語義以及語用等諸多層次的深入探索。以英語動詞詞組為例,研究人員或將動詞短語的語料庫構建起來,語篇涉及面很廣,具有很強的針對性。借助這一語料庫,研究人員可以利用先進的計算機程序,對口語和書面語言中諸如“takealook\"和“havealook\"這類短語的具體使用頻率進行精確統(tǒng)計。更深入的分析可能還會涉及這些短語在不同語境下的分布規(guī)律,例如它們在正式文本和非正式文本中的使用偏好,或者它們在不同國家英語變種中的獨特表現(xiàn),研究者詳盡分析這些短語的分布規(guī)律,不僅可以在一定程度上揭示出語言運用的內在規(guī)律,而且還可以對語言的未來走向進行預測。
古文字在研究文字演化、文化底蘊方面也是依靠實證的學問。對于文字的形態(tài)意義及它所運用到的環(huán)境,學者是通過對不同歷史上不同的文本資料的仔細考察以及出土文獻與傳世文獻的相互結合來加以分析的。本文以中國漢字“馬”為例,研究者從甲骨文、金文到小篆、隸書等各個歷史階段的“馬”字盡可能地廣泛地收集起來作為例字。研究者通過對這些例字的對比分析,可以清晰地追溯“馬”字從原來的象形造型,到抽象符號的演變過程。另外研究者會對這些形態(tài)變化背后所發(fā)生的文化動機,馬在古代社會不同時期的重要地位及其所承載的社會、文化所包含的意義進行進一步的探討。
此外,語料庫語言學與古文字學都極為看重跨學科合作的價值,這種合作對于推動各自領域的發(fā)展具有重要意義。語料庫語言學常與計算機科學、統(tǒng)計學等緊密攜手,共同探索新的分析工具與方法。古文字學方面,同樣離不開歷史學、考古學、文獻學等領域的鼎力支持。古文字學家在解讀古文字時,為了準確地推斷文字的含義和用途,往往需要借助考古所提供的有關信息以及所描繪的歷史時代背景和歷史事件,同時,文獻學浩如煙海的研究成果,也使古文字學的研究內容得到了極大的豐富,為古文字學的文本資料和參考依據(jù)。
三、語料庫語言學研究對“字料庫”構建啟示
語料庫語言學研究所采用的研究方法是相當有價值的,這一點應當給予足夠的重視,并加以深入的論述。
頻率分析:計算語料庫中特定詞匯、詞組或語法結構的出現(xiàn)頻率,從而推斷其使用的范圍和特點。搜集整理古文字資料到達一定數(shù)量,建構語料庫。這個語料庫根據(jù)研究需要而定可以是一個特定的時期,也可以跨越不同歷史時期。再在語料庫所收集的文本中執(zhí)行進行分詞和詞性標注??紤]到古文字的特殊性,為了保證分詞和標注的準確性,這一步需要借助專業(yè)的古文字知識和經(jīng)驗。具體的詞匯、詞組或語法結構的出現(xiàn)頻率是通過計算機程序統(tǒng)計分析分詞和標記后的語料庫計算出來的,通過編寫腳本或使用已有的文字分析軟件,就可以實現(xiàn)這一過程。根據(jù)統(tǒng)計結果,對其在古文字文獻中的分布情況和特點進行分析,并加以推斷。使用頻率較高的詞匯、詞組或語法結構可能預示著它在當時被廣泛使用,而使用頻率較低的詞匯或語法結構可能表示它的使用較少,或具有特定的地域、時期或風格特征等使用條件。
例如,如研究甲骨文中“雨”字的用途時,可遵循如下幾個步驟:對某一數(shù)量的甲骨文文獻進行搜集,建設一個甲骨文語料庫。標注語料中的“雨”字在不同的語境中的出現(xiàn)情況,比如“不雨”這樣的詞語。編寫程序或在語料庫中統(tǒng)計“雨”字及其組合出現(xiàn)的頻率。舉個例子:我們可能發(fā)現(xiàn),同一片甲骨文中經(jīng)常出現(xiàn)“其雨”和“不雨”,而且頻率比較高。根據(jù)統(tǒng)計結果,我們推測,在描述天氣現(xiàn)象或進行占卜儀式時,“不雨”和“其雨”是甲骨文中常用的表達方式。
此方法可以判斷出甲骨文常用字的情況,也可以根據(jù)出現(xiàn)頻率的高低尋找到某些字獨特的用法。研究者可以通過頻率分析更好地理解古文字文獻中的語言使用習慣,揭示古代語言的規(guī)律和特點。
共現(xiàn)分析法:是一種揭示詞匯間的搭配規(guī)律及其語義層面的內在聯(lián)系,對明確詞義和語義關聯(lián)具有顯著意義的研究方法,是一種專注于在特定文本集合或語料中,探究兩個或多個詞匯在限定距離內共同出現(xiàn)的頻率的研究方法。
具體地說,在甲骨文的研究中,“祖”字與“考”字在距離較近的情況下共同出現(xiàn)的頻率較高,或許預示著對先人崇拜的情形在商代是極其突出的。還可以通過共現(xiàn)分析法來分析古代文字中“天”字的情況,“天”字與“祀”字的頻繁共現(xiàn),如“祀天”等,可能反映出古代社會對天神的崇拜和蔡祀活動的重要性,“祀”與“祖”之間往往是短距離的共現(xiàn),反映出商王祭祀祖先的情況,由此可以得出商代先人崇拜與天神崇拜之間存在著密切的聯(lián)系。
共現(xiàn)分析法在語言學和文獻學研究中具有重要的應用價值,在研究古漢語詞匯方面,這種方法可以幫助學者揭示詞匯的共現(xiàn)模式,從而對詞匯的語義范疇及使用環(huán)境進行推斷,在語言學和文獻研究中對古漢語詞匯的研究具有重要的應用價值。研究者通過對具體詞匯的共現(xiàn)頻次進行統(tǒng)計分析,進而對詞匯間的語義關聯(lián)、文化內涵進行分析,從而構建出詞匯共現(xiàn)網(wǎng)絡。
關鍵詞分析:在深入分析具體語料時,識別那些頻率顯著較高的詞匯是必不可少的。這些我們通常稱之為關鍵詞的詞匯,其出現(xiàn)頻率之高可以透露出主題內容和具體的文體特征。研究者可以通過這種方法,對文字集合的內在含義、文字運用的獨特性等進行更深入的理解。例如,在對甲骨文分期問題進行深入研究時,可利用計算機技術,高效提取貞人姓名信息作為科學分類甲骨的重要依據(jù)。在具體實踐中,可以把名字相同的貞人歸入同一范疇。另外,對甲骨上的刻字內容進行細致的觀察也是另一種重要的分類方式。如“王占曰”或“XX貞”等標志性詞語,一旦在甲骨上出現(xiàn),就會被認定為商王卜辭,并按此分類。而那些沒有包含這些具體詞匯的甲骨,則有可能被歸類為記事刻辭。
在考察關鍵詞分析的過程中,不能局限于單個詞類,要涵蓋短語、句式等方面。那些經(jīng)常出現(xiàn)的固定短語搭配或特有的句式結構往往蘊涵著豐富的文化信息,包含著具體的語言習慣。對這些詞組、句式的深入研究,對認識古代社會的語言特點、思維定式都有很大的幫助。同時關鍵詞分析不是孤立地進行的,而是可以結合其他特征如文字的書寫習慣、刻寫工具等,它們共同為文字所處的年代、地域以及所屬的文化圈提供強有力的依據(jù)。如不同甲骨上的文字,通過對字體風格的對比分析,刻寫痕跡,使關鍵詞分析得出的結論得到進一步的驗證和充實。
語法結構分析:研究特定的語法結構,如動詞時態(tài)、語態(tài)、名詞短語等的使用頻率和分布,從而分析語法規(guī)則的實際應用情況。
以金文研究來說,運用語法結構分析有助于洞察西周時期漢語的語法面貌。比如,可對金文中動詞的語態(tài)呈現(xiàn)展開探究,像“見”字在一些語句里有表被動的意味,通過收集眾多帶有“見”字且能體現(xiàn)這種語態(tài)用法的金文語句,統(tǒng)計其出現(xiàn)的頻率以及在不同類型銘文(如冊命銘文、記事銘文等)中的分布狀況。由此能夠推斷出西周時期在表達被動語態(tài)時這種用法的普遍程度以及使用規(guī)律。
再者,針對名詞短語的分析也很關鍵??梢钥疾旖鹞闹忻~前修飾成分(定語)與名詞(中心語)的組合方式,像“大邑周”這樣的表述,“大邑”作為定語修飾“周”這個中心語,通過分析大量類似的名詞短語在不同金文中的運用,了解當時名詞短語的構造規(guī)則,進而深入把握古代漢語的語法架構,為古文字研究從語言學角度給予有力支撐。
歷時分析:在動態(tài)語料庫中,通過比較不同時期的語言數(shù)據(jù),研究語言隨時間演變的趨勢,以及新詞的出現(xiàn)或詞義的變遷等現(xiàn)象。
例如,“無”字最初象形程度極高,與“舞”同源,在甲骨文中呈現(xiàn)為雙手持牛尾起舞的形象,隨后逐漸演變?yōu)楸硎尽皼]有”的意義,《說文解字》中對其的解釋也僅限于“亡也”一句。這一演變過程反映了古人對“無”字從具體到抽象認識的轉變?!岸Α弊衷诓煌赜虻臅鴮懶问窖葑?。研究者通過對比不同時期的“鼎”字書寫形式,發(fā)現(xiàn)其形態(tài)從西周早期的具象圖像美逐漸演變?yōu)閼?zhàn)國時期的筆畫簡化,不同國家關于“鼎”字的書寫形式各異,在楚簡中的簡化尤為顯著,這一變化與當時的社會文化背景緊密相關。
通過對歷時性分析,不同歷史階段中語言發(fā)展的軌跡、詞匯和語法結構的演變態(tài)勢,就可以得到一定程度的刻畫。對認識語言的動態(tài)過程,探究社會變遷對語言形態(tài)的影響,這種分析手段價值是無窮的。同時,這種方法為文字的斷代和歸屬提供堅實的語言學支持,歷時性分析也是識別古文字時代特征的有力工具。
此外,應用計算機技術帶給我們的一系列高級分析手段,比如自動標記、情感分析、主題建模,使分析過程變得復雜而深刻。對于古文字研究的重要意義,計算機技術的融合是不言而喻的,在借助圖像處理和機器學習算法進行文字自動識別和分類的同時,大大提高了研究者對海量古文字資料檢索、分析和處理的能力。這些技術的應用,不僅使研究的效率和準確性有了顯著的提高,而且為古文字學和很多學科的交叉融合開辟了廣闊的空間,加快了古文字學的蓬勃發(fā)展,促進了研究成果的即時共享,學界與學界之間的交互與合作得到了加強。
四、結語
總而言之,語料庫語言學研究的范式,給構建“字料”古文字提供了一個很深的啟迪。通過對這些先進研究方法的吸收,古文字學者對古文字資料能夠比較科學系統(tǒng)地收集整理,進而可以對其中的語言規(guī)律、歷史文化內涵有進一步的挖掘。這不僅為深化古文字學研究奠定扎實的基礎,而且為相關領域的研究提供了寶貴的資源和支持,奠定了堅實的基礎。放眼望去,古文字“字料庫”的建構和應用將隨著計算機技術和人工智能的不斷進步而迎來史無前例的廣闊前景和無限可能。古文字學者可以緊握這些先進技術的鑰匙,不斷促進古文字學研究的持續(xù)進步,為繼承和弘揚中華優(yōu)秀傳統(tǒng)文化貢獻力量。
參考文獻:
[1]許慎.說文解字[M].北京:中華書局,1963.[2]劉釗.新甲骨文編[M].福州:福建人民出版社,2009.[3]董蓮池.新金文編[M].北京:作家出版社,2011.[4]高明.古文字類編[M].北京:中華書局,1980.[5]陳夢家.殷墟卜辭綜述[M].北京:中華書局,1988.[6]裘錫圭.文字學概要[M].北京:商務印書館,1988.[7]劉華.語料庫語言學-理論、工具與案例[M].北京:外語教學與研究出版社,2020.
(上接第102頁)
比如,“紅妝應圖”中的“紅妝”二字倘若直譯,則是“redmakeup”,既沒有體現(xiàn)原文含義,也不通順。實際上,“紅妝”在文中指的是美人在鏡中的樣子。這句與后面的“千嬌集影”一起,意譯為了“withbelles'silhouettesgatheredupon”,即美人許許多多的嬌姿都體現(xiàn)在鏡中。通過這樣的意譯,外國游客也能明白青銅鏡上銘文的含義。
五、結語
本文在功能對等理論的指導下,以中國國家博物館網(wǎng)站上一部分文物的中英文介紹為語料,深入分析其中體現(xiàn)的翻譯方法和技巧。中國國家博物館文物眾多,內涵豐富,這就需要譯者有豐富的文化知識,運用不同的翻譯方法和技巧,將文物介紹中的信息以及背后所承載的文化內涵在譯文中表現(xiàn)出來,盡可能讓原文和譯文實現(xiàn)對等。希望本文在為類似的翻譯提供一定參考的同時,讓國內外游客都能了解不同文物的魅力和背后的文化內涵,進一步推動中華優(yōu)秀傳統(tǒng)文化走向世界。
參考文獻:
[1]趙丹丹.淺論奈達的功能對等理論[J].文學教育
(中),2011,(03):54-55.
[2]閆雨霏.功能對等翻譯理論文獻綜述[J].海外英語,2024,(15):31-34.
[3]時和平.功能翻譯理論的補充與發(fā)展一介紹奈達近作《從一種語言到另一種語言》[J].中國翻譯,1987,(03):42-44.
[4]汪波,郝興躍.奈達功能對等理論在中國的傳播[J].英語廣場,2018,(09):15-17.
[5]張易男,李燕鴻.博物館文本翻譯的特點和翻譯原則——以湖北省博物館為例[J].湖北工業(yè)大學學報,2019,34(03):74-77.
[6]熊兵.翻譯研究中的概念混淆—以“翻譯策略”“翻譯方法”和“翻譯技巧”為例[J].中國翻譯,2014,35(03):82-88.
[7]岳晟婷.村上春樹《挪威的森林》中外來語的翻譯策略分析[J].嘉應文學,2025,(04):76-78.
[8]程妍.中國企業(yè)網(wǎng)站簡介英譯的實用翻譯方法[J].佳木斯職業(yè)學院學報,2021,37(05):70-72.
[9]高強,李曹.淺談直譯法與意譯法在翻譯工作中的應用[J].科技信息(科學教研),2008,(14):263-264.