一、記憶與邂逅:項楚先生其人其學(xué)
我第一次見項楚先生是在1993年8月底。那時,我剛好結(jié)束了第一次在上海復(fù)旦大學(xué)的留學(xué)生活,回到本已有一段時間,但仍希望能繼續(xù)在中國開展研究活動。于是,我與前輩三浦理一郎先生一同走訪了中國各地。我們作為代表,代替受邀出席由夏傳才先生主辦的“首屆《詩經(jīng)》國際學(xué)術(shù)研討會”的東洋大學(xué)教授新田幸治先生,一起前往石家莊。之后又經(jīng)過北京,前往成都的四川大學(xué)。當(dāng)時,明海大學(xué)的游佐升先生正好也在成都,我們借助這層關(guān)系,有幸拜訪了項楚先生。
說到項楚先生,我在赴中國留學(xué)之前,就已經(jīng)通過《敦煌文學(xué)研究論叢》以及《敦煌變文選注》等著作知曉他的名字。在我完成本科畢業(yè)論文《地獄變文》的研究之后,偶然在《敦煌文學(xué)研究論叢》中讀到了項楚先生關(guān)于“地獄變文”的論文,驚訝于他的研究興趣與我如此接近,因此一直希望有朝一日能親自拜訪這位學(xué)者。在1993年前后,我們曾邀請當(dāng)時在駒澤大學(xué)留學(xué)的湛如先生到東洋大學(xué)東方學(xué)研究所進行演講,當(dāng)時他也曾提及項楚先生,將其與陳允吉先生、孫昌武先生并列為中國佛教與文學(xué)研究領(lǐng)域的一流學(xué)者。因此,在游佐先生滯留四川期間,我們東洋大學(xué)“金岡一門”的五位師生決定一同拜訪項楚先生。這五人除我、三浦先生、游佐先生外,還有游佐教授的夫人彌生女士,以及東方學(xué)研究所研究員柿市里子女士。值得一提的是,彌生夫人也是“金岡一門”的一員。
面對我們五位外國人突然登門拜訪,項楚先生以自然、溫和的態(tài)度接待了我們,這使得我們的內(nèi)心感到非常溫暖。據(jù)說他當(dāng)時剛從美國歸國,途中還順道訪問了日本。我曾聽說他通讀佛教經(jīng)典,對學(xué)術(shù)要求極其嚴(yán)格,原以為是一位極為嚴(yán)厲的學(xué)者,但出乎意料的是,他為人極其溫和,臉上總帶著發(fā)自內(nèi)心的笑容,給我留下了極其深刻的印象。確實,在拜讀項楚先生的研究成果時,我深切感受到他在嚴(yán)謹(jǐn)?shù)恼{(diào)查與文獻引用之外,在關(guān)鍵之處亦展現(xiàn)出極具平衡感的審美與學(xué)術(shù)趣味,甚至可以說是一種帶有“游戲精神”的學(xué)問樂趣。在那次拜訪之后,我才開始逐漸意識到這些特質(zhì)的存在。之后,當(dāng)我得知他創(chuàng)立了四川大學(xué)“中國俗文化研究所”時,更加深了這種印象?!八孜幕边@一名稱本身就體現(xiàn)出他不僅關(guān)注嚴(yán)肅的學(xué)術(shù)研究,同時也試圖深人探討作為“人”的另一面——或者說,更為本質(zhì)的日常性與內(nèi)在性。我由此更加感受到,他是一個具有高度平衡感的人,其人格魅力亦由此可見。
此后,我在中國的學(xué)術(shù)會議上多次與項楚先生重逢,也逐漸與他建立了親密的關(guān)系。每次想起他總是與夫人一同,以溫和的笑容示人的模樣,心中便涌上一股溫暖之情。我記得在某次學(xué)術(shù)會議的外出參訪活動中,中午休息時,大家偶然看到休息室里有一張麻將桌,于是他與夫人及幾位同齡的與會者便馬上興致勃勃地開始打起麻將來。許多在場的研究者都很驚訝,原來項楚先生也會打麻將,而我卻反而覺得:“這才是項楚先生??!”
二、詩與“游”的探尋:杜甫、李白與生成式AI
話說至此,在回憶項楚先生的同時,我也該逐步進入正題了。本文既是為了紀(jì)念項楚先生,也回應(yīng)了《杜甫研究學(xué)刊》方面的約稿。我作為一名從事敦煌學(xué)、唐代文學(xué)與唐代文化研究的學(xué)者,在思考該談何種主題時,決定聚焦于唐代詩人的游興與娛樂。所謂“游玩”,形式多樣,但若從日常娛樂、日常樂趣的角度來看,我個人希望以“酒”作為切入點,展開一番探討。
另外,若只是單純地談“杜甫與酒”或“李白與酒”,作為一種“游玩”便顯得乏味無趣,更容易流于俗套,缺乏新意。因此,作為一位現(xiàn)代研究者,我希望在“游”中再添加一層嘗試——那就是引人近年來廣受關(guān)注、在坊間流行的“生成式人工智能”(GenerativeAI)作為本次實驗的一部分。生成式AI一經(jīng)問世,人文學(xué)界的研究者便多持負(fù)面看法,例如“學(xué)生會讓AI代寫報告”“學(xué)生將不再努力學(xué)習(xí)外語”等觀點。在大學(xué)內(nèi)部,也不乏將使用AI視為“惡”的聲音。然而,另一方面也有不少聲音指出,“如今企業(yè)普遍使用生成AI”“不會操作AI就找不到工作”等。也就是說,原本被視為高等教育“敵人”的工具,竟成了社會的現(xiàn)實需求,這無疑是一個值得深思的矛盾現(xiàn)象。從社會現(xiàn)狀來看,這種局面無疑對大學(xué)教師,尤其是人文學(xué)研究者而言,是一種不利的趨勢。那么,為何會出現(xiàn)這種狀況呢?原因或許在于,生成AI尚未成為人文學(xué)研究者在學(xué)術(shù)研究中“不可或缺”的工具。但回顧過去,我們曾經(jīng)習(xí)慣以手寫方式撰寫論文(在日本的文學(xué)系,畢業(yè)論文必須用鋼筆寫在稿紙上提交),也主要依靠紙質(zhì)資料進行研究。到了90年代中期,計算機迅速普及,人文學(xué)者也逐漸習(xí)慣了這一工具,甚至開始視使用電子書籍為理所當(dāng)然。而這一轉(zhuǎn)變,所用時間不過十年左右。因此,我認(rèn)為,如今的生成AI將來也很可能像當(dāng)年的計算機那樣,成為研究者日常工具的一部分。我相信,許多人也會與我有相似的看法。然而,目前的問題在于,我們在人文學(xué)研究中該如何具體運用生成AI,尚未有太多深入的討論。我本人也正處于探索階段,思考如何將其作為研究工具加以活用。說實話,目前為止,我自己還未能找到特別有效的用法。順便一提,現(xiàn)在大家讀到的這篇約六七千字左右的文章,表格之外的文字部分并非手寫而成,也并非通過鍵盤敲打出來,而是完全借助語音輸人完成的。這也可以說是當(dāng)代技術(shù)進步帶來的又一項“新玩具”,一種具有革命性的創(chuàng)新。
關(guān)于生成式AI如何能夠應(yīng)用于中國文學(xué)、唐代文學(xué)研究,我其實一直在思考這個問題。我也曾直接向生成AI請教過這一點,但在“提出全新構(gòu)想”這一方面,AI似乎還難以超越人類的腦力,目前尚未提供真正令人驚艷的創(chuàng)意。這也并不奇怪,畢竟現(xiàn)階段的生成AI,其功能仍主要是搜集網(wǎng)絡(luò)上的既有信息,再將其整理呈現(xiàn),而不是創(chuàng)造出人類從未思考過的觀點。因此,在這樣的前提下,我想借此機會介紹我所構(gòu)思出的一個想法,并由此正式進入本文的主題探討。
三、使詩人語言“可視化”:文本挖掘的嘗試
我最初所想到的一種較為簡單的思路,是基于現(xiàn)有的文本數(shù)據(jù),運用所謂“文本挖掘”(textmining)的方法,從而以機械化手段探究作者的意圖與寫作傾向。這種方法在歐美以及日本的新聞界早已被廣泛采用,比如將某國領(lǐng)導(dǎo)人的講話或官方聲明按時間順序轉(zhuǎn)化為文本,通過分析特定時期詞匯的使用傾向,來推測該國的政策動向及其未來走向。由于該方法如今已能處理海量文獻資料,因此不僅適用于語言學(xué)研究,也被廣泛應(yīng)用于近現(xiàn)代文學(xué)作品的風(fēng)格分析,甚至利用海量學(xué)術(shù)論文來探測學(xué)術(shù)研究的趨勢。就我的看法而言,這一方法完全可以運用于對漢詩的分析。
基于上述思路,我制作了下方的“表一”。該表羅列了唐代詩人在詩作中偏好使用的漢字,僅憑這一點,便可在一定程度上揭示出各位詩人的用字特點。接下來,我將簡要說明制作這張表的過程。
首先,需要做的是收集文本數(shù)據(jù)。目前,網(wǎng)絡(luò)上公開了各種各樣的文本數(shù)據(jù)。嚴(yán)格來說,這些數(shù)據(jù)在沒有經(jīng)過文本??敝?,尚不能作為嚴(yán)肅研究的資料來使用。然而,在本次嘗試中,由于實驗性質(zhì)強且時間有限,盡管本人對此略感遺憾,仍選用了公開在“維基文庫”上的資料,所使用的文本為《全唐詩》。在進行文本挖掘時,文本量越大,所得數(shù)據(jù)就越客觀。因此,這里僅選取《全唐詩》中至少留下三卷作品的詩人,且以中唐以前的詩人為對象。若用于正式研究,可根據(jù)需要選定具體的研究對象。將收集到的文本輸入到如KH-coder之類的文本挖掘軟件中,即可進行數(shù)據(jù)分析。但KH-coder在默認(rèn)設(shè)置下無法僅提取單字,常將兩個或多個字組合為一個詞來識別(盡管可能有對應(yīng)的設(shè)置可以調(diào)整)。因此,我首先借助生成式AI對文本進行了預(yù)處理。處理方法是在提示詞中指示AI在每個漢字后加上句號“。”,以將其隔開。如此一來,就不會將兩個字誤識為一個詞語。將這樣處理過的文本輸人到KH-coder中后,就可以對所用漢字種類進行統(tǒng)計。將該處理過程應(yīng)用于每一位詩人后,便可得到一份包含各詩人用字頻率的Ex-cel表。隨后,再將各自獨立的Excel文件進行整理,按使用頻率排序,最終匯總為一個總表。至于具體的表格處理方式,我是向生成AI提問后得知的。根據(jù)生成AI所提供的步驟,我將所有的Excel數(shù)據(jù)一一輸人,最終生成了表一。僅通過羅列詩人偏好使用的字,也能一定程度上揭示出他們的創(chuàng)作傾向。這便是本次嘗試的第一項成果。表中左側(cè)列出的是詩中所用的漢字,右側(cè)數(shù)字則表示該字在各詩人詩作中的使用頻率排名。整體順序以杜甫為中心進行排列。從中可看出,在杜甫的詩中,“酒”字的出現(xiàn)頻率排名為第77位。乍一看似乎偏低,但從全表來看,“酒”字在唐詩中的使用頻率并不算高,進入前50名的只有李白和白居易兩位。此外,還可以看出杜甫詩作中“老”字的使用頻率排名第18位,尤為突出,這也成為其詩風(fēng)的一大特點。
接下來進行的工作,是在前述分析所得的傾向基礎(chǔ)上,進一步聚焦于特定漢字。例如,以“酒”字為例,我們可以從詩集中篩選出所有包含“酒”字的詩篇,并分析這些詩中還出現(xiàn)了哪些其他字詞。通過這種方式,我們便可進一步探究“酒”在該詩人作品中的意義與象征。順帶一提,只需向生成式AI發(fā)出指令,便可快速匯總出所有含有“酒”字的詩篇。當(dāng)然,也可以利用傳統(tǒng)計算機的搜索功能,對結(jié)果進行核對與確認(rèn),以確保其準(zhǔn)確性。
就這樣,我從杜甫描寫“酒”的詩中提取了相關(guān)詞匯,整理成了“表二”。這些詞匯按詞性分類,這是KH-coder軟件所具備的功能之一。本表中也包含了兩個字以上的詞組。每個詞語旁邊的數(shù)字表示該詞在詩中出現(xiàn)的次數(shù)。
在這些與“酒”相關(guān)的詩作中,可以看到如“成都”“蜀”這樣的地名,也能發(fā)現(xiàn)如“草堂”這樣的常見名詞,這對于《杜甫研究學(xué)刊》而言可能是有價值的信息。不過更引人注意的是,“晚”字作為名詞或形容詞共出現(xiàn)了21次,“老”字則有13次之多。這一用字趨勢正體現(xiàn)了杜甫詩風(fēng)的特點。正如前文所述,“老”字在杜甫全詩中使用頻率也顯著高于其他詩人,而即便是在描寫飲酒的詩中,這種傾向依舊保持不變。
隨后,我又嘗試分析了李白詩中描寫“酒”的作品,并整理成“表三”。巧合的是,李白與杜甫在“酒”字的使用次數(shù)上均為61次,這使得兩者之間的比較更具可比性。通過比較不難發(fā)現(xiàn),正如前表所示,李白詩中“月”字的使用頻率極高,而在這些描寫酒的詩中,“月”與“明月”合計出現(xiàn)的次數(shù)高達46次,依然居于高位。
至于接下來的分析部分,正是其中最有趣之處,不過我想將其留給各位讀者自行體會。通過對這些表格的瀏覽、聯(lián)想與思考,從中把握其用詞與風(fēng)格的傾向,再重新回到詩作本身進行賞析,也許會是一種別有風(fēng)味的樂趣。
四、技術(shù)與人文學(xué)的交匯點:AI應(yīng)用的未來展望
綜上所述,本文嘗試?yán)帽蛔u為“人類新工具”的生成式人工智能技術(shù),探討像我們這樣的人文學(xué)者可以如何加以活用。作為從事人文學(xué)研究的人,我們肩負(fù)著理解人類活動、滋養(yǎng)人類精神的責(zé)任。本文所提出的構(gòu)想,也正是我作為一位研究者在這一背景下的一個實踐嘗試。如文中多次所述,本稿并非旨在確立某種研究定論,而是一種以創(chuàng)意為導(dǎo)向的探索,也希望為學(xué)習(xí)與欣賞唐詩者提供一種新穎的視角。當(dāng)然,本文所使用的數(shù)據(jù)尚未經(jīng)過嚴(yán)格的文本???,若要將其提升為可靠的研究資料,仍需進一步的分析與驗證。但就欣賞唐詩的角度而言,我相信這已是一份頗具參考價值的素材。采用這種方法,甚至還可以分析某位詩人隨年齡增長而在詩作中產(chǎn)生的變化,或者聚焦某一主題,對不同詩人間的完成度進行比較等。雖然筆者在正文中并未詳細(xì)論述,但出于個人興趣,曾嘗試將杜甫描寫飲食的詩作按年代進行分類,結(jié)果顯示出某種程度上的風(fēng)格差異,頗為引人人勝。本文原為紀(jì)念項楚先生而寫,但愿這種新興技術(shù)所帶來的研究方法,能讓人們重新思考人文學(xué)科的樂趣、其作為精神滋養(yǎng)之源的重要性,這些方法蘊含了未來研究的無限可能。
責(zé)任編輯 賈兵
Professor Xiang Chu,Tang Poetry, and Generative Artificial Intelligence: Remembrance and Experimental Analysis,an Attempt to Connect the Past and Futureof Literature
ARAMI HIROSHI
Abstract:This paper honors the late scholar Professor Xiang Chu and,inspired by his scholarlyspirit,explores the themes of“travel”and“wine”in Tang poetry.It further experimentswithgenerative artificial intelligence(Generative AI)asa researchtool. Through text-mining methods,the author conducts statistical analyses of“wine”poems by DuFu and Li Bai in the Complete Tang Poems,illustrating eachpoet’slexical preferencesand stylisticdifferences,and exploresthepotential applicationsofAI technology in humanities research.This paper serves both as a tribute to Professor Xiang Chu’sacademic legacy and as an initial experiment in merging modern technology with traditional literature,oering new perspectives and methods for future studies of classical Chinese literature.
Key Words: Generative AI; Tang poetry text mining;“wine” poems by Du Fu and Li Bai