摘" "要:數字人文為人文研究資料的處理提供了新方法,但在具體實踐中卻存在重數據分析、輕問題論證與解釋的現象,無法有效融入傳統(tǒng)人文研究框架。在循證視角下,文章梳理人文研究循證過程,構建SMCI模型描述人文研究問題,從證據檢索、證據質量評價、證據綜合三個層面開展問題驅動的數字人文循證決策。以南京大屠殺為例,從證據利用檢索出發(fā)梳理人文研究問題描述中的證據檢索、證據質量評價特征及證據綜合的具體路徑;從證據制作檢索出發(fā)梳理人文研究問題論證中資料的差異性特征,分析二手證據與問題論證的相關性,并依據論證需求制作一手證據。結果表明,循證視角下的數字人文循證路徑,為數字人文開展研究問題有譜系、研究證據有來源、研究結果可解釋的數據分析提供理論基礎,問題驅動的數字人文循證決策的開展需依據循證范式重構人文研究資料。
關鍵詞:循證決策;數字人文循證;問題驅動;南京大屠殺
中圖分類號:G252" "文獻標識碼:A" "DOI:10.11968/tsyqb.1003-6938.2025008
Exploration of the Practice Path of Digital Humanities from an Evidence-Based Perspective
Abstract Digital humanities provide new methods for the processing of humanities research materials, but in specific practice, there is a phenomenon of overemphasizing data analysis and neglecting problem argumentation and explanation, making it difficult to effectively integrate into the traditional framework of humanities research. From an evidence-based perspective, this paper sorts out the evidence-based process of humanities research, constructs the SMCI model to describe humanities research problems, and carries out problem-driven digital humanities evidence-based decision-making from three levels: evidence retrieval, evidence quality evaluation, and evidence synthesis. Taking the Nanjing Massacre as an example, this paper sorts out the specific paths of evidence retrieval, evidence quality evaluation characteristics, and evidence integration in the description of humanistic research problems from the perspective of evidence utilization retrieval; sorts out the differential characteristics of materials in the argumentation of humanistic research problems from the perspective of evidence creation retrieval, analyzes the relevance between secondary evidence and problem argumentation, and creates primary evidence according to the needs of argumentation. The results show that the evidence-based approach to digital humanities provides a theoretical basis for data analysis with a genealogy of research questions, a source of research evidence, and explainable research results. The implementation of problem-driven digital humanities evidence-based decision-making requires the reconstruction of humanities research materials based on the evidence-based paradigm.
Key words evidence-based decision-making; digital humanities evidence-based; problem-driven; The Nanjing Massacre
數字人文將數字技術應用于人文研究中,重點關注人文研究資料的語義檢索、動態(tài)展示與量化分析[1]。具體到數字人文實踐層面,作為數字人文領域具體項目、技術工具或方法的實施,其數據分析結果在輔助人文學者對具體領域的主體性理解與解釋上卻力有未逮[2]。以CBDB項目為例,2024年CBDB訪問學者的匯報重點在于以數字技術為主的人文研究資料內容提取與格式化表示,識別人物關系并構建群體網絡,在人文研究問題層面則重點說明數據集及其分析在人文研究中的潛力[3],并未分析數字人文實踐如何釋放其潛力,也未給出數字人文實踐介入人文研究問題提出與論證的有效路徑[4]。
循證實踐(Evidence-Based Practice)最早起源于循證醫(yī)學,強調決策應建立在研究證據上,應以研究問題為核心分析研究資料[5]。隨著時間發(fā)展,已有循證社會科學統(tǒng)計[6]、循證教育學[7]、循證衛(wèi)生決策[8]、循證信息貧困[9]、法循證學[10]等不同學科領域的循證實踐,呈現了循證社會科學這一以證據的生產、轉化和利用為核心的醫(yī)文工交叉學科的內在屬性[11]。具體到人文研究領域,已有的檔案循證[12]、古籍循證[13]相關實踐重點關注研究資料溯源,卻忽略了在具體應用層面人文研究問題的提出與研究結果的解釋[14],并未有效輔助人文研究中的問題提出、資料收集和證據分析[15]。
為提升數字人文研究的嚴謹性、透明性和可靠性,促進數字人文實踐更好地融入傳統(tǒng)人文學科的研究框架,確保數字人文實踐不僅僅是數據的分析與展示,更可生成可靠證據參與到人文研究問題提出與論證中。本文引入循證思想,首先從研究問題、研究資料、研究證據三個層面梳理人文研究循證過程;其次構建人文研究問題描述模型,從證據檢索、證據質量評價與證據綜合三個層面開展問題驅動的數字人文循證決策;最后以南京大屠殺為例,從證據利用檢索、證據制作檢索出發(fā)開展人文研究問題的描述與論證。
1" "問題驅動的數字人文循證決策
循證決策遵循相對固定的實施步驟:問題描述、證據檢索、證據評價、最佳證據實踐、實踐效果評估[16],強調在決策過程中充分利用現有數據和證據,通過科學分析和評估,以事實為依據,提高決策準確性和有效性[17]。目前數字人文的循證決策研究主要聚焦于人文研究證據檢索與評價在技術上的可行性,如夏翠娟等面向循證實踐設計中文古籍數據模型,實現多來源古籍書目的細粒度語義檢索[13];黎安潤澤等基于循證思維構建檔案文獻遺產數據故事化模型,側重溯源可信數據的多元互證[12];尚宏利等梳理循證數字人文證據整合基本框架,提出多元互證的實踐路向,聚焦于原始文獻資料的獲取和加工分類[18]??傮w上看,數字人文證據以人文研究資料為基礎,通過數字技術產生了嵌入人文研究決策過程的潛力。
在循證決策過程中,人文學者通過歸納總結人文現象形成理論,以實踐演繹驗證理論,反饋新的研究問題并不斷迭代[19]。與循證醫(yī)學不同的是,人文研究問題并沒有疾病那么直觀,其研究過程的循證邏輯并不明確。因此,本文以開展問題驅動的數字人文循證決策為目標,在循證視角下梳理人文研究循證過程,構建人文研究問題描述模型,明確數字人文循證決策流程。
1.1" " 人文研究循證過程梳理
人文研究循證過程中,研究問題與研究證據之間相互牽制、相互依存[20]。研究證據是研究問題提出與論證過程中被用來證明研究觀點的研究資料[21]。其中“證詞”作為一種特殊的證據,是被人文學者應用于支撐自身觀點的陳述[20]。人文研究中可以作為研究證據的研究資料范圍是不斷變化的,從“二重證據法”運用“紙上之材料”與“地下之新材料”到“四重證據法”運用傳世文獻(古籍)、出土文獻(金石學)、比較材料、實物及圖像等[22]。多重證據法為人文研究問題的提出與論證提供了新材料、新思路,主要表現為對現有研究資料的懷疑、對研究資料矛盾部分的分析、對無研究資料支撐觀點的推測[23](梳理研究問題、研究資料、研究證據各人文研究循證組件關系見圖1)。
如圖1所示,人文研究循證過程以研究資料為核心開展研究問題的提出與論證,在問題論證過程中則分析研究資料,形成研究證據。其中研究資料包含學術型與非學術型兩部分,人文研究學者歸納非學術型資料形成學術型資料,學術型資料則是學者根據學術理解對非學術型資料的演繹。在人文研究學者的演繹與歸納過程中,學者對研究資料產生疑問形成研究問題,分為不信資料、資料矛盾、未有資料三類。研究證據產生于學者對研究問題的論證,根據來源的不同區(qū)分為證詞與證據兩個類別,其中證詞是特殊的證據,證詞的使用需要學者追本溯源。
總結而言,人文研究循證過程聚焦于研究問題、研究資料、研究證據三個層面,在研究過程中學者需要分析大量的研究資料,發(fā)現研究問題,并將研究資料轉化為能解答研究問題的研究證據。
1.2" " 人文研究問題描述模型構建
循證醫(yī)學中臨床問題的構建參照PICO模型為證據的生成提供基礎[24]。以最佳證據實踐為目標,本文提出SMCI模型,梳理并構建人文研究問題,其中S(Subject/Scope)指研究主題與范圍,對應解答域預設;M(Materials)指研究資料,對應研究對象;C(Clues)指研究線索,對應問題指向;I(Idea/Interpretation)指研究觀點與解釋,對應疑問項[25]。以實例《小說中的南京大屠殺民族國家觀念表達》[26]一文為例,其研究問題可描述為:
(1)研究主題與范圍S為人文研究問題的提出與論證設定界限,指導人文研究中資料的檢索范圍,為疑問的發(fā)現指明方向。上述實例中“南京大屠殺”作為解答域預設,就天然為學者指明了中國、日本、國際三方視角資料的檢索方向,同時預設了三方在書寫研究資料中的不同立場,為學者的主觀辨析提供基礎。
(2)研究資料M則將學者從抽象的研究主題引向具體的研究對象上,輔助學者理解研究對象的背景信息,開展以研究資料為中心的人文研究。上述實例中“小說”作為研究對象,進一步明確了研究資料的體裁以及與該體裁相關的作者及其創(chuàng)作背景信息,在此基礎上,學者依據研究資料特征開展進一步的梳理。
(3)研究線索C則聚焦于研究資料中可能指向研究問題的具體內容。它進一步細化了研究問題的論證范圍,指明了學者處理研究資料的方向,縮小了可成為研究證據的研究資料范圍。如“民族國家觀念”,定位了研究資料中能體現三方話語立場的內容部分,以研究線索為依據,學者比對研究資料內容,發(fā)現內容表述中不一致的地方。
(4)研究觀點與解釋I則反映了學者面向同一研究對象時在理解與解釋上的差異性,說明了學者問題論證的方式。在上述實例中學者關注南京大屠殺小說中民族國家觀念的“表達形式”,另有研究則聚焦于南京大屠殺小說中集體記憶“如何被重構”[27]。
由此,SMCI模型梳理了人文研究問題描述的具體內容及其作用,為數字人文循證決策的開展提供依據。
1.3" " 數字人文循證決策流程
數字人文循證決策過程中學者遵循DIKW信息鏈對人文研究資料開展考據,其中產生的“知識增量”為數字人文證據[28]。人文研究資料考據過程包括三步:(1)證據檢索:開展資料和證據的搜集、鑒定與分析;(2)證據質量評價:運用邏輯推理方法,判定事件、材料的真?zhèn)闻c是非;(3)證據綜合:推求和印證某一現象與結論[29](數字人文循證決策參照人文研究問題模型開展最佳證據實踐見圖2)。
如圖2所示,以SMCI模型為基礎,數字人文循證決策在證據檢索、證據質量評價、證據綜合三個階段遵循DIKW信息鏈邏輯產生知識增量。其中證據檢索關注研究資料的全面搜集并篩選出與研究主題與范圍相關的記錄;證據質量評價包括研究資料產生的合理程度及內容的規(guī)范程度,并在其中發(fā)現有意義的研究線索;證據綜合則將各來源信息匯集呈現證據總體情況,生成決策方案解釋研究觀點,開展最佳決策實踐。
最佳證據實踐是不斷循環(huán)的過程,其中證據檢索可分為證據利用檢索與證據制作檢索兩大類,證據利用檢索更關注如何檢索到當前最佳證據以指導管理決策,證據制作檢索則更關注在信息來源、檢索策略、檢索方式等方面的證據檢索區(qū)別。前者偏向于學術型研究資料檢索聚焦于人文研究問題描述,后者則偏向非學術型研究資料檢索聚焦于人文研究問題論證[11]。
2" "南京大屠殺人文研究問題描述
南京大屠殺作為解答域預設為研究對象、問題指向、疑問項的確定提供了一個大的范圍,但要形成有價值、可論證的人文研究問題仍需以SMCI模型為基礎不斷開展循證決策,縮小研究主題與范圍?;诖吮疚膹淖C據利用檢索出發(fā)開展數字人文循證。
2.1" " 證據利用檢索
本文以中國知網為學術型研究證據來源,于2024年12月25日以“南京大屠殺”為主題開展資料檢索并進行計量可視化分析(見圖3)。
如圖3所示,總體趨勢分析呈現了檢索結果數量為2802篇,并給出了其在不同年份上的演變。從時間分布上看,學術論文包含6個發(fā)表峰值:1995年(162篇)、2000年(141篇)、2005年(137篇)、2009年(123篇)、2012年(114篇)、2015年(218篇),這些年份分別為世界反法西斯戰(zhàn)爭和中國抗日戰(zhàn)爭勝利50、60、70周年,紀念南京大屠殺同胞遇難60、70、80周年,表明南京大屠殺研究有較強的周期性,其重點在于紀念。
中國作者分布則呈現了不同作者的發(fā)文量從高到低依次排列,為后續(xù)證據質量評價提供參考,另主題分布、學科分布在一定程度上反映了檢索結果即南京大屠殺歷史研究的偏向性。
2.2" " 證據質量評價
證據質量評價除從總體分析外,本文另以虛線框圖標識質量分級特征、實線框圖標識內容效度,以論文檢索條目列表及論文詳情頁為例,對學術論文質量評價特征進行梳理(見圖4)。
如圖4所示,學術論文的質量分級特征如創(chuàng)作者、人物描述、出版來源、被引情況等影響不同研究資料的證據推薦強度。學術論文的內容效度如事件描述、主題結構則為人文研究問題的描述以及證據與問題的相關性提供參考。
2.3" " 證據綜合
2.3.1" "證據的定量分析
在證據質量評價的基礎上,本文綜合考慮期刊論文的影響力以及內容的相關性,以在CSSCI期刊上發(fā)表,且標題中含有“南京大屠殺”為納排標準篩選出論文共309篇,以定量方法對研究論文的關鍵詞與摘要進行主題分析(見圖5)。
如圖5所示,通過詞云及關鍵詞樹的形式,將大量文字材料轉化為圖,輔助人文研究學者直觀快速了解領域研究重點,其中詞云圖表明南京大屠殺現階段研究重點在于對歷史記憶、創(chuàng)傷記憶、遇難者、難民、日軍暴行、安全區(qū)等層面的探討。關鍵詞樹進一步縮小研究范圍,給出與人相關的日本軍隊、市民、人口變化;與地點相關的南京、南京市區(qū)域、難民收容所、安全區(qū);與事件相關的南京大屠殺,事件;與物相關的日本軍國主義、文化、“審判戰(zhàn)犯軍事法庭”等相關研究線索。
綜合詞云圖中的南京大屠殺、歷史記憶,以及關鍵詞樹中給出的市民、安全區(qū)、難民收容所等研究線索,本文進一步將研究主題與范圍縮小到“南京大屠殺”名稱的界定與時空內涵的梳理。
2.3.2" "證據的定性分析
以“南京大屠殺”名稱的界定與時空內涵的梳理為目標,梳理論文中不同研究觀點(見圖6)。
結果顯示,論文觀點綜合結果呈現為不同研究資料內容中持續(xù)時間、區(qū)域范圍等方面的沖突以及因未有資料與不信資料而產生的疑問。
(1)資料沖突
在名稱界定上,中國方面在早期以“南京大屠殺事件”為名稱,其不僅指侵華日軍在南京的屠殺暴行,而且包括侵華日軍在南京所犯的強奸、搶劫、焚燒破壞等方面的暴行,或簡稱為“殺、燒、淫、掠”[30]?,F階段“南京大屠殺”成為特定專有名詞被中國學術界使用,日本肯定派以等同于“南京大屠殺”的“南京大虐殺”或“南京虐殺”為名稱,日本虛構派則以“南京事件”弱化“大屠殺”事件的性質,西方學術界則普遍使用“Nanjing Massacre”,其他相關表述為“The Rape of Nanking”“Nanjing Atrocity”“Nanjing Accident”[31]。
在時空層面,有1937年12月13日至1938年6月論,將南京大屠殺事件范圍延伸到上海附近,將時間框定為從上海附近開始到南京被攻陷后的掃蕩戰(zhàn)為止。陳安吉支持遠東國際軍事法庭的界定,認為南京大屠殺時間為1937年12月13日至1938年1月,遠東國際軍事法庭證詞也指出,至1938年2月,日軍的暴行雖然仍在繼續(xù),但已不再具有大規(guī)模的特點[30]。隨著研究深入,中國學者認為南京大屠殺的上限時間為1937年12月上旬,下限時間應為1938年3月,在空間上則以12個行政區(qū)為基礎,可外延至與市區(qū)相鄰的江寧、江浦與六合;日本肯定派認為南京大屠殺時間上限為12月4日,下限為1938年3月28日,地域上應包括南京特別市行政區(qū)域及其周邊6個縣(江浦、六合、江寧、句容、溧水、高淳);日本虛構派由于不承認南京大屠殺,很少明確大屠殺的時間概念,在空間上僅將“南京”概念限定于南京城內,并與南京安全區(qū)混淆[31]。
(2)未有資料與不信資料
在對南京大屠殺歷史記憶的探討中,劉燕軍引用遠東國際軍事法庭中國檢察官顧問向哲浚的開庭詞來說明南京大屠殺在審判后象征意味凸顯,其證詞中提到“暴力事件的持續(xù)強度”,但并未有更進一步的解釋說明[32],原文如下:
1946年6月,遠東國際軍事法庭中國檢察官顧問向哲浚在法庭的開庭詞中指出:針對平民的謀殺和大屠殺、酷刑、強奸、搶劫、搶奪和肆意地摧毀財產等是“日本戰(zhàn)爭行為的模式”?!叭毡拒婈犓傅倪@些反人類罪行發(fā)生在其所占領的中國的每個省份,時間在1937年-1945年。這些行為的一個突出例證是發(fā)生在1937年12月13日南京陷落后。在中國軍隊方面的所有抵抗都已經停止,而且城市已經完全由被告松井石根將軍指揮的軍隊所控制后,暴力和犯罪開始發(fā)生并逐漸減弱地持續(xù)了40天?!保?2]
總結而言,在南京大屠殺人文研究問題描述中,數字人文循證首先從證據利用檢索出發(fā),以中國知網為學術型證據來源,以“南京大屠殺”為主題進行證據檢索;其次,以檢索結果的總體計量可視化分析特征、論文條目信息、論文詳情頁信息為依據開展證據質量評價輔助證據篩選;最后,以CSSCI發(fā)表且標題中含“南京大屠殺”為納排標準進行論文篩選,并通過定量分析、定性分析的方式從詞云圖、關鍵詞樹形圖到具體論文觀點分析綜合確定南京大屠殺時空內涵仍需開展進一步的梳理,整個數字人文循證過程中產生的研究線索則為后續(xù)梳理南京大屠殺時空內容所需的證據制作檢索提供依據。
3" "南京大屠殺時空內涵數字人文循證實踐
3.1" " 證據制作檢索
人文研究問題描述為南京大屠殺時空內涵開展數字人文循證實踐提供了持續(xù)時間、區(qū)域范圍、暴力事件類別、事件變化程度等研究線索。從證據制作檢索出發(fā)需從專業(yè)數據庫以及網絡資源進行檢索。
(1)專業(yè)數據庫檢索
抗日戰(zhàn)爭與近代中日關系文獻數據平臺由中國社會科學院、中國歷史研究院、國家圖書館及國家檔案局牽頭創(chuàng)建,近代史所承辦。旨在打造涵蓋海內外抗戰(zhàn)和近代中日關系的文獻共享和學術交流平臺。本文在抗日戰(zhàn)爭與近代中日關系文獻數據平臺以“南京大屠殺”為關鍵詞展開檢索(見圖7)。
結果共檢索到295本圖書,9本報刊,1個視頻,綜合而言,南京大屠殺文獻數據主要以圖書為主,包含南京大屠殺史料集共72冊。接著以“安全區(qū)”為關鍵詞在抗日戰(zhàn)爭與近代中日關系文獻數據平臺中檢索出《南京大屠殺史料集(12)英美文書、安全區(qū)文書、自治委員會文書》,進一步對南京大屠殺史料集進行梳理,發(fā)現南京大屠殺史料集(48-55)共有8本南京大屠殺遇難同胞名錄。
(2)網絡資源檢索
本文以日本士兵、安全區(qū)、暴行為關鍵詞檢索,并對第一條“南京南京”的檢索資源進行可視化分析(結果見圖8)。
開展進一步溯源,發(fā)現其實為2021年中國數字人文開放數據創(chuàng)新研究大賽里《拉貝日記》中《日本士兵在南京安全區(qū)的暴行》文件文本挖掘處理這一賽題的成果之一。
3.2" " 證據質量評價
與學術型研究資料不同,非學術型研究資料并沒有一個涵蓋多類別的統(tǒng)一平臺,因此針對其的證據質量評價則需根據具體檢索信息進行判斷。以文獻數據檢索結果中出版時間最早的記錄為例開展質量評價(見圖9)可知,具體文獻信息中責任者項缺失,另溯源到原文的發(fā)行時間為1946年1月,與文獻信息中的出版時間一致,表明該平臺文獻信息的準確性以及掃描文件對原書籍的還原度較高。
進一步評價南京大屠殺史料集(48-55)共有8本南京大屠殺遇難同胞名錄。該專題所收錄遇難者名錄,系指南京大屠殺期間,在南京城區(qū)和近郊遭日軍以各種方式直接或間接殺害的無辜平民與放下武器的軍人,以卡片的形式記錄遇難者信息,不僅標明了遇難者姓名、遇難難者概況(性別、年齡、籍貫、住所、職業(yè)等)、遇難情形(被害時間、地點,方式),而且羅列了調查者、陳述人、具呈人、填報者、口述者、證人等的姓名、職業(yè)、住址、與遇難者的關系等,給出資料來源,增強了信息的可信度,另同一姓名的不同卡片信息,都羅列到該名之下,以檔案保存資料原貌的原則一一收錄,在使用過程中需有所甄別。以虛線框圖標識質量分級特征、實線框圖標識內容效度,以書籍封面頁及內容頁為例,對南京大屠殺遇難者同胞名錄質量評價特征進行梳理(見圖10)。
結果發(fā)現,史料集的質量分級特征如責任者、出版來源增強了研究資料作為證據的可信度。史料集的內容效度如人物描述、時間錨點、地點記載、事件類別則為南京大屠殺時空內涵的循證開展提供數據基礎,證人或口述者與遇難者關系體現了人物情況、資料來源,給出卡片數據的來源資料名稱,進一步增強人、地、時、事的可信度。
另外,網絡資源中2021年中國數字人文開放數據創(chuàng)新研究大賽以南京大學為主辦方,依托和鯨社區(qū),體現了其存在較高的證據推薦強度,《日本士兵在南京安全區(qū)的暴行》這一文本挖掘則表明:其內容與南京大屠殺時空內涵的高契合度,其分析過程所用代碼及結果可在和鯨社區(qū)直接查看,提高了其內容的可信程度。
3.3" " 證據綜合
3.3.1" "二手證據分析
《拉貝日記》中《日本士兵在南京安全區(qū)的暴行》文件文本挖掘處理這一賽題的成果以項目、網頁、論文等形式出現,其中持續(xù)時間主要以趨勢圖呈現,支持南京大屠殺在持續(xù)時間上表現為52天以至更長這一結論,反駁了遠東國際軍事法庭證詞中對至1938年2月日軍暴行已不具大規(guī)模特點的描述。在暴力事件類別上,根據分析者不同,產生了不同的事件分類體系,但基本在“殺、燒、淫、掠”外還挖掘出“闖入、破壞、強迫、傷害、搜查、偷竊、救助、逃脫”等新的事件類別。在持續(xù)強度層面,明確存在1937年12月15日-22日與1938年1月28日-2月3日兩個暴行事件高發(fā)期,反駁了中國檢察官顧問向哲浚對暴行開始發(fā)生并逐漸減弱地持續(xù)了40天的論述。
二手證據為南京大屠殺時空內涵的梳理提供了證據支撐,但囿于文本量的限制,其代表性及說服力仍有欠缺,本文出于拓展數據量這一需求開展進一步的證據制作。
3.3.2" "一手證據制作
本文綜合抗日戰(zhàn)爭與近代中日關系文獻數據平臺檢索結果,依據出版來源、證據完整度、內容符合程度為納排標準,篩選出8本遇難者同胞名錄開展一手證據制作。對8本遇難者同胞名錄進行數據提取,刪除掉1937年8月至12月間,因日軍空襲南京造成的遇難者數據,共獲得10410條數據,相較于《拉貝日記》中的426條數據[33],為南京大屠殺時空內涵的梳理提供更有說服力的證據。
對數據進行描述型統(tǒng)計,其中性別填寫為男、女或不詳,共有10410條數據,其他由于卡片中部分數據為空,共獲得年齡數據4853條,職業(yè)數據4167條,被害時間10039條,被害地點8402條,被害方式10266條。以該數據集為基礎開展證據的定量分析,對現有南京大屠殺時空內涵相關觀點進行補充解釋(見圖11)。
可以看出,證據的定量分析以實體統(tǒng)計可視化的形式,對南京大屠殺的區(qū)域范圍、持續(xù)時間與事件類別,給出了對應的補充解釋:在區(qū)域范圍層面,支持日本肯定派學者將范圍擴大到六地的觀點;在持續(xù)時間層面,為中國學者的12月上旬以及日本肯定派的12月4日提供數據支撐,佐證了南京大屠殺持續(xù)時間應該提前的觀點;在事件類別層面,發(fā)現了失蹤、被逼自殺等隱藏在大屠殺敘事下的微觀敘事,為后續(xù)南京大屠殺時空內涵的探討提供新的證據。在對現有研究觀點補充解釋的同時,以遇難同胞的性別、年齡、職業(yè)等為研究線索可制作新的證據,為后續(xù)研究提供新的研究線索(見圖12)。
如圖12所示,遇難同胞的性別、年齡、職業(yè)各有不同,而在這不同后面則是一個個鮮活的個體,新證據可為開展不同個體視角下的南京大屠殺微觀敘事提供研究線索。綜合圖11、12,遇難者同胞名錄數據進一步豐富了南京大屠殺時空內涵,被害者的個人情況、遇難情況不僅呈現了南京大屠殺在數量上的多,更體現了遇難同胞生死轉瞬的極端生活狀態(tài)。
4" "可行數字人文循證路徑構建
4.1" " 構建研究問題有譜系的循證研究
人文研究問題以人文研究為載體,在人文知識體系中并不是孤立的,而是圍繞一個或一組主題,相互聯系并具有一定結構和關系的問題網絡[25]。研究問題譜系的梳理為數字人文循證框定研究主題與范圍,為后續(xù)的證據檢索、質量評價與證據綜合提供相應的標準,提供該研究問題的學術話語體系,為數字人文循證與人文研究問題的對話提供中介。
以南京大屠殺為例,對其學術史梳理可發(fā)現其遵循歷史挖掘-歷史傳播-歷史記憶的研究鏈路。在日本方面“虛構”論、“微不足道”論背景下[34],國內對南京大屠殺史料的收集工作雖取得階段性成果,但學術層面上對史料資源的挖掘與利用卻稍顯不足,存在泛化、偽化、簡化等問題[35]。在人類命運共同體背景下,南京大屠殺研究應超越創(chuàng)傷記憶,從“批判罪惡”擴展為“倡導和平”[36]。但超越仍需以史實細節(jié)為前提,《南京大屠殺》電影虛構一個中日一體的家庭來支撐影片的劇作結構,囿于人道主義,并未再現歷史資料中的史實細節(jié),沒有呈現符合中國人民記憶的歷史再現[37]。在傳播層面,很多人仍處于“雖有所知,語焉不詳”的狀態(tài),并未形成對這段歷史的整體認知[38]。
研究問題譜系的梳理,可明確宏觀的歷史概況與人物微觀敘事在歷史挖掘及后續(xù)和平記憶的構建方面中同等重要,可引導不同學科背景的學者從數據定量分析到定性分析的靈活轉變,將數字人文循證與人文研究關聯起來。
4.2" " 構建研究證據有來源的循證研究
人文研究中,研究證據與研究問題相互牽制、相互依存,學者不僅要有提出問題的能力,同時也需設計證據檢索、證據質量評價與證據綜合的標準與具體路徑,通過個人主觀開展證據的篩選,并將證據組織到解決問題的過程中[20]。然而證據從檢索到綜合的整個路徑是不透明的,其研究結果不可復制,作為輔助功能的數字人文也就無從插手。
以人文研究問題描述模型為基礎,從問題的提出開始,即將其整個證據檢索與綜合路徑進行呈現,可輔助人文學者判斷該問題提出的合理性,與領域知識體系的契合度以及其所產生知識增量的創(chuàng)新度。將數字人文從單純的數據處理轉換為問題驅動的循證過程,為最終數字人文循證結果嵌入人文領域知識體系提供基礎。
以南京大屠殺為例,本文從證據利用檢索與證據制作檢索入手,分別完成了人文研究問題的提出與論證,呈現證據檢索、證據質量評價、證據綜合的具體流程與細節(jié)。最后形成的證據包含定量分析與定性分析兩部分,其中定量分析可復現可重用,定性分析有依據有來源。后續(xù)人文學者既可有的放矢地對定性分析結果進行批判,也可將定量分析結果作為證據的一種,納入其他論證體系中。
4.3" " 構建研究結果可解釋的循證研究
數字人文與人文研究的沖突關鍵在于,數據實體定量分析與研究對象主觀闡釋之間的割裂。這也是諸多人文學者無從下手數字人文研究的癥結所在,即為什么這么處理資料,資料處理后的用處是什么?
要回答這兩個問題仍需從人文研究問題描述模型出發(fā),將證據來源、證據檢索、證據質量評價、證據綜合與研究主題與范圍框定、研究資料篩選、研究線索發(fā)現、研究觀點與解釋一一對應。梳理人、地、時、事、物在不同研究資料、不同部分的不同內涵,從數據內涵出發(fā),分析其在問題提出、意義闡釋中的作用[39]。
以南京大屠殺為例,在證據檢索部分,證據來源信息、檢索策略信息呈現了學者的檢索偏向;在證據質量評價部分,從質量分級與內容效度兩個層面出發(fā)構建證據納排標準并給出具體依據,說明了學者在證據篩選上的能力;在證據綜合部分,定量分析與定性分析結合,其中具體數據的涵義明確了該證據在論證研究問題的粒度與深度。通過數字人文循證呈現學者處理研究資料的原因、研究資料的處理流程、研究證據的轉化過程。將數字人文結果從簡單的圖表展示轉換為復雜的邏輯過程,可提高研究結果的可解釋性。
5" "結語
數字人文如何提出、論證與解釋人文研究問題,是數字人文融入人文傳統(tǒng)研究框架的關鍵。本文從循證視角出發(fā),基于現階段數字人文實踐重研究證據分析,輕研究問題提出與研究結果解釋的現狀,構建問題驅動的數字人文循證實踐路徑。
本文首先基于循證思想,分析人文研究中研究問題、研究資料、研究證據各循證組件間關系,明確人文研究循證過程。進一步以最佳證據實踐為目標,構建SMCI模型從研究主題與范圍、研究資料、研究線索、研究觀點與解釋四個層面描述人文研究問題。接著,以DIKW信息鏈為基礎,從證據檢索、證據質量評價、證據綜合三個層面梳理數字人文循證決策流程,將其中產生的知識增量定義為數字人文證據。在實證環(huán)節(jié),以南京大屠殺為例,從證據利用檢索與證據制作檢索出發(fā)開展人文研究問題的描述與論證,通過完整呈現證據來源、檢索策略、質量分級特征、內容效度、定量分析和定性分析中的數據內涵與處理邏輯,開展了研究問題有譜系、研究證據有來源、研究結果可解釋的數字人文循證決策。
數字人文循證實踐路徑基于現有循證的規(guī)范體系,將數字人文的數據實體定量分析與人文研究的研究對象主觀闡釋關聯起來,將數字人文結果融入人文領域的知識話語體系,輔助人文學者開展從證據檢索到證據綜合的全流程批判以及部分成果的復現與重用。然而,本文雖驗證了數字人文循證實踐路徑在支撐人文研究決策層面的價值,但要充分發(fā)揮其潛力,使其成為人文研究多重證據的一種,仍需對數字人文證據開展進一步分類與適用性評估,提高其可信度。
參考文獻:
[1]" 梁晨.量化數據庫:“數字人文”推動歷史研究之關鍵[J].江海學刊,2017(2):162-164,239.
[2]" 成一農.拋棄人性的歷史學沒有存在價值——“大數據”“數字人文”以及歷史地理信息系統(tǒng)在歷史研究中的價值[J].清華大學學報(哲學社會科學版),2021,36(1):181-190,206.
[3]" Presentations of CBDB Visiting Scholars(2023-2024)[EB/OL].[2024-11-13].https://projects.iq.harvard.edu/cbdb/presentation-cbdb-visiting-scholars-2024-2025.
[4]" 潘雨亭,柯平.我國人文學科數字人文研究的全景解析與思考[J].圖書情報工作,2024,68(15):128-140.
[5]" Sackett D L,Straus S E,Richardson W S,et al.Evidence-based medicine:how to practice and teach EBM[M].2nd ed.Edinburgh amp; New York:Churchill Livingstone,2000:10-52.
[6] 楊克虎,尚宏利,周文杰.循證社會科學的統(tǒng)計基礎[M].北京: 科學出版社,2024.
[7] 楊克虎,郭麗萍.循證教育學研究方法與實踐[M].北京: 科學出版社,2023.
[8] 楊克虎,李秀霞.循證衛(wèi)生決策研究方法與實踐[M].北京: 科學出版社,2023.
[9] 周文杰,尚宏利,魏志鵬.循證信息貧困研究:回歸分析[M].北京: 科學出版社,2024.
[10]" 劉光華.法循證學理論與實踐[M].北京: 科學出版社,2024.
[11]" 楊克虎,沙勇忠,魏志鵬.循證社會科學總論[M].北京: 科學出版社,2024.
[12]" 黎安潤澤,牛力,謝震香.基于循證思維的檔案文獻遺產數據故事化模型構建研究[J].情報理論與實踐,2024,47(10): 151-163.
[13]" 夏翠娟,林海青,劉煒.面向循證實踐的中文古籍數據模型研究與設計[J].中國圖書館學報,2017,43(6):16-34.
[14]" 張濤.論歷史證據與史料的認識關系[J].歷史教學問題,2019(6):131-136,189.
[15]" 倪小佳,陳耀龍,蔡業(yè)峰.中西醫(yī)結合腦卒中循證實踐指南(2019)[J].中國循證醫(yī)學雜志,2020,20(8):901-912.
[16]" 楊文登.循證實踐:一種新的實踐形態(tài)?[J].自然辯證法研究,2010,26(4):106-110.
[17]" 楊克虎,郭麗萍,蔡立群.證據驅動的循證決策國際進展、趨勢與展望[J].圖書與情報,2024(2):102-108.
[18]" 尚宏利,張思潔,魏志鵬,等.循證數字人文證據整合的基本框架與具體流程研究[J].農業(yè)圖書情報學報,2022,34(11):38-47.
[19]" 趙晨,田貴華,張曉雨,等.循證醫(yī)學向循證科學發(fā)展的內涵和思考[J].中國循證醫(yī)學雜志,2019,19(5):510-514.
[20]" 陳新.歷史研究中的證據與證明——自柯林武德以來的討論[J].江海學刊,2019(5):177-184,255.
[21]" 陳新.態(tài)度決定歷史:后現代狀況下的歷史學[J].歷史教學問題,2007(6):34-38.
[22]" 胡昭曦.古史多重證據法與綜合研究法——紀念徐中舒先生誕辰120周年[J].中華文化論壇,2018(11):4-10.
[23]" 譚佳,韓鼎,李川.早期中國與神話歷史研究——關于中國文學人類學“四重證據法”的對話[J].文藝研究,2020(7):91-100.
[24]" The well-built clinical question:a key to evidence-based decisions[J].ACP Journal Club,1995,123(3):A12.
[25]" 索傳軍,牌艷欣.科學問題譜系構建研究[J].中國圖書館學報,2025,51(1):61-81.
[26]" 李永東.小說中的南京大屠殺與民族國家觀念表達[J].中國社會科學,2015(6):152-174,209.
[27]" 洪治綱.集體記憶的重構與現代性的反思——以《南京大屠殺》《金陵十三釵》和《南京安魂曲》為例[J].中國現代文學研究叢刊,2012(10):20-30.
[28]" 張曉林,梁娜.知識的智慧化、智慧的場景化、智能的泛在化——探索智慧知識服務的邏輯框架[J].中國圖書館學報,2023,49(3):4-18.
[29]" 王宏斌.歷史考據法探源[J].史學理論研究,2002(3):30-42.
[30]" 陳安吉.“南京大屠殺史”研究的歷史回顧和今后的任務[J].民國檔案,1997(4):74-84.
[31]" 張連紅.中日兩國南京大屠殺研究的回顧與思考[J].南京大學學報(哲學.人文科學.社會科學版),2007(1):95-109.
[32]" 劉燕軍.南京大屠殺的歷史記憶(1937—1985)[J].抗日戰(zhàn)爭研究,2009(4):5-22.
[33]" 劉嘉龍,宋寧遠,裴雷,等.數字人文視閾下的歷史研究線索挖掘與應用[J].圖書館論壇,2024,44(12):111-120.
[34]" 高興祖.五十八年回顧:日本關于南京大屠殺事件的爭論[J].南京大學學報(哲學社會科學版),1995(3):1-15.
[35]" 於以傳.史料教學應充分關注證據價值及論證邏輯[J].歷史教學問題,2013(4):127-130.
[36]" 劉成.和平建設是對創(chuàng)傷歷史的一種最好紀念和修復[J].史學月刊,2023(2):31-36.
[37]" 李奕明.歷史再現與人民記憶──評《南京大屠殺》[J].電影藝術,1996(3):15-17.
[38]" 王山峰.南京大屠殺的儀式敘事與社會記憶[J].日本侵華史研究,2015(4):29-38.
[39]" 王兆鵬.古典文學研究數據化的可行性[J].文學遺產,2022(6):4-9.
作者簡介:劉嘉龍,男,南京大學數據管理創(chuàng)新研究中心、南京大學數據智能與交叉創(chuàng)新實驗室博士研究生,研究方向:知識組織、數字人文;李亞菲,女,南京大學數據智能與交叉創(chuàng)新實驗室、南京大學信息管理學院博生研究生,研究方向:數字敘事與知識組織;宋寧遠,男,南京大學數據智能與交叉創(chuàng)新實驗室、南京大學信息管理學院助理教授,研究方向:信息資源語義組織、數字人文;裴雷,男,南京大學數據智能與交叉創(chuàng)新實驗室、南京大學信息管理學院教授,研究方向:信息管理。