摘 要:2021年俄羅斯總統(tǒng)普京簽署解密了新一批伯力審判檔案,涉及原侵華日軍第七三一部隊反人類暴行的核心罪證,其史料價值不言而喻。與此同時,面對復雜多變的外部局勢,如何快速有效地翻譯、整理和挖掘史料,并迅速同我國細菌戰(zhàn)檔案研究形成互證聯(lián)系,成為亟待解決的領域問題。本文嘗試從檔案的數(shù)智化建設、內容的數(shù)智化挖掘和數(shù)智化形態(tài)傳播三個維度,探索新解密伯力審判檔案的數(shù)智化實踐道路,以為我國在國際社會的細菌戰(zhàn)話語權建設貢獻力量。
關鍵詞:伯力審判;細菌戰(zhàn);檔案數(shù)智化
中圖分類號:K265" "文獻標志碼:A" "文章編號:1002-2589(2024)06-0080-03
俄羅斯新解密伯力審判檔案作為揭示侵華日軍細菌戰(zhàn)罪行的關鍵史料,其研究對于還原歷史真相、維護二戰(zhàn)勝利成果具有不可替代的重要性。數(shù)智時代背景下,如何利用先進技術手段系統(tǒng)保護、整理和深入挖掘檔案成為七三一問題研究面臨的時代課題,本文將圍繞科技賦能伯力審判檔案研究展開探討。
一、進一步挖掘俄藏伯力審判檔案的現(xiàn)實意義
由于美國曾明確表示,在東京審判框架內不會審議與發(fā)展和使用細菌武器有關的問題[1]。1950年,蘇聯(lián)政府在伯力審判結束后,以多國文字的形式向世界公布了部分伯力審判文件。審判至今,囿于俄羅斯檔案保密規(guī)定,我國學界無法對俄檔案獲取更多信息。但在2021年,俄羅斯啟動了“1949年哈巴羅夫斯克審判檔案”項目并以線上形式對外公布,至今已發(fā)掘出370份有關伯力審判的檔案,以此為線索又可查閱到4 300余條檔案信息[2]。本次公布的檔案涉及俄羅斯境內14家檔案機構,檔案形式多樣,除審訊記錄外,還有語音檔案、新聞報道、漫畫等形式。內容涉及侵華日軍第七三一部隊和第一○○部隊的核心罪證,這對我國針對該領域的研究意義重大。
(一)明晰罪行史實
伯力審判檔案的線上公布,其遵循國際法的審判流程以及突出的證據(jù)屬性,對我國七三一檔案系統(tǒng)挖掘與保護有著顯著意義。我國現(xiàn)存七三一部隊罪行檔案包含戰(zhàn)時與戰(zhàn)后調查檔案,戰(zhàn)時檔案以“特別移送”檔案為主。新解密檔案生動還原了伯力審判過程。一方面,它更加詳盡地重現(xiàn)了歷史場景;另一方面,基于新解密出來的供詞,我們對日本侵華日軍細菌戰(zhàn)的作戰(zhàn)計劃、實施過程、隊伍建設等歷史真相有了更加清晰的認識。
(二)發(fā)現(xiàn)罪行新線索
新解密的線上檔案中,細菌戰(zhàn)戰(zhàn)俘的系統(tǒng)審訊筆錄尤為引人關注?;谝酝徟泄_的資料,我們只知道部分結果,而對其過程并不清楚。以山田乙三審訊筆錄為例,國內資料有載:1949年11月3日、11月5日、11月17日、12月1日、12月6日,以及12月26日早庭。新解密的資料顯示,在1947年2月27日,山田就已經(jīng)受審。從公開的這些審訊記錄來看,能夠更加清楚地了解到日本侵華細菌戰(zhàn)的罪行細節(jié),是對我國現(xiàn)有七三一問題研究的重要補充。依據(jù)這些檔案,還可通過特定視角深入理解冷戰(zhàn)背景下東亞國際關系格局的演變[3]。
(三)完善罪證鏈條
當前國際社會的細菌戰(zhàn)檔案呈現(xiàn)多國共存態(tài)勢,包括中國、美國、日本和俄羅斯。以往我國主要關注日美檔案收集,對俄羅斯的館藏檔案知之甚少。本次線上解密后,我們可知蘇聯(lián)檔案的性質迥異于日美兩國。它不僅能與我國七三一遺址檔案文物相互印證,還可通過綜合比對中美日俄等國多邊檔案的路徑,構建侵華日軍細菌戰(zhàn)完整罪證鏈條。
二、伯力審判檔案數(shù)智化保護路徑
2021年俄羅斯檔案公開窗口期非常珍貴,然而傳統(tǒng)歷史檔案翻譯與整理方法難以在短期內取得顯著成果。哈爾濱市社會科學院七三一問題國際研究中心同哈爾濱工業(yè)大學俄語系和人工智能實驗室成立了“七三一檔案翻譯與傳播專題工作組”,探索伯力審判檔案的“新舊”系統(tǒng)保護與挖掘的數(shù)智化路徑。
(一)檔案數(shù)智化整理
2021年新解密的檔案,其史料價值無需贅述。在應用方面,最現(xiàn)實的問題就是數(shù)字化的整理。該批檔案語言復雜,字體風格多樣,手寫和打印內容混雜,數(shù)字和字母差別對應。傳統(tǒng)OCR(Optical Character Recognition)技術在精準識別方面不盡如人意。為此,我們提出了一種基于視覺大語言模型(Vision-Language Model, VLM)的兩階段框架。視覺特征隨后經(jīng)過視覺—語言映射器,與語言信息進行多模態(tài)融合,其特征被映射到共享嵌入空間中,由解碼器生成初步的文本識別結果,使模型能夠更精準地應對復雜俄語文檔的識別任務。此外,引入了中俄大語言模型,專注于糾錯與格式優(yōu)化。有效提升了俄語檔案OCR的識別準確性。通過采用基于視覺大語言模型的兩階段框架,可以顯著提升俄語檔案OCR的識別精準度和輸出文檔的質量。(見圖1)
(二)檔案數(shù)智化挖掘
2021年線上解密檔案是俄羅斯系統(tǒng)整合二戰(zhàn)檔案的一個縮影。近年來,由俄羅斯政府主導、民間組織積極參與的二戰(zhàn)檔案普查行動一直在進行。其中較具代表性的是“搜索行動”組織,共號召了45 000多名搜索隊員,組成1 500多個搜索隊,歷時8年完成了俄羅斯境內二戰(zhàn)檔案的“摸家底”。新解密俄藏伯力審判檔案可以同我國境內多地的細菌戰(zhàn)博物館和遺址形成供詞和證物的互證關系,借助事理圖譜,可以在關鍵人物、時間線、地點、事件等重要歷史參數(shù)上,清晰呈現(xiàn)檔案的知識層,也會將新解密檔案同我國檔案互證關系進一步具體化。與此同時,通過對檔案的知識抽取,還可挖掘不同事件關系,展現(xiàn)細菌戰(zhàn)檔案內部、檔案與檔案之間、檔案同戰(zhàn)時語境、檔案同當代國際形勢的復雜強弱邏輯關聯(lián),實現(xiàn)從史料研究跨越到多維學科研究。(見圖2)
在伯力審判的12名細菌戰(zhàn)戰(zhàn)犯和多名證人中,證詞最多的一名證人發(fā)揮著至關重要的作用。東京審判期間,蘇聯(lián)將川島清、柄澤十三夫押解到日本。通過事理圖譜的方法,我們初步還原了川島清的職業(yè)生涯。如圖2所示,川島清身居細菌戰(zhàn)研究與行政中樞,擔任過本部第一部部長、第三部部長和第四部部長、總務部部長,不僅親自領導繁殖大批致命的細菌,還使用活人進行細菌實驗。這種可視化的圖譜呈現(xiàn),縮減了翻閱傳統(tǒng)史料的時間,更將其關系鏈條呈現(xiàn)得一覽無余。
(三)“數(shù)字人”建設
基于數(shù)智化的檔案整理和挖掘,在細菌戰(zhàn)構筑的國內和跨境記憶共同建設中,數(shù)智化也可活化記憶的敘事形式,加快新解密檔案進入公眾視野。首先,采用大模型驅動+RAG(Retrieval-Augmented Generation),確保每一次回答都能基于翔實、準確的歷史數(shù)據(jù),減少因算法局限導致的事實性錯誤。其次,考慮到用戶的多樣化需求,我們在數(shù)字人的設計上給予了高度的個性化選擇,無論是音色還是形象,都可以根據(jù)個人偏好進行調整,讓每位用戶都能找到最適合自己學習方式的歷史伙伴。數(shù)字人可將歷史記憶與陳列展覽、宣傳教育結合起來,在愛國主義和國防教育過程中注入AI元素,注重受眾對歷史的真聽真看真感受。
三、伯力審判檔案研究數(shù)智化道路前瞻
長期以來,我國七三一問題研究都存在罪證檔案不完整的“硬傷”。2021年俄羅斯線上解密的檔案僅是其細菌戰(zhàn)檔案的一部分,除已知伯力審判錄音檔案外,審判記錄、戰(zhàn)犯日記等新線索不斷涌現(xiàn)[4]。
(一)引入大語言模型,加快已有檔案的翻譯與整理工作
大數(shù)據(jù)分析技術在伯力審判檔案研究中的應用,將為深入剖析日本細菌戰(zhàn)罪行的全貌與系統(tǒng)性特征提供強有力的工具。通過對檔案中的各類數(shù)據(jù)進行大規(guī)模、多維度的深度挖掘與關聯(lián)分析,歷史學研究人員能夠突破傳統(tǒng)研究方法的局限,探尋不同檔案資料之間隱藏的內在聯(lián)系與邏輯關系。對不同時期罪證檔案的關聯(lián)分析,能夠清晰地梳理出細菌戰(zhàn)從策劃、籌備到實施、擴散的歷史脈絡與演進規(guī)律。同時,借助數(shù)據(jù)建模與先進的算法分析技術,能夠從海量檔案數(shù)據(jù)中發(fā)現(xiàn)隱藏于其中的潛在規(guī)律與發(fā)展趨勢,如細菌戰(zhàn)實驗數(shù)據(jù)與戰(zhàn)爭局勢變化之間的內在關聯(lián)等。這些基于大數(shù)據(jù)分析得出的研究成果,為歷史學研究提供了更為豐富、多元且具有深度的視角與證據(jù)支持,有助于構建更為系統(tǒng)、科學且全面的日本細菌戰(zhàn)罪行研究體系,從而在歷史學研究領域更精準地還原歷史真相,傳承歷史記憶。
(二)采用大模型技術,構建細菌戰(zhàn)國際話語陣營
我國是日軍細菌戰(zhàn)的第一受害國,侵華日軍在中國犯下了滔天罪行。七三一部隊雖被稱為“東方奧斯維辛”,但其社會影響力與之相去甚遠,西方社會對其知之甚少。細菌戰(zhàn)的受害記憶是個體到集體的創(chuàng)傷記憶[5],也是地方到民族的國家創(chuàng)傷記憶,更是不同民族的人類創(chuàng)傷記憶。大模型技術的引入,可以打破檔案的“物理邊界”,共同構筑細菌戰(zhàn)記憶共同體,凝聚細菌戰(zhàn)話語權的共同意識。強大的算力讓不同民族、不同文化的向往和平的人,都能走進“共同的細菌戰(zhàn)記憶場”。同時,還可依托“二戰(zhàn)博物館聯(lián)盟”,實現(xiàn)細菌戰(zhàn)主題博物館的國際合作,增強國際社會對日本軍國主義犯罪暴行的歷史認同,形成和平共識,助力七三一罪證檔案走出龍江,進入民族和世界記憶。
(三)應用大模型技術,提升細菌戰(zhàn)傳播效能
“數(shù)字人”建設是活化細菌戰(zhàn)傳播形式的嘗試,未來如何更加有效地將大模型技術引入細菌戰(zhàn)傳播領域,形成細菌戰(zhàn)的數(shù)智化傳播模式,仍需多方支持和探索。面對大模型時代的傳媒媒介泛化,大模型技術在傳播方式和傳播效能兩個層面或可助力細菌戰(zhàn)的傳播工作。在創(chuàng)意傳播形式方面,大模型技術拓展“歷史+”的傳播內容,生成各類主題視覺元素,如主題插圖、微電影、影視特效等,可以活化罪證“講述”形式,將歷史記憶與陳列展覽、宣傳教育相結合。可以活化罪證“教育”形式,在愛國主義和國防教育基地建設中融入虛擬和仿真元素。在傳播效能方面,基于大模型技術迅速識別熱點話題和輿情趨勢,繼而做出情感和邏輯關聯(lián)分析,更加有效地把握傳播動態(tài)和方向。
參考文獻:
[1]Тужилин С. В." Совершенные преступления являются гро-мадным злодеянием против человечества//Военно-исто-рический журнал. 2020. № 12. С. 23.
[2]宮文婧,鞠坤依.俄羅斯新解密伯力檔案的情況概述、價值闡釋與現(xiàn)實意義[J].學理論,2024(4):69-73.
[3]柳豐華.俄烏沖突促使俄羅斯轉向中國[J].俄羅斯學刊,2024(5):5-23.
[4]趙士見,宮文婧.俄羅斯新解密伯力審判檔案探析[J].中國檔案,2024(8) :61-63.
[5]宮文婧,王宇,石巍巍.從地方記憶到國家記憶:侵華日軍第七三一部隊罪行檔案文獻[J].檔案與建設,2023(12):92-94.
收稿日期:2024-11-29
基金項目:國家社科基金抗日戰(zhàn)爭研究專項工程“侵華日軍細菌戰(zhàn)罪行史料整理及專題數(shù)據(jù)庫建設”(16KZD014);黑龍江省哲學社會科學研究規(guī)劃項目《東京審判后蘇聯(lián)與新中國對日本細菌戰(zhàn)犯的審判研究》(22ZSB259)
作者簡介:賈明秀,講師,博士,從事俄漢翻譯理論與實踐、文化外譯、話語分析研究;李寶航,碩士研究生,從事大語言模型、機器翻譯研究。