許振哲/上海理工大學檔案館
鑒定是檔案工作的重要環(huán)節(jié),正規(guī)的檔案鑒定工作可以追溯至1789年法國大革命[1]。在這之后的200多年時間里,世界各國根據(jù)檔案工作實際,圍繞檔案鑒定工作展開研究,形成了一系列具有代表性的檔案鑒定理論。近年來,隨著科技的迅猛發(fā)展,人類社會已大踏步邁入人工智能時代,各行各業(yè)的工作模式正在發(fā)生廣泛而深刻的變革。技術(shù)已不再是桎梏,而是成為實際工作開展的助力因素。新形勢下,既往的檔案鑒定理論是否能夠適應實際工作的需求?檔案鑒定工作應當如何順勢而上?
從20世紀初開始,各種具有代表性的檔案鑒定理論相繼問世:1901年邁斯奈爾提出年齡鑒定論,主張尊重高齡案卷;20世紀20、30年代,卡林斯基提出職能鑒定論,認為一個單位的地位越高,其職能越重要,生成的檔案就越有價值;詹金遜提出行政官員決定論,主張檔案的鑒定和銷毀應由行政官員決定,檔案工作者不宜參與;1956年,謝倫伯格提出文件雙重價值理論,認為檔案具有第一價值和第二價值,需要檔案工作者在檔案鑒定工作中發(fā)揮更大的作用;到了20世紀80年代,隨著電子文件的大量涌現(xiàn),宏觀鑒定理論應運而生,主要包括布姆斯的社會分析與職能鑒定理論,塞穆爾斯文獻戰(zhàn)略以及特里庫克的宏觀鑒定戰(zhàn)略,主張以更加宏觀的視角全面考量文件的社會職能。我國的檔案鑒定理論誕生較晚,始于20世紀80年代,包括相對價值標準理論、價值鑒定論、本位原則理論等[2]。雖然不同理論具體描述有所差異,但其內(nèi)核仍不可避免地打上了西方檔案鑒定理論烙印,未能跳出既定價值鑒定框架。
21世紀隨著人工智能技術(shù)深入發(fā)展,新的檔案鑒定思潮也隨之出現(xiàn)。2015年,周林興、鄧晉芝二人提出“(經(jīng)過鑒定后)所保存的檔案都是過濾后的檔案,所反映的不是完整的而是被選擇了的歷史,所呈現(xiàn)給后人的不是原汁原味的而是被強化或弱化了的社會記憶……因此,基于歷史視域的考量,應當弱化檔案鑒定”[3]。馬伏秋認為“我國檔案鑒定理論研究與實際工作嚴重脫節(jié),檔案鑒定工作缺乏科學、具體的理論指導……應當徹底廢止銷毀鑒定”[4]。楊冬權(quán)指出:“檔案的這種多重價值或多方面價值就使檔案的‘選擇性管理’漏洞百出,捉襟見肘,無法應付。只有‘全部性管理’才能適應檔案價值多重性的需要,才能滿足未來利用者的各方面需求……我國檔案工作面臨著一個從‘選時代’到‘全時代’的全新蛻變和全面改變”[5]。
周林興等人關于檔案鑒定工作的論述,是對人工智能時代檔案工作模式的嘗試與探索,也是對傳統(tǒng)檔案鑒定理論的挑戰(zhàn)與突破,有學者將他們的觀點統(tǒng)稱為“檔案鑒定非必要論”[6]。觀點一經(jīng)問世,在學術(shù)界引起軒然大波,引發(fā)無數(shù)討論。在技術(shù)條件已然成熟的今天,檔案界為何對檔案鑒定非必要論充滿抵觸與質(zhì)疑?當前我國檔案鑒定工作存在哪些問題?弱化鑒定甚至取消鑒定在未來是否具備實現(xiàn)的可能性?
關于檔案應由文件形成者還是檔案人員鑒定,檔案界至今爭論不休。我國采用“檔案人員、業(yè)務人員和有關領導三結(jié)合”的鑒定模式,理論上看可以讓文件形成者與檔案人員共同參與到鑒定環(huán)節(jié)中,很好地解決了沖突,實際則不然。有學者指出,“我國所謂的三結(jié)合,實際只是兩結(jié)合,機關或者檔案館的領導并不會親自參與鑒定工作……鑒定工作由檔案部門和業(yè)務部門人員共同組成的鑒定小組來操作,這種組織看似科學,實際上難以正常開展工作和保證質(zhì)量……三結(jié)合只在工作到一定階段時出面議一議,把把關[7]?!比Y(jié)合鑒定模式的初衷,是“一道程序,三方參與”,保證每一份檔案的價值能夠被全面充分地認知。然而實際工作中,卻變成了“彼此獨立,三重過濾”,歸檔鑒定、檔案室鑒定、檔案館鑒定彼此割裂,不再是一個綜合性環(huán)節(jié),而是成為三道線性流程。每個流程的鑒定人員都擁有同時鑒別檔案第一價值和第二價值的權(quán)利。這就導致三結(jié)合的鑒定模式不僅無法全面綜合地鑒別檔案價值,反而會在每個鑒定環(huán)節(jié)都將一部分有價值的檔案剔除在外。
歸檔鑒定模式因循守舊還表現(xiàn)為,對檔案保管期限表和歸檔范圍的全面依賴。當前鑒定工作主要依據(jù)國家檔案局2006年發(fā)布的《機關文件材料歸檔范圍和文書檔案保管期限規(guī)定》和2012年發(fā)布的《企業(yè)文件材料歸檔范圍和檔案保管期限規(guī)定》[8]。上述文件發(fā)布至今已有相當長的時間,很難滿足當前形勢下的檔案鑒定需求,加之保管期限表中往往摻雜大量“重要的”、“一般的”這類模糊不清的字眼,直接影響檔案人員對檔案價值的實際判斷。傅榮校指出:“我國目前的檔案保管期限表尚無法充分反映出現(xiàn)有的先進的價值理論和鑒定標準,也無法充分體現(xiàn)出與我國目前鑒定理論發(fā)展水平相適應的內(nèi)容,鑒定理論與檔案保管期限表之間的銜接不力,直接影響了鑒定理論的發(fā)展和更新……可能使那些具有重要第二價值的文件遭到毀滅性的打擊”[9]。歸檔范圍的局限性對檔案鑒定工作造成了較大影響,也讓很多檔案進入可歸可不歸的灰色地帶,大量非官方背景的社會記錄未被納入檔案資源對象范疇,難以進入檔案管理的“資源池”,難以保證檔案的齊全完整性[10]。
非官方來源的檔案不在歸檔范圍,無法進館;官方來源的檔案經(jīng)過層層篩選,十不足一。最終呈現(xiàn)給公眾的,都是官方視角、人為選擇、支離破碎的社會記憶,未來的研究者從“一家之言”能否窺得歷史的本來面貌?這是否已然背離了檔案鑒定工作初衷?
有學者根據(jù)性質(zhì)將檔案鑒定劃分為檔案質(zhì)量鑒定(包括檔案的原始性、真實性、完整性、準確性、載體質(zhì)量鑒定)和檔案價值鑒定,并認為檔案價值鑒定是檔案鑒定的核心[11]。檔案價值,通俗而言就是檔案對人類的有用性,不同的價值體系、不同的判定標準,都會影響人們對檔案價值的認知?!皩Ρ締挝粺o用的檔案,可能對全社會有用;對自己無用的,可能對別人有用;對今天無用的,可能對明天有用;對國家或單位無用的,可能對家庭或個人有用;表面看無用的,可能實際上有用”[12]。因此有學者認為檔案價值具有多重性和不確定性,甚至有人陷入了檔案價值“不可知論”的泥潭[13]。
人類對事物的認知需要經(jīng)歷一個由淺入深、螺旋上升的過程,在這個過程中對于檔案價值的認知,對鑒定標準的界定亦不可避免地帶有局限性。舉例而言,檔案館是否存在永久保存,但從未被利用過的檔案呢?答案是肯定的。如果這份檔案從未被利用過,它的價值從何體現(xiàn)呢?如果它沒有價值,為何能夠接收進館永久保存呢?也許有人會說,檔案現(xiàn)在沒被利用,不代表未來沒有價值。那么問題又來了,日常工作中,難免碰到需要查詢的檔案沒有歸檔的情況,這些檔案顯然是具有價值的,為何在鑒定環(huán)節(jié)沒有考慮這部分檔案未來可能存在價值,而是選擇將其拒之門外呢?由此看來,當前檔案價值鑒定標準在理論與實際兩端均難以自洽,認知的局限決定了人們在某個特定階段不可能全面認清檔案的價值,由此確立的價值鑒定標準,必然會導致相當數(shù)量有價值的檔案無法入庫、散佚蒙塵。
檔案價值的多重性和不確定性決定無論何種價值鑒定體系都必然存有一定的局限性。那么“形成檔案全歸檔,歸檔檔案全留存”[14]顯然成為給后世留下寶貴檔案遺產(chǎn)的最佳途徑。
根據(jù)流程,可以將檔案鑒定劃分為進館鑒定、開放鑒定和銷毀鑒定三個環(huán)節(jié)。不同于進館鑒定嚴苛刻板,銷毀鑒定中“鑒而不銷、銷而不毀”的現(xiàn)象頻頻發(fā)生[15]。檔案在進館鑒定環(huán)節(jié)會被劃定保管期限,理論上保管期滿的檔案對黨和國家不再具備有用性。然而在實際工作中,人們往往傾向于這些檔案在未來依然具有發(fā)揮價值的可能,從而將保管期限一再延長。檔案進館鑒定與銷毀鑒定遵循的是同樣的價值評判標準,為何在進館鑒定環(huán)節(jié)可以做到應歸盡歸、蹈矩循規(guī),而在銷毀鑒定環(huán)節(jié)卻是態(tài)度曖昧、謹小慎微?
以上這種現(xiàn)象一方面源于當前檔案保管期限表條款太少,內(nèi)容過于概括,保管年限劃分簡單隨意,只有10年、30年、永久三個檔次,不足以囊括不同門類的所有檔案。另一方面,檔案銷毀相關規(guī)范性文件太少、年份太早,且用詞充斥一般的、重要的等模糊字眼,缺乏明確的、可供參考的銷毀依據(jù),很難作為實際工作的參照。這就導致各級各類檔案館在期滿鑒定過程中畏首畏尾,慎之又慎,不敢輕言銷毀,唯恐造成黨和國家的損失。
現(xiàn)階段檔案銷毀鑒定推進不力,還有更深層次的現(xiàn)實原因:實際工作中,需要查閱的檔案卻被告知已經(jīng)銷毀的現(xiàn)象并不鮮見,銷毀鑒定也因此愈發(fā)舉步維艱。檔案工作者對進館鑒定和銷毀鑒定的雙重標準并非本意,檔案價值的不可捉摸,決定了銷毀鑒定必然要承擔相當程度的風險,正是出于對檔案事業(yè)的熱忱與責任,才會讓對待進館鑒定無比嚴苛的檔案工作者在銷毀鑒定時產(chǎn)生一次又一次的寬容。當前形勢下,唯有廢止銷毀鑒定,才可能在源頭規(guī)避給黨和國家檔案事業(yè)造成損失的一切可能。
紙質(zhì)檔案時代檔案保管能力有限,這也是檔案鑒定工作產(chǎn)生的直接原因。人們通過衡量預測檔案對當下以及未來的有用性,從既有檔案中挑選出一部分加以保存。電子檔案時代,載體類型發(fā)生變更,檔案存儲密度呈幾何級提升,已完全能夠承載不斷增長的館藏數(shù)量,然而電子時代檔案工作需依賴人類加工,海量的數(shù)字檔案全部進館,光憑人力不可能完成,因此檔案鑒定工作依然未能擺脫傳統(tǒng)模式的桎梏。
隨著卷積神經(jīng)網(wǎng)絡的發(fā)展成熟,深度學習技術(shù)的推廣使用,人類社會開始大踏步邁入人工智能時代。相信在不久的將來,隨著人工智能技術(shù)在檔案領域的深度應用,機器將取代人類,完成各項繁復的檔案工作。機器可以根據(jù)人類設定的算法邏輯進行實時歸檔、自動著錄、動態(tài)鑒定,并在此過程中不斷收集用戶行為數(shù)據(jù),實現(xiàn)升級優(yōu)化。人工智能時代的到來,必將打開檔案鑒定工作新局面。
載體形式的升級為檔案全部性管理提供了充足的存儲空間,人工智能技術(shù)的應用則讓全部性管理由理論成為可能。通過機器深度學習,未來檔案工作可以實現(xiàn)全過程自動化管理,“形成檔案全歸檔,歸檔檔案全留存”將成為人工智能時代檔案工作的總體方針。
需要注意的是,全部性管理只是在歸檔環(huán)節(jié)不再對檔案價值進行判定,并不意味著檔案歸檔鑒定的取消。歸檔鑒定不僅包括檔案價值鑒定,還包括檔案質(zhì)量鑒定,傳統(tǒng)檔案鑒定工作側(cè)重于價值鑒定,一定程度上忽視了質(zhì)量鑒定的重要性。人工智能時代,檔案管理的對象是電子數(shù)據(jù),這就決定將來電子文件單軌制運行、單套制管理是大勢所趨。為確保電子檔案的原始性、真實性、完整性、準確性,加強檔案質(zhì)量鑒定刻不容緩。人工智能時代,檔案工作者的職責不僅沒有減輕,反而更甚以往。電子檔案元數(shù)據(jù)、電子簽名、時間戳等元素未來都將成為檔案質(zhì)量鑒定的對象。檔案部門可以通過數(shù)字證書授權(quán)中心核驗歸檔人的電子簽名,確保歸檔文件傳輸過程未經(jīng)篡改,保證其真實性、準確性;通過聯(lián)合信任時間戳服務中心核驗檔案的時間戳,確保檔案的原始性;檔案部門還可以保存文件歷次修改的元數(shù)據(jù),為將來的研究提供多元的視角,傳承更加完整的社會記憶。
檔案價值是動態(tài)的,會隨時間、場合、用戶的變化呈現(xiàn)不同程度的有用性,任何檔案價值鑒定理論都難以全面衡量檔案的價值。因此人工智能時代實行全部性管理,取消前端歸檔價值鑒定,可以有效解決進館檔案的取舍問題。
然而隨著全部性管理進程的推進,檔案館未來可能面臨館藏數(shù)量繁多、檢索效率低下的困境。傳統(tǒng)鑒定模式下,館藏資源相對有限,用戶可以根據(jù)檢索結(jié)果逐一閱覽;全部性管理模式下,電子館藏浩如煙海,任意詞條檢索得到的結(jié)果都將是成千上萬條,如何從中高效地篩選有用信息將成為困擾用戶的最大問題。
為保證用戶的檢索利用效率,提升檔案利用體驗,檔案部門應通過檔案利用平臺主動抓取用戶行為數(shù)據(jù),利用卷積神經(jīng)網(wǎng)絡進行關聯(lián)運算,構(gòu)建終端檔案價值動態(tài)鑒定體系。檔案利用平臺將單位時間內(nèi)用戶群體的檢索詞條、檔案點擊量、檔案累計瀏覽時長等數(shù)據(jù)進行關聯(lián)并深度運算,通過用戶的行為數(shù)據(jù)來衡量一段時間內(nèi)哪些檔案對用戶更具有用性,并將檢索頻次、檔案利用率等數(shù)據(jù)加權(quán)換算,作為衡量館藏檔案動態(tài)價值的標準。當用戶進行檢索時,利用平臺將優(yōu)先把單位時間內(nèi)加權(quán)檢索分值更高的結(jié)果推送給用戶,免除用戶逐一瀏覽海量信息的困擾。
圖 開放檔案智能鑒定數(shù)據(jù)庫
人工智能背景下的檔案價值動態(tài)鑒定體系,以用戶行為數(shù)據(jù)為依據(jù),將檔案檢索利用率作為價值鑒定的唯一指標。該體系中檔案的價值并非一成不變而是隨檔案檢索利用頻次的波動不斷變化,從而能夠極大地提升用戶檢索利用效率,也可以動態(tài)滿足不同時代不同群體的差異化利用需求。
目前,各地檔案館普遍存在“只進不出”或“進大于出”的現(xiàn)象,一些保存期限為10年、30年的檔案更是近乎永久保存,檔案銷毀鑒定已然名存實亡,直接廢止銷毀鑒定可以為實際工作減去很多不必要的麻煩。
廢止銷毀鑒定意味著所有檔案不再有保管年限的劃分,進館檔案都將永久保存,但這并不意味著檔案只要歸檔進館就一勞永逸。全部性管理的根本目的是更好地服務利用,而用戶最終能夠接觸到多少檔案完全取決于檔案開放水平。很多地區(qū)的檔案部門秉持謹慎的態(tài)度對待檔案開放鑒定,盡管新版檔案法將檔案開放期由30年減少到25年,但一些檔案的開放期仍然一再延長,久久未能面世,可謂“養(yǎng)在深閨人未識”。
檔案開放是檔案價值得以發(fā)揮的必然路徑,但涉及國家安全或者重大利益以及其他到期不宜開放的檔案則有必要進行多次開放鑒定。想要兼顧用戶的實際利用體驗與信息安全,實現(xiàn)檔案開放利用的長效機制,必須構(gòu)建一個開放檔案智能鑒定數(shù)據(jù)庫維系電子檔案的內(nèi)部運轉(zhuǎn)。
如圖所示,館藏紙質(zhì)檔案和歸檔電子文件轉(zhuǎn)化為電子檔案后進入開放檔案智能鑒定數(shù)據(jù)庫,首先根據(jù)文件的時間戳鑒定檔案是否形成期滿25年,年限已滿檔案轉(zhuǎn)入檔案開放鑒定庫,年限未滿檔案轉(zhuǎn)入待開放庫;其次對開放鑒定庫中的檔案進行二次鑒定,經(jīng)濟、教育、科技、文化等適宜開放的檔案轉(zhuǎn)入人工智能訓練庫,涉及國家安全或重大利益的檔案轉(zhuǎn)入加密庫;待開放庫的檔案形成期滿25年后再次轉(zhuǎn)入開放鑒定庫,加密庫檔案自進庫之日起,再次開放期滿后轉(zhuǎn)入開放鑒定庫,重復上述開放鑒定流程;人工智能訓練庫是數(shù)據(jù)庫的最后一個模塊,所有進入訓練庫的檔案,可供人工智能直接接觸、深度學習,并向用戶推送信息、標記出處。開放檔案智能鑒定數(shù)據(jù)庫的建成,可以借助人工智能自動完成檔案開放鑒定,“應開放盡開放”“能公布全公布”,最大程度發(fā)揮檔案的價值。