甄子瑩 顏祥林/南京大學(xué)信息管理學(xué)院
隨著數(shù)字化、智能化進(jìn)程的推進(jìn),各行各業(yè)都面臨技術(shù)革新和思維變革的現(xiàn)實(shí)?,F(xiàn)今圖書情報(bào)檔案學(xué)科已邁向以大數(shù)據(jù)和人工智能為代表的“數(shù)智”環(huán)境,進(jìn)入“數(shù)智”賦能時(shí)代[1]。在“數(shù)據(jù)”與“智能”交匯的時(shí)代,科技名人檔案作為科技名人的原始記錄,其資源整合必然要立足“數(shù)智”環(huán)境,與“數(shù)智”趨勢(shì)對(duì)接以成為檔案資源庫(kù)與檔案知識(shí)庫(kù)的重要支持性資源。
科技名人檔案資源走向開發(fā)和深層次建設(shè)已成為檔案學(xué)界的共識(shí)[2],但直接針對(duì)科技名人檔案資源整合問(wèn)題探討的成果不多,有的學(xué)者就名人檔案信息化建設(shè)問(wèn)題提出要以整合為路徑,具體包括對(duì)信息資源、信息技術(shù)、信息平臺(tái)進(jìn)行整合[3],也有的以科技名人檔案的傳播入手,探討科技名人檔案內(nèi)容整合[4]。從整體的研究方向上看,相關(guān)研究主要側(cè)重于編目方法、價(jià)值探討、資源開發(fā)、知識(shí)管理、數(shù)字化與信息化建設(shè)等研究議題,研究視角與思維面相對(duì)零散?;诖耍覀冋J(rèn)為“數(shù)智”時(shí)代的科技名人檔案資源該如何整合這一議題,有其時(shí)代意義。此外,筆者在參與“老科學(xué)家學(xué)術(shù)成長(zhǎng)資料采集項(xiàng)目”(以下簡(jiǎn)稱“采集工程”)實(shí)踐中發(fā)現(xiàn),科技名人檔案資源深度的開發(fā)及體系化構(gòu)建還沒(méi)有完全實(shí)現(xiàn)。所以加強(qiáng)科技名人檔案資源的整合,從實(shí)踐角度明確“數(shù)智”時(shí)代的資源整合動(dòng)因與思路十分必要。
人們?cè)陂_展檔案管理的實(shí)踐中,形成了檔案管理規(guī)律的沉淀與總結(jié)。檔案作為管理過(guò)程與程序的“中介”,繞不開整合這一“揚(yáng)棄”過(guò)程[5]。資源整合的主要目的是使用戶知道到哪里找到所需信息、怎樣查找所需信息以及如何篩選檢索結(jié)果[6]等。明確資源整合的動(dòng)因,是在“檔案信息”“人(檔案管理者與檔案利用者)”“檔案利用”之間找到平衡點(diǎn)的先決條件。
綜上,檔案管理與資源整合相伴而行。以“采集工程”為例,其整合動(dòng)因可總結(jié)為:第一,該項(xiàng)目采集到的學(xué)術(shù)成長(zhǎng)資料具備高價(jià)值性,但是總體來(lái)看還沒(méi)有建立面向傳播與開發(fā)的整合體系;第二,該采集項(xiàng)目的采集成果經(jīng)過(guò)有序且較為合理的層次性整理與組織,完成了某種意義上的整合,但“采集工程”成果的開發(fā)利用乃至科技名人檔案的“活化”仍需改進(jìn)。“采集工程”項(xiàng)目將合規(guī)上交和歸檔后的整合成果進(jìn)行收藏與展示,其平臺(tái)主要有:采集工程館藏基地[7]、老科學(xué)家學(xué)術(shù)成長(zhǎng)資料數(shù)據(jù)庫(kù)[8]以及科技人物專題網(wǎng)站[9]等。整合傳播平臺(tái)較為完善,但檔案開發(fā)成果(資料清單、??瘓?bào)道、老科學(xué)家學(xué)術(shù)成長(zhǎng)資料采集工程叢書等)相對(duì)單一。有學(xué)者就采集工程中形成的數(shù)據(jù)庫(kù)、建立的實(shí)物和虛擬展區(qū)等成果,探討如何進(jìn)行知識(shí)采集、組織與揭示[10],以加強(qiáng)檔案利用者與檔案之間的聯(lián)系?;谏鲜稣J(rèn)識(shí),筆者認(rèn)為,“采集工程”的整合成果需與信息技術(shù)緊密結(jié)合,將“整合”過(guò)程進(jìn)行拓展與深化。
進(jìn)入“數(shù)智賦能”時(shí)代,科技名人檔案的資源整合如何在“數(shù)智”環(huán)境下完善與發(fā)展,應(yīng)明確“數(shù)智”賦能下整合的意義與合理性。
第一,“數(shù)智”技術(shù)助力科技名人檔案深度開發(fā)。隨著信息技術(shù)的不斷革新和日益成熟,文檔管理迎來(lái)了數(shù)字轉(zhuǎn)型,對(duì)原件的形態(tài)管理也隨著技術(shù)發(fā)展衍生出模擬態(tài)、數(shù)字態(tài)、數(shù)據(jù)態(tài)[11]多態(tài)并存的文檔管理局面。顯然,“數(shù)智”時(shí)代注重對(duì)優(yōu)質(zhì)數(shù)據(jù)多重處理和應(yīng)用,科技名人檔案不可避免與各種形態(tài)的(含數(shù)據(jù)的電子表格文件、用計(jì)算機(jī)語(yǔ)言編寫的程序、電子底圖等)數(shù)據(jù)進(jìn)行組織。筆者參與的“采集工程”項(xiàng)目更側(cè)重于老科學(xué)家學(xué)術(shù)成長(zhǎng)資料(口述資料、音視頻資料、書信手稿等文獻(xiàn)資料和相關(guān)實(shí)物)的獲取、學(xué)術(shù)科研成果和科學(xué)思想的搶救性保存,采集成果存在應(yīng)用“不智能”“不智慧”的現(xiàn)實(shí)問(wèn)題,而“數(shù)智”技術(shù)與工具無(wú)疑可以在提升科技名人檔案的信息“質(zhì)量”方面發(fā)揮作用。如運(yùn)用機(jī)器視覺(jué)、命名實(shí)體識(shí)別、關(guān)系抽取等技術(shù),從科技名人檔案數(shù)據(jù)庫(kù)多模態(tài)的數(shù)據(jù)里抽出語(yǔ)義標(biāo)簽,再通過(guò)知識(shí)圖譜技術(shù)將這些語(yǔ)義信息融合構(gòu)建,為科技名人檔案開發(fā)與利用者進(jìn)行專題匯編、知識(shí)分析、問(wèn)答與挖掘打下“檔案資料可靠完備”和“知識(shí)有機(jī)聚合”的雙重基礎(chǔ)。
第二,“數(shù)智”時(shí)代呼喚科技名人檔案內(nèi)容利用與渠道傳播接續(xù)發(fā)力??萍济藱n案內(nèi)容“優(yōu)質(zhì)”,具備自身復(fù)合性與多樣性的遞增價(jià)值,是“數(shù)智”時(shí)代認(rèn)可的豐富且優(yōu)質(zhì)的信息資源。“數(shù)智”技術(shù)帶來(lái)了新的技術(shù)協(xié)作形式,能在融合多媒體、聯(lián)合多主體等方面提升科技名人檔案自身影響力。以“采集工程”為例,其作為科技名人檔案建設(shè)的重要體現(xiàn),還具有學(xué)術(shù)性與知識(shí)性[12],蘊(yùn)含于科技名人檔案中的文化學(xué)術(shù)信息資源、科學(xué)與社會(huì)記憶對(duì)展現(xiàn)科技名人檔案的學(xué)術(shù)與精神文化底蘊(yùn)具有復(fù)合性的支撐作用。毫無(wú)疑問(wèn),“數(shù)智”賦能時(shí)代技術(shù)工具對(duì)科技名人檔案的內(nèi)容開發(fā)(如強(qiáng)化時(shí)間、空間等維度的內(nèi)容整合)具有提升與促進(jìn)作用。
前文已討論了資源整合認(rèn)識(shí)上的動(dòng)因和意義。筆者認(rèn)為進(jìn)一步明確“數(shù)智”賦能時(shí)代科技名人檔案資源整合實(shí)踐要點(diǎn)和主旨,是一種必要的反思。
有學(xué)者對(duì)名人檔案信息內(nèi)容傳播策略[13]做出思考與研究,主要觀點(diǎn)是:面向傳播的科技名人檔案是一種主動(dòng)服務(wù)行為,要實(shí)現(xiàn)科技名人檔案被“感知”,就要從時(shí)間、空間、類型維度進(jìn)行精細(xì)化、完整性、多樣化的保障。筆者認(rèn)為,在精細(xì)化整合機(jī)制的搭建中,要保證資源內(nèi)容的質(zhì)量,“質(zhì)”才是科技名人檔案后續(xù)開發(fā)與整合的前提;“數(shù)智”賦能下的科技名人檔案資源整合在此基礎(chǔ)上要更注重以科技名人檔案資源作為本位,并在資源本位觀的指導(dǎo)下進(jìn)行層次性構(gòu)建和技術(shù)應(yīng)用研究??偟膩?lái)說(shuō),“數(shù)智”賦能下的科技名人檔案資源整合,首先要以資源本位進(jìn)行多維度整合;其次有必要進(jìn)行層次性完善,而非一勞永逸的搭建,以期達(dá)到科技名人檔案價(jià)值內(nèi)涵的發(fā)現(xiàn)和再發(fā)現(xiàn),以啟發(fā)科技史學(xué)者和研究者利用科技名人檔案資源。
科技名人檔案資源整合是一項(xiàng)“落地”實(shí)踐,一方面,不可一味地探討技術(shù)研究,而應(yīng)努力探索技術(shù)合理應(yīng)用;另一方面,不能一味地逃避科技名人檔案資源整合過(guò)程中的數(shù)據(jù)保全、隱私問(wèn)題、保密與開放等問(wèn)題。
科技名人檔案不僅涉及微觀層面的信息,還包括宏觀甚至深層次的信息。傳統(tǒng)科技名人檔案信息組織主要是文本信息的組織,在數(shù)字和網(wǎng)絡(luò)環(huán)境下,文本信息與多媒體信息共存[14]?!皵?shù)智”環(huán)境下,科技名人檔案資源經(jīng)過(guò)科學(xué)整合、保障安全性的同時(shí),進(jìn)行檔案資源定量管理、檔案信息資源共享與傳播的嘗試是有意義的。但這絕不是單純的技術(shù)性問(wèn)題,資源整合要在平衡好方便存取與隱私保密的基礎(chǔ)上開展,才能做好目錄、全文、數(shù)據(jù)的匯編工作,做好全文目錄、全文數(shù)據(jù)庫(kù)建設(shè),做好保密措施、信息傳播過(guò)程中的隱私保護(hù)、著作權(quán)權(quán)利歸屬制度安排,搭建高效、安全的科技名人檔案資源傳播與共享平臺(tái)。
科技名人檔案所蘊(yùn)含的豐富資源就是自身成長(zhǎng)的土壤,但想要價(jià)值之花綻放,還需要實(shí)質(zhì)性的技術(shù)“養(yǎng)分”來(lái)培育。當(dāng)然,不能淺層次地堆砌數(shù)字技術(shù),而是應(yīng)該以資源整合存在的問(wèn)題為導(dǎo)向,注重做好科技名人檔案資源整合與信息技術(shù)的聯(lián)結(jié)和匹配。
以解決科技名人檔案“變藏為用”問(wèn)題為例,受文獻(xiàn)[15]啟發(fā),科技名人檔案資源能和GIS技術(shù)產(chǎn)生良好的配合,應(yīng)用GIS技術(shù)來(lái)優(yōu)質(zhì)整合、對(duì)比、分析、挖掘科技名人檔案??萍济藱n案是科學(xué)家學(xué)術(shù)生涯和人生歷程的原始記錄,在某種程度上能映射出科學(xué)家的學(xué)術(shù)與人生軌跡、科學(xué)技術(shù)發(fā)展演進(jìn)的空間歷程乃至社會(huì)歷史動(dòng)態(tài)發(fā)展的進(jìn)程。若將個(gè)體科學(xué)家的人生軌跡結(jié)合地理空間維度的相關(guān)知識(shí)進(jìn)行分析,會(huì)有更多更新的發(fā)現(xiàn)。筆者參與的“采集工程”項(xiàng)目,收錄了大量反映老科學(xué)家本人學(xué)術(shù)、社會(huì)、科技等系列活動(dòng)的手稿、書信、照片、口述記錄等檔案材料。毫無(wú)疑問(wèn),若能將科學(xué)家個(gè)體的學(xué)術(shù)地理活動(dòng)軌跡有序分析對(duì)比,建立網(wǎng)絡(luò)化的動(dòng)態(tài)分布展示,會(huì)產(chǎn)出優(yōu)質(zhì)且可靠的新知識(shí),這些新知識(shí)能夠契合學(xué)者的興趣點(diǎn)。思考科技名人檔案與GIS技術(shù)的結(jié)合,為各界學(xué)者提供研究資源,就是運(yùn)用“數(shù)智”技術(shù)整合科技名人檔案以促進(jìn)其“變藏為用”的一種有效手段。此外,科技名人檔案涉及多層知識(shí)結(jié)構(gòu),若要解決科技名人檔案多級(jí)著錄的問(wèn)題,可以嘗試在科技名人檔案的內(nèi)容整合中開發(fā)智能、多級(jí)著錄[16]的功能。
無(wú)論是在傳統(tǒng)環(huán)境還是在網(wǎng)絡(luò)環(huán)境下,針對(duì)科技名人檔案的資源整合離不開協(xié)作。以“采集工程”關(guān)于老科學(xué)家成長(zhǎng)資料的收集、整理與價(jià)值開發(fā)面臨的實(shí)際問(wèn)題為例,由于老科學(xué)家年齡較高、學(xué)術(shù)成果豐碩,對(duì)其時(shí)間(接受教育時(shí)期、科研工作起步時(shí)期、科研飛躍時(shí)期等)、事件(留學(xué)、進(jìn)修、育人、學(xué)科建設(shè)、科研活動(dòng)等)和人物關(guān)系(家庭成員、師生傳承、與其他科技合作者的交集、學(xué)術(shù)交往等)的梳理與考證工作龐雜,筆者所在課題組主要是依靠傳統(tǒng)的大腦記憶整理和人工采集梳理來(lái)編寫老科學(xué)家大事年表。在實(shí)踐中,有必要打通與智能技術(shù)從業(yè)人員合作可能性,使科技名人檔案資源建設(shè)同智能技術(shù)相融合,探索數(shù)據(jù)智能技術(shù)在科技名人檔案資源整合中能做什么。從這個(gè)角度來(lái)說(shuō),發(fā)掘內(nèi)容資源的遞增價(jià)值理應(yīng)多方參與,不但可以激發(fā)新的協(xié)作聯(lián)合形式,提高現(xiàn)代檔案工作者的信息素養(yǎng),從長(zhǎng)遠(yuǎn)看還能積極尋找科技名人檔案高效整合的路徑與協(xié)同方式,充分發(fā)揮多方力量,為科技名人檔案建設(shè)注入智慧因子,讓科技名人檔案建設(shè)處于動(dòng)態(tài)完善的多主體參與建設(shè)的集優(yōu)過(guò)程,這是提升科技名人檔案資源整合效能的必要環(huán)節(jié)。