肖辛格
摘 要:在當前人工智能浪潮下,高校檔案編研工作迎來了新的挑戰(zhàn)。文章分析了當前人工智能技術的特點,在此基礎上探討了人工智能技術運用于高校檔案編研的挑戰(zhàn),并進一步指出要高校檔案編研工作需要轉變工作思路,才能實現(xiàn)人工智能技術與高校檔案編研的有機結合。
關鍵詞:高校檔案編研;人工智能;檔案資源挖掘;檔案工作
在高校檔案工作中,檔案編研是不可或缺的重要一環(huán)。高校檔案中往往蘊藏著豐富的校園歷史文化信息,對這些信息資源進行挖掘,形成編研成果,可以實現(xiàn)學校檔案工作與校園文化建設、大學生素質教育的緊密結合,助力學校文化傳承創(chuàng)新。
隨著計算機技術的進步,人類社會迎來了新的人工智能浪潮,高校檔案編研工作也因此面臨著巨大挑戰(zhàn)。要在新的環(huán)境下做好檔案編研工作,就需要充分把握當前人工智能技術的特點,轉變工作思路,創(chuàng)新工作內容,以多樣化的人工智能手段來展現(xiàn)檔案編研成果。
一、當前人工智能技術的特點
1.識別、模擬能力大大增強。以深度學習為代表的人工智能技術取得了重要突破,使得計算機在諸多領域的識別能力、模擬能力均得到了顯著提升。比如從2015年起,圖像自動分類算法的錯誤率降至4%以下,已經低于人工標注時5%的錯誤率。再如,2017年華盛頓大學的人工智能研究團隊曾利用深度學習技術分析了大量的奧巴馬視頻,然后可以利用任何一個人的講話視頻,來生成一段假的奧巴馬講話視頻,不論是聲音還是影像,幾乎很難找出破綻。這些都反映了當前人工智能技術在識別能力、模擬能力上取得的重大突破。
2.依賴海量數(shù)據(jù)。當前眾多人工智能技術能夠取得優(yōu)異成績的重要原因之一,就是海量數(shù)據(jù)作為支撐。得益于計算機運算能力的提升和網(wǎng)絡技術的發(fā)展,網(wǎng)絡上的數(shù)據(jù)量迅猛增加。在海量數(shù)據(jù)中,一些學者發(fā)現(xiàn)了很多原本難以觀察到的規(guī)律,推動了各自領域的發(fā)展,數(shù)據(jù)的作用開始得到普遍重視,“大數(shù)據(jù)”這一概念也開始廣為人知。當前人工智能技術能取得如此輝煌的成績,同樣離不開“大數(shù)據(jù)”的支撐。比如一個物體檢測模型可能需要有上十萬乃至上百萬張不同物體的圖像才能取得較好的效果。雖然技術進步才是人工智能發(fā)展的根本原因,但如果缺少了海量數(shù)據(jù),技術也很難發(fā)揮其應有的效果。即使確實存在小數(shù)據(jù)集下訓練得到的優(yōu)質模型,但總體而言,目前仍是數(shù)據(jù)集越大,模型的效果越好。
3.技術產業(yè)化過程加速。相較于此前人工智能浪潮中各項技術的發(fā)展,當前人工智能浪潮下的技術,從誕生到實現(xiàn)產業(yè)化的進程也大大縮短。比如,2011年,微軟鄧力團隊憑借深度學習技術在語音識別上取得了巨大成功,在此后短短幾年內,語音翻譯、語音打字等系統(tǒng)被迅速開發(fā)出來,并成功投入了商業(yè)應用,成為一些即時通訊軟件、輸入法的基礎功能。再如,2012年,基于深度學習的圖像識別技術在計算機視覺領域著名比賽ImageNet中取得了優(yōu)異的成績,僅僅幾年后,依賴圖像識別、圖像生成技術的程序層出不窮,如自動修圖程序、換臉程序、自動生成人臉程序等;刷臉認證技術、無人駕駛技術等也迅速得到了廣泛關注,甚至投入了應用。技術快速實現(xiàn)產業(yè)化,給社會帶來了巨大的經濟效益,也為日常生活提供了巨大的便利。
二、人工智能技術運用于高校檔案編研的挑戰(zhàn)
人工智能技術的迅猛發(fā)展讓越來越多的行業(yè)發(fā)生了巨大變革,高校檔案編研工作同樣應該充分運用先進的人工智能技術,把握住機遇,以適應新的時代發(fā)展要求。當然,要使技術的力量得到充分發(fā)揮,讓人工智能技術與高校檔案編研工作能夠有機結合,就必須認清當前人工智能技術用于高校檔案編研時存在的一些挑戰(zhàn)。
1.人工智能技術與檔案編研的切合點仍待探索。當前人工智能技術主要在模式識別、檢索能力、邏輯處理能力等方面占有明顯優(yōu)勢,而高校檔案編研工作則重在“編輯”和“研究”,需要一定的挖掘能力、歸納能力和創(chuàng)新意識。人工智能技術所具備的優(yōu)勢和檔案編研工作所需要的能力之間不完全匹配。如何將人工智能技術的優(yōu)勢與檔案編研工作有機結合,仍需要在具體實踐中反復試錯、不斷探索。
2.檔案資源建設程度與人工智能技術不相適應。以往的高校檔案編研,主要立足于已有的館藏檔案資源。如果館藏資源有限,編研工作也會受到嚴重制約。在當前人工智能浪潮下,深度學習等技術十分依賴于“大數(shù)據(jù)”,檔案編研對檔案資源建設的依賴程度更是有增無減。就目前來看,高校檔案資源建設依然很難適應“大數(shù)據(jù)”的要求。所以,要想借力人工智能技術,提升檔案編研工作質量,就仍需要進一步加強檔案資源建設。
3.檔案編研工作者難以應對頻繁的技術更新。當前的高校檔案編研工作者多為檔案學、歷史學、文獻學等專業(yè)出身,對快速涌現(xiàn)的人工智能技術的接納能力比較有限,運用這些技術來展開編研工作則更為困難。即便有大量技術實現(xiàn)了產業(yè)化,可以直接加以利用,但受限于知識背景構成,編研工作者一般也很難將相應的技術與編研工作結合到一起。
三、高校檔案編研工作思路的轉變
要應對上述挑戰(zhàn),有效發(fā)揮人工智能技術的優(yōu)勢,助力檔案編研,就需要轉變工作思路,讓檔案編研工作緊跟技術發(fā)展水平。轉變工作思路,具體可以從以下三個方面展開:
1.充分利用人工智能技術創(chuàng)新工作內容。傳統(tǒng)的高校檔案編研,一般多集中在參考資料編整、檔案文件匯編、校史編修等方面,這些工作中的數(shù)據(jù)統(tǒng)計與分析——比如歷年畢業(yè)生人數(shù)的統(tǒng)計、開課數(shù)量及課時的統(tǒng)計、歷年收支狀況的統(tǒng)計等等——仍然停留在對信息資源的簡單整理、提取和概括上,難以實現(xiàn)更深層次的量化分析。如果要進一步挖掘檔案本身所蘊藏的價值,則可以利用一些人工智能技術開展深度檔案數(shù)據(jù)挖掘。
比如,利用情感分析技術來創(chuàng)新高校檔案編研。情感分析,其目標一般是從文本中分析出人們的觀點、情感、評價、態(tài)度和情緒。近年來,情感分析發(fā)展十分迅猛,涌現(xiàn)出大量研究成果,應用領域也得到了充分擴展。如運用在商業(yè)領域對產品評價進行分析挖掘,運用在教學領域進行教學評價,以及運用在網(wǎng)絡輿情監(jiān)控領域進行輿情事件趨勢預測等等。如今,在金融、傳媒、旅游、教育、醫(yī)療、政治等各種領域都可以看到與情感分析有關的應用或產品。因而,我們同樣可以利用情感分析技術,深度挖掘檔案資源中的觀點、情感、評價等。比如對校報等某些特定檔案進行挖掘,可以考察高校媒體輿情的歷時變遷情況,反映高校歷史發(fā)展變化中的社群情緒脈絡;對學校特定重大事件的相關檔案進行挖掘,可以考察事件前后的輿情變化情況,為學校應對重大事件提供有效參考等。
要依靠人工智能技術實現(xiàn)工作創(chuàng)新,人才隊伍培養(yǎng)十分重要。一方面,要培養(yǎng)檔案編研工作者的信息化思維和創(chuàng)新意識,并鼓勵編研工作者多接觸、了解人工智能領域研究進展和新近成果。另一方面,要吸收跨學科、跨專業(yè)的人才,特別是與人工智能技術較為密切的相關學科的人才,為檔案編研注入新的活力。
2.基礎資源建設與檔案編研工作并駕齊驅。要適應人工智能技術對“大數(shù)據(jù)”的需求,就需要充分進行檔案資源建設。做好檔案資源建設,檔案征集和檔案數(shù)字化是十分重要的工作。檔案征集既包括實體檔案征集,也包括電子檔案征集。為了更好地適應人工智能技術的要求,實體檔案就需要進行檔案數(shù)字化。對于實體檔案的數(shù)字化,一般局限于紙質檔案的數(shù)字化。實際上,實體檔案的數(shù)字化完全可以進一步拓寬思路,比如將3D掃描技術運用到檔案數(shù)字化工作中,將非紙質的實體檔案掃描到電腦中,以3D文件的形式存儲下來。在后續(xù)編研中,則可以利用相應的人工智能技術和多媒體技術——比如VR虛擬現(xiàn)實設備來呈現(xiàn)這些實體檔案。
與此同時,編研工作固然依托于檔案資源建設,但也不能完全受制于檔案資源建設。一些人工智能技術本身可以為檔案編研提供新的手段和方法,如果運用得當,在有限的檔案資源下,也可以獲得出彩的成果。特別是憑借當前人工智能技術強大的信息資源挖掘能力,僅利用已有檔案資源,就可以挖掘出很多有價值的信息,如挖掘校園歷史人物關系、挖掘學科發(fā)展變化的脈絡、挖掘學院發(fā)展中重大事件的時間線索等等,這些都可以為校史研究提供有效的參考材料。而且,編研工作也可以成為資源建設的助推器,推動檔案資源建設工作的深入。換言之,就是要建立以需求為導向,建立“以用帶征”的工作模式:先確定合適的選題,在編研過程中根據(jù)需求去征集相應的檔案資源,實現(xiàn)以編研促征集。這樣,即使檔案資源建設滯后,也不會完全限制編研工作的發(fā)展。
3.運用多樣化的手段豐富呈現(xiàn)形式。高校檔案編研工作所面向的群體中,還包括了學生、校友群體。特別是對于學生群體,他們從小接觸各類電子移動設備,熟悉各類新型技術,了解豐富的媒體手段。傳統(tǒng)形式的文件匯編、校史校志等編研成果表現(xiàn)力十分有限,難以吸引如今的學生群體。所以在高校檔案編研工作中,還需要進一步豐富成果的呈現(xiàn)形式。當然,從更高的層面來看,豐富呈現(xiàn)形式也不僅僅是為了適應受眾的需要,更是為了適應時代的變化,緊跟時代腳步。
人工智能技術快速的產業(yè)化過程,為高校檔案編研工作及時運用新技術提供了可能。比如,可以利用計算機視覺領域的人工智能技術,對學校歷史老照片進行色彩修復或色彩還原,或是根據(jù)學校重要歷史人物的聲像檔案,構造出相應的虛擬人物形象,再運用到紀錄片視頻中,利用虛擬人物來講解相應的校園歷史故事,增強受眾的沉浸感和代入感。此外,甚至可以通過深入挖掘某一歷史時期校園場景信息、人物信息等,充分實現(xiàn)場景還原和人物建模,制作VR虛擬現(xiàn)實作品;也可以再以此為基礎,選取合適的歷史事件和切入角度,編制劇本,開發(fā)體驗游戲,寓教于樂。當然,要以視頻、游戲等手段來呈現(xiàn)編研成果,僅僅依靠檔案編研工作者很難完成。因而,高校編研工作還應該加強與傳媒專業(yè)、計算機專業(yè)及信息管理相關專業(yè)的合作。
四、結語
如今,我們又一次處在了新的人工智能浪潮之中,各行各業(yè)都或多或少地受到了人工智能浪潮的影響,檔案工作同樣也不例外。高校檔案編研對學校文化傳承創(chuàng)新職能的實現(xiàn)起到了積極的促進作用。在人工智能浪潮下,只有充分利用人工智能技術,才能有效實現(xiàn)文化興校、文化育人。
參考文獻:
[1]劉 兵.情感分析:觀點挖掘、情感和情緒[M].北京:機械工業(yè)出版社,2017.
[2]劉 智.課程評論的情感傾向識別與話題挖掘技術研究[D].華中師范大學,2014.
[3]梁曉敏,徐 健.輿情事件中評論對象的情感分析及其關系網(wǎng)絡研究[J].情報科學,2018,36(02)