錢毅 崔浩男
摘 要:人物照片檔案資源蘊含豐富的隱性知識和語義信息,其深度開發(fā)利用仍處于探索階段。文章借鑒圖像學的圖像類型和分析層次理論,結合當下的人臉識別等技術,提出以“認人—識人—用人”為明線、“人臉特征庫—人物知識庫—人物應用場景池”為暗線的人物照片檔案開發(fā)新框架,以實現(xiàn)照片檔案的要素識別、語義關聯(lián)和深度利用,對于轉變照片檔案開發(fā)利用的傳統(tǒng)思維和固有方式具有指導作用。
關鍵詞:照片檔案;信息資源開發(fā);圖像學理論;語義增強
分類號:G273
Research on the Development and Utilization of Portrait Photographic Archives Based on Iconology Theory
Qian Yi1,2, Cui Haonan1,3( 1.School of Information Resource Management of Renmin University of China, Beijing 100872; 2.Research Center of Electronic Records Management of Renmin University of China, Beijing 100872; 3.Research Center for Digital Humanities of Renmin University of China, Beijing 100872 )
Abstract: Portrait photographic archives contain rich tacit knowledge and semantic information, and their in-depth development and utilization is still in the exploratory stage. Based on the image type and analytic hierarchy theory of iconology, combined with the current face recognition and other technologies, this paper puts forward a new framework for the development of portrait photographic archives, which takes recognizing portrait - knowing portrait - using portrait as the bright line and face feature database - portrait knowledge database - portrait application scene as the dark line, so as to realize the element recognition, semantic relevance and in-deep utilization of photographic archives. This paper has a directive function for changing the traditional thinking and inherent way of photographic archives development and utilization.
Keywords: Photographic Archives; Development of Information Resources; Iconology Theory; Semantic Enhancement
檔案資源的智慧化轉型是“十四五”時期檔案工作應對數(shù)字時代挑戰(zhàn)、實現(xiàn)全面數(shù)字轉型的題中之義。但是,當前檔案資源的智慧化轉型研究還大多圍繞常規(guī)文本類資源展開,對特殊門類資源的管理和開發(fā)關注不足,缺乏深入、可復用的智慧化開發(fā)路徑與方法。特殊門類的檔案資源往往信息表示更為復雜,凝聚的語義更為豐富,可挖掘的價值更強,對于豐富和提升檔案機構的資源品質具有不可或缺的獨特作用。因此,本文聚焦人物照片檔案,即組織機構或個人在社會實踐活動中直接形成的對國家和社會具有保存價值并歸檔保存的人像照片,結合圖像學理論與人工智能技術,創(chuàng)新照片檔案開發(fā)利用的思維,探索照片檔案資源智慧化轉型的路徑和方案。
當前,照片檔案管理的研究趨勢已從傳統(tǒng)照片檔案轉向數(shù)碼照片檔案,進入“深水區(qū)”和“內涵式”的高質量發(fā)展階段。為聚焦研究主題,筆者通過在中國知網(wǎng)、萬方、維普等文獻庫中檢索主題為“數(shù)碼照片檔案”的文獻(檢索時間為2022年2月),發(fā)現(xiàn)當前研究主要圍繞“數(shù)碼照片檔案”“數(shù)碼照片”“照片檔案”“檔案管理”等主題展開;研究主體集中在公共事業(yè)單位;研究內容比較關注在數(shù)碼時代的客觀環(huán)境下,依托照片檔案管理的現(xiàn)狀改進實際工作,側重經驗總結。[1-3]此外,當前研究較少關注人物照片檔案這一特定類別,僅有學者提出一種照片檔案人物自動標注方法,以解決不同照片重復人物的標注問題。[4]
1 人物照片檔案開發(fā)利用的新理論
本文的研究對象是人物照片檔案,即原生數(shù)碼照片檔案和傳統(tǒng)載體照片檔案的數(shù)字化成果中包含人物要素的部分。人物照片檔案歸根結底屬于“圖像”的范疇,因而可以借鑒藝術領域中圖像學的相關理論。圖像志(Iconography)被認為是圖像學發(fā)展的早期階段,[5]是藝術史研究的一種方法學,主要涉及圖像的收集、整理和描述、分類工作,并對作品中的人物身份、事件、形象進行知識性的解釋。20世紀后,傳統(tǒng)圖像志發(fā)展為現(xiàn)代圖像學研究,開始注重對圖像作品主題事件和深層意義的探索。[6]
1.1 圖像類型研究
美國藝術史學家馬克·D·富勒頓區(qū)分了“象征性”和“敘事性”兩種圖像類型,認為象征性圖像表示某種物體或現(xiàn)象,敘事性圖像則主要和某個故事或事件相關聯(lián),都帶有深刻的精神寓意和文化內涵。[7]據(jù)此,人物照片檔案可區(qū)分為“象征型人物照片”和“敘事型人物照片”。象征型人物照片是指以人物形象為核心拍攝對象,為特定目的而進行的有選擇性的拍攝,如人物標準肖像照、會議合影等形式。這類照片往往在照片檔案中占據(jù)相當比重,由于其形成本身具有特定目的性和時機選擇性,因而在常規(guī)管理到位的情況下,相關元數(shù)據(jù)信息有一定的保障。敘事型人物照片則是指為記錄客觀活動場景而拍攝的一類照片,人物作為其中的要素得以展示。這類照片的“敘事性”特點突出,主要用于展示客觀活動過程和典型場景,承載更多的業(yè)務動作和事件屬性,相對而言沒有刻意突出人物形象,符合人們平時生活中的“抓拍”情形,人物形象表達也更為自然。簡而言之,象征型照片有較強的確定性,數(shù)據(jù)來源更為明確;敘事型照片的隨機性更強,數(shù)據(jù)來源更為豐富。在人物照片檔案開發(fā)中應有機融合兩種照片類型,在不同應用場景中充分發(fā)揮兩種照片的優(yōu)勢。
1.2 圖像分析層次研究
圖像學提供的圖像分析層次思想可以用于指導人物照片檔案的開發(fā)。帕諾夫斯基將圖像學分析步驟分為三層:第一層為“前圖像志描述”,即描述圖像的自然意義,包括外觀的形式結構、外在事實意義等,解釋者應該有實際經驗;第二層為“圖像志分析”,是發(fā)現(xiàn)、解釋圖像的傳統(tǒng)意義和作品的特定主題,解釋者應該有原典知識;第三層為“圖像學分析”,解釋圖像或作品的內在意義和內容,解釋者應該有綜合直覺能力。[8]由此可見,結合圖像背后的內涵才能理解圖像的完整意義。在大規(guī)模數(shù)字化的當下,這種對圖像作品內容的描述和闡釋方法可為人物照片檔案的內容開發(fā)環(huán)節(jié)帶來啟示。如表1所示。
2 人物照片檔案開發(fā)利用的新框架
基于上述圖像學理論,結合人工智能技術,尤其是人臉識別技術的廣泛應用,本文從實際業(yè)務開展和基礎設施構建兩條線索共同切入,探索人物照片檔案開發(fā)利用的新思維。一方面,從檔案行業(yè)的業(yè)務開展內容看,“認人—識人—用人”分別對應圖像學分析的三個層次,可作為“明線”貫穿業(yè)務活動中;另一方面,從資源體系和技術融合的角度看,結合上述線索可以構建“人臉特征庫—人物知識庫—人物應用場景池”的基礎設施“暗線”,分別代表著要素與要素的連接、知識與知識的關聯(lián)、場景與場景之間的協(xié)同?!懊骶€”與“暗線”的三個環(huán)節(jié)分別由淺至深地實現(xiàn)信息要素識別、信息語義關聯(lián)和信息深度利用的目的。如圖1所示,本文提出基于圖像學理論的人物照片檔案開發(fā)框架,可根據(jù)需求進一步構建實現(xiàn)路徑和應用場景模塊,實現(xiàn)底層對象、中層要素、高層語義的連接。
2.1 明線——實際業(yè)務開展
照片檔案管理可以圍繞“人”這一基礎性要素創(chuàng)新人物照片檔案開發(fā)的流程,促使人物照片檔案在“載體—文件—數(shù)據(jù)—語義—價值”維度上延伸。
(1)認人:人臉識別技術的成熟應用
認人,指通過人工智能技術中的人臉識別技術能夠對數(shù)碼照片檔案中的人物予以高效識別和精準指認。就照片檔案的利用而言,利用者通常會用“人名”作為關鍵字進行檢索,這就要求對照片中的人物進行充分的識別和標注。目前對人物照片檔案的識別方式比較傳統(tǒng):主要依據(jù)照片檔案六要素“拍攝時間、事由、地點、人物、背景、攝影者”進行。在要素齊全的情況下,可根據(jù)“人物”要素的相關著錄信息進行識別,而當照片檔案進館要素不齊、照片檔案載體本身出現(xiàn)發(fā)黃粘連和脫落、只著錄了主要人物信息卻沒有著錄所有人物信息時,[9]則往往依靠人工識別。AI人臉識別技術的發(fā)展使得基于人物圖像的數(shù)碼照片自動“認人”成為可能,據(jù)此可以對人物圖像識別的邏輯與嵌入照片檔案管理全過程的技術要點進行重新設計。
(2)識人:人物照片檔案的語義關聯(lián)
識人,指基于現(xiàn)有人物圖像,結合相關檔案館藏以及外部信息源進行語義分析和邏輯關聯(lián)。目前,單靠文字說明和部分著錄元數(shù)據(jù)的照片檔案無法滿足檔案深度利用的要求,通過人工逐一標注海量照片數(shù)據(jù)的方式則囿于各項成本而難以實現(xiàn)。為突破瓶頸,需進一步創(chuàng)新“識人”機制,可使用對應的圖像數(shù)據(jù)增強工具,結合圖像語義提取圖像特征值建立特征索引庫。同時,設計“識人”模式下的成果反哺機制,通過人臉識別技術所識別的人物信息,回溯至檔案特征索引庫中增加“補充性著錄資料”,逐漸豐富照片著錄信息。依托這種方式,通過自建或利用相關語義基礎設施,可以批量對人物照片檔案相關信息進行語義增強,如利用其家族、所在機構、社交圈、相關事件、行動軌跡等基礎數(shù)據(jù)對人物進行語義拓展和關聯(lián)。
(3)用人:人物照片的深度挖掘利用
用人,指借助照片檔案資源中的人物要素及其關聯(lián)信息,在各類利用場景中挖掘人物照片檔案資源的深度利用價值,最終服務于前端開發(fā)工作。其核心含義是將“認人”和“識人”中獲得的人物表面信息,結合其他背景要素信息,在人工智能技術手段下,形成真實、完整、流暢的檔案敘事。其主要思路包括:第一,基于人工智能的各項服務場景技術,如照片時間軸技術、GPS地點人物相結合的元素檢索技術、情感分析技術等,實現(xiàn)對照片檔案中人物的軌跡分析、交集分析、關系分析、情感分析等。第二,結合人物照片檔案的其他元素信息(如主題、時間、地點、攝影者等)進行交叉分析處理,完整展示照片形成的歷史背景和社會環(huán)境因素,探索多人物交集環(huán)境下多要素結合的檔案檢索、查詢應用,明晰檔案信息深度挖掘利用的基本路徑。第三,協(xié)助檔案機構人員開展歸檔環(huán)節(jié)的決策分析,通過人物庫與移交照片的對比,獲取反饋結果,從而為檔案人員開展歸檔鑒定提供判斷依據(jù),實現(xiàn)敏感信息自動識別與檔案分級分類。第四,借助數(shù)據(jù)平臺實現(xiàn)開發(fā)成果的實時迭代更新,當新的人物照片檔案數(shù)據(jù)源納入該成果主題時,依照開發(fā)模型和規(guī)范,相關新數(shù)據(jù)會被及時填入開發(fā)產品中。
2.2 暗線——基礎設施構建
建設人臉特征庫、人物知識庫、人物應用場景池等檔案語義基礎設施是提升人物照片檔案資源開發(fā)能力的“暗線”。檔案語義基礎設施是用于拓展檔案數(shù)據(jù)內涵的具有工具性和服務性的語義產品。[10]照片檔案語義基礎設施不僅包含帶有照片檢索服務的文獻庫,還包含基于資源對象和數(shù)據(jù)單元層面的基礎知識庫和開發(fā)產品,應支持跨機構的共建共享、跨網(wǎng)域的開放互聯(lián)和跨領域的知識融通。[11]這將涉及到照片檔案數(shù)字化、文本化、數(shù)碼照片的知識表示、數(shù)字圖像互聯(lián)與共享、照片知識庫構建等多個環(huán)節(jié)。[12]
(1)人臉特征庫:通過技術賦能管理
人臉特征庫建設的核心是通過人臉識別技術賦能精細化管理,主要包括“技術認人”和“管理認人”兩個關鍵節(jié)點。技術認人是通過人臉識別技術和外部資源的協(xié)同來建設人臉比對庫,提高認人的效率,避免大量的重復勞動,是后續(xù)開發(fā)環(huán)節(jié)的基礎。管理認人是在主題場景的指導下,通過人工提取著錄項,豐富元數(shù)據(jù)中的基本信息,有利于進一步增強信息密度、打破信息迷霧、提升信息關聯(lián)。通過技術和管理手段來構建人臉特征庫實現(xiàn)照片人物識別,可以克服合影人物眾多難以識別、老舊照片人物模糊、人物信息不全等難點,是照片價值得以充分發(fā)揮的重要途徑,也是照片檔案資源進行人機交互的重要方式。
(2)人物知識庫:通過關聯(lián)增強語義
通過人臉識別、人工著錄能夠得到較為充分的人物照片檔案基礎數(shù)據(jù),由此可以進一步以人物照片檔案內容的解析為基礎,建立人物照片檔案信息的關聯(lián)關系,實現(xiàn)照片檔案之間、照片檔案與其他資源之間的靈活互動,建設人物知識庫等語義基礎設施。由于與照片人物相關的信息很有可能分布存放在不同單位和系統(tǒng)之中,加之采用不同的描述方法和標準,難以實現(xiàn)跨機構、跨系統(tǒng)的開發(fā)利用。但人物照片檔案與相關檔案資源往往隱含著共同的“記憶點”,因而通過對照片檔案內容進行分層處理,形成照片層、元數(shù)據(jù)層和標簽層的多層數(shù)據(jù)對象,針對數(shù)據(jù)對象采用主題建模、標簽加注等手段來構建本體模型和知識圖譜,可以在人物層面實現(xiàn)語義樹的層次拓展和縱向延伸。在這個過程中,人物照片檔案所記錄反映的“人、事、時、地、物”要素及其互相之間的關系能夠得到更加靈活的揭示,可以將更多的顯性知識與隱性知識、內部知識與關聯(lián)知識、通用知識與專用知識疊加起來,實現(xiàn)照片檔案內容的語義增強,[13]有助于完整反映歷史事實的證據(jù)情況和發(fā)展線索。
(3)人物應用場景池:通過成果輔助敘事
數(shù)字時代的人物照片檔案開發(fā)成果及其應用場景應更加多元,包括數(shù)字出版物、專題數(shù)據(jù)庫、微系統(tǒng)、融媒體可視化產品等。這些多元化的成果能提供各種數(shù)據(jù)服務,用戶可通過可視化產品瀏覽、數(shù)據(jù)庫檢索、數(shù)據(jù)集調用、微服務應用等多種方式加以利用,并可以在線上直接與開發(fā)者進行雙向交互,由此支撐構建以照片檔案為核心資源的融媒體數(shù)字記憶空間,真正實現(xiàn)全方位、多模態(tài)圖文互動的檔案敘事。隨著媒體融合時代的到來,檔案敘事不再單單依靠文字,而是應綜合運用圖片、視頻、音頻等多種信息傳播方式,給用戶帶來更加豐富的使用感受。隨著互聯(lián)網(wǎng)技術與數(shù)字展陳設備的發(fā)展,照片檔案的圖像敘事正在實現(xiàn)流程再造,敘事的“集中采編、移動優(yōu)先、融媒產品、全屏直播”成為趨勢,統(tǒng)一的檔案故事在不同媒體中呈現(xiàn)出不同敘事特征,一種多元化的檔案敘事形態(tài)正在形成。伴隨著照片檔案智能化的發(fā)展,照片檔案在檔案敘事中的作用將不斷凸顯,其與檔案文本敘事方式可以有機結合,利用融媒體展陳產生新的敘事風格,實現(xiàn)從“零散信息”到“聚合信息”的跨越,即借助照片檔案的典型性特點,結合其他檔案材料的完整性特點,實現(xiàn)多資源、多媒體聯(lián)動,完成全方位的檔案敘事。
3 總結與展望
照片檔案具有生動性、講述力、故事感,采用圖像文字組合等簡單的數(shù)字化形式雖能復原或重構相關信息,卻難以描述故事元素之間的復雜關聯(lián)和模糊語義。本研究基于圖像學理論,以“認人、識人、用人”為線索,提出實現(xiàn)人物照片檔案信息識別、分析和挖掘利用的新框架,有助于從根本上轉變照片檔案的管理邏輯起點,實現(xiàn)從照片檔案的載體管理轉向照片檔案的內容管理。未來在檔案工作實踐過程中結合人工智能技術不斷檢驗、改進現(xiàn)有框架,可以將原先照片資源開發(fā)過程中對人物照片檔案的簡要羅列式的思維,創(chuàng)新為“以人敘事”的新型人物照片檔案開發(fā)思路,將原先“用照片去襯托故事”的利用模式變?yōu)椤坝谜掌ブv故事”的新模式,實現(xiàn)人物照片檔案資源和其他資源之間的關聯(lián)敘事,真正實現(xiàn)照片檔案資源的“活化”。
*本文系國家檔案局科技項目“AI人臉識別在數(shù)碼照片檔案管理中的應用研究”(項目編號:2021-X-09)階段性研究成果。
注釋與參考文獻
[1]朱玉清.基于高校照片檔案編研的反饋及思考[J].中國檔案,2021(4):44-45.
[2]曾靜怡,顧偉,劉力超,等.照片檔案創(chuàng)新編研思路探析[J].檔案學通訊,2021(4):71-76.
[3]曾靜怡.上下文在照片檔案敘事中的應用[J].檔案學研究,2021(6):100-105.
[4]李剛.一種照片檔案的人物自動標注的方法[J].電子技術與軟件工程,2020(15):137-138.
[5]比亞洛斯托基,楊思梁,宋青青.圖像志[J].新美術,1990(1):73-88.
[6]徐建融.大辭海:美術卷[M].上海:上海辭書出版社,2012:516.
[7]李旭暉,吳燕秋,王曉光.基于角色關聯(lián)的敘事型文化遺產知識表示方法[J].圖書情報工作,2017(9):116-122.
[8]宋小蒙.從圖像志看圖像學的本土化[J].美與時代(下),2020(11):15-17.
[9]郭俊山.淺談檔案館搬遷中的檔案保護[J].黑龍江檔案,2019(1):97.
[10]劉煒,謝蓉,張磊,等.面向人文研究的國家數(shù)據(jù)基礎設施建設[J].中國圖書館學報,2016(5):29-39.
[11]夏翠娟.面向人文研究的“數(shù)據(jù)基礎設施”建設——試論圖書館學對數(shù)字人文的方法論貢獻[J].中國圖書館學報,2020(3):24-37.
[12]顏佳,楊敏,彭梅.面向數(shù)字人文的圖像數(shù)據(jù)基礎設施建設研究——以我國圖博檔領域為視角[J].圖書館,2021(5):51-58.
[13]陳濤.目標檢測在數(shù)字人文圖像中的應用嘗試[J].數(shù)字人文研究,2021(3):39-50.