關(guān)鍵詞:出版物圖像;隱秘性風險;人機協(xié)同;深度學習;區(qū)塊鏈
一、引言
宣傳思想文化工作事關(guān)黨的前途命運,事關(guān)國家長治久安,事關(guān)民族凝聚力和向心力。習近平總書記對宣傳思想文化工作作出重要指示強調(diào):“世界百年未有之大變局加速演進,中華民族偉大復(fù)興進入關(guān)鍵時期,戰(zhàn)略機遇和風險挑戰(zhàn)并存,宣傳思想文化工作面臨新形勢新任務(wù),必須要有新氣象新作為。”出版作為宣傳思想文化工作的重要組成部分,承擔著筑基、鑄魂、賦能的重要使命,高質(zhì)量出版物對塑造國家精神、建立民族自信具有重要意義。
隨著信息技術(shù)的飛速發(fā)展和多媒體傳播手段的日益普及,出版物圖像對文化傳播的影響力不斷提升,在塑造公眾意識、引導(dǎo)社會思潮方面發(fā)揮著關(guān)鍵作用。近年來,出版物圖像質(zhì)量問題所引發(fā)的社會輿論問題不容小覷,相較于一般差錯,出版物圖像事故極易引爆輿情,動搖大眾對出版權(quán)威性的信任與依賴,尤其當前國際國內(nèi)環(huán)境復(fù)雜,若圖像隱含并傳播了有風險的內(nèi)容,不僅會造成輿論倒戈、文化自卑論調(diào)抬頭,更會成為不良文化入侵的罅隙,從而影響社會穩(wěn)定和國家安全。在大數(shù)據(jù)、云計算、人工智能、區(qū)塊鏈等智能技術(shù)與出版工作深度融合的行業(yè)背景下,探索智能技術(shù)的優(yōu)勢疊加,并將其與人類智慧相結(jié)合,進而構(gòu)建起一種人機協(xié)同、優(yōu)勢互補、提質(zhì)增效的出版物圖像審核模式,實現(xiàn)對出版物圖像隱秘性風險更為精準、高效的識別與把控,對助力出版業(yè)務(wù)流程優(yōu)化,服務(wù)出版業(yè)高質(zhì)量發(fā)展,具有積極的意義。
二、出版物圖像風險及其分類
出版物圖像,泛指在出版物中使用的圖片,包括攝影作品、美術(shù)作品、圖表、地圖等。這些圖像作為出版物的一部分,在傳達信息、豐富內(nèi)容、增強視覺效果、吸引讀者興趣等方面發(fā)揮著重要作用?!霸谶@個讀圖時代,圖像符號伴隨著出版文化的發(fā)展,逐步演化為當代文化的主導(dǎo)力量。出版機構(gòu)以傳播文化為己任,出版物與視覺圖像的結(jié)合能夠更加方便快捷地傳播文化信息,更加直觀、生動、形象地傳播信息,滿足受眾的感官體驗和信息需要。圖像化是數(shù)字時代出版物發(fā)展的必然趨勢?!彼裕S著出版物圖像的廣泛使用和傳播,切實做好出版物圖像風險的辨識與防控,是嚴守出版物意識形態(tài)安全關(guān),嚴把出版物質(zhì)量關(guān)的必然要求。
出版物圖像風險泛指在出版過程中,因圖像使用失當而可能引發(fā)的多種風險,包括圖書質(zhì)量風險、法律風險以及經(jīng)濟風險等。相較于對文字、語法等傳統(tǒng)常規(guī)內(nèi)容所開展的編校審核工作,圖像所蘊含的要素更多,因此呈現(xiàn)更為多元且復(fù)雜的特性,并具備較強的隱秘性。故而,出版物圖像風險的甄別與判定面臨著諸多挑戰(zhàn),無論是在差錯發(fā)現(xiàn)的難易度還是風險判定的準確性等方面,均存在較大的差異與不確定性。結(jié)合出版業(yè)務(wù)實際,本文將出版物圖像風險劃分為顯著性風險和隱秘性風險兩大類。
出版物圖像的顯著性風險是指出版物圖像中那些容易被識別、直觀可見的風險。這些風險問題視覺上較為突出,可以被人工或者現(xiàn)有的智能審校工具直接甄別出來。例如,圖像內(nèi)容含有明顯有悖于出版質(zhì)量管理規(guī)范的涉黃、涉暴、涉敏等違規(guī)內(nèi)容,以及編校中容易發(fā)現(xiàn)的圖文不符、圖文錯配、不合常理等圖片問題。
出版物圖像的隱秘性風險是指不易被傳統(tǒng)人工審核或現(xiàn)有智能審校工具識別和判斷的風險,以及隱藏在圖像細節(jié)中的風險。這類風險可能潛藏著文化自信失根、傳播倫理失范、出版權(quán)威失信、創(chuàng)作人員失準等時代隱患,具體包括但不限于以下幾個方面:導(dǎo)向爭議(涉及政治、軍事、民族、宗教、外交等敏感信息)、知識差錯(存在錯誤知識或不準確信息)、倫理失范(違背倫理和道德規(guī)范,誤導(dǎo)受眾,侵犯隱私等)、有悖審美(脫離大眾心理認知和審美習慣,過度變形、夸張、怪異)等。
三、出版物圖像隱秘性風險識別的現(xiàn)實困境
出版物圖像覆蓋各個領(lǐng)域,來源復(fù)雜、種類紛繁,要素多元。相較于涉黃、涉暴等顯著易察的違背出版管理規(guī)范的問題類型,部分圖像在表面看似合規(guī)的呈現(xiàn)之下,實則潛藏著傳播錯誤的歷史認知、扭曲的價值觀或違背公序良俗的審美觀念等問題。這些隱秘性風險往往根植于圖像的深層內(nèi)涵之中,借助象征意義、文化隱喻等手段暗中發(fā)揮作用,甚至通過極為細微的展現(xiàn)方式,如畫面角落不起眼的標志、人物服飾上的特定紋樣等,悄然傳遞錯誤或不良信息。這無疑極大地提升了出版圖像審核工作的復(fù)雜性與難度層級。
(一)圖書編輯層面
傳統(tǒng)出版單位在技術(shù)應(yīng)用、平臺搭建、數(shù)據(jù)分析等方面的能力相對薄弱,圖書編輯作為出版物圖像審核的主體,其人工審核的效率較低。一方面,迫于企業(yè)生產(chǎn)經(jīng)營壓力,圖書編輯承擔的社會效益、經(jīng)濟效益指標被不斷壓實。圖書出版體量大、流程和環(huán)節(jié)多、出版周期長,需要溝通和協(xié)調(diào)的事務(wù)紛繁復(fù)雜,在這樣的條件下要保證出版進度,對編輯的業(yè)務(wù)能力和組織能力都是考驗。繁重的文字加工任務(wù)常常使得編輯在進行圖像審核時流于形式,難以真正做到全面、深入、準確地審核出版物圖像中的各類風險。另一方面,出版物圖像隱秘性風險的識別需要審查者具備深厚的專業(yè)知識、敏銳的文化洞察力以及對社會價值導(dǎo)向的精準把握,能夠穿透圖像的表面現(xiàn)象,剖析其潛在的、不易被直接感知的風險因素,從而確保出版物圖像在知識傳播、價值導(dǎo)向和審美引領(lǐng)等多方面符合出版規(guī)范與社會期望。除此之外,很多圖像單純依靠編輯個人的經(jīng)驗與能力來進行審核,存在著較大的局限性,難以避免主觀理解和審美上的偏差。
(二)業(yè)務(wù)管理層面
當下出版管理流程中,對圖像質(zhì)量的審查整體上滯后于行業(yè)發(fā)展。就現(xiàn)行國家所頒布的一系列質(zhì)量管理規(guī)定而言,其多集中于出版物的文字內(nèi)容審核維度,針對圖像的審核并不算規(guī)范且不夠系統(tǒng)。此外,三審三校是我國圖書出版質(zhì)量管理的重要環(huán)節(jié),圖像無論作為出版物主體還是文字內(nèi)容的補充,原則上均應(yīng)經(jīng)過三審三校的嚴格流程。然而,這一點在實際的出版流程中并未被切實體現(xiàn)。以繪制插圖類稿件為例,常規(guī)操作流程往往是在文稿內(nèi)容歷經(jīng)三審并定稿之后,相關(guān)人員才正式啟動插圖繪制工作。由于繪制進程難以掌控,與之對應(yīng)的圖片三審環(huán)節(jié)在時間上大幅滯后于文稿三審流程,并且在執(zhí)行過程中容易流于形式,難以達成其預(yù)期的審核效果與質(zhì)量把控目標。這種在出版流程中對圖像審核的不規(guī)范、不嚴謹以及滯后性的狀況,在相當程度上構(gòu)成了出版物圖像風險頻繁發(fā)生的關(guān)鍵原因之一,嚴重影響了出版物的整體質(zhì)量與行業(yè)的健康穩(wěn)定發(fā)展,亟待出版管理實踐與理論研究對其加以深入反思與系統(tǒng)性改進。
(三)技術(shù)應(yīng)用層面
近年來,國內(nèi)以方正智能審校、蜜度文修智能校對為代表的審校軟件,持續(xù)在對圖像中文字內(nèi)容的審核,對圖像中色情、暴力等問題的辨識等方面加大研發(fā)力度。例如,方正智能審校于2021年、2022年陸續(xù)上線了“圖片內(nèi)容檢查”“視頻內(nèi)容審核”功能,但前者僅限于對圖片中的文字內(nèi)容進行識別與審核;后者僅增加了敏感人物、違規(guī)標識等顯著性圖像問題的識別功能。鳳凰智能編校2022年上線“圖片內(nèi)容審核”功能,但僅支持識別并過濾色情、暴力、恐怖、政治敏感等內(nèi)容圖像。蜜度2024年發(fā)布了文修智能校對大模型3.0版,支持文本、圖片、視頻等多種內(nèi)容形態(tài)的校對??傮w上,隨著智能審校系統(tǒng)在出版流程中的廣泛應(yīng)用,其在書稿文字內(nèi)容的審校方面展現(xiàn)了較高的質(zhì)量與效率。但是,現(xiàn)有技術(shù)研發(fā)尚未充分發(fā)揮人工智能和圖像識別技術(shù)所具備的自主學習能力,尤其對于圖像中是否隱藏敏感信息、圖像是否經(jīng)過惡意篡改等復(fù)雜問題,現(xiàn)有的工具很難提供有效的檢測手段,無法滿足出版行政管理部門及出版企業(yè)對出版物圖像內(nèi)容風險控制所期待的精細化、精準化的更高要求。
四、基于人機協(xié)同視角的出版物圖像隱秘性風險識別路徑
作為新質(zhì)生產(chǎn)力的代表,智能技術(shù)正在重繪出版業(yè)生態(tài)圖景,人工智能、大數(shù)據(jù)等新技術(shù)的興起,推動了出版業(yè)的變革與發(fā)展。如何有效利用新技術(shù)推進出版深度融合,構(gòu)建一個更加開放、互聯(lián)、智能的書業(yè)新生態(tài),成為行業(yè)關(guān)注和探索的重要話題。故此,針對出版物圖像隱秘性風險的有效識別問題,可以通過人工智能、區(qū)塊鏈、圖像處理、信息安全等領(lǐng)域的跨學科融合,利用編輯與智能技術(shù)的各自優(yōu)勢開展協(xié)同創(chuàng)新,不斷完善全流程的出版物圖像質(zhì)量審查機制,為圖像審核工作提供更優(yōu)質(zhì)、更高效的人機協(xié)同工作模式,共同強化出版物圖像質(zhì)量的過程控制,守好出版物的意識形態(tài)安全關(guān)和質(zhì)量關(guān)。
(一)深耕數(shù)據(jù)積累,以深度學習為驅(qū)動,實現(xiàn)出版物圖像隱秘性風險智能識別
1. 搜集并歸納圖像風險,積累大規(guī)模的隱秘性風險圖像數(shù)據(jù)集
人工智能時代,大模型所代表的一系列新技術(shù)離不開高質(zhì)量的數(shù)據(jù),強大且豐富的數(shù)據(jù)庫是構(gòu)建人機協(xié)同審核模式的基礎(chǔ)。當前,AI出版審核系統(tǒng)對數(shù)據(jù)庫和功能的維護升級大多依賴技術(shù)公司,編輯無法根據(jù)日常工作經(jīng)驗及行業(yè)動態(tài)對其進行實時反饋、補充,帶來數(shù)據(jù)庫更新滯后、功能無法滿足實踐需要的問題。所以,提升出版物隱秘性風險的智能審核質(zhì)量與效率,需要我們集聚國家及各地的出版物質(zhì)量監(jiān)督部門、出版企業(yè)、行業(yè)協(xié)會等多方力量,對其在日常業(yè)務(wù)中獲取的風險圖像線索進行持續(xù)收集,倡導(dǎo)多方主體共同建設(shè)、共享成果。同時,可以按照導(dǎo)向爭議風險、倫理失范風險、知識差錯風險、圖文錯配風險、有悖審美風險等對圖像進行分類與歸納。在形成大量數(shù)據(jù)集的基礎(chǔ)上,采用基于隱式擴散模型、跨模態(tài)變換的數(shù)據(jù)增強方法等,進一步生成隱秘性風險圖像的擴展數(shù)據(jù)集,并按照相關(guān)規(guī)范完成標注,以便訓(xùn)練和評估圖像風險識別模型。
2. 利用人工智能技術(shù),持續(xù)構(gòu)建多元化的圖像風險識別模型
首先,設(shè)計一種基于深度生成模型的繪畫風格感知神經(jīng)網(wǎng)絡(luò),提取出版物圖像的風格編碼及其獨特視覺特征。其次,聯(lián)合運用圖神經(jīng)網(wǎng)絡(luò)、深層卷積神經(jīng)網(wǎng)絡(luò),設(shè)計一種圖像美學感知神經(jīng)網(wǎng)絡(luò),提取出版物圖像的幾何特征、語義特征、布局特征和色彩組合特征等,實現(xiàn)對圖像美學分數(shù)的回歸分析。最后,設(shè)計一種基于孿生網(wǎng)絡(luò)架構(gòu)和能夠生成模型的常識性重要標志感知神經(jīng)網(wǎng)絡(luò),提取并匹配出版物圖像中的標志性建筑、人物、圖案等。在此基礎(chǔ)上開發(fā)“AI+”計算機視覺驅(qū)動的出版物圖像隱秘性風險識別算法。針對出版物圖像潛在的有悖審美、導(dǎo)向爭議、倫理失范類風險的評估,利用繪畫風格神經(jīng)網(wǎng)絡(luò)和圖像美學感知神經(jīng)網(wǎng)絡(luò)實現(xiàn)辨識;針對出版物圖像潛在的圖文錯配、知識差錯類風險的評估,利用常識性重要標志感知神經(jīng)網(wǎng)絡(luò)實現(xiàn)辨識。由于新的風險形式持續(xù)涌現(xiàn),上述模型必須不斷優(yōu)化與更新。一方面,需定期收集新的圖像數(shù)據(jù)用以進行模型訓(xùn)練,適時調(diào)整模型參數(shù),從而更好地適應(yīng)不斷變化的圖像風險環(huán)境。另一方面,可以構(gòu)建反饋機制,利用人工識別的結(jié)果以及實際應(yīng)用中出現(xiàn)的錯誤案例,及時對模型進行優(yōu)化。如此一來,模型方能始終保持較強的風險識別能力,為圖像風險的防控提供有力的技術(shù)支持。
基于深度學習的出版物圖像隱秘性風險技術(shù)路徑如圖1所示。
(二)利用區(qū)塊鏈技術(shù),增設(shè)第三方人工審核,兼顧出版物圖像數(shù)據(jù)的隱私與安全
1. 基于聯(lián)盟鏈與IPFS,將外部審查納入圖像隱秘性風險識別流程
深度學習在高效處理大量數(shù)據(jù)、自動化執(zhí)行標準化任務(wù)以及模式識別等方面表現(xiàn)出色。然而,出版物圖像種類多元,尤其是以繪制類插圖為代表的出版物圖像,在審美判斷、文本理解等方面存在較大差異,導(dǎo)致圖片辨識結(jié)果主觀性較強、爭議性較大。故此,可利用區(qū)塊鏈技術(shù),對相對復(fù)雜、不確定的圖片識別任務(wù)增設(shè)第三方專家審核,提升風險識別精度和效率。聯(lián)盟鏈適用于多實體共享數(shù)據(jù)但互相不完全信任場景,可提供權(quán)限控制、智能合約等功能;IPFS是去中心化文件存儲系統(tǒng),適合存儲非結(jié)構(gòu)化數(shù)據(jù),能通過內(nèi)容尋址確保文件的唯一性和可驗證性。以聯(lián)盟鏈+IPFS建立圖像風險人機協(xié)同審核框架,即聯(lián)盟鏈存儲IPFS文件哈希值,既確保數(shù)據(jù)鏈下的存儲及其不可篡改性,又部署智能合約管理IPFS鏈接和文件元數(shù)據(jù),實現(xiàn)對文件訪問權(quán)限的控制、數(shù)據(jù)交換以及版權(quán)保護等功能。
2. 利用區(qū)塊鏈的共識投票機制,構(gòu)建高效、透明、可審計的審核流程
當AI識別模型檢測到圖像潛在隱秘性風險時,區(qū)塊鏈上的智能合約即可啟動人工審核流程。首先,系統(tǒng)根據(jù)風險概率確定需要參與共識的審核人員數(shù)量,并根據(jù)預(yù)定規(guī)則將圖像審核任務(wù)分配給不同的審核節(jié)點,即將需要審核的圖像和相關(guān)數(shù)據(jù)分發(fā)給審核專家。其次,審核專家查看圖像并進行獨立評估和投票,投票結(jié)果均被記錄在區(qū)塊鏈上,確保投票的不可篡改性和透明度。最后,根據(jù)預(yù)定義規(guī)則對圖像是否存在風險達成共識。這種方式也提供了一種可審計的機制,可以追蹤和記錄每一個決策和操作,從而提高整個流程的可信度。
3. 充分考慮版權(quán)保護與管理,確保相關(guān)圖像數(shù)據(jù)及個人隱私的安全
雖然區(qū)塊鏈強調(diào)透明性,但對于圖像審核過程中涉及的用戶隱私數(shù)據(jù),可以通過數(shù)字水印、智能合約、時間戳和分布式存儲技術(shù)進行保密,為出版物圖像使用風險辨識提供更為可靠的保障。在出版物版權(quán)的保護與管理上,在圖像識別和處理全過程中,可通過采取去標識化、數(shù)據(jù)最小化、加密和匿名化等隱私保護措施,使圖像數(shù)據(jù)在收集、存儲和處理的整個周期中都符合隱私保護標準,確保數(shù)據(jù)安全和個人隱私不受侵害。具體來說,可以在傳輸和存儲過程中采用強加密算法對圖像數(shù)據(jù)進行加密,防止未經(jīng)授權(quán)的訪問,確保數(shù)據(jù)的安全性;可以實施身份驗證和授權(quán)機制,嚴格控制數(shù)據(jù)訪問權(quán)限;可以對數(shù)據(jù)去標識化和匿名化,對圖像數(shù)據(jù)主體和審查人員進行匿名化處理,使牽涉其中的個人的身份難以被追溯,并能實現(xiàn)圖像審核的全程可追溯化,便于發(fā)生問題時追蹤數(shù)據(jù)處理的流程。
基于區(qū)塊鏈的人機協(xié)同的出版物圖像隱秘性風險識別技術(shù)路徑如圖2所示。
五、結(jié)語
無論人機協(xié)作的程度如何加深,圖書編輯作為出版企業(yè)最具有創(chuàng)造性、最活躍的生產(chǎn)要素,始終承擔著出版內(nèi)容質(zhì)量控制的關(guān)鍵角色,其職能和地位是不可替代的。未來,我們應(yīng)始終遵循國家及行業(yè)管理規(guī)范,持續(xù)監(jiān)測出版新業(yè)態(tài)快速發(fā)展而新衍生的質(zhì)量缺口,分析整理出版物圖像質(zhì)量管理的潛在風險點及關(guān)鍵控制點,全面構(gòu)建以技術(shù)為核心、以數(shù)據(jù)為要素的資源體系,深入探索出版物圖像隱秘性風險辨識與防范的理論與實踐,不斷完善全流程的出版物圖像質(zhì)量審查機制,助力出版業(yè)務(wù)流程優(yōu)化,筑牢人機協(xié)同的安全防火墻,服務(wù)出版高質(zhì)量發(fā)展。