丁乙
摘要:2022年《馬拉喀什條約》對中國生效,在新政策依托下,探索視障者閱讀新形式、提升視障者閱讀質(zhì)量,讓視障者更好地分享精神文化成果,是公共圖書館需要思考的問題。通過文獻(xiàn)調(diào)查國內(nèi)外公共圖書館視障閱讀服務(wù)現(xiàn)狀,以及基于對上海圖書館東館無障礙閱覽室視障服務(wù)特色的分析,探索運用多模態(tài)預(yù)訓(xùn)練大模型提升公共圖書館視障閱讀質(zhì)量的創(chuàng)新策略。
關(guān)鍵詞:視障? 無障礙閱讀? 多模態(tài)? 預(yù)訓(xùn)練? 上海圖書館
《中華人民共和國殘疾人保障法》明確了殘疾人享有平等接受教育、平等參與文化生活的權(quán)利。我國重視殘疾人特別是盲人的閱讀權(quán)益,不斷出臺政策保障殘疾人閱讀權(quán)益。1952年中國盲文統(tǒng)一,1994年設(shè)立中國盲文圖書館,2012年政策扶持盲文出版事業(yè)。
2016年鼓勵公共圖書館設(shè)立盲人閱覽室,2022年《馬拉喀什條約》對中國生效,國家版權(quán)局印發(fā)《以無障礙方式向閱讀障礙者提供作品暫行規(guī)定》。一系列法律政策的出臺為公共圖書館視障讀者服務(wù)提供了有力支撐。
國內(nèi)外公共圖書館視障閱讀服務(wù)現(xiàn)狀
國外公共圖書館視障閱讀服務(wù)。大英圖書館解決了租用聽書設(shè)備的問題,幫助視障讀者實現(xiàn)實時聽書。其與知名耳機、話筒制造商森海塞爾合作,通過在視障者手機上免費安裝Mobile Connect程序,幫助視障讀者在圖書館內(nèi)以手機取代聽書設(shè)備實現(xiàn)無障礙收聽。美國公共圖書館的盲人服務(wù)起步較早,在1868年就有服務(wù)記錄,然而美國公共圖書館網(wǎng)站的無障礙程度尚有待提高。郭亞軍等在2020年以《康復(fù)法案》第508條為標(biāo)準(zhǔn),調(diào)查了146家美國公共圖書館網(wǎng)站信息的無障礙程度,認(rèn)為符合信息無障礙標(biāo)準(zhǔn)的只有15%,其中,圖片沒有替代文本是普遍問題。圖片缺少替代文本,屏幕閱讀器無法讀出圖片信息,導(dǎo)致視障者難以完整瀏覽圖書館網(wǎng)站信息,影響視障者圖書館網(wǎng)站使用體驗。日本公共圖書館視障讀者特色服務(wù)包括面對面朗讀服務(wù),館員和志愿者在圖書館或前往讀者家中為讀者閱讀館藏文獻(xiàn)及讀者的信件、明信片等生活中需要閱讀的文本。幫助視障讀者通過生活化閱讀解決日常視障困難,體現(xiàn)人文關(guān)懷。
國內(nèi)公共圖書館視障閱讀服務(wù)。視障用戶信息素養(yǎng)教育是公共圖書館視障服務(wù)之一,可以滿足視障讀者個性化的信息需求。近些年,無障礙電腦、手機培訓(xùn)班逐漸成為國內(nèi)公共圖書館普遍的視障服務(wù)內(nèi)容。深圳圖書館和浙江圖書館深挖無障礙電腦、手機培訓(xùn)班,形成特色服務(wù)。深圳圖書館舉辦無障礙電腦比賽,通過賽前特訓(xùn)和賽后頒發(fā)獎項的形式,提升視障者參與熱情,幫助其鞏固電腦操作知識,擴大培訓(xùn)影響。浙江圖書館依托地域優(yōu)勢,邀請螞蟻金服公司員工從軟件開發(fā)者的角度,為視障者講解手機支付寶操作方法,幫助視障者更好地理解和使用支付寶軟件,并根據(jù)他們的反饋進(jìn)行優(yōu)化。
國內(nèi)外公共圖書館通過改變聽書載體、簡化聽書形式、培訓(xùn)讀者掌握聽書方法等方式,幫助視障讀者閱讀文獻(xiàn)。然而,視障者聽書閱讀形式有以下不足:一是長期使用聽書設(shè)備可能損傷聽力,健康的聽力是大部分視障者安全出行的保障;二是對于聽障、視障雙重障礙者群體或者老年聽力退化群體,難以通過聽書滿足精神文化需求;三是有考學(xué)、晉升需求的視障學(xué)生通過聽書設(shè)備來閱讀學(xué)習(xí),效率低且效果有限。
上海圖書館盲人服務(wù)繼承與發(fā)展
2001年,上海圖書館在淮海路館綜合閱覽室內(nèi)設(shè)立了面向視障讀者的盲人閱覽室,至今已經(jīng)20多年了。通過閱讀豐富視障者精神文化生活,強化視障者與社會的溝通是上海圖書館一直以來的堅持。東館無障礙閱覽室2022年開放服務(wù),繼承了視障閱覽室原有的免費郵寄外借、無障礙電影等業(yè)務(wù),并拓展了盲文刻印服務(wù)。
上海圖書館盲人服務(wù)的歷史與特色。2002年5月,上海圖書館開始提供視障讀者免費郵寄外借服務(wù)。在當(dāng)時屬于全國首創(chuàng),是由上海圖書館、市殘聯(lián)、市郵政局三方共同合作開展的。視障讀者通過服務(wù)熱線向上海圖書館提出借書請求,上海圖書館完成外借操作后,將盲文文獻(xiàn)放入特制的視障讀者專遞包,通過郵局工作人員免費送到視障讀者家中。讀者閱讀完畢后,也只需撥打所在區(qū)對接的郵局工作人員電話,等待上門取件即可。這一服務(wù)解決了視障者出行難問題。無障礙閱覽室升級了免費郵寄外借服務(wù),對于在無障礙閱覽室登記過個人信息的視障讀者,可以通過電話或郵件提出盲文文獻(xiàn)借還需求,工作人員確認(rèn)信息后,使用順豐快遞寄送到讀者家中,費用由上海圖書館視障讀者專項基金支付。
無障礙電影指運用科學(xué)技術(shù),為普通的電影影片增加配音、旁白解說和手語視頻,幫助視障者和聽障者能像常人一樣觀看電影內(nèi)容。2009年,上海市殘疾人聯(lián)合會、上海圖書館、上海電影評論學(xué)會聯(lián)合成立無障礙電影工作室制作無障礙影片,通過上海的公共圖書館為視障讀者提供免費借閱服務(wù)。首部無障礙電影《高考1977》在全國影院同期推出,400余位殘疾人在上海圖書館觀看了這部影片。無障礙閱覽室延續(xù)無障礙電影服務(wù),每季度舉辦一次。
2011年底,上海圖書館為上海市33萬殘疾讀者推出“無障礙數(shù)字圖書館”,作為國內(nèi)第一家完全符合無障礙標(biāo)準(zhǔn)的公共圖書館網(wǎng)站,登錄數(shù)字圖書館可以免費觀看680多部上圖講座視頻,閱讀收聽2000多冊有聲電子書。
東館無障礙閱覽室的創(chuàng)新服務(wù)。根據(jù)上海市殘疾人聯(lián)合會數(shù)據(jù),上海市2017年有視力殘疾人89253人,2018年有視力殘疾人93159人,2019年有視力殘疾人95550人,呈逐年遞增趨勢。為滿足更多視障者的精神文化需求,2022年上海圖書館東館無障礙閱覽室開放并探索視障閱讀新形式,拓展了盲文刻印服務(wù)。
盲文文獻(xiàn)總量少、體積大、采購難、價格高。早些年,掌握盲文的視障者數(shù)量少,聽書成為視障者主要閱讀方式之一。當(dāng)前,隨著社會經(jīng)濟發(fā)展,視障者普遍受到更好的教育,盲童有相應(yīng)的升學(xué)需求,需要反復(fù)閱讀、思考研究重點的學(xué)習(xí)材料。
東館無障礙閱覽室為有需要的視障讀者提供盲文文獻(xiàn)刻印服務(wù),幫助視障讀者將需要刻印的word文檔帶至無障礙閱覽室或發(fā)送至無障礙閱覽室的工作郵箱,由館員將明文通過軟件轉(zhuǎn)換為盲文后,通過盲文刻印機進(jìn)行刻印輸出。由此,聽力障礙的視障者可以通過觸摸盲點的形式閱讀明文文獻(xiàn)。盲童學(xué)校的學(xué)生可以將校外的中英文試卷、文件講義等學(xué)習(xí)材料刻印成盲文以便攜帶、學(xué)習(xí)思考和保存。
目前,東館無障礙閱覽室盲文刻印服務(wù)遇到了一些新的挑戰(zhàn):一是盲文刻印效率低,明、盲文轉(zhuǎn)換比大約是1∶3至1∶4,即一頁word文檔的明文文本轉(zhuǎn)換成盲文文本需要3—4頁;二是盲文刻印機普遍存在噪聲,盲文刻印服務(wù)必須在保證無障礙閱覽室現(xiàn)場服務(wù)基礎(chǔ)上進(jìn)行;三是明盲文轉(zhuǎn)換軟件在表格、特殊符號、生僻字、下畫線等方面存在偏差。
數(shù)字賦能無障礙閱讀
科技以人為本,數(shù)字時代更應(yīng)關(guān)注弱勢群體需求,如何運用科技推進(jìn)無障礙閱讀發(fā)展,讓特殊群體享受到科技的福利,是公共圖書館無障礙閱讀服務(wù)未來的思考方向。多模態(tài)預(yù)訓(xùn)練大模型是阿里達(dá)摩院預(yù)測的2023年十大科技趨勢之一,多場景、多任務(wù)的預(yù)訓(xùn)練大模型將增強模型的跨模態(tài)語義對齊能力,打通各個模態(tài)之間的關(guān)系,使得模型逐步標(biāo)準(zhǔn)化。
單模態(tài)與多模態(tài)。人類擁有視覺、聽覺、嗅覺、味覺、觸覺等多模態(tài)的感知體驗用以收集、解釋和分析對象。視覺模態(tài)是人類閱讀時最主要的感知信息來源,視覺模態(tài)的先天性缺失是視障讀者閱讀的主要障礙。單模態(tài)模型是從一個領(lǐng)域或者視角對同一個描述對象獲取數(shù)據(jù),即只包含圖像、語音、文本、傳感器數(shù)據(jù)等其中一種類型的數(shù)據(jù),容易導(dǎo)致以下三個問題。
一是模態(tài)缺失。為視障人士設(shè)計的無障礙閱讀技術(shù)常因耦合性欠缺,沒有讓視障者獲得良好的閱讀體驗。現(xiàn)實中,視障讀者常常會遇到模態(tài)缺失現(xiàn)象,例如由于拍攝原因?qū)е碌奈谋灸B(tài)缺失、語音識別錯誤帶來的語言模態(tài)缺失、背景聲音嘈雜導(dǎo)致部分模態(tài)數(shù)據(jù)模糊。
二是數(shù)據(jù)類型單一,輸入模態(tài)往往難以完全與給定模態(tài)對齊。單模態(tài)預(yù)訓(xùn)練模型是在某一個單一模態(tài)中訓(xùn)練產(chǎn)生的。例如,輸入的語音模態(tài)與之前預(yù)先訓(xùn)練的文本模態(tài)屬于近義語義但不完全一致,輸入句子嵌入由單一模態(tài)預(yù)訓(xùn)練的文本編碼器提取、語義上與圖像模態(tài)不一致,這就給本就視障模態(tài)缺失的群體增加了困難閱讀。
三是產(chǎn)生冗余信息。對于文本中插入圖像的閱讀,若采用單模態(tài)模型,在讀取文本和圖像特征時是獨立進(jìn)行的。不考慮模態(tài)信息交互,操作的獨立性不可避免產(chǎn)生冗余信息,圖像中的信息也必然有與文本內(nèi)容一致的地方。
多模態(tài)模型通過不同領(lǐng)域或者視角對同一個描述對象獲取數(shù)據(jù),并通過探尋各類型數(shù)據(jù)之間的關(guān)系訓(xùn)練數(shù)據(jù)和完善數(shù)據(jù)集。構(gòu)建多模態(tài)閱讀模型能彌補視障讀者主要視覺模態(tài)缺失,更好地進(jìn)行細(xì)顆粒度的語義建模。
預(yù)訓(xùn)練模型與自然語言處理。自然語言處理是運用人工智能技術(shù),理解語言、處理語言、生成語言,使得計算機擁有與人類一樣的聽說讀寫譯的能力,是輔助殘疾人閱讀的各類視聽讀機器、助視設(shè)備的技術(shù)基礎(chǔ)。預(yù)訓(xùn)練是人工智能發(fā)展史的標(biāo)志之一,即把一個已經(jīng)訓(xùn)練好的圖像分類模型的參數(shù)應(yīng)用到另一個類似任務(wù)上作為初始參數(shù)的過程。預(yù)訓(xùn)練能保存之前解決問題的模型,一旦遇到類似問題,就可以從之前的模型入手,不用從頭開始。因此,預(yù)訓(xùn)練模型能大規(guī)模、可復(fù)制地處理自然語言,提高自然語言處理效率。將預(yù)訓(xùn)練模型運用到輔助殘疾人無障礙閱讀中,可以提高閱讀效率,減少閱讀障礙重復(fù)出現(xiàn)。
多模態(tài)預(yù)訓(xùn)練大模型。多模態(tài)預(yù)訓(xùn)練大模型是將同一對象在不同領(lǐng)域獲取的數(shù)據(jù)合集的模型參數(shù)應(yīng)用到另一個相關(guān)任務(wù)上的過程,能讓文本與圖片映射在同一空間,通過對圖像和文本之間相似度的度量,實現(xiàn)跨模態(tài)探索。例如,2021年7月中國科學(xué)院自動化研究所發(fā)布的“紫東太初” 屬于三模態(tài)預(yù)訓(xùn)練大模型,支持圖像、語音、文本三模態(tài)數(shù)據(jù)間的跨模態(tài)檢索。與OPPO合作,文瀾模型實現(xiàn)了為視障人士讀取收集圖片的功能,踐行科技向善的理念。
目前多模態(tài)預(yù)訓(xùn)練大模型尚在起步階段,還存在數(shù)據(jù)量規(guī)模遠(yuǎn)小于自然語言語料庫、訓(xùn)練效率低、難實時檢測識別等問題。但可以看到,在人們的閱讀習(xí)慣從文本向文字、圖像多元化進(jìn)行拓展的數(shù)字時代,多模態(tài)預(yù)訓(xùn)練大模型能有力提升無障礙閱讀質(zhì)量。未來,要使多模態(tài)預(yù)訓(xùn)練大模型廣泛應(yīng)用于無障礙閱讀,還需探索高效的模態(tài)表示和多模態(tài)信息交互方法。
作者單位:上海圖書館(上??茖W(xué)技術(shù)情報研究所)
參考文獻(xiàn)
[1]馬鈺薈.中國盲文圖書館早期館史研究[J].辦公室業(yè)務(wù), 2021(16):176-178.
[2]劉涵.大英圖書館殘障讀者服務(wù)現(xiàn)狀及啟示[J].河北科技圖苑,2022(3): 36-40,14.
[3]袁莉莉.美國圖書館殘障用戶服務(wù)研究及啟示[J].圖書館研究與工作,2019(2):72-76.
[4]郭亞軍,席俊紅,劉燕權(quán).信息無障礙,距離還有多遠(yuǎn)?——對146家美國城市公共圖書館的調(diào)查[J].圖書館論壇,2020(2):151-158.
[5]陳婧,臧可,鄧亞.日本圖書館殘障讀者服務(wù)探析[J].圖書館建設(shè),2016(1):61-66.
[6]丁亞茹.國內(nèi)外公共圖書館視障用戶信息素養(yǎng)教育實踐與啟示[J].圖書館,2021(10):28-33.
[7]李婉彬,李燕娜.公共圖書館視障讀者信息需求調(diào)查及分析[J].圖書館論壇,2013(4):77-81,53.
[8]王亞莘,單琪,潘文建.在斷點相遇:“數(shù)字盲道”中視障閱讀的技術(shù)協(xié)商[J].出版發(fā)行研究,2022(6):79-83.
[9]孫宇沖,程曦葦,宋睿華,等.多模態(tài)與文本預(yù)訓(xùn)練模型的文本嵌入差異研究[J].北京大學(xué)學(xué)報:自然科學(xué)版,2023(10):48-56.
[10]盧志武,金琴,宋睿華,等.悟道·文瀾:超大規(guī)模多模態(tài)預(yù)訓(xùn)練模型帶來了什么?[J].中興通訊技術(shù),2022(2):25-32.
[11]劉華玲,陳尚輝,喬梁等.多模態(tài)混合注意力機制的虛假新聞檢測研究[J].計算機工程與應(yīng)用,2023(9):95-103.
[12]吳煒華,張海超.多模態(tài)視域下數(shù)字出版的技術(shù)演進(jìn)與實踐探索[J].現(xiàn)代出版,2023(1):54-62.
[13]王惠茹,李秀紅,李哲等.多模態(tài)預(yù)訓(xùn)練模型綜述[J].計算機應(yīng)用,2023(4):991-1004.
[14]祁彬斌,胡玉寧,朱學(xué)芳,等.面向盲人閱讀的觸覺交互服務(wù)框架構(gòu)建與應(yīng)用研究[J].圖書情報工作,2019(14):20-29.