中圖分類號:G250.76 文獻標識碼:A DOI:10.11968/tsyqb.1003-6938.2025024
Risks,Causes,and Suggestions in China Smart Libraries from the Perspective of Critical Algorithms
Abstract Algorithms,asan important wayof connecting people,information,and resources,arebeing integrated into theintelligent processoflibraries inChina,reshaping thestructuralrelationshipand interactiverulesamong them.However,the \"non-neutrality\"ofalgorithms brings challenges tothedata processingandserviceoflibraries,soithasgreat significance to examine and sort out negative effects ofalgorithms during information service processs of smart libraries.Firstly,thisarticleintroducescritical algorithmtheoryandtakes itasananalyticalframework toexplorerisksof smart libraries from thre aspects:informationbias,cultural masking,andthelackof subjectivity.Subsequently,internal reasons fortheformationoftheserisksaredisclosed,includingalgorithmic biases,alue biases inalgorithms,andcovert algorithmiccontrol.Finall,risk defensesuggestions whicharealgorithmco-construction,culturalco-creation,andinstitutionalconsensus,areprovided toachieve the goalof providing effective information servicesandenhancingcultural identity.
Key words smart library; intelligent technology; critical algorithm; risk analysis
隨著ChatGPT4.0、Sora、DeepSeek等生成式人工智能工具的相繼問世,憑借各自在語言生成和圖像認知上的出色表現(xiàn),將人工智能的發(fā)展推向一個新高度。面對技術浪潮,學界應如何理性看待智慧圖書館的發(fā)展?在探討這一問題之前,我們有必要回歸圖書館的本質,思考在人工智能算法“無所不能”的背景下,智慧圖書館的核心價值究竟是什么,又該如何發(fā)揮作用。這些問題促使我們重新審視智能技術在智慧圖書館中的應用邊界和倫理規(guī)范?!丁笆奈濉惫参幕阵w系建設規(guī)劃》明確提出,將“全國智慧圖書館體系建設項目\"作為重要任務,推動公共圖書館向“以人為中心\"轉型,建設開放、智慧、包容、共享的現(xiàn)代圖書館。盡管智慧圖書館已受到圖書館學、情報學、社會學等多學科關注,但現(xiàn)有研究仍存在以下不足:一是研究視角較為單一,多集中于信息傳播方式、數(shù)字交互技術、信息資源結構等技術層面;二是對人工智能技術的負面影響關注不足,缺乏對算法歧視、認知偏差等重要心理過程的深人探討。
與單一學科視角相比,批判算法理論將算法視為技術性和社會性兼具的二元組合,在理解圖書館場景、提升泛化能力和適應復雜場景方面更具優(yōu)勢。因此,本研究以批判算法理論為框架,系統(tǒng)梳理圖書館智慧化進程中面臨的風險挑戰(zhàn),探究風險形成的內在機制,提出緩解智能技術應用困境的可行建議,以推動圖書館與智能技術的深度融合與協(xié)同發(fā)展。
1智慧圖書館風險形態(tài)解構
智慧圖書館是一個以智能技術為載體的系統(tǒng)工程。當智能技術介入圖書館時,二者開始發(fā)生一系列的碰撞、融合、取代等現(xiàn)象,信息服務的邊界被不斷延伸,內涵也變得立體、生動。與數(shù)字圖書館和虛擬圖書館概念不同的是,智慧圖書館更強調“以人為中心而非科技”,突出人的主體性[1]。依據(jù)DIKW“數(shù)據(jù)-信息-知識-智慧\"金字塔模型可知,數(shù)字化是智慧性的前提和基礎。
不同于計算機領域側重研究如何提升效率,人文社會科學領域中的算法研究將算法當作技術與社會的組合,強調對社會行動主體、組織結構、制度安排等廣泛的影響[3]。代表性方向是批判算法,英國學者Gillespieha和Seaver[4]總結了批判算法研究的五個維度。由于本文主要關注算法的應用風險,故引入批判算法研究第一個維度“算法及其選擇的影響(the specific implications of algorithms and the choicestheymake)作為分析框架,包括三個方面:算法的合理化、自動化和量化帶來人類判斷、復雜程度和相關語境的抹去;算法內嵌的價值觀和偏見導致個性化、社會分類和歧視;算法的問責和政策回應問題。
具體而言,第一點反映了智能分析過程中,因為信息被化約、抹去導致細節(jié)丟失引起的算法偏差。人類判斷的抹去意味著人在算法面前只是數(shù)據(jù)的一部分,而非真實、可思考、有判斷力的生物;復雜性被簡化,指將現(xiàn)實問題抽象并轉化為計算問題時可能會丟失重要信息;語境的抹去,即忽視特定環(huán)境對問題本身的影響。第二點指出算法是由人設計的,設計人員、實施者等可能會在無意中將個人的價值觀、信仰、偏好融入算法邏輯中。第三點闡明了如何應對算法帶來的挑戰(zhàn),智慧圖書館情景下的算法追責與治理,可以理解為構建以用戶為核心的治理體系。本文將基于上述三個方面,分析我國智慧圖書館面臨的算法應用風險、成因及應對策略。
用戶與以智能算法為介導的智慧圖書館交互過程,遵循“智慧平臺-算法-用戶\"的表征路徑。人工智能技術在同時滿足平臺和用戶需求時,應避免圖書館服務的局限與割裂,應用過程中容易觸發(fā)的一系列風險,可概括為三類(見圖1)。算法和智慧平臺之間,技術理性逐步取代價值理性,出現(xiàn)信息偏差風險;智慧平臺與用戶交互過程中,過度強調技術效率與便捷性,導致文化價值被遮蔽;算法與用戶之間,算法智能水平的不斷提升,加劇用戶主體性缺失的風險。
1.1信息偏差風險:信息繭房的生成與認知剝奪
智慧平臺依賴算法處理海量數(shù)據(jù)作出決策,批判算法理論指出算法通過數(shù)據(jù)和程序化的邏輯來替代人類的主觀判斷,實際上掩蓋了背后的技術邏輯。算法的自動化決策減少了人類的直接干預,但機制帶來的復雜情境的忽視會引起信息偏差風險。如智慧圖書館中算法可基于用戶歷史行為為其推薦內容,卻無法捕捉用戶的真實需求或情境變化。
智慧圖書館的個性化服務與資源推薦離不開數(shù)據(jù)資源和算法技術的支持。數(shù)據(jù)資源是智慧平臺服務的基礎,算法是其實現(xiàn)的路徑。智慧圖書館平臺基于平臺數(shù)據(jù)資源,通過算法技術提供智慧服務,其具體實現(xiàn)過程依賴于數(shù)據(jù)關聯(lián)。圖書館智慧平臺可提供豐富的線上活動,為用戶開啟數(shù)字資源利用的新藍圖,如基于用戶畫像的信息匹配、基于用戶需求識別模型的知識精準推送等。從技術角度而言,人工智能技術可通過數(shù)據(jù)鏈實現(xiàn)圖書館數(shù)字資源的強鏈接,然而以算法思想為載體的不合理關聯(lián)機制會帶來信息偏差,主要包括選擇性偏差和可得性偏差[5],從而導致平臺服務信息繭房的生成與用戶認知剝奪。選擇性偏差,即過分強調某些典型類別的重要性,而不顧甚至忽視有關其他潛在可能性的證據(jù)。充分利用館藏資源、發(fā)揮特色文化優(yōu)勢需搭建以算法為核心的智慧圖書館數(shù)字資源體系,但自前圖書館在對數(shù)字資源進行分類和整理時,主要對淺層特征進行關聯(lián),從而忽略內容的深度和復雜性,未能發(fā)現(xiàn)隱藏在大量數(shù)據(jù)中的有用信息和知識,導致關聯(lián)算法的實際效果與預期目標存在較大差距。圖書館數(shù)字資源形態(tài)多樣,分散的信息單元和多模態(tài)的數(shù)據(jù)信息需通過更高級的技術手段,如情感分析、知識發(fā)現(xiàn)、知識關聯(lián)等,來促進用戶與資源信息之間的交互和聯(lián)通,實現(xiàn)圖書館資源的轉型。
可得性偏差,即根據(jù)易得性來判斷事件的可能性而忽視對其他信息的關注和發(fā)掘,造成判斷出現(xiàn)偏差。智慧圖書館情境下主要表現(xiàn)在用戶信息繭房的形成,如社交媒體上人們可以輕松接觸到和自己觀點相近的信息并與之互動,長期如此可能導致用戶觀點變得偏狹。在智慧圖書館個性化服務與資源推薦中,平臺資源若因為數(shù)據(jù)關聯(lián)方式存在缺陷而未被充分利用,可能導致用戶接收到的信息資源趨于同質化,即算法在不斷迎合“個性需求”的過程中形成“信息繭房\"[6]。當關聯(lián)算法推送的內容愈發(fā)滿足用戶單方面需求時,信息的深度和廣度會明顯弱化,阻礙用戶持續(xù)獲取信息的信心和意愿,引起心理抗拒。這將增加用戶全面獲取目標信息的難度,有研究表明憑多數(shù)用戶的認知水平和知識結構,很難自主地從算法“認知陷阱\"中走出。大量同質、低質化內容帶來的枯燥感,加上智能平臺本身的封閉性,很難吸引更多用戶,更別說讓用戶樂在其中。
1.2文化遮蔽風險:文化失衡的生成與多樣性消解
智能技術通過豐富文化表現(xiàn)形式,為活化館藏資源提供新的視角。如國家圖書館打造的感應互動電子墻—“魔墻”,讓讀者全方位體驗館藏的甲骨文、永樂大典、名家手稿等多種數(shù)字資源;遼寧省圖書館推出遼寧紅色“六地”文獻館,集數(shù)字互動體驗、電子資源查閱、紅色文旅導覽于一體[8]。
首先,算法并非完全中立,批判算法理論提出算法設計和運行過程中可能內嵌了價值觀和偏見,從而導致信息趨同化、淺薄化,阻礙知識的自由傳播和文化的多樣性發(fā)展。智慧圖書館用戶與平臺互動過程中催生的快餐式文化,在智能技術主導的圖書館建設背景下,可能導致文化特質邊緣化與同質化。無論是基于數(shù)字影像重構的情景再現(xiàn)還是以生成式人工智能技術為代表的數(shù)智技術,折射出感知技術不足以呈現(xiàn)文化的豐富內涵的現(xiàn)實。長期使用或沉迷于虛擬現(xiàn)實場景容易產(chǎn)生孤獨感,造成人際關系障礙,同樣地,依賴生成式人工智能處理問題,可能會導致用戶在知識探究過程中的表層化傾向,從而阻礙其對知識本體的深人理解和掌握[9]。一項關于公共文化機構服務的研究發(fā)現(xiàn),公眾對“對話式”人智互動應用的情感傾向為負面,對圖書館機器人的真實性、數(shù)智化服務的實用性存疑[10]。長此以往會造成用戶深層的文化需求得不到滿足,互動效果大打折扣。圖書館如何平衡創(chuàng)新文化體驗和文化傳播本質之間的關系,這些冰冷的數(shù)字和機器能否代表“以人為中心\"的服務核心,有待時間和實踐檢驗。
其次,本土文化與外來文化的矛盾日益凸顯:流行文化在“討好\"算法方面具有優(yōu)勢,世界文化憑借強大影響力容易收獲“粉絲\"好感。算法驅動的信息分發(fā)機制將圖書館內容推送引向市場化、娛樂化。當平臺未充分掌握用戶具體需求時,會優(yōu)先推送數(shù)據(jù)表現(xiàn)突出的內容,如暢銷書籍、經(jīng)管勵志類作品,信息陳列頁面上也會展陳引起更多點擊、互動的內容,用戶在接受的同時也將自身推向“迎合流量”的深淵,不僅對用戶的閱讀習慣和信息消費行為產(chǎn)生影響,也會對圖書館數(shù)字資源的多樣性和深度造成負面影響。同時,發(fā)達國家和地區(qū)在文化產(chǎn)業(yè)領域的優(yōu)勢地位,使他們在規(guī)劃布局、主題設計、產(chǎn)品打造等方面更具競爭力,持續(xù)吸引著大眾的注意力。如美國國會圖書館保存了如珍珠港事件后的路人訪談資料、23位美國總統(tǒng)的手稿(包括《獨立宣言》)等歷史文獻[],定期在世界范圍內舉辦展覽以推動公眾對歷史和社會問題的關注;法國國家圖書館不僅收藏了法國歷代王室藏書,其館藏的敦煌遺書和漢籍數(shù)量也很龐大[12],通過講座、展覽和研討會促進公眾和研究人員對知識的追求。美國圖書館協(xié)會的核心理念之一為“平等、多樣性和包容”,以此打造了多種語言,適用多國文化背景的產(chǎn)品,促進各國各民族用戶無障礙使用文化產(chǎn)品。可見,具有強勢流量效應的文化產(chǎn)品受到市場的熱烈追捧,而國內一些注重本土文化根基和民族文化創(chuàng)新的作品在短時間內很難獲得關注和粉絲群體,傳統(tǒng)文化因數(shù)據(jù)驅動力不足而逐漸邊緣化,限制地方文化資源的深度挖掘和有效利用。
1.3主體性缺失風險:技術支配引發(fā)用戶主體性消解
批判算法提出算法的廣泛應用帶來的問責和政策的挑戰(zhàn),即算法的復雜性和“黑箱”特性使其決策過程難以被理解和監(jiān)督,導致問責機制缺失,現(xiàn)有的政策和法律框架可能無法有效應對算法帶來的新問題。對智慧圖書館而言,盡管個性化推薦系統(tǒng)、智能檢索工具旨在提升用戶體驗,但可能過度主導用戶的信息獲取過程。實際上,智慧圖書館用戶的主體性是重要的個人特征,用戶在信息活動中不再是被動接受信息的“受眾”,而是主動創(chuàng)造和分享內容的“用戶”,有必要警惕智能技術的不當使用對用戶的自主性和主觀能動性的削弱。
首先,基于智慧圖書館算法的信息投喂能方便用戶快速獲取目標信息,但實踐中,過度智能化對用戶的自主性發(fā)展抑制效用體現(xiàn)在對自我控制、信息處理、獨立決策等能力的限制。如智慧圖書館中的即時問答、即時訪問和下載服務會培養(yǎng)用戶對即時滿足的期待,鑒于數(shù)字原住民的“伴隨技術成長\"“喜歡即時滿足和獎勵\"典型特征[13],智能技術可能會削弱他們延遲滿足的自我控制能力。圖書館中海量信息帶來的信息過載,影響用戶信息檢索、信息分析、決策的質量,使個體在信息洪流中難以有效辨識和處理信息[14]。當人們將認知、選擇、決策等任務委派給智能工具時,也意味著人類主體性的基本屬性被算法取代。過度依賴智能工具可能降低用戶的認知參與度,進而影響其獨立解決問題和進行決策的能力,逐漸侵蝕用戶的選擇自主權和對信息處理過程的控制權。
其次,智能技術在閱讀活動中的快速推進和滲透正讓人淪為技術的“附屬品”,用戶閱讀技能退化伴隨著主觀能動性消減。人工智能機器人可提供全天候智能服務,包括閱讀推薦、智慧答疑、閱讀指導、輔助閱讀等,長遠來看,算法過度利用帶來信息的即時滿足會抑制用戶的探索欲,從而激發(fā)思維惰性、惰性心理。生成式人工智能擅長處理個性化的信息需求,不僅使越來越多人選擇讓渡自身主體性地位,由內而外地屈從于算法的高效、快捷,還讓如ChatG-PT、DeepSeek等工具成為生產(chǎn)力和創(chuàng)造力的主要貢獻者,顯著提升信息生產(chǎn)效率,但也令人與機器之間的主客體界限變得模糊[15]??傊黧w性反映用戶對技術積極利用的程度,是構建智慧圖書館良好信息秩序的有力保障,但隨著人工智能應用加劇了主體性危機,圖書館工作者和研究人員需警覺其潛在的消極影響。
2智慧圖書館風險生成的內在原因
2.1算法偏差風險鏈:從信息到?jīng)Q策
算法偏差即算法執(zhí)行過程中產(chǎn)生的系統(tǒng)性錯誤,伴隨算法生命周期的各個階段,Suresh和Guttag將算法偏差分為六類,歷史偏差、表征偏差、測量偏差、聚合偏差、評估偏差和部署偏差[16]。智慧圖書館中,算法偏差常指智能平臺的計算結果與預期結果形成的落差[17],表現(xiàn)為對某些行為、群體的特殊偏見,被視為一種社會技術現(xiàn)象[18]。該情境下算法偏差主要表現(xiàn)為采樣偏差、測量偏差、評估偏差(見圖2),分布于“信息-數(shù)據(jù)-知識-決策\"整個過程。由于路徑較長,各階段不合理處理方式產(chǎn)生的小錯誤最終會被放大[19]。由于智慧圖書館的算法偏差風險意指“信息-數(shù)據(jù)-知識-決策\"轉化鏈中算法系統(tǒng)性偏差的積累與放大,因此算法偏差風險鏈分析主要從采樣偏差、測量偏差、評估偏差三方面展開。
首先是資源建設層的采樣偏差,采樣方法或樣本選擇的不合理性,導致樣本數(shù)據(jù)與總體數(shù)據(jù)存在分布偏差。采樣偏差產(chǎn)生并作用在資源建設層面,由于智慧圖書館依賴多源異構數(shù)據(jù),但采樣偏差可能導致數(shù)據(jù)不全面,進而影響資源建設和個性化服務。具體而言,智慧圖書館需要處理多源異構、分布廣泛、動態(tài)增長的數(shù)據(jù),因為并非所有數(shù)據(jù)都能被同等有效地采集和分析,可能導致數(shù)據(jù)代表性失衡,用戶畫像片面化。如智慧圖書館個性化服務的局限性表現(xiàn)在對用戶行為數(shù)據(jù)的依賴,如果這些數(shù)據(jù)未將用戶的網(wǎng)絡行為數(shù)據(jù)(如社交平臺記錄、學習行為記錄等)納入其中,就會導致智慧平臺對用戶需求的理解和預測存在偏差,從而影響資源推薦和個性化服務的精準度。其次是知識生產(chǎn)層的測量偏差,當選擇的變量不能有效體現(xiàn)所指內容時,變量的偏差會影響預測模型整體結果。智慧圖書館提供的智能服務場景中,測量偏差主要表現(xiàn)為測量指標與領域的適配不足。如圖書館資源流量監(jiān)控系統(tǒng)實時監(jiān)測用電量、用水量及網(wǎng)絡流量,可能存在監(jiān)測設備的精度誤差和數(shù)據(jù)采集的實時性等問題,這些都會影響評估圖書館資源利用的準確度。人工智能的知識生產(chǎn)基于一個前提條件:數(shù)據(jù)須經(jīng)過計算和測量以形成可供識別的標簽。如果用戶興趣標簽的形成涉及偏見,那么生成的預測模型也可能存在偏見。最后是服務決策層的評估偏差,當測試數(shù)據(jù)集不能充分代表模型最終應用的總體時,就會出現(xiàn)評估偏差。智慧圖書館算法評估面臨的問題是知識服務模型多在理想化數(shù)據(jù)集中進行驗證,缺乏真實服務場景的檢驗。數(shù)據(jù)挖掘的模型很多是在非代表性人群上開發(fā)的,相關報告和論文甚至沒有公布是在哪些人群上測試,讓評估偏倚的檢測非常困難[2。智慧圖書館服務過程中,當面向知識服務的多類型、多模態(tài)數(shù)據(jù)資源模型未能充分考慮不同類型數(shù)據(jù)的特性時,也會導致知識服務的不準確,進而形成評估偏差。
因此,智慧圖書館中算法偏差帶來的不合理、不公正的判斷都會強化圖書館工作者、用戶、資源之間的不良關系,甚至因為算法歧視對個人或群體造成傷害,破壞圖書館生態(tài)的穩(wěn)定性。但這并不意味著算法本身不堪一擊,警惕算法的合理性偏差和洞悉其發(fā)生規(guī)律,可增強智慧圖書館生態(tài)的風險抵御能力和自我調節(jié)能力。
2.2算法價值觀偏見:文化淺層化與人性算計
算法并非價值中立,它負載著算法設計師、工程師的主觀價值,會不公平地對待某些群體并引發(fā)價值觀偏見、職業(yè)偏見、性別歧視等問題。智慧圖書館中算法的價值觀偏見,涉及文化內涵呈現(xiàn)不足和對人類心理弱點的利用。
(1)文化內涵層面的表征偏差。智慧圖書館在有關文化的數(shù)字化進程中需對技術祛魅,智慧圖書館的使命之一在于通過技術活化館藏資源。首先,文化要素存在量化困境。算法驅動的資源數(shù)字化和知識組織不足以提取和呈現(xiàn)圖書館館藏資源豐富的文化特征,且由于文化本身模糊抽象且常以虛體的形式存在,背后的內容常缺乏明確的概念和描述[21],很多內隱性指標不能直接測量,單一的算法類型不足以呈現(xiàn)其價值。實踐中,圖書館資源文化的數(shù)字表征往往未能充分覆蓋實際的生態(tài)范疇,追求量化的算法機制在文化面前變得捉襟見肘。其次,文化語境存在解構風險。圖書館中大量的報紙、圖書、期刊、手稿等館藏資源有很強的文化價值和史料價值,單一的技術手段難以精確捕捉這些資料的內涵,并以具體化的形式呈現(xiàn)。文化中的情感、價值觀、習俗等元素是難以量化的,數(shù)字化過程中處理不善會導致文化意義的丟失。再者,文化體驗存在技術依賴,當前過于重視智能技術對圖書館資源、空間、管理的數(shù)字化,忽視景觀設計和環(huán)境設置對情感培育和文化氛圍的營造。人工智能在全面理解采用適宜手段展現(xiàn)文化內涵方面,仍面臨諸多挑戰(zhàn),需要進一步發(fā)展和探索。
(2服務交互層面的人性偏見。智慧圖書館的智能推薦系統(tǒng)的目的在于提升用戶的知識獲取效率,但在流量為王的背景下卻成為算計人性的工具。對人性的放大和利用也是算法偏見的體現(xiàn)。算法看似是一種非人為操縱的技術,但常被當作人性發(fā)展的工具和手段[22],如果平臺為謀求流量和經(jīng)濟利益而不擇手段地迎合人性的弱點,那這種方式是對算法規(guī)則的“欺騙”。算法傾向于推薦符合人類心理和行為特征的內容,這些內容被選中是因為根據(jù)其他用戶數(shù)據(jù)反饋,推薦的內容易傳播且能帶來更大關注。智慧平臺通過捕捉目標用戶平日的數(shù)據(jù)信息(如借閱記錄、停留時長、頁面滾動速度等),預判其閱讀習慣、思維方式、個人偏好進而提供精準化、個性化的信息和娛樂服務,智能算法充分利用人們貪圖新奇、追求刺激的心理特點,引導用戶停留、瀏覽、消費[23]。雖然算法誘導造成的時間損失和非必要消費在承受范圍之內,但用戶還可能被算法劃分為三六九等,放大算法的歧視傾向,后果是逐漸窄化用戶信息獲取范圍,使更多值得被關注的內容無法抵達用戶[6],促進認知偏差甚至是錯誤認知的形成。因此,需謹慎看待智能信息推送,將其作為信息獲取的輔助手段。算法的發(fā)展方向應該是致力于“彰顯”文化價值而不是“遮蔽”,“發(fā)掘”人性的優(yōu)點而不是“算計”。
2.3算法的隱匿控制:自主性從用戶到算法的轉移
算法的隱蔽性指其運作機制和決策邏輯對于用戶而言是不可見的,從而限制他們對算法決策的理解和質疑[24],這一特性對算法自主性的促進體現(xiàn)在算法的自我學習和自我優(yōu)化。智慧圖書館通過人工智能、大數(shù)據(jù)分析等技術提升了服務效率,但也因算法運作的“黑箱化\"特征,導致用戶在知識獲取、資源選擇、隱私控制等方面的自主性被逐漸削弱。
(1)智慧圖書館的技術智能與決策不透明。智慧圖書館廣泛采用AI客服提供實施咨詢服務,盡管響應策略能高效適應用戶行為模式,但其決策過程對用戶完全不可見,且用戶難以理解內部邏輯,進而削弱自主選擇能力。人工智能具有在與外界互動中不斷學習和調整行為策略的能力,這種能力使其能夠應對不斷變化的環(huán)境。如哈爾濱工業(yè)大學圖書館推出的聊天機器人“AI館員\"[25],集成了一個包含多種期刊和圖書的閱讀輔助工具,該機器人通過學習人機互動過程中服務內容、用戶態(tài)度、個人信息等數(shù)據(jù),能迅速響應用戶的閱讀需求和適應用戶的行為模式。同時,智能優(yōu)化領域中,算法可通過自動化手段生成訓練數(shù)據(jù)集增強智能體的性能。具體而言,智能體在搜索結果排序、信息質量評估以及在線評論分析等自我對弈過程中,能夠產(chǎn)生新的、更具挑戰(zhàn)性的訓練樣本,這些樣本不僅在數(shù)量上具有規(guī)模優(yōu)勢,還覆蓋了廣泛應用場景。這一機制通過增強智能體知識獲取的廣度和深度,提高其在復雜環(huán)境下的適應性和決策能力。這種趨勢導致算法的自主性與用戶的自主性呈現(xiàn)此消彼長的態(tài)勢,隨著算法自主性的增強,用戶的自主性減弱,甚至出現(xiàn)主體隱匿[26]。
(2)用戶參與的被動性排斥與主動性讓渡。一是自動化管理系統(tǒng)的隱蔽決策造成了用戶參與的被動性排斥。由于智慧圖書館的圖書采購、庫存管理等依賴于算法自動化決策,即用戶并不了解影響圖書采購結果的因素,進而無法獲知自身如何參與到智慧圖書館的資源建設中,被排除在資源建設的參與之外。二是用戶選擇讓渡主觀能動性與算法的隱蔽性緊密相關。算法的不可感知和不可解釋代表著風險和問題不外顯,智慧圖書館中算法的隱蔽性讓用戶難以感知到它的存在,只有當個體充分認知到算法濫用的危害性時,對算法的信任程度才會降低[2]。然而,多數(shù)情況是人們在不自知中墜入算法的\"陷阱”一沉溺于推送信息帶來的即時感、滿足感、愉悅感的“溫床”。算法的個性化推薦、營銷、推送等功能能夠很好地迎合個體需求,但同時也會削弱和損害用戶的主觀能動性。信息多樣性是用戶自主決策的前提條件,而個性化帶來的信息繭房則會排除用戶不感興趣的信息而只推送相關信息,進而阻礙用戶進行自主決策。自制力較差的年輕用戶,容易沉迷其中、分散注意力,就算有幸躲過“信息繭房”的侵擾,也難逃虛假信息、數(shù)字鴻溝、信息過載等問題。生成式人工智能信息質量的評價標準尚未建立,很多信息來不及辨別優(yōu)劣、真?zhèn)尉鸵训诌_用戶,進而制約其廣泛利用[28]。即使用戶想維護信息權益,也會因為算法隱蔽且無形而無從舉證。
3構建智慧圖書館風險防御體系
3.1算法共建:打造技術協(xié)同與信息互通的工作機制
為緩解算法偏差風險,智慧圖書館生態(tài)系統(tǒng)的三大核心主體—圖書館文化服務者、人工智能技術團隊和終端用戶應構建“三位一體”的協(xié)同機制。在履行基礎本職工作的同時,各部門人員需協(xié)同共進,互利互惠;用戶與智能平臺保持信息互通,不斷優(yōu)化信息服務質量。算法實踐中的諸多偏差可演化為算法歧視甚至算法霸權,破壞信息公平和信息安全從而加劇風險的破壞性。這對智慧圖書館相關的多元主體提出更高的協(xié)作要求:思維方式、創(chuàng)新理解、交互模式需保持一致。圖書館工作者需深度應用智能編目系統(tǒng)和語義增強技術優(yōu)化特藏資源管理,技術團隊則要針對智慧圖書館特有的多源異構數(shù)據(jù)(如古籍數(shù)字孿生體、跨庫元數(shù)據(jù)、讀者行為軌跡)開發(fā)抗偏見算法架構,用戶通過智慧館員助手動態(tài)反饋個性化知識需求,三方形成“需求感知-算法優(yōu)化-服務進化\"的智慧循環(huán)。對智慧圖書館實踐者而言,不僅要充分發(fā)揮自身文化的高認知和經(jīng)驗性優(yōu)勢,更要將算法便捷服務的觸角向青年學生、年長者、弱勢群體等延伸,深耕織密智慧服務的“交通網(wǎng)絡”。對終端用戶而言,在采納智能平臺所推薦的閱讀書目和智能分析結果時,應保持審慎態(tài)度,認識到智能平臺的輔助性質而非決定性作用。用戶應結合個人需求、專業(yè)判斷和經(jīng)驗,以及其他相關信息源,對智能平臺推薦內容進行全面評估和合理利用。
同時,不可否認,人與機器存在著天然鴻溝,保持充分的信息溝通有利于平衡人的意圖和機器理解能力之間的差距。除依靠人工智能工程師提供常規(guī)算法服務外,用戶也可自行馴化智能模型。對于推薦算法模型,可根據(jù)內容、點贊數(shù)、評論質量等指標篩選推薦信息,同時用戶的觀看時間,是否點贊、評論、轉發(fā)等數(shù)據(jù)也會反饋給后臺,使模型變得“更懂我”,推薦用戶想要的內容。對于生成式人工智能,想要獲得更好的交流效果,提問前應盡可能提供目標、場景、思考角度等信息,問題描述盡可能詳細、準確,以避免誤解和模糊回答,交流內容可由淺入深、由泛到精。智能語言機器人對人類的充分理解,建立在積極溝通和信息準確傳遞的基礎上,人機互通對人的邏輯思維和知識結構提出更高要求。因此,與機器進行充分的互動與溝通,有助于獲得更有價值的信息反饋。
3.2文化共創(chuàng):創(chuàng)新表達、跨界互融,打造數(shù)字文化新標桿
圖書館智慧化進程面臨智能技術迭代速度快、滲透力強、影響面廣等因素帶來的壓力,文化載體從數(shù)字化平臺到智慧交互系統(tǒng)的升級(如基于數(shù)字孿生的古籍活化系統(tǒng)、多模態(tài)大模型驅動的虛擬參考咨詢等),使其更容易向大眾傳播知識。鑒于文化本身并不能自我更新以適應新環(huán)境,在梳理風險發(fā)生規(guī)律的基礎上提出創(chuàng)新文化表達方式和推進跨界融合的建議,以夯實圖書館的文化根基。
一方面,文化表達方式應做到戰(zhàn)術風險可防、戰(zhàn)略風險可破。具體而言,戰(zhàn)術上需要規(guī)范管理來防范,通過調研和元分析,識別信息風險及主要影響因素,也可用大數(shù)據(jù)分析、預測風險發(fā)生的概率;在架構和執(zhí)行算法時確保無不良興趣誘導,不引入涉及盲目消費、算法歧視、網(wǎng)絡沉迷等有明顯偏好的數(shù)據(jù)模型;平臺設計方面考慮用戶的多元需求,對專業(yè)要求較高的用戶設計學術性版塊,對青年學習者提供科普圖解、互動問答等趣味性活動。戰(zhàn)略上,決策者對智慧圖書館長遠發(fā)展要有科學規(guī)劃,避免“任性決策”。館藏資源的獨特性是圖書館生命力的保障,將具有地域性、民族性、時代性的資源標識為特有資源,更符合“人無我有,人有我優(yōu)”的開發(fā)策略。
另一方面,當文化遮蔽的風險處于可控制范圍內,可嘗試突破以往圖書館發(fā)展中的不足。利用館藏優(yōu)勢,延伸文化內涵,打造獨具特色的文化生態(tài)圈。由于人工智能常以信息推薦、資源關聯(lián)的優(yōu)勢介入圖書館,考慮到單個圖書館資源分布的單一性和離散性,常規(guī)文化體驗模式很難滿足用戶日益增長的文化需求,有必要發(fā)揮人工智能在資源整合方面的優(yōu)勢,推動圖書館數(shù)字資源一體化進程,將原來的“散點\"轉為“線狀”。智慧圖書館的優(yōu)勢在于打破文化資源分布的空間結構,全面整合不同地域的優(yōu)質文化資源,構建多個特色鮮明的數(shù)字文化體驗項目。
3.3制度共識:規(guī)范算法行業(yè)和提升用戶算法素養(yǎng)
智慧圖書館的迭代是算法不斷“人化”的過程,即技術向人文價值回歸的過程。蘇宇指出未來算法規(guī)制需以人的主體性為核心,構建開放、反思且統(tǒng)合的框架,以有效應對算法風險2,強調了在算法治理中人的主體性是核心,需要構建以用戶為中心的治理體系。突破用戶主體性困境的前提是強化算法的行業(yè)自律,全面提升用戶的人工智能素養(yǎng)。
一是規(guī)范行業(yè),有限度地公開算法,構建智慧圖書館算法倫理規(guī)范體系。如今算法濫用和過度使用造成的危害日益普遍,督促智慧圖書館行業(yè)形成自己的職業(yè)倫理和規(guī)范。針對個性化推薦、資源推薦等算法核心場景,技術研發(fā)和利用人員應統(tǒng)一思想、強化算法認知,堅持用主流價值導向駕馭算法;管理人員提高算法風險的洞察力和對風險源頭的審查力度,能基本掌控風險的演化過程?!昂谙湫浴笔撬惴E用的主要原因,監(jiān)管機構在算法不透明的情況下難以有效監(jiān)管,加上算法本身會涉及商業(yè)利益或知識產(chǎn)權問題,故不能“一刀切”地要求算法完全公開。因此,建議在有條件、有限度的情況下公開算法,使算法黑箱呈現(xiàn)一定程度的透明性,緩解算法偏見、弱化算法濫用,加強用戶信任度和好感度。
二是強化用戶的算法素養(yǎng),增進用戶與智能平臺的交互,提升算法認知和應對技能。算法素養(yǎng)指在數(shù)字平臺和服務中,用戶能夠意識到算法的使用并了解算法運作方式的能力[30]。中央網(wǎng)絡安全和信息化委員會印發(fā)的《提升全民數(shù)字素養(yǎng)與技能行動綱要》指出,注重培養(yǎng)具有數(shù)字意識、計算思維、終身學習能力和社會責任感的數(shù)字公民。智慧圖書館推進過程中,用戶算法素養(yǎng)的培養(yǎng)利于使用者從意識層面規(guī)范行為,有效規(guī)避使用者向智能工具投喂失真、誤導性甚至錯誤信息而形成的不良網(wǎng)絡環(huán)境。實際應用中,用戶還可依據(jù)自身的算法知識和經(jīng)驗,明晰不同信息主體的權利和責任,如個人數(shù)據(jù)是否被作為算法的訓練數(shù)據(jù)使用,大語言模型生成的內容是否侵權,訓練的數(shù)據(jù)集是否需要獲得權利人的許可。
4結語
人工智能技術推動圖書館智慧化服務的趨勢不可阻擋,但其發(fā)展過程中會遭遇很多困難和質疑。批判算法視角重新審視了智慧圖書館發(fā)展進程中的風險,包括算法量化對人類判斷和社會復雜性的忽視,算法內嵌的價值觀導致的社會性問題,算法的問責和政策回應不足以凸顯治理和倫理框架。但可以確定的是,技術應始終服務于用戶,且這些問題可通過技術改進、政策制定和社會監(jiān)督等舉措加以解決。因此,應科學看待智能技術在智慧圖書館中的應用,主觀上厘清風險生成機制,客觀上推進技術的友好化、人性化,共同助力公正透明、健康有序的智慧圖書館行業(yè)生態(tài)的建設。
參考文獻:
[1]吳丹,呼小可,楊馨梅.我國智慧圖書館信息服務的智慧化特征識別研究[J].圖書館建設,2024(2):9-20.
[2]Ackhoff RL.FromData to Wisdom[J].Journal of Applied Systems Analysis,1989,16:3-9.
[3]趙璐.算法實踐的社會建構——以某信息分發(fā)平臺為例[J].社會學研究,2022,37(4):23-44,226-227.
[4]Gillespi,eaverCriialAgoriStudies:aRadingListEB/OL]22ps:/oialmeacoective-ing-lists/critical-algorithm-studies/.
[5]夢非,朱慶華.社交網(wǎng)絡信息傳播中意見偏差的國外研究進展[J].情報理論與實踐,2021,44(10):193-201.
[6]周瓊,歐陽劍.信息繭房背景下高校圖書館媒介與信息素養(yǎng)教育模式探究與實踐[J].圖書館學研究,2021(22):42-48.
[7]凝聚精華 助力推廣——圖書館特色閱讀空間之智慧體驗空間篇[EB/OL].[2025-01-31].ttps://ww.lsc.org.cn/cns/ht-ml_pass/contents/1672215860724/1632702162302439424.html.
[8]遼寧紅色“六地\"文獻館開館《進軍沈陽》《東北抗聯(lián)歌曲集》等4000余種文獻集體亮相[EB/OL].[2025-01-31]https:/whly.ln.gov.cn/whly/mtjj/2024070214374316797/.
[9]吳南中,陳咸彰,馮永.從\"失序\"到\"有序\":生成式人工智能教育應用的轉向及其生成機制[J].遠程教育雜志,2023,41(6):42-51.
[10]周昊旻,葉丁菱,鄧璐薌.社交媒體視域下公共文化機構服務數(shù)智化現(xiàn)狀與發(fā)展研究[J].圖書情報工作,2024,68(22):16-25.
[11]LibaryofogressPersoalDigitalArcvinB/O]].ps://w.digitalpreservati.goprsoalarig/.
[12]裴程.從馬薩林宮到“圖書館-博物館-長廊\"——法國國家圖書館黎塞留館址古今變遷[J].圖書館雜志,2018,37(7):97-106.
[13]王曉敏,楊嶸均.數(shù)字化原住民人性化教育的困境及其變革路徑[J].江蘇高教,2023(6):25-33.
[14]郭佳,黃程松.國外網(wǎng)絡環(huán)境中信息過載研究進展[J].情報科學,2018,36(7):170-176.
[15]鄭煌杰.可信的人工智能:技術倫理風險下AIGC的治理基點[J/OL].科技進步與對策,1-11[2025-01-27].ttp://kns.cnki.net/kcms/detail/42.1224.G3.20241101.1042.002.html.
[16]SureshH,Guttag JV.A frameworkforunderstandingunintendedconsequencesofmachinelearning[J]arXivpreprintarXiv:1901.10002,2019,2(8):73.
[17]閆坤如.人工智能的算法偏差及其規(guī)避[J].江海學刊,2020,329(5):141-146.
[18]Favaretto M,De ClercqE,ElgerBS.BigDataanddiscrimination:Perils,promisesandsolutions.AsystematicreviewJ].Jour-nal of Big Data,2019,6(1):1-27.
[19]Cachat-RoetG,KlarsfeldiversityquityndincusioninrtificialintellgenceanevaluationofgidelinsldArtificial Intelligence,2023,37(1):2176618.
[20]PaquetteL,OcumpaughJ,LiZetal.Who’slearning?UsingdemographicsinEDresearchJ].JouralofEducatioalataMining,2020,12(3):1-30.
[21]劉夢佳.新時代高校圖書館中華優(yōu)秀傳統(tǒng)文化閱讀推廣的問題與對策[J].教育理論與實踐,2024,44(27):18-22.
[22]趙司空.算法本體論及其批判探析[J].自然辯證法研究,2021,37(6):52-58.
[23]謝亞可.普適傳播的技術邏輯與倫理審視[J].倫理學研究,2018(3):94-99.
[24]于欽明,王啟帆.泛娛樂主義的算法審視與糾治[J].江漢論壇,2024(7):79-84.
[25]圖書館\"超級大腦”上線\"AI館員\"閃亮登場[EB/OL].[2025-01-31].http://ww.lib.hit.edu.cn/2024/1218/c14793a361321/page.htm.
[26]閆坤如,曹彥娜.人工智能時代主體性異化及其消解路徑[J].華南理工大學學報(社會科學版),2020,22(4):25-32.
[27]王旭,程光輝,趙鴻玉,等.技術性壓力視角下智慧圖書館人工智能風險防控體系研究[J].圖書館學研究,2024(7):56-69.
[28]趙楊,張雪,范圣悅.AIGC驅動的智慧圖書館轉型:框架、路徑與挑戰(zhàn)[J].情報理論與實踐,2023,46(7):9-16.
[29]蘇宇.算法規(guī)制的譜系[J].中國法學,2020(3):165-184.
[30]DogruelL,MasurP,JoeckelS.DevelopmentandValidationofanAlgorithmLiteracyScaleforInternetUsersJ].Communica-tion Methods and Measures,2022,16(2):115-133.