摘 要:現(xiàn)階段,人工智能已成為出版機構向用戶提供知識服務的重要驅動力量。將知識服務內容生產(chǎn)、呈現(xiàn)、傳播等與人工智能進行深度融合已成為出版機構提升競爭力水平的題中之義。基于對出版機構人工智能應用現(xiàn)狀及發(fā)展趨勢的綜合把握,可作出如下研判:在知識內容生產(chǎn)方面,創(chuàng)新趨勢主要在于建立高準確率的內容核查機制、應用深化文本內容理解的編輯與校對技術;在知識內容呈現(xiàn)方面,創(chuàng)新趨勢主要在于優(yōu)化用戶交互體驗的智能語音與多模態(tài)內容生成;在知識內容傳播方面,創(chuàng)新趨勢主要在于使用高度智能和開放式算法的個性化推薦系統(tǒng)、實施智能化的版權監(jiān)控。
關鍵詞:人工智能;出版機構;知識服務;數(shù)字出版
DOI: 10.3969/j.issn.2097-1869.2024.03.015 文獻標識碼:A
著錄格式:沈海濤,陳哲.人工智能驅動下出版業(yè)知識服務創(chuàng)新趨勢研究[J].數(shù)字出版研究,2024,3(3):133-140.
人工智能是一種研究、開發(fā)用于模擬延伸和擴展人的智能的理論、方法、技術及應用系統(tǒng)的技術科學。作為計算機科學的一個分支,其主要研究內容包括機器人、語言識別、圖像識別、自然語言處理(Natural Language Processing,NLP)和專家系統(tǒng)[1]。近年來,我國高度重視人工智能的發(fā)展。2022年7月,《關于加快場景創(chuàng)新以人工智能高水平應用促進經(jīng)濟高質量發(fā)展的指導意見》發(fā)布,提出要探索人工智能發(fā)展的新模式、新路徑,以人工智能高水平應用促進經(jīng)濟高質量發(fā)展??梢?,伴隨技術的飛速發(fā)展及國家戰(zhàn)略部署的推進,人工智能將與各行各業(yè)達成發(fā)展創(chuàng)新與深度融合。
在出版業(yè)知識服務領域,人工智能的應用在生產(chǎn)流程、場景、模式及產(chǎn)品形態(tài)等方面引發(fā)顯著變革。然而,技術的更迭演進并不會停止在某一時刻,人工智能作為當前顛覆性的技術之一,將不斷賦能出版業(yè)知識服務,繼續(xù)衍生出創(chuàng)新性、革命性的產(chǎn)用模式。把握人工智能驅動下出版業(yè)知識服務的創(chuàng)新趨勢,是出版機構在下一輪技術革命浪潮中立于不敗之地的基石,并且對推動出版業(yè)的健康發(fā)展、提高其服務質量與競爭力,以及更好地服務于社會主義現(xiàn)代化建設具有深遠意義。
1 人工智能驅動下出版業(yè)知識服務達成路線
探討出版業(yè)知識服務在各階段的達成路線(見圖1),可以為出版機構提供具體的操作指南,其中包含如何整合現(xiàn)有資源、選擇適合的技術工具、設計實施步驟等。技術引入有助于出版機構識別人工智能等技術演進的關鍵節(jié)點和潛在的新興技術,比如,了解NLP、深度學習、大數(shù)據(jù)分析等技術在出版業(yè)的應用趨勢,可以幫助出版機構在趨勢研判的基礎上盡早謀篇布局,促成穩(wěn)固發(fā)展。
1.1 知識采集
出版機構不僅有傳統(tǒng)的紙質書籍,還有電子書、有聲書、視頻課程、在線數(shù)據(jù)庫等多源異構的數(shù)據(jù)資源。經(jīng)過多年建設,這些數(shù)據(jù)已成為出版機構內部重要的資源。向用戶提供知識服務的前提在于系統(tǒng)地搜集并有效整合所需的知識資源。為此,需要針對不同模態(tài)和形式的數(shù)據(jù)資源進行內容提取,例如可使用光學字符識別(Optical Character Recognition,OCR)技術從電子書和掃描文檔中提取文本;利用語音識別技術將有聲書中的語音轉換為文本;利用視頻內容分析技術提取視頻課程的關鍵幀、字幕和語音內容。為了便于后續(xù)處理,還需要將不同格式的數(shù)據(jù)轉換成統(tǒng)一格式,并從各類資源中提取元數(shù)據(jù),用于分類和索引。
1.2 知識抽取與清洗
知識抽取是從各種數(shù)據(jù)源中提取知識并構建知識圖譜的過程。為了識別采集到的數(shù)據(jù)資源中的關鍵信息,將其轉化為可用的知識形式,需要采用文本挖掘、實體識別、關系抽取等技術從原始數(shù)據(jù)中提取結構化、半結構化或非結構化的數(shù)據(jù)資源。該階段需要運用機器學習、NLP等技術[2]。知識數(shù)據(jù)在存儲前必須經(jīng)過預處理,使用NLP、數(shù)據(jù)清洗技術去除噪聲,如在知識源生產(chǎn)過程中出現(xiàn)的重復數(shù)據(jù)、錯誤信息,須經(jīng)過標準化處理才能保證數(shù)據(jù)質量。
1.3 知識組織與存儲
知識組織是指將清洗后的知識進行結構化處理。在這一階段,利用NLP技術和機器學習模型,人工智能可自動分類數(shù)據(jù)內容,將其歸納至正確的主題類別,并自動生成關鍵詞標簽,提高知識資源的可發(fā)現(xiàn)性。
知識存儲以構建知識圖譜為途徑,將知識以節(jié)點和邊的形式進行組織,以供查詢和推理。除了自有平臺數(shù)據(jù)和用戶數(shù)據(jù)外,出版機構內部也擁有大量行業(yè)數(shù)據(jù)。構建專業(yè)知識圖譜,可以更好地服務用戶的知識需求,而用戶畫像知識圖譜的搭建,則能夠滿足用戶個性化、定制化、精準化需求。為了使知識計算得以有效展開,需要將知識圖譜關聯(lián)多種異構知識庫,對各類顯性和隱性知識進行表示、組織和融合。
1.4 知識表示與推理
知識表示是將出版機構所保有的非結構化知識信息轉化為結構化數(shù)據(jù)。通過知識表示,可以構建索引和元數(shù)據(jù),使得內容資源能夠被快速定位和檢索,也會更加有序且易于被機器理解和處理。知識服務的關鍵在于要求出版機構由內容思維轉變?yōu)橛脩羲季S,這離不開對用戶需求的探知。因此,出版機構若要實現(xiàn)更為個性化和精準的內容推薦,就需要基于已有的知識圖譜和邏輯規(guī)則進行推理。
知識推理是一套嚴密、復雜的邏輯推理過程,推理結果可賦權人工智能系統(tǒng)理解用戶查詢的潛在意圖,從龐大的知識數(shù)據(jù)庫中提取準確答案或提供決策支持。此外,知識推理還支持知識圖譜的動態(tài)更新和優(yōu)化,發(fā)現(xiàn)知識間的潛在關聯(lián),補全缺漏信息和修正錯誤鏈接,為用戶提供更深層次的交互體驗。
1.5 知識管理與融合
知識管理需要出版機構通過大數(shù)據(jù)分析、NLP、機器學習等手段,獲取、整理、存儲和分享企業(yè)內外部的信息。對海量數(shù)據(jù)資源進行自動提取、歸納和分類,幫助用戶更為高效和便捷地獲取知識,并根據(jù)用戶需求和偏好,及時推薦相關知識內容,提供個性化的知識服務。為了提升知識內容的準確性和時效性,人工智能技術可運用于實時監(jiān)控和知識變化分析,從而及時更新和修正知識庫。除此之外,知識管理也是人工智能技術在出版機構內部應用的重點場景之一,在知識管理方面的先行探索將為企業(yè)知識服務平臺大模型建設筑牢根基。
知識融合涉及將不同格式和結構的知識整合在一起,解決知識重復和沖突,提高知識的一致性和完整性。藉由對現(xiàn)有資源進行深度挖掘和關聯(lián),還可以創(chuàng)造出更具價值的知識產(chǎn)品。在人工智能領域,知識融合的意義重大,因為它可以幫助機器學習系統(tǒng)更好地理解和解決復雜問題。此外,知識融合有助于構建統(tǒng)一的知識管理體系,通過實體鏈接、語義標注等技術,提升知識的組織性和可檢索性。
1.6 知識應用與服務
知識創(chuàng)新應用需要在對知識圖譜進行查找、學習、推理等知識計算的基礎上,為用戶提供智能化、智慧化的知識服務[3]。對此,可以根據(jù)用戶需求設計服務接口(Application Programming Interface,API)明確服務功能、數(shù)據(jù)的輸入和輸出格式、訪問協(xié)議等。然后,將語義搜索、知識推理、智能推薦算法等集成到現(xiàn)有的IT架構中,確保服務的穩(wěn)定性和可拓展性。在服務前端,可通過網(wǎng)頁、移動應用平臺、聊天機器人等方式提供用戶友好型界面或API;在服務過程中,需要提升監(jiān)控服務性能,優(yōu)化用戶體驗。同時,還需建立反饋機制,根據(jù)用戶交互數(shù)據(jù)和效果評估,持續(xù)優(yōu)化知識庫和服務算法,繼而引入在線學習機制,使系統(tǒng)能按照新產(chǎn)生的數(shù)據(jù)進行自我更新,提升知識服務效能。國際領先的教育出版公司圣智開發(fā)的MindTap在線學習平臺通過提供在線測試與及時反饋,幫助用戶在課后自主檢測對相關知識點的掌握情況,并可以根據(jù)用戶錯誤情況、薄弱點等提出個性化解決方案。
2 知識內容生產(chǎn)創(chuàng)新
2.1 內容本體:提升事實核查準確率
生成式人工智能是人工智能領域的一個分支,通過自然語言指令創(chuàng)造視頻、音頻、圖片、文本等新內容。傳統(tǒng)人工智能的重點是預測模型以執(zhí)行特定任務,例如估計數(shù)字、分類數(shù)據(jù)或在一組選項之間進行選擇。相比之下,生成式人工智能的重點是創(chuàng)造原創(chuàng)內容,而不是基于模型決策邊界的正確答案[4]。三個主要因素促成了生成模型的進步:互聯(lián)網(wǎng)上可用的訓練數(shù)據(jù)的爆炸式增長、訓練算法的改進、用于訓練模型的可用計算能力的增加。例如,GPT-3的訓練使用了大約45TB的文本數(shù)據(jù)(大約100萬英尺的書架空間),將文本分解成標記的單詞片段,并創(chuàng)建1.75億個參數(shù),通過統(tǒng)計識別標記序列中最可能的下一個標記來生成新文本。而新版本GPT-4是一個多模態(tài)大語言模型,對文本和視頻圖像都有響應。
當前,生成式人工智能技術正在被出版機構廣泛接納并采用,因為它有潛力改變內容創(chuàng)造、編輯和分發(fā)的形式。美國科技公司Veristage開發(fā)出一款名叫Insight的大語言模型平臺,將一部十幾萬字的中文小說文稿上傳至該平臺,幾分鐘后便能形成包括英語、德語等在內的多語言評估報告。報告還能詳細剖析這部作品的目標受眾、潛在賣點、宣傳文案、新媒體營銷方案和版權相關建議等。
但在專業(yè)領域,已有學者發(fā)現(xiàn)ChatGPT等生成式人工智能模型可能并不可靠,如產(chǎn)生事實與推理錯誤,并大規(guī)模傳播。Monteith等研究發(fā)現(xiàn)一般公眾很容易從生成式人工智能中獲得錯誤信息,他們可能會因為毫無防備地接受這些錯誤信息而加速其傳播。然而與個人護理和公共衛(wèi)生有關的醫(yī)療錯誤信息可能產(chǎn)生嚴重的負面后果[5]。Sivasankari等證實由于ChatGPT假新聞的泛濫和錯誤信息的傳播,人工智能在謠言傳播中得到大面積使用[6]。2023年,律師Steven A Schwartz在與美國地區(qū)法官P.Kevin Castel就一起因航空公司雇員受傷而提起的訴訟進行辯論時發(fā)現(xiàn),他使用OpenAI尋找的案例至少有6起不存在,在2023年5月提交的一份文件中,法官Castel指出,Schwartz提交的卷宗包含虛假的姓名和案卷編號,以及虛假的內部引文。而Schwartz本人也承認他“沒有意識到其內容可能是虛假的”[7]。由此可見,現(xiàn)階段在技術局限、數(shù)據(jù)質量、算法偏差及人為操縱等因素的作用下,人工智能生成內容的準確率仍有待提升。而將內容質量作為立身之本的出版業(yè),也應重視所提供知識服務的嚴謹性和準確性。基于此,嚴密施行事實核查機制將成為未來出版業(yè)開展知識服務時無法回避的一道程序。為了提升供給內容的準確率,出版機構在向用戶提供知識服務時可以從以下幾個階段著手。
在數(shù)據(jù)預處理階段,對原始數(shù)據(jù)進行清洗、去噪、標注和轉換,可以確保訓練數(shù)據(jù)的質量,以便更好地適應模型訓練的要求。在模型選擇階段,需要選擇適合目標任務的模型架構,如BERT1、生成對抗網(wǎng)絡(Generative Adversarial Networks,GAN)等,從而提升生成內容的準確性。Wang等[8]經(jīng)過實證研究發(fā)現(xiàn),BERT和微調RoBERTa模型2在性能方面優(yōu)于其他模型。值得注意的是,BERT模型的準確率超過87%,而改進的RoBERTa模型的準確率為98%。在數(shù)據(jù)優(yōu)化階段,可以采用文本糾錯和語義理解技術,對生成內容進一步優(yōu)化和修正。此外,還可通過增加訓練數(shù)據(jù)量、優(yōu)化訓練策略和引入外部知識庫等策略來提升生成內容的準確性。而從用戶角度出發(fā),平臺應提醒用戶在使用時盡量提供詳細的背景闡述和需求描述,以便平臺系統(tǒng)能夠更準確地理解用戶需求。
2.2 內容編輯與校對:深化文本內容理解
編輯與校對是出版物公開發(fā)行之前必不可少的流程。編輯的主要目的是識別并糾正語法、語氣風格、事實核查、句法和語義元素等問題;校對作為隨之而來的后一階段,主要目的是審查編輯的工作,解決潛在的錯誤,并改進頁眉、頁腳和格式等頁面元素[9]。現(xiàn)階段,人工智能技術可以輔助進行文本糾錯、拼寫檢查與語法檢查等,提高稿件的質量和準確性。在出版機構內部,編輯人員可以借助人工智能工具快速、高效地完成稿件審查和修改工作,減輕工作負擔。這類技術的應用已在業(yè)內達成廣泛共識。國外編校人員常用Grammarly、ChatGPT和PerfectIt等軟件進行編輯校對輔助。然而,?z?eli?k[10]研究發(fā)現(xiàn),ChatGPT在檢測拼寫、標點錯誤及節(jié)省時間方面可能是一個有用的工具,但其仍然存在偏見和不準確問題,比如其似乎更“偏愛”美式英語而非英式英語,該工具在理解文本的上下文語境或文化方面的能力也有限。要解決人工智能在編校過程中所產(chǎn)生的技術偏誤,需要依托深度學習和NLP技術的進步。
首先是對上下文的深度理解。未來,人工智能驅動的編輯器能夠通過深度學習模型,深入理解文本的語義和上下文關系,在此基礎上生成的修改建議更能遵循原文邏輯,避免斷章取義情況的發(fā)生。
其次是跨文化適應性。在全球化背景下,內容創(chuàng)作與傳播跨越國界漸成常態(tài),智能化編輯工具通過訓練大規(guī)模多語言數(shù)據(jù)集,能夠理解和轉化不同文化語境下的表達習慣、俗語、俚語及特定文化應用,從而在編輯和翻譯過程中保留原文的文化特色。
再次是個性化風格模擬。人工智能編輯器可以根據(jù)特定作者的寫作風格、行業(yè)術語使用習慣或目標受眾偏好,調整編輯建議或自動生成內容。
最后是敏感內容識別與處理。在尊重多樣性和避免冒犯性表達方面,智能化編輯技術能夠幫助識別并提示潛在的敏感內容,包括但不限于關于種族、性別、宗教信仰等問題的不當表述。這不僅有助于保證出版內容的安全合規(guī)性,也體現(xiàn)出對于不同文化價值觀的理解和尊重。
3 知識內容呈現(xiàn)創(chuàng)新
3.1 智能語音:優(yōu)化用戶交互體驗
在NLP和語音識別技術的加持下,用戶不但可實現(xiàn)“聽書”的功能,而且能在界面前端進行問答互動,獲得即時的知識解答和內容解析,進而增強其在獲取知識內容過程中的交互感和參與感。
智能語音技術的發(fā)展表明,在人類的主導下,技術思想已經(jīng)開始探尋人類更深層次的需求。一方面,出版機構知識服務平臺可以借助智能語音提供多場景服務,特別是當用戶處于移動場景中,可以通過語音指令獲取知識內容,體現(xiàn)出技術的場景適配性。另一方面,智能語音能夠滿足泛群體的需求。正如美國傳播學家伊萊休·卡茲(Elihu Katz)所言:人是有著特定需求的個體,他們基于特定的需求或動機來使自己的體驗得到滿足[11]。據(jù)統(tǒng)計,截至2022年,中國的視障群體超過1 700萬,其中超過800萬完全失明[12]。提供智能語音功能以滿足視障用戶的知識服務需求,能夠使得以視障人士為代表的特殊群體的需求被“看見”,這在大幅提升知識內容到達率的同時,也表現(xiàn)了技術可供性所衍生出的人文關懷??梢姡悄苷Z音技術不僅有潛力優(yōu)化出版領域傳統(tǒng)的業(yè)務流程,更預示著其將開創(chuàng)一種嶄新的用戶體驗維度與服務模式,未來或將成長為出版業(yè)知識服務向智慧化方向轉型的關鍵性力量之一。
3.2 內容形式:實現(xiàn)多模態(tài)內容生成
在人工智能科學的疆域里,“模態(tài)”一詞特指信息的不同表達維度或感知途徑,涵蓋了文字、圖像和音視頻等內容的廣泛范疇。通過模仿人類認知的深度與廣度,人工智能技術正經(jīng)歷著從依賴單一信息渠道到多維度融合的轉變,這一進程深刻反映了人工智能從單模態(tài)到多模態(tài)的飛躍。多模態(tài)人工智能的核心機制圍繞三大支柱構建:傳感輸入、信息融合及響應輸出。這些模塊構成了一個多級協(xié)作系統(tǒng),每個模塊都承擔著獨特而關鍵的任務,確保系統(tǒng)能夠跨越數(shù)據(jù)類型的界限,實現(xiàn)綜合性洞察與解析。傳感輸入模塊捕獲來自不同源頭的信息流;信息融合模塊則如同大腦的整合中樞,將這些異構數(shù)據(jù)統(tǒng)一協(xié)調,挖掘它們之間的內在聯(lián)系與互補價值;響應輸出模塊則基于深度理解生成行動或反饋,與用戶或環(huán)境互動。
相較單一模態(tài)的傳統(tǒng)知識服務形式,多模態(tài)內容服務平臺利用不同數(shù)據(jù)模態(tài)間的互補優(yōu)勢,在實現(xiàn)更為準確的預測和決策支持的基礎上,為用戶定制化、個性化需求的滿足賦予更多的想象空間?,F(xiàn)階段,生成式人工智能大模型從單模態(tài)向多模態(tài)發(fā)展已成為行業(yè)共識。繼谷歌在2022年9月推出可以直接通過輸入文本生成3D模型的應用DreamFusion之后[13],英偉達發(fā)布了分辨率更高、速度更快的Magic3D[14]。在文本端應用ChatGPT(2022年11月面世)和圖像生成應用Midjourney V5(2023年3月面世)影響下,文本端和圖像生成應用在2023年呈爆發(fā)式增長。2024年2月,OpenAI發(fā)布其首款視頻生成模型Sora,使視頻生成領域成為新一輪行業(yè)熱點。面對用戶需求場景在內容模態(tài)方面的延伸,多模態(tài)內容生成模式將會廣泛應用在出版機構所提供的知識服務平臺中。
4 知識內容傳播創(chuàng)新
4.1 個性化推薦系統(tǒng):高度智能和開放式算法
個性化推薦的概念自20世紀90年代首次提出以來,迅速成為學術界、工業(yè)界等領域的熱門話題。其核心是機器學習用戶興趣,通過對海量數(shù)據(jù)的挖掘,幫助網(wǎng)站為客戶提供完全個性化的決策支持和信息服務[15],本質上就是取代用戶對從未見過的產(chǎn)品進行評價,自動完成選擇的過程。
個性化推薦技術依賴用戶偏好模型,這些模型來源于瀏覽、搜索、喜歡、收藏、評論和其他歷史行為,再使用邏輯回歸進行離線訓練,并通過映射約簡進行計算[16]。根據(jù)項目的建模方式,個性化推薦系統(tǒng)有兩種主要方法:協(xié)同過濾和基于內容的推薦。推薦系統(tǒng)也可以根據(jù)系統(tǒng)所基于的源數(shù)據(jù)類型進行區(qū)分——顯性或隱性用戶反饋。由于不同的推薦方法都有其自身局限性,Burke提出了一種混合推薦系統(tǒng),該系統(tǒng)不僅使用了內隱反饋的觀察結果,還利用了各種上下文信息[17],伴隨算法模型的更新還出現(xiàn)了基于知識的過濾和進化計算技術[18]。當下,互聯(lián)網(wǎng)正由Web2.0時代向Web3.0時代過渡,普通網(wǎng)民達成從消費者到產(chǎn)消者的身份轉化。但與此同時,現(xiàn)代社會的一個典型病癥也得以濫觴——網(wǎng)民自身知識素養(yǎng)不足或內容缺乏把關可能導致內容質量良莠不齊或內容過載,用戶需求端無法及時接收有效信息。因此,為了有效甄別并提取信息,滿足用戶的個性化和精準化需求,出版業(yè)知識服務平臺個性化推薦的發(fā)展將集中在開發(fā)高度智能和交互式算法方向[19]。為此,出版機構可利用Transformer、BERT等深度學習模型和最近鄰算法,深入理解文本內容及上下文語境信息,挖掘用戶顯性和隱性需求,同時集成知識圖譜以增強推薦系統(tǒng)的語義理解和關聯(lián)推理,通過分析用戶訪問的時間、地點、設備、情緒狀態(tài)等隱私,結合情境感知技術,實時調整推薦策略。隨著用戶在多個設備和平臺上消費內容,推薦系統(tǒng)將會實現(xiàn)跨平臺的個性化追蹤和服務,確保用戶在不同場景下都能享受連貫的知識服務體系,并通過用戶反饋、偏好設置、問答等形式收集實時反饋,不斷優(yōu)化推薦模型。英國的Shimmr.ai公司使用NLP技術,從類型、情節(jié)、主角、反派、主體、情感等方面分析作者的敘事技巧和故事的情感走向,由此向不同讀者推薦感興趣的圖書。從分析到推薦分為三步:第一步是基于結構和價值、興趣、情感三要素提取圖書“DNA”;第二步是生成營銷文案,并自動生成符合消費者需求的、多媒介形態(tài)的標簽和關鍵詞;第三步是推送給需要的消費者。
4.2 版權維護:智能化版權監(jiān)控
版權是一種鼓勵創(chuàng)新和創(chuàng)意表達的重要機制。當前,行業(yè)競爭日益加劇,對于版權的保護顯得尤為重要。而在版權保護的過程中,識別侵權行為非常關鍵。為此,國外眾多大型互聯(lián)網(wǎng)企業(yè)都開始利用人工智能進行相應探索。Facebook開發(fā)了一套名為Rights Manager的系統(tǒng),利用人工智能技術對用戶上傳的視頻進行內容識別,以防止未經(jīng)授權的內容在平臺上傳播。
目前,利用深度學習和圖像識別技術,人工智能技術可以快速識別和對比網(wǎng)絡上流傳的文本、圖像和音視頻內容,通過與版權數(shù)據(jù)庫內的正版作品進行對比,及時發(fā)現(xiàn)潛在的侵權行為。但是,出版機構利用人工智能技術在應對知識服務過程中的版權問題時,還面臨以下困難。
一是對于原創(chuàng)性的判斷存在誤區(qū)?,F(xiàn)有人工智能水平仍處在“弱人工智能”的階段,涉及對文化、藝術及科學貢獻等主觀評價時,難以完全理解人類的創(chuàng)造力和作品的深層含義。
二是技術誤報與漏報。盡管人工智能檢測技術能夠高效篩查大量內容,但可能存在將合法使用誤判為侵權和未能識別真正的侵權行為等問題,影響版權保護的正確性和公正性。
三是隱私與數(shù)據(jù)安全問題。在實施版權保護時,人工智能工具需處理大量用戶數(shù)據(jù),如何在版權保護和用戶隱私維護之間找到一個平衡點依舊是一項艱巨的挑戰(zhàn)。
未來,通過大數(shù)據(jù)與模式識別,人工智能將能夠識別各種文本模式??梢詷嫿ɑ谡Z義的指紋或摘要技術,而非簡單的字符匹配以識別內容的核心思想,以此來降低原創(chuàng)性誤判等問題。而伴隨算法的進步,人工智能將能更準確地識別和處理復雜的版權問題,自動化處理版權登記、檢測、授權及侵權訴訟,提升效率和準確性。在用戶隱私保護層面,人工智能將會減少通過API接收或生成的數(shù)據(jù)來訓練未來的模型,并在使用完請求所需的必要時間內刪除數(shù)據(jù)。
5 結語
人工智能正逐步重塑出版業(yè)的知識服務生態(tài),革新知識采集、處理、推理到應用的全鏈條,展現(xiàn)了以人工智能為代表的數(shù)智技術應用在提升出版服務質量方面的巨大潛能。伴隨人工智能從感知智能向認知智能的邁進,出版業(yè)知識服務的重點和難點將轉變?yōu)槿绾我允鼙娦枨鬄轵寗恿?,基于知識資源提供專業(yè)問題的解決方案[20]。在對出版業(yè)人工智能應用現(xiàn)狀進行梳理,并結合人工智能技術發(fā)展走向的基礎上,可作出如下研判:在知識內容生產(chǎn)創(chuàng)新層面,面對生成式人工智能帶來的內容創(chuàng)造與傳播變革,須警惕其可能帶來的錯誤信息傳播風險。在此背景下,建立高準確率的事實核查機制,保障知識內容的真實性和可靠性,成為不容忽視的議題。智能化編輯與校對技術的發(fā)展將會極大提高出版物的質量控制水平,同時保持內容的文化多樣性和風格獨特性。在知識內容呈現(xiàn)創(chuàng)新層面,智能語音技術能夠滿足多場景和泛群體的需求,讓人工智能的發(fā)展在展示技術特性的同時,也體現(xiàn)對于人文主義關懷的考量。多模態(tài)內容生成使得知識服務平臺向高級別的交互智能邁進,開創(chuàng)一個能夠無縫溝通多元信息、精準服務個性化需求的新場域。在知識內容傳播層面,深度智能化的個性化推薦系統(tǒng)讓內容推送更加貼合用戶定制化需求,促進知識服務體驗的質變。而版權維護雖面臨諸多難題,但人工智能的介入無疑為版權保護提供了新的可能,通過智能化監(jiān)控鋪設一張更加嚴密的版權防護網(wǎng)。出版業(yè)知識服務創(chuàng)新在人工智能的賦能下正處于蓬勃發(fā)展的階段,并且有著廣闊的發(fā)展前景。但是在適配技術應用、探索技術前沿的同時,出版行業(yè)還需持續(xù)關注技術倫理、用戶隱私保護及內容質量把控,以期在人工智能的助力下,構筑更為開放、高效、精準且負責的知識服務體系。
作者簡介
沈海濤,男,天津人民出版社副社長,副編審。研究方向:編輯出版。
陳哲,男,北京印刷學院新聞傳播學院碩士研究生。研究方向:數(shù)字出版。
參考文獻
YANG F. Optimization of personalized recommendation strategy for ecommerce platform based on artificial intelligence[J]. Informatica,2023,47(2):235-242.
柳益君,李仁璞,羅燁,等.人工智能+圖書館知識服務的實現(xiàn)路徑和創(chuàng)新模式[J].圖書館學研究,2018(10):42,61-65.
董彥.人工智能背景下圖書館知識服務創(chuàng)新研究[J].圖書館學刊,2019(7):78-81.
GOLDSTEIN J A, SASTRY G, MUSSER M, et al. Generative language models and automated influence operations: Emerging threats and potential mitigations[EB/OL].(2023-01-10)[2024-07-08].https://arxiv.org/pdf/2301.04246.
MONTEITH S, GLENN T, GEDDES J R, et al. Artificial intelligence and increasing misinformation[J].British Journal of Psychiatry,2023,224(2):33-35.
SIVASANKARI S, VADIVU G. Tracing the fake news propagation path using social network analysis[J].Soft Computing,2022,26(23):1-9.
計算機世界. 9次著名的統(tǒng)計分析和人工智能災難[EB/OL].(2023-10-25)[2024-07-17]. https://new.qq.com/rain/a/20231025A01WHU00.
WANG Z, CHENG J, CUI C, et al. Implementing BERT and fine-tuned RobertA to detect AI generated news by ChatGPT[EB/OL].(2023-06-09)[2024-07-08].https://arxiv.org/pdf/2306.07401.
CALONIA J. Copy editing vs. Proofreading: What’s the difference?[EB/OL].(2022-09-02)[2024-07-08].https://www.grammarly.com/blog/whats-the-difference-between-copy-editing-and-proofreading.
?Z?ELI?K N P. A comparative analysis of proofreading capabilities: Language experts vs. ChatGPT[M].BüLENT P. International studies in educational sciences. Ankara: Serüven Publishing,2023:147-61.
伊萊休·卡茨, 保羅·F·拉扎斯菲爾德.人際影響:個人在大眾傳播中的作用[M].張寧,譯.北京:中國人民大學出版社,2016:15.
湖南日報.青年說丨殘障不是阻礙,人生同樣精彩[EB/OL].(2022-02-22)[2024-07-17]. https://baijiahao.baidu.com/s?id=1725465873008038100amp;wfr=spideramp;for=pc.
POOLE B, JAIN A, JONATHAN T, et al. Dream fusion: Text-to-3d using 2d diffusion[EB/OL].(2023-09-01)[2024-07-08]. https://arxiv.org/pdf/2209.14988.
LIN C, GAO J, TANG L, et al. Magic3d: High-resolution text-to-3d content creation[C]. Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition. Vancouver: Institute of Electrical and Electronic Engineers, 2023:300-309.
LI H, ZHANG S, SHI J, et al. Research and design of intelligent learning system based on recommendation technology[J]. Mechatronic Systems and Control,2019,47(1):43-49.
XU K, ZHOU H, ZHENG H, et al. Intelligent classification and personalized recommendation of ecommerce products based on machine learning[EB/OL].(2023-03-28)[2024-07-08].https://arxiv.org/pdf/2403.19345.
LEE S, MOORE R, REN G, et al. Making personalized recommendation through conversation: Architecture design and recommendation methods[C].California: The Thirty-Second AAAI Conference on Artificial Intelligence, 2018:727-730.
VERMA P, SHARMA S. Artificial intelligence based recommendation system[C]. 2020 2nd International Conference on Advances in Computing, Communication Control and Networking (ICACCCN). IEEE, 2020:669-673.
HSU C H, ALAVI A H, DONG M. Interactive personalized recommendation systems for human health[J]. Journal of Ambient Intelligence and Humanized Computing,2021(12):3209-3212.
代楊.價值創(chuàng)造視角下面向受眾需求的出版知識服務研究[J].編輯之友,2023(12):92-99.
Research on Innovation Trend of Knowledge Service in Publishing Industry Driven by Artificial Intelligence
SHEN Haitao1, CHEN Zhe2
1. Tianjin People’s Publishing House, 300051, Tianjin, China; 2. School of Journalism and Communication, Beijing Institute of Graphic Communication, 102600, Beijing, China
Abstract: Artificial intelligence has become an important driving force for publishing institutions to provide knowledge services to users. Deep integration of knowledge service content production, presentation and dissemination with artificial intelligence (AI) has become a key issue for publishing institutions to enhance their competitiveness. Based on comprehensive understanding of current status and development trend of AI application in publishing institutions, the following conclusions can be made. In terms of knowledge content production, innovation trend mainly lies in content verification mechanism with high accuracy, and editing and proofreading technology to deepen text content understanding; in terms of knowledge content presentation, innovation trend mainly lies in intelligent speech and multimodal content generation to optimize user interaction experience; in terms of knowledge content dissemination, innovation trend mainly lies in personalized recommendation systems with highly intelligent and open algorithms and intelligent copyright monitoring.
Keywords: Artificial intelligence; Publishing agency; Knowledge service; Digital publishing