摘 要:文章介紹了嘉興市圖書館運用人工智能生成內(nèi)容(AIGC)技術,自主研發(fā)AIGC繪圖應用“AI繪夢大師”,成功將其運用到閱讀推廣活動“AI繪畫之旅”以及活動的過程和成效等情況。指出公共圖書館在采用AIGC技術時需應對版權爭議與法律適應性、內(nèi)容尺度的監(jiān)管與引導、內(nèi)容質(zhì)量的評估與控制、行業(yè)沖擊與職業(yè)轉(zhuǎn)型等挑戰(zhàn),并提出了相應的對策。
關鍵詞:人工智能生成內(nèi)容;公共圖書館;閱讀推廣
中圖分類號:G258.2 文獻標識碼:A
AIGC Empowering Reading Promotion: A Case Study of the Development and Application of \"AI Dream Master\" at Jiaxing Library
Abstract This paper introduces how Jiaxing Library leveraged Artificial Intelligence Generated Content (AIGC) technology to independently develop the drawing application \"AI Dream Master\" and successfully integrate it into reading promotion activities. The study highlights the \"AI Drawing Journey\" event, detailing its process and outcomes. The paper also discusses the positive impact of AIGC technology in reading promotion, such as fostering innovation, enhancing participants' skills, popularizing AIGC creation, lowering the barrier to artistic creation, and connecting art with everyday life. Finally, the paper identifies challenges public libraries face when adopting AIGC technology, including copyright issues, legal adaptability, content moderation, quality control, industry impact, and professional transitions, and proposes corresponding solutions.
Key words artificial intelligence generated content(AIGC); public library; reading promotion
1 引言
AI(Artificial Intelligence, 人工智能)繪畫技術并非一個全新概念,20世紀70年代,藝術家哈羅德·科恩(Harold Cohen)開始探索編程控制機械臂的藝術創(chuàng)作。由于當時技術有限,AI繪畫作品與人類藝術家作品相比存在顯著差異,因此并未在藝術界引起太多反響[1]。2022年8月的科羅拉多州藝術博覽會上,AI繪畫作品《太空歌劇院》榮獲“數(shù)字藝術/數(shù)字修飾攝影”類別最高榮譽。《太空歌劇院》基于最新人工智能生成內(nèi)容(Artificial Intelligence Generated Content, AIGC)技術,利用AI繪圖模型Midjourney生成,其藝術水平足以與人類藝術家媲美,在全球藝術界和科技界引起了廣泛關注[2]。
AIGC技術的核心在于構建基于自然語言處理的預訓練模型,并結(jié)合先進的生成算法與多模態(tài)技術,開發(fā)出能夠自動生成豐富內(nèi)容的產(chǎn)品。其基本特征在于利用海量數(shù)據(jù)和智能化的內(nèi)容組織來推動內(nèi)容的生產(chǎn)[3]。AIGC技術生成的內(nèi)容有文本、圖像、音頻和視頻等多種形式,與公共圖書館為讀者提供的服務資源高度契合。將AIGC技術引入讀者服務,尤其是閱讀推廣活動中,將為公共圖書館活動策劃和實施帶來別樣的體驗。
傳統(tǒng)的公共圖書館閱讀推廣活動通常以內(nèi)容策劃為核心,涵蓋文本為主的親子閱讀和朗誦,圖文為主的書法和繪畫,以及各類音視頻創(chuàng)意征集活動等。隨著時間推移,這些活動逐漸顯露出同質(zhì)化嚴重、創(chuàng)新性不足等問題。公共圖書館閱讀推廣服務具有商家對顧客(Business to Consumer,B2C)屬性,而個性化服務在多個B2C行業(yè)中已被證明具有明顯優(yōu)勢。例如,抖音、小紅書等平臺為大眾提供個性化視頻推薦,逐漸取代傳統(tǒng)短視頻平臺。隨著AIGC技術的迅猛發(fā)展,公共圖書館閱讀推廣活動迎來了實現(xiàn)更多個性化服務的機遇。2023年初,嘉興市圖書館成立項目研究團隊,研發(fā)基于AIGC技術的繪圖應用“AI繪夢大師”,并將其應用于少兒閱讀推廣活動中。通過開展個性化的“AI繪畫之旅”活動,引導少兒讀者發(fā)揮想象力,創(chuàng)作出獨一無二的精美繪本。這不僅豐富了圖書館的服務內(nèi)容,也為讀者提供了更加個性化和富有創(chuàng)意的閱讀體驗。
2 “AI繪夢大師”的研發(fā)
2.1 “AI繪夢大師”的原理
“AI繪夢大師”是一款基于AIGC技術的繪圖應用,通過文本描述生成相應圖像,實現(xiàn)“文本到圖像”的轉(zhuǎn)換。當前主流的AIGC繪圖模型主要包含以下兩個核心功能:
(1)文本與圖像匹配度訓練:AIGC繪圖應用的核心能力在于根據(jù)文本描述生成匹配的圖像。該過程關鍵在于提升文本與圖像之間的匹配精度。為實現(xiàn)這一目標,模型需要大量圖文數(shù)據(jù)進行訓練,獲取這些圖文匹配數(shù)據(jù)是完成訓練任務的關鍵?;ヂ?lián)網(wǎng)上存在大量圖文匹配數(shù)據(jù),如微信公眾號、微博等社交媒體上的圖文信息,均可作為模型訓練的數(shù)據(jù)源。
(2)圖像生成技術:目前主要有兩種主流技術用于圖像自動生成,即生成對抗網(wǎng)絡(Generative Adversarial Network, GAN)和擴散模型(Diffusion Model)。GAN技術起源于2014年,是AIGC領域的早期主流技術,Diffusion Model雖較晚出現(xiàn),但由于其較低的訓練難度和較高的生成質(zhì)量,已逐漸取代GAN成為主流技術[4]?!癆I繪夢大師”采用Diffusion Model技術來實現(xiàn)圖像生成。
構建AIGC繪圖模型成功后,需使用目標數(shù)據(jù)對模型進行持續(xù)訓練,直至能滿足“輸入指令→生成作品”要求,此時,模型便可用于設計和研發(fā)繪圖應用。例如,若要利用AIGC技術繪制一個粽子,其原理如圖1所示。通過訓練,“AI繪夢大師”能根據(jù)用戶文本指令生成相應圖像作品,為用戶提供豐富且個性化的創(chuàng)作體驗。
2.2 “AI繪夢大師”的研發(fā)過程
2.2.1 繪圖模型選擇的策略性分析
“AI繪夢大師”研發(fā)的關鍵是選擇合適的繪圖模型。項目研究團隊對當前市場上的主流AIGC繪圖模型進行了深入的調(diào)研[5],并對各自的主要特性進行了系統(tǒng)梳理與總結(jié)(見表1)。
通過對各類模型的優(yōu)劣進行評估,重點關注模型生成速度、多平臺兼容性以及開源性等關鍵指標,研究團隊最終選定Stable Diffusion模型作為“AI繪夢大師”核心繪圖引擎。Stable Diffusion模型運用Diffusion Model技術,以其快速圖像生成能力、優(yōu)秀跨平臺兼容性以及完全開源的特性脫穎而出[6]。這些特點不僅能滿足公共圖書館多樣化應用場景的需求,也能為用戶提供更自由和廣闊的創(chuàng)作空間。
選擇Stable Diffusion模型的決策過程體現(xiàn)了項目研究團隊對技術先進性、實用性和開放性的綜合考量,確?!癆I繪夢大師”在提供高效、個性化服務的同時,也能夠適應不斷變化的技術發(fā)展和用戶需求。
2.2.2 研發(fā)步驟與實施
“AI繪夢大師”應用的研發(fā)遵循一系列系統(tǒng)化步驟,確保應用的高效構建與功能完善。(1)本地化部署與技術需求明確化。AIGC繪圖軟件部署方案本地化,在此基礎上,研究團隊明確了二次開發(fā)所需的技術規(guī)范,為后續(xù)開發(fā)工作奠定基礎。(2)作圖流程的確立與優(yōu)化。確立AIGC繪圖關鍵流程,包括提示詞、反向提示詞以及大模型等核心概念。針對本館繪本活動具體需求,研究團隊對自部署(即利用自動化工具準確部署至目標環(huán)境)的AIGC繪圖接口進行二次封裝,并優(yōu)化作圖流程,以適應低齡讀者的使用習慣,確保應用的易用性和可訪問性。(3)系統(tǒng)分析與設計。這一步驟對于確保應用的功能性、穩(wěn)定性和可擴展性至關重要,確保應用最后順利上線使用。
2.2.3 上線使用
2023年下半年,“AI繪夢大師”在嘉興市圖書館繪本制作活動“AI繪畫之旅”中正式上線使用。項目研究團隊密切關注讀者的使用反饋,結(jié)合讀者意見,持續(xù)對應用程序進行迭代升級(見圖2)。這一過程不僅提升了用戶體驗,也滿足了讀者不斷變化的實際需求。
2.3 “AI繪夢大師”的特色分析
(1)內(nèi)容生成健康適宜?!癆I繪夢大師”特別強調(diào)內(nèi)容生成的健康性和適宜性,項目研究團隊針對當前市場上一些不夠規(guī)范的AI繪圖工具在內(nèi)容審核方面的缺陷,在系統(tǒng)設計初期就采用了關鍵詞過濾機制,并預設了相應的內(nèi)容準則。這一策略能有效避免生成衣著暴露、姿態(tài)不雅等不適宜少兒的圖像內(nèi)容,確保生成的圖片健康向上,符合少兒讀者的使用需求。
(2)審美設計少兒化。“AI繪夢大師”在審美設計方面力求滿足少兒讀者的特殊需求。與成人審美傾向的通用AI模型不同,研究團隊在Stable Diffusion大模型的基礎上,結(jié)合多種LoRA模型(高效、靈活且適用于多種場景的模型微調(diào)技術)進行訓練,最終成功生成符合低齡兒童審美的藝術風格圖片。這種針對性設計策略不僅確?!癆I繪夢大師”能更好地服務于少兒閱讀推廣活動,而且能有效吸引少兒讀者,激發(fā)他們的創(chuàng)造力和想象力。
(3)操作界面簡化易用?!癆I繪夢大師”避免了商用繪圖軟件普遍存在的操作復雜、術語繁多等問題,在操作界面設計上進行顯著簡化(見圖3)。通過對少兒讀者實際需求進行調(diào)研,項目研究團隊優(yōu)化AI繪圖流程,對繪圖創(chuàng)作風格、主題和場景進行精心預設。這些改進極大降低了少兒讀者的使用門檻,使他們能夠更加輕松地操作繪圖工具,享受創(chuàng)作樂趣,同時也提高了他們對藝術創(chuàng)作的興趣和參與度。
通過上述三方面的改進和優(yōu)化,“AI繪夢大師”不僅在技術層面實現(xiàn)了創(chuàng)新,更在用戶體驗和教育價值上展現(xiàn)出獨特優(yōu)勢,為少兒讀者提供了一個健康、有趣且富有啟發(fā)性的數(shù)字創(chuàng)作平臺。
3 “AI繪夢大師”的應用——“AI繪畫之旅”活動
3.1 活動背景與理論基礎
在目前的圖書情報學科領域,對AIGC技術的研究主要集中于理論探討,如對AIGC技術在圖書館智慧服務中的潛在應用進行前景分析[7],將AIGC技術與元宇宙技術相結(jié)合,對圖書館環(huán)境構建進行理論分析[8]。AIGC技術的實際應用尚處于起步階段,主要體現(xiàn)在參考咨詢服務領域[9]。
嘉興市圖書館自主研發(fā)的“AI繪夢大師”在閱讀推廣活動——“AI繪畫之旅”中正式使用,不僅為AIGC技術在圖書情報領域的應用提供了實證案例和實踐參考,而且對于提升公共圖書館閱讀推廣活動質(zhì)量、豐富活動形式及增強活動個性化體驗具有深遠意義,同時也為探索圖書館服務創(chuàng)新提供了新的思路和方法。
3.2 活動流程設計與實施
(1)讀者培訓與教育。在活動啟動階段,項目研究團隊為少兒讀者提供“AI繪夢大師”的使用培訓,核心目標是使少兒讀者理解并掌握提示詞的概念,學會如何運用正向和反向提示詞來構建畫面的主體與背景。這一培訓過程為少兒讀者的后續(xù)創(chuàng)作奠定了基礎,確保他們能夠充分理解并運用AIGC技術進行藝術創(chuàng)作。
(2)初步創(chuàng)作與實踐。培訓結(jié)束后,少兒讀者利用“AI繪夢大師”進行初步創(chuàng)作,將他們的創(chuàng)意想法轉(zhuǎn)化為可視化的繪本草圖。這是整個創(chuàng)作流程的核心環(huán)節(jié),它不僅激發(fā)了少兒讀者的想象力和創(chuàng)造力,也為他們的個性化表達提供了技術平臺。
(3)二次創(chuàng)作與藝術加工。在初步創(chuàng)作的基礎上,項目研究團隊指導少兒讀者使用美圖秀秀等軟件對草圖進行二次加工,通過添加顏色、細節(jié)等元素來豐富和完善他們的作品。這一環(huán)節(jié)不僅鍛煉了少兒讀者的藝術審美和創(chuàng)作能力,而且使最終的繪本作品更加生動和具有個性。
(4)作品評選與展示?;顒幼詈笠画h(huán)是對所有參與作品進行專業(yè)評選。在嘉興數(shù)字圖書館、嘉興市圖書館微信公眾號、嘉興市圖書館視頻號等多個平臺展出并表彰少兒讀者的優(yōu)秀創(chuàng)作成果。此外,優(yōu)秀作品還將被制作成實體書,在嘉興市圖書館展出,進一步擴大作品的影響力和公眾認可度。
3.3 活動成效
(1)提升了公共圖書館閱讀推廣活動的創(chuàng)新水平。傳統(tǒng)閱讀推廣活動需要館員在廣告宣傳、素材搜集、活動評價和報道撰寫等環(huán)節(jié)投入大量精力。AIGC技術在這些環(huán)節(jié)中發(fā)揮重要作用,甚至在某些方面實現(xiàn)了超越,顯著提升閱讀推廣活動的創(chuàng)意水平和效率。在活動策劃階段,館員只需提供關鍵提示信息,AIGC便能生成文案和海報;在活動進行階段,AIGC軟件承擔核心流程;在活動總結(jié)階段,AIGC能自動整理素材生成報道和視頻剪輯。這一變革使得館員能夠?qū)⒏嗑性诓邉澓蛣?chuàng)意工作上,提升公共圖書館閱讀推廣活動的創(chuàng)新水平。
(2)培養(yǎng)了讀者綜合能力?!癆I繪畫之旅”活動對參與者的綜合能力提升具有重要意義,主要體現(xiàn)在三個方面。一是語言描述能力:參與者需要通過精準的提示詞描述生成符合想象的圖片,不斷修改和優(yōu)化提示詞,有效鍛煉了語言描述能力。二是藝術創(chuàng)造力:真正的藝術創(chuàng)作需要融入人類情感,當孩子們將豐富想象力融入AIGC技術,更能創(chuàng)作出精彩的作品。三是與人工智能的協(xié)作能力:參與者在與人工智能協(xié)作中,學會如何管理人工智能并與之協(xié)同工作,這是未來人類進入人工智能時代的必備技能。
(3)科普了AIGC創(chuàng)作優(yōu)勢,降低藝術創(chuàng)作門檻。作為社會教育的重要基地,公共圖書館有責任普及前沿科技知識?!癆I繪畫之旅”活動使讀者親身體驗到AIGC創(chuàng)作的優(yōu)勢。如通過提示詞在互聯(lián)網(wǎng)和數(shù)據(jù)庫中精準收集豐富的素材;通過細致的參數(shù)調(diào)整界面進行人機交互,使創(chuàng)作者能夠根據(jù)自己的創(chuàng)意對畫面進行微調(diào),甚至改變畫風;快速生成具有經(jīng)典風格的草圖,極大提高了創(chuàng)作效率。AIGC技術強大的內(nèi)容生成能力,使沒有經(jīng)過專業(yè)藝術訓練的普通人也能夠參與藝術創(chuàng)作,實現(xiàn)藝術創(chuàng)作的平民化,讓腦海中的創(chuàng)意成為現(xiàn)實。
4 面臨的挑戰(zhàn)與應對策略
在強大的計算能力和海量數(shù)據(jù)支撐下,當前AIGC技術的內(nèi)容創(chuàng)作效率已經(jīng)顯著超越人類。例如,在傳統(tǒng)的公共圖書館繪畫活動中,參與者創(chuàng)作一個復雜作品往往需要數(shù)小時,而通過使用“AI繪夢大師”等繪圖應用,參與者僅需輸入提示文本,不到一分鐘便能生成一張精美的作品草圖。展望未來,在AIGC技術的輔助下,內(nèi)容創(chuàng)作相關行業(yè)的生產(chǎn)效率必將得到更加顯著的提升。盡管AIGC技術帶來了諸多便利,但公共圖書館從業(yè)人員也應認識到在其研發(fā)和應用過程中面臨的諸多挑戰(zhàn)。
4.1 版權爭議與法律適應性
AIGC模型的訓練數(shù)據(jù)來源于現(xiàn)有的數(shù)據(jù)資料,而生成內(nèi)容是模型經(jīng)過大量訓練后的成果。未經(jīng)授權使用他人作品進行模型訓練,可能導致生成內(nèi)容帶有他人風格元素,引發(fā)版權爭議。隨著AIGC技術的廣泛應用,在快速發(fā)展的人工智能時代如何為創(chuàng)作者提供明確規(guī)范的標準,已成為一個日益重要的議題。國外已有學者開始深入探討在創(chuàng)作中使用人工智能帶來的一系列知識產(chǎn)權問題,并提供了解決方案和建議[10]。國內(nèi)法律法規(guī)尚未明確對藝術風格的版權界定,但學術界已經(jīng)開始研究AIGC生成內(nèi)容的財產(chǎn)權和著作權保護機制,以保障AIGC能更加規(guī)范地用于作品創(chuàng)作[11]。公共圖書館應密切關注相關法律法規(guī)的更新,避免將AIGC生成的作品用于商業(yè)目的,以防版權糾紛。
4.2 內(nèi)容尺度的監(jiān)管與引導
雖然AIGC應用設計過程中可以對關鍵詞進行過濾,預設內(nèi)容準則,以去除不健康的生成內(nèi)容,但互聯(lián)網(wǎng)上內(nèi)容的多樣性意味著任何程序也不能100%確保沒有漏洞。因此,公共圖書館的技術人員需要對AIGC應用程序持續(xù)進行查漏補缺,對內(nèi)容準則進行完善,并引導讀者避免使用涉及暴力、色情、極端仇恨言論等的不當文本內(nèi)容。
4.3 內(nèi)容質(zhì)量的評估與控制
AIGC生成內(nèi)容的質(zhì)量高度依賴訓練數(shù)據(jù)的質(zhì)量和數(shù)量。盡管AIGC模型能夠根據(jù)用戶需求快速生成內(nèi)容,但用戶在使用生成內(nèi)容前依然需要自行判斷和篩選。如果原始訓練數(shù)據(jù)存在錯誤,或者訓練內(nèi)容過于復雜導致AIGC模型不能完全理解,AIGC就有可能生成不正確的答案[12]。此外,AIGC模型在訓練數(shù)據(jù)的使用和編碼過程中還可能出現(xiàn)生成內(nèi)容的偏見問題[13]。因此,公共圖書館應該對AIGC生成內(nèi)容的質(zhì)量進行評估和篩選,防止錯誤和虛假知識在圖書館中積累,以維護圖書館的文化公信力。
4.4 行業(yè)沖擊與職業(yè)轉(zhuǎn)型
AIGC技術極大提高了內(nèi)容生產(chǎn)效率和多樣性,降低了創(chuàng)作門檻,但同時也將對內(nèi)容生產(chǎn)行業(yè)產(chǎn)生沖擊。以公共圖書館為例,部分由圖書館員承擔的工作可能會被AIGC取代,如參考咨詢、圖書推薦等。然而AIGC改變的只是公共圖書館服務的內(nèi)容和效率,公共圖書館在信息素養(yǎng)教育等方面擔負的責任并沒有改變,館員作為讀者和信息資源之間中介者的角色也沒有改變[14]。因此,公共圖書館從業(yè)人員應積極擁抱和掌握AIGC技術,而非抗拒和逃避。例如,公共圖書館可以提供大量來源可靠、針對性強的文獻數(shù)據(jù),館員可將其收集整理作為訓練數(shù)據(jù)提供給AIGC訓練模型,解決當前AIGC生成內(nèi)容在某些學科領域深度不夠的問題[15]。公共圖書館也可以利用AIGC技術賦能閱讀推廣服務,提高閱讀推廣活動的創(chuàng)新性和吸引力。
5 結(jié)語
如今,AIGC技術正在以前所未有的速度更迭發(fā)展,ChatGPT、Sora、Claud3等大模型快速地進行版本升級[16],為公共圖書館行業(yè)的發(fā)展帶來了前所未有的機遇,同時也帶來了挑戰(zhàn)。嘉興市圖書館積極適應技術變革,自主研發(fā)“AI繪夢大師”,并成功將其用于閱讀推廣活動——“AI繪畫之旅”。實踐證明,公共圖書館只要合理利用AIGC技術,妥善應對可能出現(xiàn)的問題,完全能夠在AIGC技術的輔助下更好地服務于公眾,推動知識的傳播和文化的發(fā)展。
參考文獻:
[1] 趙睿智,李輝.AIGC背景下AI繪畫對創(chuàng)意端的價值、困境及對策研究[J].北京文化創(chuàng)意,2023(5):42-47.
[2] 楊宇鶴.AI繪圖的演化、影響與思辨[J].傳媒.2023(17):52-55.
[3] 詹希旎,李白楊,孫建軍.數(shù)智融合環(huán)境下AIGC的場景化應用與發(fā)展機遇[J].圖書情報知識.2023(1):75-85.
[4] 杜雨,張孜銘.AIGC:智能創(chuàng)作時代[M].北京:中譯出版社,2023:66.
[5] CAO Y,LI S,LIU Y,et al.A comprehensive survey of AI-Generated content (AIGC):a history of generative AI from GAN to ChatGPT[J].ArXiv Preprint arXiv,2023(2):1-43.
[6] 翟尤,郭曉靜,曾宣瑋.AIGC未來已來[M].北京:人民郵電出版社,2023:9.
[7] 蔡子凡,蔚海燕.人工智能生成內(nèi)容(AIGC)的演進歷程及其圖書館智慧服務應用場景[J].圖書館雜志,2023(4):34-43.
[8] 劉佳佳.基于AIGC技術的圖書館元宇宙服務應用前景與挑戰(zhàn)[J].圖書館研究與工作,2024(4):57-64.
[9] CHEN X.ChatGPT and its possible impact on library reference services[J].Internet Reference Services Quarterly,2023:1-9.
[10] SCIMECA M,BONFIGLIO R.Dignity of science and the use of ChatGPT as a co-author[J].ESMO Open,2023,8(4):101621.
[11] 鄒杰,賈長森.從數(shù)據(jù)到作品:AIGC著作權保護的規(guī)范邏輯[J].人工智能,2023(6):97-105.
[12] HOUSTON A B,CORRADO E M.Embracing ChatGPT:Implications of emergent language models for academia and libraries[J].Technical Services Quarterly,2023,40(2):76-91.
[13] LUND B D,WANG T,MANNURU N R,et al.Chat GPT and a new academic reality: artificial intelligence-written research papers and the ethics of the large language models in scholarly publishing[J].Journal of the Association for Information Science and Technology,2023,74(5):570-581.
[14] 呂游.AIGC技術在圖書館服務創(chuàng)新中的應用與展望[J].圖書館工作與研究,2024(3):67-72.
[15] 儲節(jié)旺,羅怡帆.人工智能生成內(nèi)容賦能圖書館知識服務的路徑研究[J].情報理論與實踐,2024(8):34-42.
[16] 陶煒,沈陽.從ChatGPT到Sora:面向AIGC的四能教育和范式革新[J].現(xiàn)代教育技術,2024,34(4):16-27.
作者簡介:朱文淵,嘉興市圖書館館員,研究方向為圖書館閱讀推廣;湯益飛,嘉興市圖書館高級工程師,研究方向為信息化建設和服務;邱仁博,嘉興市圖書館高級工程師,研究方向為信息化建設和服務。
收稿日期:2024-06-12編校:李萍 王伊藝