摘要:為加深用戶對AI技術(shù)整體認(rèn)知,了解ChatGPT這類新型的智能技術(shù)的多模態(tài)的典型應(yīng)用。ChatGPT在信息資源建設(shè)、信息組織與檢索、信息管理算法與技術(shù)、人機交互與協(xié)同等方面提供借鑒,具有深遠(yuǎn)影響。并通過思考ChatGPT技術(shù)產(chǎn)品,分析ChatGPT在圖書館管理中的應(yīng)用,及ChatGPT存在的由于技術(shù)局限的安全風(fēng)險。
關(guān)鍵詞:ChatGPT;語料;學(xué)習(xí)能力;圖書館管理;安全風(fēng)險
中圖分類號:G25 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2024)24-0088-03
開放科學(xué)(資源服務(wù))標(biāo)識碼(OSID)
1 ChatGPT的支撐技術(shù)
ChatGPT(Chat Generative Pre-trained Transfomer)是基于GPT3.5架構(gòu)的大型機器語言系統(tǒng)模型。完整的ChatGPT支撐技術(shù)構(gòu)成是由計算軟硬件及基礎(chǔ)設(shè)施等構(gòu)建的。其中包括基礎(chǔ)層、多模態(tài)訓(xùn)練模型、支持應(yīng)用技術(shù)的應(yīng)用層(見圖1)[1]。ChatGPT最早是一種無標(biāo)簽數(shù)據(jù)的預(yù)訓(xùn)練半監(jiān)督學(xué)習(xí)方法。后來通過微調(diào)具有對具體任務(wù)進(jìn)行全監(jiān)督學(xué)習(xí)的能力。GPT架構(gòu)(Generative Pre-trained Transformer)生成式預(yù)訓(xùn)練變換模型,經(jīng)過訓(xùn)練,能夠自主的展開學(xué)習(xí),從而實現(xiàn)高質(zhì)量的人機對話和具備海量的預(yù)訓(xùn)練語料。目前OpenAI最新技術(shù)GPT4.0模型驅(qū)動功能更強大。具有更好的創(chuàng)造性、協(xié)作性、安全性和邏輯推理能力。在算力方面上,ChatGPT利用云計算Azur AID的超算設(shè)施支持GPT3.5模型等大型語言訓(xùn)練模型??偹懔\行3640天約消耗3640PF-days,可以適應(yīng)廣泛的下游任務(wù)[2]。
ChatGPT的支撐技術(shù),AIGC(即Artificial Intellingenc Generated Content)作為ChatGPT的核心技術(shù),是利用人工智能技術(shù)來自動產(chǎn)生內(nèi)容的。AIGC經(jīng)歷了從PGC(Professional-generated content,專業(yè)生產(chǎn)內(nèi)容)、UGC(User-generated content,用戶生產(chǎn)內(nèi)容)、AIUGC+AIPGC才發(fā)展到AIGC技術(shù)(見圖2)[3],AIGC典型技術(shù)體現(xiàn)比如,內(nèi)容撰寫、語義理解、數(shù)字編輯孿生為文字、圖形、音頻、視頻等復(fù)合形式的內(nèi)容。
RLHF(Reinforcement Learning from Human Feedback)技術(shù)是基于人類反饋的強化訓(xùn)練學(xué)習(xí),即近端策略優(yōu)化PPO算法,來更理解性的分析輸出的結(jié)果,經(jīng)過海量文本數(shù)據(jù)語料訓(xùn)練、監(jiān)督學(xué)習(xí)、人工糾錯、對話模擬形成更接近人類語言的模型。ChatGPT通過機器學(xué)習(xí)、Gan(Generative Adversarial Networks,神經(jīng)網(wǎng)絡(luò))等多種人工智能技術(shù)運用,以人類思維理解、情感認(rèn)知、信息分析達(dá)到智能交流。通過初級預(yù)訓(xùn)練語言深度學(xué)習(xí)從而利用各個場景審視觀察達(dá)到強化訓(xùn)練。再通過打分模型的訓(xùn)練評估數(shù)據(jù)輸出的質(zhì)量,從而判別輸出一個文本質(zhì)量評估標(biāo)記數(shù)字模型的優(yōu)劣。最后基于RL進(jìn)行語言模型優(yōu)化,將初始需要調(diào)整的任務(wù)建模及通過打分的模型,進(jìn)一步迭代式的更新打分模型(RM)和策略模型(Policy)以達(dá)到不斷輸出適合需求和認(rèn)知的參數(shù)[4]。
Transformer(多層變換器)作為ChatGPT的底層技術(shù),訓(xùn)練與推理并行的能力強大,能夠自主地從數(shù)據(jù)中展開學(xué)習(xí),通過人類潛在的能力,比如,預(yù)訓(xùn)練、人工清洗數(shù)據(jù)、人類反饋強化學(xué)習(xí)這些能力,結(jié)合自監(jiān)督學(xué)習(xí)能力,能夠具備獲得具有更大語料數(shù)據(jù)庫、更高更準(zhǔn)確的計算能力、能夠更好地融入工作內(nèi)容場景,及具有預(yù)測自適應(yīng)學(xué)習(xí)的多能力。ChatGPT是依附多種人工智能技術(shù),加之人類智能深度學(xué)習(xí),以實現(xiàn)認(rèn)知語言理解的一種技術(shù)模式。在2022年12月公測后,助推新一代人工智能技術(shù)的熱潮。更有利于圖書館擴展管理服務(wù)、提升工作效率。
1) ChatGPT的多模態(tài)應(yīng)用:作為個性的智能認(rèn)知工具,ChatGPT可以在游戲、娛樂、社交媒體、翻譯、編程等方面帶來顛覆性重塑。在語言文本產(chǎn)業(yè)鏈中,廣泛在教育、醫(yī)療、媒介、法律等領(lǐng)域發(fā)揮重要作用。例如,電商把ChatGPT聊天機器人技術(shù)加入其貨物配送應(yīng)用中,將提升營銷和顧客服務(wù)和其他自動化服務(wù);可以互動交流有關(guān)食材、使用方法、健康飲食、等方面問題,以方便推薦更合理健康的膳食品類。為更好地輔助企事業(yè)單位辦公,例如,內(nèi)容撰寫,只須把所需資料、數(shù)據(jù)服務(wù)輸入ChatGPT中,ChatGPT可以從數(shù)據(jù)中深度和廣度分析、檢索知識編寫出一份詳細(xì)、完善的有遠(yuǎn)見的計劃或報表等。ChatGPT在新商業(yè)模式下,能夠帶動傳統(tǒng)行業(yè)應(yīng)用,搭建起ChatGPT+醫(yī)療、ChatGPT+電商、ChatGPT+制造業(yè)、ChatGPT+金融等新的應(yīng)用場景里[5]。
在高校為解決教育職業(yè)數(shù)字化提供了不同的契機,為高校圖書館發(fā)展提供多重角色。比如:教學(xué)管家、個性化輔助員、圖書館咨詢員、教學(xué)評估員等[6]。
2) 教學(xué)管家的角色,ChatGPT的Eysenbach自適應(yīng)系統(tǒng)可為學(xué)生提供個性化指導(dǎo)與輔導(dǎo)。了解學(xué)生對知識的掌握程度,以彌補學(xué)生對知識理解的漏洞,提升學(xué)生學(xué)習(xí)的成效。為學(xué)生職業(yè)方向提供規(guī)劃與咨詢,保障學(xué)生職業(yè)生涯規(guī)劃更加清晰與明確,助力企業(yè)所要求等人才,進(jìn)行專業(yè)性職業(yè)學(xué)習(xí)與培訓(xùn),構(gòu)建終身學(xué)習(xí)的模式。ChatGPT輔助教學(xué)上,可以為教師提供智能數(shù)字化設(shè)備操作說明,豐富教師的教學(xué)方式,提高教師教授課程的趣味性,為學(xué)生提供針對性輔導(dǎo)以及來自學(xué)生的反饋,從而提升教學(xué)效率和質(zhì)量。
3) 圖書館咨詢員的角色,ChatGPT可以作為教學(xué)與圖書館信息的連接員為學(xué)生提供多方面準(zhǔn)確的信息??梢宰寛D書館所有資源發(fā)揮該有的作用。中文數(shù)據(jù)庫、外文數(shù)據(jù)庫、電子圖書、試用數(shù)據(jù)庫、自建數(shù)據(jù)庫、書目查詢、論文查重等功能成為職業(yè)教育、高等教育、繼續(xù)教育三教改革與三教融合的內(nèi)生力。輔助學(xué)生互動學(xué)習(xí)從而減輕三教融合中因教師、設(shè)備資源缺少及環(huán)境帶來的困難。
4) 個性化輔助員的角色,ChatGPT可以化身AI助理,可以設(shè)置一些指定的自定義指令,比如,可以作為某個專業(yè)性職業(yè)的客服人員或老師、程序員等,為他們量身定制課程、計劃、生成代碼提供獨特的價值。智能輔助提升學(xué)習(xí)能力和互動體驗??梢源蛟霤hatGPT成為個性化虛擬伴侶,鼓勵和陪伴在你的左右,評估你當(dāng)前的表現(xiàn),提供反饋和鼓勵,培養(yǎng)你持續(xù)學(xué)習(xí)的能力。
2 ChatGPT的技術(shù)和安全風(fēng)險分析
1)因為ChatGPT3.5模型巨大的算力消耗,以及1750億個參數(shù)需要上萬個CPU/GPU全天24小時不間斷輸入數(shù)據(jù),且花費高昂,故只能通過自行發(fā)電來供給運營所需的電力。這就意味著集中發(fā)電、公共化電力供應(yīng)才能真正滿足企業(yè)的需求[7]。
2)基于RLHF技術(shù),ChatGPT具有推理演繹能力,可以從大量數(shù)據(jù)中獲得敏感用戶信息。由于預(yù)訓(xùn)練模型深度學(xué)習(xí)的能力不夠強大,用戶輸入的信息有可能不經(jīng)許可,不能為其他用戶提供數(shù)據(jù)服務(wù)共享,而出現(xiàn)更多數(shù)據(jù)合規(guī)性和法律風(fēng)險性的問題;智能聊天時,可能演繹出言語上的歧視、偏見、仇恨,而導(dǎo)致用戶體驗上的不滿意。學(xué)術(shù)上無法提供全面和準(zhǔn)確的數(shù)據(jù),以及學(xué)科領(lǐng)域和專業(yè)知識上的不足和偏差等都會影響ChatGPT的演繹。
3)基于AIGC(人工智能生成內(nèi)容)技術(shù),只要管理者提供必要的提示語,可以協(xié)助讀者完成需要的各種任務(wù)。在內(nèi)容撰寫應(yīng)用上,生成代碼可能隱含有安全漏洞,甚至無意中將私密數(shù)據(jù)上傳到云端模型上,從而導(dǎo)致基于AI生成攻擊,無法保障學(xué)習(xí)體驗和用戶數(shù)據(jù)安全,帶來敏感信息的泄露風(fēng)險和挑戰(zhàn)[8]。
4)在知識產(chǎn)權(quán)和學(xué)術(shù)道德上,利用ChatGPT撰寫、翻譯、版權(quán)、學(xué)術(shù)論文等進(jìn)行訓(xùn)練得到的數(shù)據(jù),有可能侵犯知識產(chǎn)權(quán)和違反學(xué)術(shù)道德規(guī)范。從而侵蝕獨立的科研能力和公平公正的學(xué)術(shù)氛圍。目前可能因為基于原有知識進(jìn)行的訓(xùn)練學(xué)習(xí),缺乏解決問題的能力和持續(xù)學(xué)習(xí)的機制,還需要進(jìn)一步探索多模態(tài)、多場景兼容的新模型來加強學(xué)習(xí)。通過構(gòu)架相應(yīng)的安全技術(shù)和制度,搭建解決方案和可信任的機制平臺,可以對數(shù)據(jù)資源的精準(zhǔn)要求達(dá)到有效配置。才能保障數(shù)據(jù)采集的準(zhǔn)確、客觀、降低數(shù)據(jù)偏差率,以應(yīng)對未來ChatGPT所帶來的安全影響和威脅。
ChatGPT類產(chǎn)品的安全問題是人工智能技術(shù)普遍存在的問題,但ChatGPT的生成式人工智能的語言系統(tǒng)模型、數(shù)字編輯、文本挖掘等方面關(guān)鍵技術(shù)的迭代升級、算力性能的提升、算法效率的增強,使得目標(biāo)更加完善、精準(zhǔn)化[9]。增強了模型的知識量級和泛化特質(zhì)。它的深度學(xué)習(xí)可以不斷沖破技術(shù)瓶頸,有利于技術(shù)創(chuàng)新的良性發(fā)展及可持續(xù)的創(chuàng)新進(jìn)步。
3 ChatGPT在圖書館管理中應(yīng)用分析
1)文獻(xiàn)情報數(shù)據(jù)組織方式上的分析,從原來表面信息組織到ChatGPT語義內(nèi)容組織,以及深度挖掘科技文獻(xiàn)知識元對象,到雙向?qū)萍嘉墨I(xiàn)分析、方法、問題、實驗步驟、數(shù)據(jù)資料、語義內(nèi)容深入組織上都有深刻影響。圖書館信息機構(gòu)可以強化研究將人工智能模型如何嵌入到搜索服務(wù)中,以及如何融合和友好展示檢索結(jié)果或答案?;谖墨I(xiàn)的大數(shù)據(jù)訓(xùn)練、高質(zhì)量大型語言模型共同開展檢索服務(wù)應(yīng)用,在用戶使用方便性和用戶體驗方面以及檢索結(jié)果和答案準(zhǔn)確性之間進(jìn)行平衡[10]。推動了信息資源管理、學(xué)科理論方法的創(chuàng)新和治理變革,加快信息空間中信息資源在流動和循環(huán)速率,對信息資源管理學(xué)科研究和實踐帶來了挑戰(zhàn)和機遇。進(jìn)一步推動信息資源建設(shè)的衍生。
2)文獻(xiàn)情報知識服務(wù)模式上的分析,從信息檢索到人機交互上有了極大轉(zhuǎn)變。ChatGPT可以為前臺工作提高工作效率和服務(wù)質(zhì)量。ChatGPT可以提供文本大數(shù)據(jù)語料,搜索、查詢、等待、在線引擎的問答檢索等等功能,充分發(fā)揮圖書館海量優(yōu)質(zhì)科技文獻(xiàn)語料知識,夯實文獻(xiàn)全文本地化建設(shè),通過進(jìn)行自主大模型訓(xùn)練、圖書資料加工、積累多形式應(yīng)用,可以深化大規(guī)模語言模型應(yīng)用,提升圖書館智能化加工和服務(wù)程度的能力。在圖創(chuàng)系統(tǒng)中導(dǎo)入ChatGPT程序,比手動錄入信息可以更快時間、更高效率、更低成本提升人力的效能和整合查詢的效率。
3)文獻(xiàn)情報分析方法影響上,從手工操作到大規(guī)模智能分析,元數(shù)據(jù)由原來數(shù)據(jù)上的準(zhǔn)備、統(tǒng)計分析、提煉報告、撰寫等手工工作,從而轉(zhuǎn)變?yōu)檎莆罩悄芊?wù)的數(shù)據(jù)控制權(quán),具備觀點提煉、內(nèi)容綜述、場景問答、語言翻譯、語義分析、智能推薦、輔助決策的強大體驗[8]。能夠在大規(guī)模分析知識圖譜、圖書館知識庫等產(chǎn)品基礎(chǔ)上,實現(xiàn)語義理解與信息檢索類型上的應(yīng)用。
4)用戶閱讀習(xí)慣上能夠引導(dǎo)人機協(xié)同。廣大讀者的閱讀模式可以從語義分析多維度可視化展現(xiàn)出來,交互式應(yīng)答而形成人機協(xié)同的新模式。用戶輸入文獻(xiàn)資源,可自動實現(xiàn)知識抽取、關(guān)系揭示,提升了閱讀興趣和學(xué)習(xí)能力。ChatGPT就像圖書館管理員將大數(shù)據(jù)海量內(nèi)容篩選后傳遞給有需求的用戶,檢索和問答互相交融。
5)ChatGPT的風(fēng)險需要圖書館建立安全管控上的有效機制:ChatGPT可能存在復(fù)雜的語言結(jié)構(gòu)導(dǎo)致語境不足、不正確的語法等技術(shù)上的局限性,而生成結(jié)果具有不能理解的偏見,需要進(jìn)一步優(yōu)化、改進(jìn)模型。在數(shù)據(jù)隱私風(fēng)險方面,通過檢索、查詢、問答等行為可以記錄分析用戶需求和語料,也可能加劇數(shù)字鴻溝、數(shù)字泄漏,因此需要加密通信信息,防止侵犯個人隱私[11]。在著作權(quán)風(fēng)險方面,要注意完善對算法推薦、深度偽造等新技術(shù)應(yīng)用的規(guī)范管理等。
4 結(jié)束語
新興技術(shù)是雙刃劍,既有機遇,也伴隨著風(fēng)險。ChatGPT作為代表性的新一代人工智能技術(shù),將會對社會生活、經(jīng)濟(jì)技術(shù)、第四次工業(yè)革命帶來契機。出現(xiàn)人機一體化、工作方式智能化、生產(chǎn)力的巨大提升,帶來生產(chǎn)關(guān)系的范式變革,勞動分配方式的改革。然而,ChatGPT技術(shù)的影響很大程度上取決于算力瓶頸、數(shù)據(jù)安全領(lǐng)域能夠規(guī)范技術(shù)研發(fā)路徑,及可信可控的技術(shù)安全屏障。為此要求做好大模型技術(shù)創(chuàng)新體系和復(fù)合型人才在智能領(lǐng)域的培訓(xùn)、交流、合作。建立起全流程的數(shù)據(jù)采集與數(shù)據(jù)安全的規(guī)范管理體系優(yōu)化才能更好地推進(jìn)ChatGPT的發(fā)展。從而推動情報智能、檔案智能、智慧圖書館的信息資源等高效流動和循環(huán)發(fā)展,提升信息空間的創(chuàng)新和效率。結(jié)合人類的創(chuàng)新能力能夠充分發(fā)揮ChatGPT的優(yōu)勢。當(dāng)前ChatGPT將發(fā)展到GPT4.0技術(shù),在模型規(guī)模、完善度、推理能力、創(chuàng)造力等方面有明顯的改進(jìn)。也在逐步解決GPT3.5帶來的限制[12]。ChatGPT將會是一個重大飛躍和增量級升級,技術(shù)能夠顯著提升到一個更新的高度。
參考文獻(xiàn):
[1] 趙瑞雪,黃永文,馬瑋璐,等.ChatGPT對圖書館智能知識服務(wù)的啟示與思考[J].農(nóng)業(yè)圖書情報學(xué)報,2023,45(3):23.
[2] 陸偉,劉家偉,馬永強,等.ChatGPT為代表的大模型對信息資源管理的影響【J/OL】 圖書情報知識 2023,28(2):75.
[3] 樊雪寒.ChatGPT的數(shù)據(jù)安全問題引發(fā)關(guān)注[N].第一財經(jīng)日報, 2023-02-27(A04).
[4] 張夏恒.ChatGPT的邏輯解構(gòu)、影響研判及政策建議[J].西南師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2023, 48(2):102.
[5] 沈叢.ChatGPT將給芯片行業(yè)帶來哪些利好[N].中國電子報, 2023-03-07(007).
[6] 于文軒,馬亮,王佃利,等.“新一代人工智能技術(shù)ChatGPT的應(yīng)用與規(guī)制”筆談[J].廣西師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2023, 44(3):69.
[7] 張夏恒.新一代人工智能技術(shù)(ChatGPT)及其對人類社會的影響與變革[J].產(chǎn)業(yè)經(jīng)濟(jì)評論, 2023,18(2):85.
[8] 朱光輝,王喜文.ChatGPT的運行模式、關(guān)鍵技術(shù)及未來圖景[J].西南師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2023,48(2):106.
[9] 張智雄,劉歡,于改紅.構(gòu)建基于科技文獻(xiàn)知識的人工智能引擎[J].農(nóng)業(yè)圖書情報學(xué)報, 2021, 33(1):17-31.
[10] build next-gen apps with open AI powerful models【EB/OL】2023.3.22 https://openai.com/api/
[11] gpt-3-encoder[EB/OL][2023-03-22]https://www.npmjs.com/package/gpt-3-encoder.
[12] 令小雄,王鼎民,袁健.ChatGPT爆火后關(guān)于科技倫理及學(xué)術(shù)倫理的冷思考[J].新僵師范大學(xué)學(xué)報(哲學(xué)社會科學(xué)版), 2023, 44(1):123.
【通聯(lián)編輯:梁書】