隨著人工智能技術(shù)的飛速發(fā)展,校園領(lǐng)域的各種業(yè)務(wù)場景正迎來一場技術(shù)革新。本文旨在探討如何利用語言大模型、自然語言處理和數(shù)據(jù)工程等前沿智能技術(shù),構(gòu)建一個專注于校園知識領(lǐng)域的語言大模型智能問答互動新媒體,為大學校園提供全面、高質(zhì)量的問詢和媒體推送,形成一種區(qū)別于傳統(tǒng)知識發(fā)布服務(wù)的新媒體服務(wù)模式。該新媒體服務(wù)模式可根據(jù)實際場景涵蓋校園設(shè)施、師生管理、教育教學、校園安全、學科服務(wù)、后勤服務(wù)、科研服務(wù)、國際交流和校園文化等多個應(yīng)用場景,不僅能夠提高師生和群眾對校園各類信息獲取的效率,還能為校園師生提供更加個性化和精準的信息推送服務(wù)。提升校園的整體服務(wù)質(zhì)量,增強學生和教職工的校園信息化服務(wù)體驗。
(一)前端交互層
前端交互入口是用戶使用知識交互新媒體服務(wù)的一個窗口,是用戶服務(wù)交互的起點,用戶通過前端入口,可以使用文字、語音或圖片等方式進行提問,并獲取后端語言大模型給出的答案。根據(jù)不同的使用場景進行使用體驗的擴展,包括多輪對話服務(wù)、人工介入服務(wù)、對話歷史、專業(yè)領(lǐng)域智能體等。同時根據(jù)各校園自身的媒體窗口場景,可以把前端交互入口發(fā)布至多種渠道,例如通過掃碼使用、通過關(guān)注微信公眾號后使用、通過微信小程序使用、或集成到已有的校園信息系統(tǒng)上使用等方式。
(二) 應(yīng)用層
通過整合后端技術(shù)能力,組合成具體業(yè)務(wù)場景的解決方案,提供各類新媒體服務(wù)。
(三)多模型管理
語言大模型起到語言組織和輸出的作用,能捕捉和理解用戶對話中的上下文信息自然語言輸入;能基于數(shù)據(jù)工程中臺提供的答案片段數(shù)據(jù),生成流暢的、自然的回答內(nèi)容,回復給用戶想要的答案??梢愿鶕?jù)具體場景采用第三方模型或私有化部署的模型,也可以進行組合使用。
(四)數(shù)據(jù)層
數(shù)據(jù)工程中臺的主要作用是知識數(shù)據(jù)的采集、處理和對接共享,實現(xiàn)的效果是把所有能提供服務(wù)的材料和知識,轉(zhuǎn)化為能讓語言大模型和智能體能理解和使用的數(shù)據(jù),并對這些轉(zhuǎn)化后的數(shù)據(jù)進行有效存儲,通過接口方式提供給模型和智能體進行調(diào)用,進而提供給前端的具體服務(wù)輸出。
(五)多智能體
智能體是一個能感知數(shù)據(jù)并自動做出相應(yīng)決策和執(zhí)行行動的單獨實體,可以理解為提供不同種類服務(wù)的個體。舉個例子:在校園服務(wù)中,我需要了解學校的住宿條件和教學環(huán)境,那使用類似“校園百事通”的智能體即可得到想要的答案。如果我需要進行翻閱某學院的某科研成果或研究數(shù)據(jù)時,那就需要另外的智能體來實現(xiàn)??梢哉f不同的智能體就好像各種“服務(wù)崗位”,有著不同的“知識儲備”、“能力”和“權(quán)限”。在開發(fā)智能體使用方面,需要根據(jù)各校園服務(wù)對服務(wù)體驗深度、服務(wù)范圍和數(shù)據(jù)安全等來綜合考慮。
(六)數(shù)據(jù)管控
整個服務(wù)場景相當于一個知識數(shù)據(jù)的轉(zhuǎn)換和交互的過程,對數(shù)據(jù)的采集、存儲、轉(zhuǎn)換、傳輸、使用和共享等各個環(huán)節(jié)都需要進行安全管控,確保系統(tǒng)的運行和數(shù)據(jù)的有效傳遞。
(一) 數(shù)據(jù)自動采集
數(shù)據(jù)對整個服務(wù)的成功起到非常重要的作用,尤其是數(shù)據(jù)的數(shù)量和質(zhì)量,因此需要采用數(shù)據(jù)自動采集技術(shù),對大量分散在各業(yè)務(wù)系統(tǒng)或領(lǐng)域的數(shù)據(jù)進行采集和處理。
可以通過網(wǎng)絡(luò)爬蟲技術(shù)自動采集存在于業(yè)務(wù)頁面或發(fā)布在各已有公眾號上的數(shù)據(jù);通過數(shù)據(jù)API方式自動采集存在于業(yè)務(wù)系統(tǒng)數(shù)據(jù)庫中的業(yè)務(wù)數(shù)據(jù);通過人工導入或共享磁盤的方式采集各類非結(jié)構(gòu)化數(shù)據(jù)。
(二)多模態(tài)數(shù)據(jù)的處理
要讓語言大模型發(fā)揮有效的問答服務(wù)作用,需要把相關(guān)的數(shù)據(jù)作為“養(yǎng)分”提供給各類大模型使用,而我們?nèi)粘J褂煤土舸娴臄?shù)據(jù),大部分是由不同模態(tài)的方式存在的,包括文本、表格、圖片、音視頻等方式,這些數(shù)據(jù)很難讓大模型去檢索和使用,對多模態(tài)數(shù)據(jù)進行處理,包括語音識別與轉(zhuǎn)換、文本提取、語義分割、向量化和圖譜化等處理和轉(zhuǎn)換技術(shù),轉(zhuǎn)化成能讓語言大模型使用的向量和圖數(shù)據(jù),并把這些數(shù)據(jù)保存在向量數(shù)據(jù)和圖數(shù)據(jù)庫中。同時在整個用戶與系統(tǒng)的服務(wù)交互過程中,用戶輸入的多模態(tài)數(shù)據(jù)也需要進行處理,包括查詢重寫、語義補全等技術(shù),這些技術(shù)都可以通過某些開源的小模型和組件實現(xiàn)。
(三)語言大模型的選擇與優(yōu)化
本架構(gòu)的語言大模型主要起到對自然語言的理解和生成兩個方面的作用,在選擇大模型時,需要根據(jù)服務(wù)場景的數(shù)據(jù)量、業(yè)務(wù)復雜度和能力強度等,來確定大模型的體量,體量越大的模型其需要運行的算力成本就越高。同時根據(jù)服務(wù)的場景對模型進行訓練和優(yōu)化,以提高問題回答的準確性和效率。通過機器學習和深度學習技術(shù),能夠幫助自動學習和適應(yīng)新的數(shù)據(jù)和場景。選擇適當體量的語言模型并加之微調(diào)優(yōu)化能大大降低其運行的成本。
(四)檢索增強生成(RAG)
大語言模型在生成回答時,會出現(xiàn)一些看似真實正確,實質(zhì)是一些違反常理、問非所答或胡編亂造的回答,在技術(shù)上稱為“偏見”和“幻覺”問題,這些問題會大大降低新媒體服務(wù)的體驗和可信度。為了降低這些問題發(fā)生的概率,需要引入檢索增強生成(RAG)技術(shù),分為幾個步驟實現(xiàn),首先通過數(shù)據(jù)工程中臺把需要的知識數(shù)據(jù)進行語義分片、向量化和圖譜化等處理,保存于向量數(shù)據(jù)庫和圖數(shù)據(jù)庫中,并創(chuàng)建索引;然后把用戶的問題輸入也用同樣的方式轉(zhuǎn)化成向量,并通過對向量數(shù)據(jù)庫和圖數(shù)據(jù)庫進行語義相關(guān)性和拓撲相關(guān)性的檢索和排序召回,把相關(guān)問題和召回的答案片段清單交給到語言大模型,讓大模型進行組織歸納與自然語言的輸出。
(五)用戶交互設(shè)計
根據(jù)不同的場景設(shè)計一個友好的用戶交互業(yè)務(wù)界面,包括語音交互、文本交互和圖形交互等。通過用戶交互的設(shè)計,能夠提供更加自然和便捷的服務(wù)。
本服務(wù)模型可以應(yīng)用于多種校園知識服務(wù)場景,結(jié)合具體需求來使用,以下列舉幾個常見的使用場景:
校園百事通。面向?qū)W校師生,可以提供校園教學、生活、管理等方面的幫助。
招生服務(wù)。面向社會群眾,可以提供招生政策、專業(yè)選擇、學校文化、學習環(huán)境等方面的咨詢服務(wù)。
學生活動服務(wù)。面向校內(nèi)學生,提供選課、場地預約、社團活動、實驗室使用等的咨詢和智能辦理服務(wù)。
學習輔導服務(wù)。面向校內(nèi)各專業(yè)學生,根據(jù)學生的專業(yè)和學習狀態(tài)提供相應(yīng)的教學資料、輔助學習資料和學習建議。
科研服務(wù)。面向校內(nèi)的科研團隊,提供論文智能檢索、文獻輔助閱讀、開題分析、成果驗證等服務(wù)。
內(nèi)部知識服務(wù)。面向校內(nèi)給學院或部門,提供內(nèi)部制度和管理措施的統(tǒng)一管理和咨詢,例如:財務(wù)報銷咨詢、科研費用咨詢、招投標咨詢等。
算力成本挑戰(zhàn):隨著服務(wù)場景的增多,數(shù)據(jù)量和用戶量都會隨之增加,導致本服務(wù)架構(gòu)的運行成本也會相應(yīng)增加;加之目前的語言大模型的運行和知識數(shù)據(jù)的處理都需要用到昂貴的算力資源,在現(xiàn)階段算力成本是一項比較大的投入,在實踐中需要在模型的選擇和調(diào)優(yōu)、面向的服務(wù)群體定位等問題進行綜合考慮,對其效益和成本進行評估。
技術(shù)挑戰(zhàn):目前的語言大模型和AI技術(shù)發(fā)展非常迅速,新技術(shù)迭代速度快,需要不斷更新和優(yōu)化現(xiàn)有技術(shù),以適應(yīng)不斷變化的數(shù)據(jù)和場景,而實現(xiàn)這目標就要有持續(xù)的技術(shù)支持和持續(xù)的研發(fā)投入。
落地挑戰(zhàn):各類業(yè)務(wù)場景的落地使用都存在著差異,如需要滿足不同用戶的需求和使用習慣,這需要深入的用戶研究和個性化的服務(wù)設(shè)計,需要持續(xù)的需求調(diào)研和用戶體驗分析的投入。
安全挑戰(zhàn):生成式大模型技術(shù)是一個新興技術(shù),其發(fā)展非常迅速,也同時帶來了各種各樣的安全問題,如專業(yè)領(lǐng)域知識數(shù)據(jù)的安全、個人信息數(shù)據(jù)的安全、模型服務(wù)運行的安全等問題,分別需要在數(shù)據(jù)分級分類和處理措施、數(shù)據(jù)識別與隔離、數(shù)據(jù)隱私保護和系統(tǒng)運行安全等方面加強技術(shù)保護和管理措施。
基于大模型的校園知識互動新媒體服務(wù),是校園新媒體服務(wù)數(shù)智化轉(zhuǎn)型的重要方向。通過整合語言大模型、自然語言處理和數(shù)據(jù)工程等技術(shù),以及結(jié)合各類校園應(yīng)用場景,能夠為校園師生提供全面、高質(zhì)量的問詢和媒體交互服務(wù)。隨著智能技術(shù)的不斷發(fā)展和完善,將在校園信息化新媒體服務(wù)領(lǐng)域發(fā)揮越來越重要的作用。