楊蘇齊 羅建橋 宋瑞雪
摘要:該研究旨在設(shè)計(jì)和實(shí)現(xiàn)一個(gè)基于人工智能的中華優(yōu)秀傳統(tǒng)文化外宣平臺(tái),以“中國書法”為核心示例。該平臺(tái)集成了智能解析與分類、個(gè)性化內(nèi)容推薦和交互式智能助手等功能,旨在提供豐富且個(gè)性化的文化學(xué)習(xí)體驗(yàn)。系統(tǒng)測(cè)試結(jié)果顯示,各功能模塊在精準(zhǔn)率、召回率和準(zhǔn)確率方面均表現(xiàn)出色,驗(yàn)證了平臺(tái)在有效傳播和教育中華傳統(tǒng)文化方面的潛力。
關(guān)鍵詞:人工智能;傳統(tǒng)文化;外宣平臺(tái)設(shè)計(jì)
中圖分類號(hào):TP311? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2024)09-0050-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID)
0 引言
在全球化背景下,傳統(tǒng)文化外宣對(duì)于民族文化傳承和國際形象塑造至關(guān)重要,促進(jìn)文化遺產(chǎn)傳播和跨文化理解。而人工智能通過數(shù)據(jù)分析和模式識(shí)別等技術(shù),拓寬了傳統(tǒng)文化傳播的渠道,提供個(gè)性化和沉浸式體驗(yàn),增強(qiáng)文化的全球吸引力。隨著AI的發(fā)展,其在文化保護(hù)、傳播和創(chuàng)新中的作用日益顯著。
1 關(guān)鍵技術(shù)
1.1 機(jī)器學(xué)習(xí)技術(shù)
機(jī)器學(xué)習(xí)技術(shù),作為人工智能的重要分支,能夠成為傳統(tǒng)文化外宣的核心動(dòng)力。在機(jī)器學(xué)習(xí)領(lǐng)域,通過特定的算法和模型,如卷積神經(jīng)網(wǎng)絡(luò)(CNN) 和循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN) ,被廣泛應(yīng)用于圖像識(shí)別和自然語言處理,這對(duì)于理解和傳播文化內(nèi)容至關(guān)重要[1]。其中CNN可用于識(shí)別和分類傳統(tǒng)藝術(shù)作品的圖像,通過多個(gè)卷積層和池化層提取圖像特征,公式表示為:
[f(x)=max(0,x?w+b)]? ? ? (1)
其中,[x]是輸入圖像的特征,[w]是權(quán)重,[b]是偏置項(xiàng),[f(x)]是激活函數(shù)。
另外,RNN特別適用于處理序列數(shù)據(jù),如文本或語音,對(duì)于分析和生成具有文化意義的文本尤為有效。RNN通過引入時(shí)間維度,能夠存儲(chǔ)前一狀態(tài)的信息,其公式表示為:
[ht=σWhhht-1+Wxhxt+bh]? ? ?(2)
在這里,[ht]是時(shí)間步[t]的隱藏狀態(tài),[xt]是時(shí)間步[t]的輸入,[W]和[b]分別是權(quán)重矩陣和偏置項(xiàng),而[σ]是激活函數(shù)。
1.2 個(gè)性化內(nèi)容推薦算法
個(gè)性化內(nèi)容推薦算法在傳統(tǒng)文化外宣平臺(tái)中能夠根據(jù)用戶的興趣和歷史行為定制推薦內(nèi)容。其中,協(xié)同過濾(Collaborative Filtering) 算法應(yīng)用廣泛。該算法分為用戶基協(xié)同過濾(User-based Collaborative Filtering) 和物品基協(xié)同過濾(Item-based Collaborative Filtering) 兩種類型。用戶基協(xié)同過濾系統(tǒng)會(huì)尋找與目標(biāo)用戶興趣相似的其他用戶,然后推薦用戶偏好內(nèi)容。其核心算法通過余弦相似度來計(jì)算用戶間的相似性,公式如下:
[similarity(u,v)=i∈Irui?rvii∈Irui2?i∈Irvi2]? ? (3)
其中,[u]和[v]代表不同的用戶,[I]是用戶評(píng)分的交集,[rui]和[rvi]分別是用戶[u]和[v]對(duì)物品[i]的評(píng)分。
1.3 自然語言理解技術(shù)
自然語言理解(Natural Language Understanding, NLU) 是智能助手技術(shù)的實(shí)現(xiàn)關(guān)鍵,它使助手能夠準(zhǔn)確解析用戶的語言輸入。NLU的關(guān)鍵在于意圖識(shí)別(Intent Recognition) 和實(shí)體提取(Entity Extraction) 。這通常通過機(jī)器學(xué)習(xí)模型實(shí)現(xiàn),使用邏輯回歸,公式簡化如下:
[py|x=11+e-(w?x+b)]? ? ? ? ?(4)
在這里,[x]代表輸入特征(如用戶的查詢?cè)~匯),[y]是目標(biāo)變量(即用戶意圖的分類),[w]代表特征權(quán)重,[b]是偏置項(xiàng),而[py|x]是給定輸入[x]時(shí)意圖[y]的概率。智能助手通過理解用戶查詢的具體意圖,并據(jù)此提供相應(yīng)的信息和服務(wù),在傳統(tǒng)文化的傳播中尤為重要,便于提供更加個(gè)性化和精準(zhǔn)的用戶體驗(yàn)[2]。
2 系統(tǒng)架構(gòu)設(shè)計(jì)
2.1 分層架構(gòu)設(shè)計(jì)原則
在基于人工智能的傳統(tǒng)文化外宣平臺(tái)的系統(tǒng)架構(gòu)設(shè)計(jì)中,遵循一系列精心構(gòu)思的設(shè)計(jì)原則是至關(guān)重要的,以確保系統(tǒng)的整體效能和未來的可擴(kuò)展性。這些設(shè)計(jì)原則包括:
1) 模塊化原則:系統(tǒng)應(yīng)被劃分為獨(dú)立的模塊,每個(gè)模塊具有明確的功能和責(zé)任邊界。這種模塊化促進(jìn)了代碼的重用,簡化了維護(hù)過程,并允許單獨(dú)更新或改進(jìn)系統(tǒng)的各個(gè)部分。
2) 低耦合高內(nèi)聚:各個(gè)模塊之間應(yīng)保持低耦合,即模塊間的依賴關(guān)系最小化,而模塊內(nèi)部應(yīng)實(shí)現(xiàn)高內(nèi)聚,即相關(guān)的功能和責(zé)任應(yīng)盡可能集中在一個(gè)模塊中。這樣的設(shè)計(jì)有助于提高系統(tǒng)的穩(wěn)定性和可維護(hù)性。
3) 可擴(kuò)展性和靈活性原則:考慮到技術(shù)和業(yè)務(wù)需求的快速變化,系統(tǒng)架構(gòu)應(yīng)設(shè)計(jì)為易于擴(kuò)展和適應(yīng)新的需求[3]。
2.2 數(shù)據(jù)處理與管理模塊
1) 數(shù)據(jù)采集與集成。采用高效數(shù)據(jù)爬蟲技術(shù),基于Python的Scrapy框架,自動(dòng)化地從多元化數(shù)據(jù)源采集中華傳統(tǒng)文化相關(guān)的數(shù)據(jù)。涵蓋從歷史文獻(xiàn)、藝術(shù)作品到現(xiàn)代文化解讀等多方面內(nèi)容。同時(shí),運(yùn)用ETL(Extract, Transform, Load) 工具,確保數(shù)據(jù)從提取到轉(zhuǎn)換再到加載的過程的高效和準(zhǔn)確,適應(yīng)中華傳統(tǒng)文化數(shù)據(jù)的多樣性和復(fù)雜性。
2) 數(shù)據(jù)存儲(chǔ)解決方案。為處理大量中華傳統(tǒng)文化數(shù)據(jù),部署分布式數(shù)據(jù)庫系統(tǒng),包括Apache Cassandra和MongoDB,以滿足高并發(fā)和大規(guī)模數(shù)據(jù)存儲(chǔ)的需求。同時(shí),引入云存儲(chǔ)服務(wù),提供靈活且可擴(kuò)展的存儲(chǔ)方案,確保數(shù)據(jù)安全和高效管理。
3) 數(shù)據(jù)預(yù)處理和清洗。利用Pandas庫等數(shù)據(jù)清洗工具對(duì)收集的文化數(shù)據(jù)進(jìn)行預(yù)處理,包括去除重復(fù)值、填補(bǔ)缺失值和糾正錯(cuò)誤。此外,采用MinMaxScaler統(tǒng)計(jì)分析和數(shù)據(jù)變換技術(shù),保證數(shù)據(jù)一致性和標(biāo)準(zhǔn)化,為后續(xù)的分析和應(yīng)用提供可靠基礎(chǔ)。
4) 數(shù)據(jù)分析與處理。結(jié)合機(jī)器學(xué)習(xí)算法,如支持向量機(jī)(SVM) 和隨機(jī)森林,對(duì)復(fù)雜文化數(shù)據(jù)進(jìn)行分類和預(yù)測(cè)分析。使用自然語言處理(NLP) 工具,對(duì)文本數(shù)據(jù)進(jìn)行深入的語言分析,以更好地理解和推廣中華傳統(tǒng)文化的獨(dú)特價(jià)值和內(nèi)涵。
2.3 核心架構(gòu)設(shè)計(jì)
核心架構(gòu)設(shè)計(jì)如圖1所示。
3 平臺(tái)重點(diǎn)功能
3.1 智能解析與分類功能
智能解析與分類功能是專門針對(duì)中國傳統(tǒng)文化的關(guān)鍵特性和獨(dú)特性量身打造的。該功能集成機(jī)器學(xué)習(xí)技術(shù),旨在對(duì)傳統(tǒng)文化的各種作品進(jìn)行深度識(shí)別和細(xì)致分類,從而準(zhǔn)確展現(xiàn)傳統(tǒng)文化的豐富多樣性和深厚文化內(nèi)涵。為實(shí)現(xiàn)該目標(biāo),需要采用卷積神經(jīng)網(wǎng)絡(luò)(CNN) 來處理各類數(shù)據(jù)。以書法為例,CNN在識(shí)別書法中的細(xì)微筆觸和風(fēng)格特征方面表現(xiàn)卓越,能夠區(qū)分不同書法家的作品及其所屬的書法流派。這種自動(dòng)識(shí)別和分類功能特別適用于廣泛的中國書法樣本,從古代經(jīng)典到現(xiàn)代作品,確保每件作品都得到正確歸類和解讀[4]。此外,平臺(tái)整合自然語言處理(NLP) 技術(shù),特別是長短期記憶網(wǎng)絡(luò)(LSTM) ,用于分析書法作品中的文本元素,如詩詞、題簽等。
3.2 個(gè)性化推薦功能
個(gè)性化推薦功能是基于人工智能技術(shù)設(shè)計(jì),提供與用戶興趣和偏好高度相關(guān)的中華傳統(tǒng)文化內(nèi)容。這一功能的核心在于運(yùn)用推薦算法,使用協(xié)同過濾(Collaborative Filtering) 和基于內(nèi)容的過濾(Content-Based Filtering) ,以定制化方式推薦文化內(nèi)容,增強(qiáng)用戶體驗(yàn)。協(xié)同過濾算法通過分析用戶歷史行為(瀏覽、喜歡、評(píng)論等)和其他用戶的相似性,精準(zhǔn)預(yù)測(cè)用戶可能感興趣的新內(nèi)容。例如,對(duì)于經(jīng)常瀏覽京劇內(nèi)容的用戶,系統(tǒng)會(huì)推薦相關(guān)的京劇表演和藝術(shù)家作品,從而提供個(gè)性化的體驗(yàn)。
3.3 交互式智能助手
交互式智能助手功能的設(shè)計(jì)集中于提供豐富的互動(dòng)體驗(yàn),同時(shí)融入高級(jí)技術(shù)細(xì)節(jié)以確保精準(zhǔn)且高效的用戶交互。該功能主要運(yùn)用自然語言處理(NLP) 技術(shù),結(jié)合先進(jìn)的算法和知識(shí)圖譜,為用戶提供深入的文化探索和個(gè)性化體驗(yàn)。以中國書法為例,當(dāng)用戶提出關(guān)于書法的查詢時(shí),智能助手首先利用NLP中的關(guān)鍵詞提取功能,如TF-IDF或BERT算法,分析用戶查詢的文本,精準(zhǔn)提取“書法”“王羲之”等關(guān)鍵詞。接著,基于用戶的查詢意圖,助手采用如基于LSTM的意圖識(shí)別算法,精確判斷用戶的具體需求,無論是探索歷史背景、藝術(shù)特征還是尋找學(xué)習(xí)資源。此外,智能助手廣泛整合中華文化知識(shí)圖譜,提供結(jié)構(gòu)化和關(guān)聯(lián)豐富的回答。例如,在介紹王羲之的行書時(shí),助手能夠同時(shí)提供相關(guān)的歷史事件、影響力顯著的藝術(shù)家和流派信息。在推薦環(huán)節(jié),助手使用個(gè)性化推薦算法,根據(jù)用戶的歷史互動(dòng)和偏好提供定制化的學(xué)習(xí)資源和體驗(yàn)建議[5]。
4 系統(tǒng)實(shí)驗(yàn)與驗(yàn)證——以傳統(tǒng)文化“中國書法”為例
4.1 評(píng)價(jià)指標(biāo)與實(shí)驗(yàn)過程
本研究以“中國書法”進(jìn)行人工智能外宣平臺(tái)的性能評(píng)估,主要關(guān)注智能助手在書法內(nèi)容解析和分類的準(zhǔn)確性與效率。實(shí)驗(yàn)使用了80%的用戶數(shù)據(jù)進(jìn)行智能算法訓(xùn)練,包括書法圖像識(shí)別和風(fēng)格學(xué)習(xí),余下20%用于測(cè)試和評(píng)估算法表現(xiàn)。采用5折交叉驗(yàn)證確保結(jié)果的可靠性,并通過最小化損失函數(shù)優(yōu)化模型參數(shù)。評(píng)價(jià)指標(biāo)包括精準(zhǔn)率(P) 、召回率(R) 、F值(F) 和準(zhǔn)確率(A) ,基于真正例(TP) 、假正例(FP) 、假負(fù)例(FN) 和真負(fù)例(TN) 來計(jì)算,全面反映系統(tǒng)在各方面的性能。按如下方法計(jì)算:
[P=TPTP+FP]? ? ? ? ? ? ? ?(5)
[R=TPTP+FN]? ? ? ? (6)
[F=2×P×RP+R]? ? ? ? ? ? (7)
[A=TP+TNTP+FP+FN+TN]? ? ? (8)
4.2 實(shí)驗(yàn)結(jié)果
在人工智能驅(qū)動(dòng)的中華傳統(tǒng)文化外宣平臺(tái)中,以“中國書法”為例進(jìn)行全面測(cè)試。主要評(píng)估了智能解析與分類模型、個(gè)性化推薦算法和交互式智能助手模型在處理書法內(nèi)容的效能,專注于精準(zhǔn)率(P) 、召回率(R) 、綜合評(píng)估指數(shù)(F) 和準(zhǔn)確率(A) 四個(gè)關(guān)鍵指標(biāo)。實(shí)驗(yàn)結(jié)果如表1所示。
實(shí)驗(yàn)結(jié)果表明,平臺(tái)在關(guān)鍵功能上表現(xiàn)卓越:智能解析與分類模型顯示高效識(shí)別能力(精準(zhǔn)率88%,召回率87%) ,個(gè)性化推薦算法良好匹配用戶興趣(精準(zhǔn)率85%,召回率83%) ,而交互式智能助手模型在用戶交互方面表現(xiàn)出色(精準(zhǔn)率90%,召回率88%,準(zhǔn)確率91%) 。這些成果驗(yàn)證了平臺(tái)在推廣中華優(yōu)秀傳統(tǒng)文化方面的有效性,尤其在提升用戶體驗(yàn)方面的顯著效果。
4.3 重點(diǎn)功能模塊系統(tǒng)測(cè)試
基于人工智能的中華優(yōu)秀傳統(tǒng)文化外宣平臺(tái)中“中國書法”相關(guān)功能的測(cè)試結(jié)果,測(cè)試覆蓋了智能解析與分類、個(gè)性化推薦和交互式智能助手這三個(gè)核心功能模塊,并按照一級(jí)測(cè)試用例、測(cè)試過程、測(cè)試結(jié)果、預(yù)期結(jié)果和結(jié)論進(jìn)行呈現(xiàn):
這些測(cè)試結(jié)果表明,各功能模塊在處理和推廣中國書法文化方面表現(xiàn)出色,有效滿足了用戶對(duì)深入探索和學(xué)習(xí)中國書法文化的需求。通過這些功能模塊的性能表現(xiàn),系統(tǒng)在傳播和教育中華優(yōu)秀傳統(tǒng)文化方面的有效性得到了充分驗(yàn)證。
5 結(jié)束語
本研究成功展示了人工智能技術(shù)在推廣和教育中華優(yōu)秀傳統(tǒng)文化領(lǐng)域的巨大潛力。通過實(shí)現(xiàn)智能解析、個(gè)性化推薦和交互式助手等功能,不僅提升了文化內(nèi)容的可訪問性和吸引力,也為全球用戶打開了深入理解和欣賞中華文化的新視角。研究成果不僅體現(xiàn)了技術(shù)與文化融合的創(chuàng)新,也為未來類似項(xiàng)目提供了寶貴的經(jīng)驗(yàn)和啟示,開辟了利用人工智能促進(jìn)文化多樣性與全球文化交流的新路徑。
參考文獻(xiàn):
[1] 張楠.AI促進(jìn)傳統(tǒng)文化的創(chuàng)造性轉(zhuǎn)化[J].軟件和集成電路,2023(9):17.
[2] 黃松,譚騰.生成式人工智能時(shí)代的中華民族文化共同體建設(shè)走向:技術(shù)驅(qū)動(dòng)與范式創(chuàng)新[J].學(xué)術(shù)交流,2023(9):20-42.
[3] 張鵬禹.傳播傳統(tǒng)文化的“新使者”[N].人民日?qǐng)?bào)海外版,2023-09-04(007).
[4] 汪永亮.基于人工智能的中華優(yōu)秀傳統(tǒng)文化傳播模式創(chuàng)新[J].長春師范大學(xué)學(xué)報(bào),2023,42(7):177-180.
[5] 李海麗,李海玲.人工智能背景下民族文化負(fù)載詞的外宣翻譯[J].海外英語,2022(22):36-38.
【通聯(lián)編輯:梁書】