中圖分類號(hào):G203 文獻(xiàn)標(biāo)識(shí)碼:A DOI:10.11968/tsyqb.1003-6938.2025032
Study on Topic Modeling of Artificial Intelligence Application Scenario Based on BERTopic
AbstractAgainst the backdropof China's vigorous promotionofAI(Artificial Intellgence)application scenarios,this study employsBERTopic toexaminetopicpatterns inAdeploymentcontexts.Initialy3,524newsarticles werecollectedfromThePaper (Pengpai News)and preprocessed foranalysis.Fortopic modeling,theConan-embedding-vl pretrainedlargemodelwasutilizedfortextembedding,folowedbydimensionalityreductionviaUMAP,clusteringthrough HDBSCAN,and topicrepresentation using c-TF-IDF.Topic keywords were furtherrefinedthrough KeyBERT-based optimizationtechniques.Inopicalysis,eyworddistributions wereexaminedacrosslldomains:technologicalamp;D, culturaldigitization,regionaleconomiccollaboration,economicdevelopment,financialinnovation,capitalmarkets, healthcare/elderlycare,policycoordination,low-altitudeeconmy,urbandevelopment,ndnewsdissemination.imilarityanalysisrevealed strong inter-topiccorrelations:urbandevelopmentdemonstratedhighsimilarity witheconomicdevelopment,financial innovation,andpolicycoordination;whileeconomicdevelopmentshowed pronounced alignmentwith financialinovationandpolicycoordination.Hierarchical clusteringanddocumentdistributionanalysis indicated varyingdegreesofcross-domain integrationbetween technologicalRamp;D,culturaldigitization,andpolicycoordination with othertopicareas.Thisresearch,toacrtainextent,elucidatesthecurrentlandscape,latentdemands,andinterconected elements of disruptive applications ofAI.
Key words BERTopic;artificial inteligence;application scenarios; topic modeling; disruptive application
由國(guó)家網(wǎng)信辦、國(guó)家發(fā)改委、教育部、科技部等七部門(mén)審議通過(guò)的《生成式人工智能服務(wù)管理暫行辦法》自2023年8月15日起施行,“鼓勵(lì)生成式人工智能技術(shù)在各行業(yè)、各領(lǐng)域的創(chuàng)新應(yīng)用,生成積極健康、向上向善的優(yōu)質(zhì)內(nèi)容,探索優(yōu)化應(yīng)用場(chǎng)景,構(gòu)建應(yīng)用生態(tài)體系”]。這一政策文件與國(guó)務(wù)院2017年印發(fā)的《新一代人工智能發(fā)展規(guī)劃》科技部2022年發(fā)布的《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場(chǎng)景的通知》3以及科技部等六部門(mén)2022年聯(lián)合印發(fā)的《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》4形成了政策合力,共同描繪出我國(guó)人工智能發(fā)展戰(zhàn)略,標(biāo)志著我國(guó)人工智能進(jìn)入“應(yīng)用場(chǎng)景\"發(fā)展階段。把握應(yīng)用場(chǎng)景的現(xiàn)狀、潛在需求和關(guān)聯(lián)要素是催生人工智能顛覆性應(yīng)用的重要前提,本文基于BERTopic對(duì)人工智能應(yīng)用場(chǎng)景展開(kāi)主題建模研究,旨在探測(cè)人工智能應(yīng)用場(chǎng)景的主題現(xiàn)狀和潛能趨勢(shì),識(shí)別并表征當(dāng)前我國(guó)人工智能應(yīng)用場(chǎng)景的主題,分析主題間的相似性與關(guān)聯(lián)強(qiáng)度,把握人工智能應(yīng)用場(chǎng)景的多元格局、交叉融合態(tài)勢(shì)及未來(lái)發(fā)展?jié)撃堋?/p>
1人工智能應(yīng)用場(chǎng)景研究文獻(xiàn)綜述
人工智能應(yīng)用場(chǎng)景是由技術(shù)、環(huán)境、人三個(gè)維度的要素組成[5],指人工智能技術(shù)在特定場(chǎng)景或領(lǐng)域中的針對(duì)性、系統(tǒng)性應(yīng)用,其實(shí)質(zhì)是通過(guò)機(jī)器學(xué)習(xí)、自然語(yǔ)言處理、計(jì)算機(jī)視覺(jué)等技術(shù),針對(duì)特定場(chǎng)景中的問(wèn)題提供智能化解決方案,優(yōu)化流程效率或創(chuàng)造新價(jià)值。
研究者圍繞人工智能在科研教育領(lǐng)域的應(yīng)用開(kāi)展了研究。智慧學(xué)習(xí)機(jī)器人根據(jù)相關(guān)情境數(shù)據(jù)對(duì)學(xué)生定制學(xué)習(xí)服務(wù)并記錄學(xué)習(xí)過(guò)程;生成式人工智能在題目生成、自動(dòng)解題與輔助批閱中已有較好的應(yīng)用效果;ChatGPT支持的CUREs教學(xué)模式提升本科生在科研知識(shí)水平、科研技能水平和科研情感水平方面的科研能力[8;AIGC顯著提升了研究生在科研創(chuàng)新思維、科研實(shí)踐能力和科研創(chuàng)新品質(zhì)等方面的科研創(chuàng)新力。
研究者圍繞人工智能在醫(yī)藥健康領(lǐng)域的應(yīng)用開(kāi)展了研究。在人工智能的助力下,人類有希望解決智能診斷、智能治療、日?;o(hù)理和人性化醫(yī)療等公共衛(wèi)生所面臨的許多技術(shù)難題和社會(huì)問(wèn)題[10]。通過(guò)深度神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)皮膚癌檢測(cè)準(zhǔn)確率與專業(yè)醫(yī)生媲美\";基于機(jī)器學(xué)習(xí)已經(jīng)存在包括癌癥易感性預(yù)測(cè)、癌癥復(fù)發(fā)性預(yù)測(cè)、癌癥生存期預(yù)測(cè)等癌癥預(yù)后方法[12];麻省理工學(xué)院團(tuán)隊(duì)利用深度學(xué)習(xí)模型發(fā)現(xiàn)新型抗菌分子\"Halicin”[13] 。
研究者圍繞人工智能在交通中的應(yīng)用開(kāi)展了研究。通過(guò)優(yōu)化供需匹配,降低物流成本,拓展效益范圍,催生新交通運(yùn)輸業(yè)態(tài),為交通行業(yè)高質(zhì)量發(fā)展提供賦能[14]。Wei等針對(duì)多智能車(chē)輛協(xié)同控制,提出安全邊界約束、速度限制約束等模型,優(yōu)化交叉口與路段通行效率[15];人工智能與無(wú)人駕駛的深度融合將顛覆出行方式,孕育共享智能汽車(chē)新模式[16]。
研究者圍繞人工智能在更多領(lǐng)域的應(yīng)用開(kāi)展了研究。在金融領(lǐng)域,人工智能提升了金融服務(wù)效率和金融機(jī)構(gòu)風(fēng)險(xiǎn)控制能力,為金融產(chǎn)業(yè)創(chuàng)新發(fā)展奠定了基礎(chǔ)[1];在制造領(lǐng)域,融合典型實(shí)驗(yàn)、機(jī)理模型和深度學(xué)習(xí)構(gòu)建智能增材制造工藝優(yōu)化框架[18];在農(nóng)業(yè)領(lǐng)域,利用高光譜圖像與Resnet50模型實(shí)現(xiàn)油菜菌核病早期識(shí)別9;在安防領(lǐng)域,AI監(jiān)控系統(tǒng)使城市安防、金融安防、物業(yè)安防更高效精準(zhǔn)、覆蓋面更廣;在家居領(lǐng)域,物聯(lián)網(wǎng)技術(shù)利用深度學(xué)習(xí),通過(guò)搜集、分析用戶行為數(shù)據(jù)為用戶打造個(gè)性化服務(wù)[20];在政務(wù)領(lǐng)域,生成式AI驅(qū)動(dòng)的政務(wù)服務(wù)模型GovGPT正塑造新型政務(wù)服務(wù)方式[21]。
2研究方法與數(shù)據(jù)搜集
2.1 BERTopic主題建模研究方法
BERTopic是基于深度學(xué)習(xí)的主題挖掘模型,使用預(yù)訓(xùn)練Transformer模型和c-TF-IDF程序生成主題表征擴(kuò)展的集群嵌入方法[22]。BERTopic主題建模在文本主題識(shí)別方面具有以下優(yōu)勢(shì):出色的可解釋性、極高的一致性、卓越的語(yǔ)義理解能力、極高的靈活性。
利用BERTopic模型進(jìn)行主題建模分析遵循六個(gè)步驟:嵌入、降維、聚類、分詞、加權(quán)、微調(diào)。該模型具有模塊化特征,可以自主選擇使用方法[18.22]
(1)嵌入:通過(guò)BERT預(yù)訓(xùn)練大模型實(shí)現(xiàn)文本向量嵌入。本文選用的預(yù)訓(xùn)練大模型是Transformer結(jié)構(gòu)生成的文檔詞向量模型Conan-embedding-v1。
(2)降維:使用降維算法進(jìn)行詞嵌入向量降維,本文使用默認(rèn)UMAP算法。開(kāi)發(fā)者表示UMAP可以在降低數(shù)據(jù)集的維度時(shí)保留數(shù)據(jù)集的局部和全局結(jié)構(gòu)。
(3)聚類:對(duì)降維得到的矩陣進(jìn)行向量聚類,得到各個(gè)主題。本次采用基于密度的聚類技術(shù)HDBSCAN識(shí)別不同形狀的集群和異常值。
(4)分詞:使用CountVectorizer對(duì)文本數(shù)據(jù)進(jìn)行序列化,先將集群內(nèi)所有文檔合并為單一長(zhǎng)文本,再統(tǒng)計(jì)詞頻。這一步中可以進(jìn)行更符合研究需求的分詞處理,本次將ai、AI、人工智能作為停用詞,突出人工智能應(yīng)用場(chǎng)景的主題建模。
(5)主題表征:使用c-TF-IDF算法對(duì)主題詞在主題中的重要性進(jìn)行評(píng)估,提取主題中的核心主題詞。(6)微調(diào):將c-TF-IDF生成的主題詞視為候選主題詞,通過(guò)KeyBERT[23-24]技術(shù)微調(diào)主題表征,提升主題詞多樣性與主題解釋性。
2.2 數(shù)據(jù)搜集和預(yù)處理
澎湃新聞網(wǎng)①是一個(gè)包含內(nèi)容生產(chǎn)、審核、分發(fā)、商業(yè)化全鏈路和生態(tài)化建設(shè)的原創(chuàng)新聞客戶端。本文利用Python爬蟲(chóng)程序,圍繞關(guān)鍵詞“人工智能、家居、交通、醫(yī)療、安防、金融、客服、制造、教育、農(nóng)業(yè)、新能源、語(yǔ)音助手、物流、建筑\"進(jìn)行了澎湃新聞內(nèi)容爬取,總共獲得5384條新聞數(shù)據(jù)。
為了提高后續(xù)BERTopic主題建模的準(zhǔn)確性和可靠性,本文對(duì)數(shù)據(jù)進(jìn)行了前期的預(yù)處理,包括數(shù)據(jù)清洗、中文分詞、去除停用詞。數(shù)據(jù)清洗是對(duì)目標(biāo)數(shù)據(jù)進(jìn)行重新審查、處理及校驗(yàn)等,清洗后得到3524條新聞數(shù)據(jù),然后進(jìn)行中文分詞和去除停用詞處理。
3BERTopic主題模型分析
3.1人工智能應(yīng)用場(chǎng)景主題詞分析
(1)主題表征
主題表征的目的是使用c-TF-IDF算法對(duì)主題詞在主題中的重要性進(jìn)行評(píng)估,并提取主題中的核心主題詞。統(tǒng)計(jì)主題詞-概率分布(見(jiàn)圖1),得出11個(gè)主題和每個(gè)主題下概率排在前5的主題詞。
統(tǒng)計(jì)主題詞和文檔數(shù)量,得出主題詞和每個(gè)主題的文檔數(shù)量,以及每個(gè)主題下概率排在前10的主題詞(見(jiàn)表1)??梢钥吹?,主題0、主題1、主題2、主題3的文檔數(shù)量較多,均超過(guò)了300,主題9和主題10的文檔數(shù)量相對(duì)較少。
(2)主題表征的優(yōu)化
為了優(yōu)化主題表征的多樣性和主題解釋性,將表1中由c-TF-IDF生成的主題詞視為候選主題詞,通過(guò)KeyBERT技術(shù)對(duì)主題詞進(jìn)行微調(diào)。KeyBERT是由上下文自標(biāo)注的語(yǔ)料庫(kù)進(jìn)行訓(xùn)練,通過(guò)端到端的深度學(xué)習(xí)方法來(lái)檢索和提取與主題語(yǔ)義最相關(guān)關(guān)鍵詞與關(guān)鍵短語(yǔ)[23]。如主題0的原始主題詞為\"技術(shù)、機(jī)器人、智能、模型、人類、發(fā)展、公司、數(shù)據(jù)、用戶、系統(tǒng)”,KeyBERT微調(diào)后得到\"ChatGPT、OpenAI算力、基于、核心、創(chuàng)新、谷歌、對(duì)齊、方式、一種”,它更聚焦于當(dāng)前熱門(mén)的人工智能相關(guān)技術(shù)和企業(yè),突出了主題在具體技術(shù)和領(lǐng)域熱點(diǎn)方面的語(yǔ)義,使得主題詞能更精準(zhǔn)地反映該主題??梢钥吹?,在KeyBERT微調(diào)后,11個(gè)主題的主題詞在多樣性和解釋性方面都得到提升。如主題1的原始主題詞為“中國(guó)、藝術(shù)、地點(diǎn)、展覽、合作、發(fā)展、教授、作品、文化、美國(guó)”,KeyBERT微調(diào)后得到的主題詞為“美術(shù)館、博物館、世紀(jì)、展出、文物、展覽、一種、展示、主講人、展期”,它更聚焦于藝術(shù)展覽相關(guān)的具體場(chǎng)景和元素,如美術(shù)館、博物館、文物等,突出了主題在展覽實(shí)踐層面的語(yǔ)義。又如,主題6的原始主題詞為“醫(yī)療、醫(yī)院、健康、患者、老年人、服務(wù)、養(yǎng)老、臨床、疾病、技術(shù)”,KeyBERT微調(diào)后得到的主題詞為“愛(ài)康、科委、轉(zhuǎn)診、老年人、治療、患者、就醫(yī)、康復(fù)、平臺(tái)、腦機(jī)”,它更聚焦于醫(yī)療健康領(lǐng)域的具體機(jī)構(gòu)(如愛(ài)康、科委)服務(wù)流程(如轉(zhuǎn)診、就醫(yī)、康復(fù))及技術(shù)應(yīng)用(如腦機(jī)),突出了主題在醫(yī)療服務(wù)實(shí)踐和技術(shù)落地方面的語(yǔ)義,使得原始主題詞較為寬泛的語(yǔ)義變得更加精確。再如,主題7的原始主題詞為“發(fā)展、推進(jìn)、建設(shè)、改革、完善、經(jīng)濟(jì)、工作、機(jī)制、制度、推動(dòng)”,KeyBERT微調(diào)后得到的主題詞為“黨中央、習(xí)近平、深化改革、總書(shū)記、依法、我國(guó)、貫徹、改革、維護(hù)、深化”,微調(diào)后的主題詞在語(yǔ)義上突出了國(guó)家(如黨中央、習(xí)近平、總書(shū)記、我國(guó))對(duì)人工智能應(yīng)用場(chǎng)景的關(guān)注,彰顯了國(guó)家層面的深化改革和依法治理(如深化改革、依法)(經(jīng)過(guò)KeyBert微調(diào)優(yōu)化后的主題詞見(jiàn)表2)。
(3)主題詞分析
下面結(jié)合圖1、表1、表2以及已有的文獻(xiàn)對(duì)人工智能應(yīng)用場(chǎng)景主題詞進(jìn)行分析。
主題0的主題詞有“技術(shù)、機(jī)器人、智能、模型、數(shù)據(jù)”,聚焦人工智能技術(shù)研發(fā)與數(shù)據(jù)驅(qū)動(dòng)的算法創(chuàng)新。微調(diào)主題詞有“ChatGPT、OpenAI、算力、創(chuàng)新”,揭示了人工智能技術(shù)研發(fā)對(duì)大語(yǔ)言模型和硬件基礎(chǔ)設(shè)施的依賴。該主題對(duì)應(yīng)人工智能的基礎(chǔ)研發(fā)層,涵蓋機(jī)器人設(shè)計(jì)、智能算法優(yōu)化及跨模態(tài)模型開(kāi)發(fā),如Shao等提出了基于動(dòng)作模仿強(qiáng)化學(xué)習(xí)的四足機(jī)器人通用技能控制[25]。
主題1的主題詞有“中國(guó)、藝術(shù)、展覽、合作”,關(guān)注人工智能下的文化數(shù)字化。微調(diào)主題詞有“美術(shù)館、博物館”,聚焦AI在文化領(lǐng)域的垂直應(yīng)用,公共文化服務(wù)體系現(xiàn)代化轉(zhuǎn)型是堅(jiān)定文化自信和推進(jìn)文化強(qiáng)國(guó)建設(shè)的基礎(chǔ)保障[26],通過(guò)建立健全人工智能文化治理機(jī)制,實(shí)現(xiàn)文化治理決策的科學(xué)化、文化治理方式的精準(zhǔn)化和文化公共服務(wù)的高效化[27]。
主題2的主題詞有“企業(yè)、上海、發(fā)展、產(chǎn)業(yè)、創(chuàng)新”,圍繞人工智能賦能區(qū)域產(chǎn)業(yè)鏈協(xié)同創(chuàng)新與城市群一體化發(fā)展,人工智能發(fā)展呈現(xiàn)出“以經(jīng)濟(jì)建設(shè)為主導(dǎo),地區(qū)發(fā)展模式鮮明\"的特點(diǎn)[28]。微調(diào)主題詞有“長(zhǎng)三角、一體化、體系、高質(zhì)量”,人工智能正推動(dòng)著產(chǎn)業(yè)結(jié)構(gòu)轉(zhuǎn)型和生產(chǎn)要素流動(dòng)29,通過(guò)實(shí)現(xiàn)跨省域產(chǎn)業(yè)鏈協(xié)同,呼應(yīng)國(guó)家戰(zhàn)略,促進(jìn)區(qū)域經(jīng)濟(jì)聯(lián)動(dòng)。
主題3的主題詞有“發(fā)展、經(jīng)濟(jì)、消費(fèi)、創(chuàng)新”,圍繞人工智能助力下的經(jīng)濟(jì)優(yōu)化發(fā)展與消費(fèi)升級(jí)。人工智能驅(qū)動(dòng)了消費(fèi)升級(jí)更快更穩(wěn)地發(fā)展,相應(yīng)地,消費(fèi)升級(jí)也會(huì)為人工智能的發(fā)展帶來(lái)機(jī)遇[30]。微調(diào)主題詞有“高質(zhì)量、推進(jìn)、生產(chǎn)力”,研究表明歐亞地區(qū)國(guó)家人工智能發(fā)展的準(zhǔn)備情況與經(jīng)濟(jì)發(fā)展水平密切相關(guān)[31],表明經(jīng)濟(jì)發(fā)展需求與人工智能的應(yīng)用互為推力。
主題4的主題詞有“金融、公司、科技、企業(yè)”,圍繞人工智能賦能金融業(yè)務(wù)創(chuàng)新與企業(yè)經(jīng)營(yíng)管理。人工智能的介人逐漸顛覆管理客體,管理本質(zhì)更加復(fù)雜并且決策環(huán)境不斷優(yōu)化2。同時(shí),人工智能技術(shù)創(chuàng)新能夠培養(yǎng)企業(yè)核心能力、整體能力和動(dòng)態(tài)能力[33]。微調(diào)主題詞\"科創(chuàng)板、監(jiān)管、上市公司\"等指向資本市場(chǎng)改革。人工智能應(yīng)用于智能風(fēng)控、企業(yè)監(jiān)管、保險(xiǎn)精算以及企業(yè)融資等場(chǎng)景,推動(dòng)金融行業(yè)智能化轉(zhuǎn)型和資本市場(chǎng)改革。
主題5的主題詞有“市場(chǎng)、政策、A股、預(yù)期、板塊”,圍繞人工智能在資本市場(chǎng)中的應(yīng)用,比如利用人工智能系統(tǒng)能夠自動(dòng)響應(yīng)外部信息并結(jié)合市場(chǎng)需求進(jìn)行快速的交易,或是實(shí)現(xiàn)在無(wú)人為干預(yù)的情況下操盤(pán)對(duì)沖基[34]。微調(diào)主題詞\"上證綜指、券商、投資者\(yùn)"指向市場(chǎng)情況,通過(guò)構(gòu)建中文金融大語(yǔ)言模型實(shí)現(xiàn)市場(chǎng)情緒測(cè)度與資產(chǎn)價(jià)格風(fēng)險(xiǎn)預(yù)測(cè)[35]。
主題6的主題詞有“醫(yī)療、醫(yī)院、健康、患者、老年人”,圍繞醫(yī)療健康和養(yǎng)老服務(wù)兩個(gè)具有代表性的應(yīng)用場(chǎng)景。人工智能在生物醫(yī)學(xué)中應(yīng)用廣泛,包括疾病診斷、生活輔助、生物醫(yī)學(xué)信息處理和生物醫(yī)學(xué)研究[36。同時(shí),人工智能在養(yǎng)老領(lǐng)域涉及服務(wù)種類包括生活照料、醫(yī)療護(hù)理、精神慰藉及緊急救助[7]等多種服務(wù)。微調(diào)主題詞有“科委、平臺(tái)、腦機(jī)”,指向政策與技術(shù)要素。
主題7的主題詞有“發(fā)展、推進(jìn)、建設(shè)、改革、完善”,圍繞人工智能相關(guān)政策與推動(dòng)行業(yè)改革。國(guó)家多部門(mén)聯(lián)合發(fā)布《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》4,統(tǒng)籌人工智能場(chǎng)景創(chuàng)新;科技部發(fā)布《關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場(chǎng)景的通知》3,支持建設(shè)包括智慧農(nóng)場(chǎng)、智能港口等10個(gè)人工智能示范應(yīng)用場(chǎng)景。助力人工智能應(yīng)用場(chǎng)景的政策措施接連出臺(tái),說(shuō)明政策支持是人工智能應(yīng)用的原因之一。同時(shí),人工智能深度賦能廣電[38]、勞動(dòng)力市場(chǎng)[39]、司法[40]等領(lǐng)域改革。微調(diào)主題詞中的“黨中央、習(xí)近平、深化改革、總書(shū)記”,彰顯了國(guó)家治理與推動(dòng)深化改革。確實(shí),人工智能有潛能賦能政府治理,矯正政府失靈,提高政府效率[41]。
主題8的主題詞有“低空、無(wú)人機(jī)、經(jīng)濟(jì)、eV-TOL、航空”,圍繞人工智能驅(qū)動(dòng)下的低空領(lǐng)域技術(shù)突破與產(chǎn)業(yè)化。人工智能賦能低空經(jīng)濟(jì)在推進(jìn)智慧城鄉(xiāng)交通方面發(fā)揮了重要作用[42]。微調(diào)主題詞\"空中交通、直升機(jī)、飛行器”,聚焦低空經(jīng)濟(jì)智能化,涵蓋無(wú)人機(jī)物流、城市空中交通管理、航空器研發(fā),如我國(guó)首套具有自主知識(shí)產(chǎn)權(quán)的彩虹-4無(wú)人機(jī)航磁三分量測(cè)量系統(tǒng)[43]的問(wèn)世,為我國(guó)增添了一款新的航空物探利器。
主題9的主題詞有\(zhòng)"設(shè)計(jì)、建筑、城市、創(chuàng)新”,映射人工智能引領(lǐng)城市創(chuàng)意設(shè)計(jì)發(fā)展,當(dāng)今人工智能技術(shù)孕育了智能工具與建筑師間的合作,旨在挖掘建筑師自身創(chuàng)造力[44]。同時(shí),在城市智能管理中,利用無(wú)人機(jī)和AI技術(shù)進(jìn)行建筑物的健康監(jiān)測(cè)[42]。微調(diào)主題詞\"創(chuàng)意設(shè)計(jì)、創(chuàng)新獎(jiǎng)、設(shè)計(jì)師、城市更新”,指向城市更新與未來(lái)服務(wù)。對(duì)應(yīng)智慧城市設(shè)計(jì)領(lǐng)域,如智慧城市的安全保障方法、智慧城市移動(dòng)大數(shù)據(jù)的時(shí)空建模與可視化分析方法[45]
主題10的主題詞有“媒體、傳播、新聞”,圍繞主流媒體的新聞生產(chǎn)傳播。智能化機(jī)器、智能物體將與人的智能融合構(gòu)建新的媒體業(yè)務(wù)模式[4],在新聞生產(chǎn)與傳播過(guò)程中,人工智能已經(jīng)廣泛使用。微調(diào)主題詞“澎湃、采編\"指向具體實(shí)踐,輔助記者完成數(shù)據(jù)搜集、清洗、分析和可視化生成,提升數(shù)據(jù)呈現(xiàn)的精準(zhǔn)度和互動(dòng)性[47]。
3.2人工智能應(yīng)用場(chǎng)景主題相似性分析
繪制主題相似度熱力圖(見(jiàn)圖2)可以展示不同主題間的相似度。它通過(guò)顏色深淺來(lái)表示數(shù)據(jù)的相似度,顏色越深表示相似度越高,顏色越淺則表示相似度越低。
可以看到,主題0和主題2的相似度達(dá)0.85,表明城市群區(qū)域發(fā)展需求與人工智能技術(shù)的關(guān)系,需要不斷地創(chuàng)新和發(fā)明新的技術(shù)并通過(guò)合適的方法規(guī)劃城市的發(fā)展[48]。主題0和主題3的相似度達(dá)0.85,說(shuō)明人工智能技術(shù)研發(fā)與算法創(chuàng)新同經(jīng)濟(jì)優(yōu)化與消費(fèi)升級(jí)有極大相關(guān)性。主題0和主題9相似度達(dá)0.85,說(shuō)明人工智能技術(shù)對(duì)于城市更新和創(chuàng)意設(shè)計(jì)的支持。主題1和主題2的相似度達(dá)0.85,區(qū)域經(jīng)濟(jì)與文化觀念息息相關(guān),利用數(shù)字技術(shù)和數(shù)據(jù)要素雙輪驅(qū)動(dòng),與文化產(chǎn)業(yè)協(xié)同發(fā)展,形成數(shù)字經(jīng)濟(jì)與大城市群文化產(chǎn)業(yè)融合發(fā)展效應(yīng)[49]。主題1和主題7的相似度達(dá)0.85,說(shuō)明人工智能支持下的文化數(shù)字化展示與跨區(qū)域交流合作同人工智能相關(guān)政策與推動(dòng)行業(yè)改革存在潛在關(guān)聯(lián),值得后續(xù)研究探索。主題2和主題9的相似度達(dá)0.85,表明未來(lái)城市創(chuàng)意發(fā)展與服務(wù)關(guān)聯(lián)區(qū)域城市群一體化發(fā)展。主題3和主題5的相似度達(dá)0.88,表明AI技術(shù)驅(qū)動(dòng)的經(jīng)濟(jì)優(yōu)化發(fā)展與資本市場(chǎng)息息相關(guān),依據(jù)市場(chǎng)經(jīng)濟(jì)的原則調(diào)整經(jīng)濟(jì)結(jié)構(gòu),必須以資本市場(chǎng)為依托[50]。主題4與主題5的相似度達(dá)0.87,表明金融業(yè)務(wù)創(chuàng)新與企業(yè)管理同資本市場(chǎng)的關(guān)聯(lián)性極強(qiáng)。
主題2與主題3的相似度達(dá)0.95,是目前最高的相似度,表明經(jīng)濟(jì)發(fā)展與城市群區(qū)域發(fā)展深度綁定,人工智能已成為推動(dòng)企業(yè)轉(zhuǎn)型升級(jí)和經(jīng)濟(jì)高質(zhì)量發(fā)展的重要驅(qū)動(dòng)力[51]。主題2和主題4的相似度達(dá)0.90,表明金融業(yè)務(wù)創(chuàng)新同城市群跨區(qū)域發(fā)展存在內(nèi)部關(guān)聯(lián)。主題2和主題7的相似度達(dá)0.90,說(shuō)明政策對(duì)于人工智能賦能區(qū)域產(chǎn)業(yè)鏈協(xié)同創(chuàng)新與城市群一體化發(fā)展有一定的支持。主題3與主題4相似度達(dá)0.91,表明經(jīng)濟(jì)發(fā)展與金融創(chuàng)新之間存在緊密聯(lián)系,各區(qū)域的金融生態(tài)與經(jīng)濟(jì)增長(zhǎng)具有顯著的協(xié)調(diào)性[52],人工智能技術(shù)在金融領(lǐng)域的應(yīng)用可能會(huì)影響經(jīng)濟(jì)發(fā)展。主題3和主題7相似度達(dá)0.91,說(shuō)明人工智能助力下的經(jīng)濟(jì)結(jié)構(gòu)優(yōu)化與消費(fèi)升級(jí)同政策息息相關(guān)。
3.3人工智能應(yīng)用場(chǎng)景主題層次聚類及文檔分布分析
對(duì)主題層次聚類(見(jiàn)圖3)后發(fā)現(xiàn),主題2和主題3形成一個(gè)最底層聚類群:區(qū)域經(jīng)濟(jì)核心群。主題0和主題4構(gòu)成另一個(gè)最底層聚類群:技術(shù)-企業(yè)發(fā)展核心群。印證技術(shù)的進(jìn)步和經(jīng)濟(jì)發(fā)展的需求是人工智能應(yīng)用的原因。同時(shí)人工智能也推動(dòng)著經(jīng)濟(jì)和企業(yè)不斷發(fā)展,相輔相成。主題7與主題2和主題3合并,說(shuō)明人工智能相關(guān)政策對(duì)人工智能應(yīng)用的影響。
隨后是主題1、主題6、主題5、主題10、主題8和主題9合并,這些都是人工智能較具代表性的應(yīng)用場(chǎng)景。研究結(jié)果揭示了人工智能技術(shù)在不同場(chǎng)景和區(qū)域中的交叉滲透程度與協(xié)同效應(yīng)。不同場(chǎng)景之間的交叉融合不僅促進(jìn)了技術(shù)的創(chuàng)新和發(fā)展,還帶動(dòng)了產(chǎn)業(yè)的協(xié)同升級(jí)和區(qū)域經(jīng)濟(jì)的協(xié)同發(fā)展,同時(shí)也促進(jìn)了文化創(chuàng)意等軟實(shí)力的提升。
分析主題文檔的分布情況(見(jiàn)圖4),可以直觀地展示出不同主題下的文檔分布特征,其中701篇文檔被視為噪聲??梢钥吹?,每個(gè)主題內(nèi)部較為集中且主題之間的邊界較為明晰。其中主題0、主題1和主題7出現(xiàn)了跨越象限的情況,說(shuō)明這些主題具有交叉特征。確實(shí),主題0反映出人工智能技術(shù)研發(fā)與算法創(chuàng)新作為技術(shù)基礎(chǔ)層支撐各個(gè)主題,人工智能是驅(qū)動(dòng)新舊動(dòng)能轉(zhuǎn)換的關(guān)鍵力量[53]。主題1反映出人工智能支持下的文化數(shù)字化展示,說(shuō)明文化交流等軟實(shí)力與人工智能場(chǎng)景應(yīng)用的各個(gè)主題存在潛在關(guān)聯(lián),人民的精神文化需求不斷增加,以科技創(chuàng)新賦能的新質(zhì)生產(chǎn)力的培育必須與文化生產(chǎn)力的內(nèi)涵與品質(zhì)相融合[54]。主題7反映出政策主題滲透到應(yīng)用實(shí)施層,近年來(lái)國(guó)家出臺(tái)了大量人工智能發(fā)展政策,從指導(dǎo)思想、戰(zhàn)略目標(biāo)、總體要求、總體部署等各個(gè)方面作出了明確規(guī)定,勾勒出我國(guó)人工智能的發(fā)展階段及階段性目標(biāo),為我國(guó)人工智能及場(chǎng)景應(yīng)用設(shè)計(jì)了發(fā)展藍(lán)圖[55]。
4結(jié)語(yǔ)
本文基于BERTopic對(duì)人工智能應(yīng)用場(chǎng)景進(jìn)行了主題模型分析,挖掘了人工智能應(yīng)用場(chǎng)景的主題。識(shí)別出技術(shù)研發(fā)、文化數(shù)字化、區(qū)域經(jīng)濟(jì)協(xié)同、經(jīng)濟(jì)發(fā)展、金融創(chuàng)新、資本市場(chǎng)、醫(yī)療養(yǎng)老、政策協(xié)同、低空經(jīng)濟(jì)、城市發(fā)展、新聞傳播11個(gè)主題,發(fā)現(xiàn)區(qū)域經(jīng)濟(jì)協(xié)同與經(jīng)濟(jì)發(fā)展、金融創(chuàng)新、政策協(xié)同這三個(gè)主題的相似度較高,經(jīng)濟(jì)發(fā)展與金融創(chuàng)新、政策協(xié)同這兩個(gè)主題相似度較高,技術(shù)研發(fā)、文化數(shù)字化和政策協(xié)同與其他主題存在不同程度的交叉滲透。本文在一定程度上展現(xiàn)了催生人工智能顛覆性應(yīng)用的場(chǎng)景現(xiàn)狀、潛在需求和關(guān)聯(lián)要素。
隨著技術(shù)的不斷進(jìn)步、應(yīng)用場(chǎng)景的不斷擴(kuò)展和經(jīng)濟(jì)需求的增加,人工智能將在更多行業(yè)與領(lǐng)域有更加深入的應(yīng)用。同時(shí),人工智能應(yīng)用場(chǎng)景的發(fā)展也會(huì)面臨諸多挑戰(zhàn),如數(shù)據(jù)質(zhì)量、技術(shù)瓶頸、數(shù)據(jù)安全、倫理問(wèn)題等。因此,未來(lái)可以結(jié)合人工智能應(yīng)用場(chǎng)景存在的挑戰(zhàn)開(kāi)展更多的研究,協(xié)同推進(jìn)人工智能巔覆性應(yīng)用的健康持續(xù)發(fā)展。
參考文獻(xiàn):
[1]國(guó)家網(wǎng)信辦,國(guó)家發(fā)展改革委,教育部,等.生成式人工智能服務(wù)管理暫行辦法[EB/OL].[2023-07-10].ttps:/www.gov.cn/zhengce/zhengceku/202307/content_6891752.htm.
[2]國(guó)務(wù)院.新一代人工智能發(fā)展規(guī)劃[EB/OL].[2025-05-08].https://ww.gov.cn/zhengce/content/2017-07/20/content_5211996.htm.
[3]科技部.科技部關(guān)于支持建設(shè)新一代人工智能示范應(yīng)用場(chǎng)景的通知[EB/OL].[2025-05-12].ttps://ww.gov.cn/zhengce/zhengceku/2022-08/15/content_5705450.htm.
[4]中華人民共和國(guó)中央人民政府.科技部等六部門(mén)關(guān)于印發(fā)《關(guān)于加快場(chǎng)景創(chuàng)新以人工智能高水平應(yīng)用促進(jìn)經(jīng)濟(jì)高質(zhì)量發(fā)展的指導(dǎo)意見(jiàn)》的通知[EB/OL].[2025-05-19].htps://ww.gov.cn/zhengce/zhengceku/2022-08/12/content_5705154.htm.
[5]李夢(mèng)薇,高芳,徐峰.人工智能應(yīng)用場(chǎng)景的成熟度評(píng)價(jià)研究[J].情報(bào)雜志,2022,41(12):176-183.
[6]方海光,仝賽賽,杜婧敏,等.基于區(qū)塊鏈技術(shù)的智慧學(xué)習(xí)機(jī)器人設(shè)計(jì)研究——面向大規(guī)模學(xué)習(xí)服務(wù)系統(tǒng)的智慧學(xué)習(xí)機(jī)器人[J].遠(yuǎn)程教育雜志,2017,35(4):42-48.
[7]盧宇,余京蕾,陳鵬鶴,等.生成式人工智能的教育應(yīng)用與展望——以ChatGPT系統(tǒng)為例[J].中國(guó)遠(yuǎn)程教育,2023,43(4):24-31,51.
[8]吳怍,李鳳鳴,胡藝齡.生成式人工智能賦能本科生科研能力培養(yǎng)——ChatGPT支持的CUREs教學(xué)模式[J].現(xiàn)代遠(yuǎn)程教育研究,2024,36(3):3-10,28.
[9]馬銀琦,黃恒,毋磊,等“技術(shù)賦能\"還是\"工具依賴\":生成式人工智能對(duì)研究生科研創(chuàng)新力的影響研究[J].電化教育研究,2024,45(12):58-66.
[10]高奇琦,呂俊延.智能醫(yī)療:人工智能時(shí)代對(duì)公共衛(wèi)生的機(jī)遇與挑戰(zhàn)[J].電子政務(wù),2017(11):11-19.
[11]EstevaAuprelB,ovRA,taatolgistevesiicatiofnciepualeoksure,2017,542(7639):115-118.
[12]高美虹,尚學(xué)群.利用人工智能預(yù)測(cè)癌癥的易感性、復(fù)發(fā)性和生存期[J].生物化學(xué)與生物物理進(jìn)展,2022,49(9):1687-1702.
[13]StokesJ,YangK,wasonK,etal.AeeplearnngapproachtntibioticdiscoveryJ].Cell,1(2):44.
[14]趙光輝.人工智能驅(qū)動(dòng)交通運(yùn)輸高質(zhì)量發(fā)展邏輯機(jī)理及發(fā)展路徑[J/OL].當(dāng)代經(jīng)濟(jì)管理,1-21[2025-06-09].ttp:/kns.cnki.net/kcms/detail/13.1356.F.20250514.1759.002.html.
[15]WeiY,AvcC,LiuJ,etalDnamicprogramming-basedmultivehiclelongitudinaltrajectoryoptizationwithsipliedarfollowing models[J].Transportation Research PartB:methodological,2O17,106:102-129.
[16]高奇琦.共享智能汽車(chē)對(duì)未來(lái)世界的影響[J].人民論壇,2017(20):39-47.
[17]李佳珂.人工智能對(duì)金融創(chuàng)新的積極影響[J].人民論壇,2018(25):78-79.
[18]Zhao M,WeiH,MaoY,etal.Predictionsofadditivemanufacturing processparametersandmoltenpooldimensiosithphysics-informed deep learning model[J].Engineering,2023,23:181-195.
[19]梁萬(wàn)杰,馮輝,江東,等.高光譜圖像結(jié)合深度學(xué)習(xí)的油菜菌核病早期識(shí)別[J].光譜學(xué)與光譜分析,2023,43(7)2220-2225.
[20]張新苗,余自武,楊雨綺.人工智能在波音787上的應(yīng)用與思考[J].工業(yè)工程與管理,2017,22(6):169-174.
[21]汪波,牛朝文.從ChatGPT到GovGPT:生成式人工智能驅(qū)動(dòng)的政務(wù)服務(wù)生態(tài)系統(tǒng)構(gòu)建[J].電子政務(wù),2023(9):25-38
[22]GrotendorstM.BERTopic:Neuraltopic modeling withaclass-basedTF-IDFprocedureJ].arxivpreprintarxiv:2203.05794,2022.
[23]GrootendorstM.KeyBERT:Minimal KeywordExtractionwithBERTEB/OL].2025-02-10].htps://maartengr.github.i/KeyBERT/.
[24]LiuMY,LuoXWWangGBetalIntellgentinforationextractionfrogovementositeispectioeportsofostruction projects:A graph-based text mining approach[J].Advanced Engineering Informatics,2023,58:102163.
[25]ShaoYC,JinYB,HuangZL,etal.Alearing-basedcontrolpipelieforgeneric motorskilsforquadrupedrobotsJournalof Zhejiang University-ScienceA(AppliedPhysicsamp;Engineering),2024,25(6):443-454.
[26]楊博,王連.數(shù)字化賦能公共文化服務(wù)體系高質(zhì)量發(fā)展:邏輯、困境與路徑[J].圖書(shū)與情報(bào),2023(5):130-138.
[27]季正聚,趙學(xué)琳.人工智能賦能文化治理:價(jià)值意蘊(yùn)、問(wèn)題表征、實(shí)踐理路[J].中國(guó)編輯,2024(12):4-13.
[28]劉紅波,林彬.中國(guó)人工智能發(fā)展的價(jià)值取向、議題建構(gòu)與路徑選擇——基于政策文本的量化研究[J].電子政務(wù),2018(11):47-58.
[29]曾晨語(yǔ),魏下海,余玲錚.生成式人工智能如何重塑勞動(dòng)力市場(chǎng):研究綜述與未來(lái)展望[J].產(chǎn)業(yè)經(jīng)濟(jì)評(píng)論,2025(3):82-102.
[30]蒲曉曄,黃鑫.人工智能賦能中國(guó)經(jīng)濟(jì)高質(zhì)量發(fā)展的動(dòng)力問(wèn)題研究[J].西安財(cái)經(jīng)大學(xué)學(xué)報(bào),2021,34(4):101-109.
[31]基里爾·魯?shù)?,陳勝?歐亞地區(qū)國(guó)家人工智能發(fā)展:因素、風(fēng)險(xiǎn)和中國(guó)機(jī)遇[J].俄羅斯研究,2025(1):5-23.
[32]徐鵬,徐向藝.人工智能時(shí)代企業(yè)管理變革的邏輯與分析框架[J].管理世界,2020,36(1):122-129,238.
[33]張竹,邢小強(qiáng),徐赫辰.人工智能技術(shù)創(chuàng)新與中國(guó)企業(yè)高質(zhì)量發(fā)展:能力基礎(chǔ)觀視角[J/OL].外國(guó)經(jīng)濟(jì)與管理,1-21[2025-06-03].htps://doi.org/10.16538/j.cnki.fem.20250228.401.
[34]劉憲權(quán).人工智能時(shí)代證券期貨市場(chǎng)刑事風(fēng)險(xiǎn)的演變[J].東方法學(xué),2021(2):43-53.
[35]姜富偉,劉雨旻,孟令超.大語(yǔ)言模型、文本情緒與金融市場(chǎng)[J].管理世界,2024,40(8):42-64.
[36]Rong GG,MendezA,Bou AE,et al.醫(yī)療保健中的人工智能—綜述與預(yù)測(cè)性案例研究[J].Engineering,2020,6(3):189-211.
[37]睢黨臣,曹獻(xiàn)雨.人工智能養(yǎng)老的內(nèi)涵、現(xiàn)狀與實(shí)現(xiàn)路徑[J].新疆師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2019,40(2):111-119,2.
[38]王虎,陳小萍.人工智能賦能廣電供給側(cè)結(jié)構(gòu)性改革的路徑[J].電視研究,2020(10):23-26.
[39]蔣南平,鄒宇.人工智能與中國(guó)勞動(dòng)力供給側(cè)結(jié)構(gòu)性改革[J].四川大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2018(1):130-138.
[40]魏斌.司法人工智能融入司法改革的難題與路徑[J].現(xiàn)代法學(xué),2021,43(3):3-23.
[41]程承坪.人工智能促進(jìn)經(jīng)濟(jì)發(fā)展的途徑[J].當(dāng)代經(jīng)濟(jì)管理,2021,43(3):1-8.
[42]莊茁.人工智能賦能低空經(jīng)濟(jì):應(yīng)用場(chǎng)景與未來(lái)方向[J].人民論壇,2024(15):38-44.
[43]郭華,王明,姚雨暘,等.彩虹-4無(wú)人機(jī)航磁三分量測(cè)量系統(tǒng)研發(fā)及應(yīng)用研究[J].地球物理學(xué)報(bào),2022,65(11):4485-4494.
[44]周漸佳,閆超,何宛余,等.新主體性的誕生:人工智能時(shí)代的建筑理論[J].建筑學(xué)報(bào),2024(1):29-36.
[45]ShanZ,ShiL,iBetalmpowerinsmartcityatioalwarenesviaigobiledataJ]FrotiersofIforatichnologyamp;Electronic Engineering,2024,25(2):286-307.
[46]彭蘭.智媒化:未來(lái)媒體浪潮——新媒體發(fā)展趨勢(shì)報(bào)告(2016)[J].國(guó)際新聞界,2016,38(11):6-24.
[47]何康,鄭雨蛟.從數(shù)據(jù)驅(qū)動(dòng)到智能驅(qū)動(dòng):新聞可視化的應(yīng)用創(chuàng)新[J].中國(guó)編輯,2025(2):34-41.
[48]楊俊宴,鄭屹.城市:可計(jì)算的復(fù)雜有機(jī)系統(tǒng)——評(píng)《創(chuàng)造未來(lái)城市》[J].國(guó)際城市規(guī)劃,2021,36(1):124-130.
[49]臧紅敏.數(shù)字經(jīng)濟(jì)與大城市群文化產(chǎn)業(yè)融合發(fā)展研究[J].圖書(shū)與情報(bào),2024(1):67-73.
[50]康立,王棟.論資本市場(chǎng)對(duì)我國(guó)經(jīng)濟(jì)結(jié)構(gòu)戰(zhàn)略性調(diào)整的支持[J].中南財(cái)經(jīng)政法大學(xué)學(xué)報(bào),2002(3):97-103,144.
[51]呂鐲,張恒鑫,李連偉.人工智能對(duì)企業(yè)成長(zhǎng)的影響研究[J].科研管理,2025,46(5):55-63.
[52]逐進(jìn),朱順杰.金融生態(tài)、經(jīng)濟(jì)增長(zhǎng)與區(qū)域發(fā)展差異——基于中國(guó)省域數(shù)據(jù)的耦合實(shí)證分析[J].管理評(píng)論,2015,27(11):44-56.
[53]沈坤榮,丁露,趙倩.以人工智能培育經(jīng)濟(jì)發(fā)展新動(dòng)能[J/OL].社會(huì)科學(xué)輯刊,1-9[2025-06-09].htp://ns.cnki.net/kc-ms/detail/21.1012.C.20250609.0954.010.html.
[54]魏鵬舉.作為新質(zhì)生產(chǎn)力的文化科技融合與人文經(jīng)濟(jì)發(fā)展[J].福建論壇(人文社會(huì)科學(xué)版),2024(6):55-64.
[55]賈開(kāi),郭雨暉,雷鴻竹.人工智能公共政策的國(guó)際比較研究:歷史、特征與啟示[J].電子政務(wù),2018(9):78-86.
作者簡(jiǎn)介:劉湘貝,女,碩士研究生;嚴(yán)亞蘭,女,、教授,博士生導(dǎo)師;查先進(jìn),男,教授,博士生導(dǎo)師。