文/孟倫 楊博文
ChatGPT是由OpenAI創(chuàng)造的生成式人工智能聊天機器人程序,能夠幫助使用者開展文本生成、開放域問答、分類、摘要、編寫等活動。OpenAI于2022年11月30日首次發(fā)布GPT模型,憑借著較低的操作門檻和便捷的接入方式,將人工智能“祛魅”,使其廣泛地進入人們的生活。作為多維高擬真人工智能的代表,ChatGPT的興起受到了公眾的廣泛關(guān)注并引發(fā)了熱議,因此對公眾的關(guān)注焦點議題及其情緒態(tài)度展開數(shù)據(jù)挖掘和分析梳理具有重要意義。
在中文新聞傳播學界,ChatGPT的興起和應(yīng)用引起了廣泛關(guān)注,討論話題主要圍繞技術(shù)原理及其完善方向、技術(shù)產(chǎn)生的深遠影響、采納者特質(zhì)及其采納動因三個方面展開。在研究開展的早期階段,對技術(shù)原理及其完善方向進行介紹的研究占據(jù)主流,如王建磊等人撰文指出ChatGPT具有超模擬傳播特質(zhì)和反延伸的傳播邏輯。郭全中等人認為可遷移性提升、內(nèi)生偏見和研發(fā)成本降低是ChatGPT的突破關(guān)鍵。方詩詩等人將ChatGPT的生成錯誤類型分成23類,并對其錯誤生成的內(nèi)在機制進行解釋。隨著人們對技術(shù)原理和特性有了更多的了解,越來越多研究者注意到ChatGPT代表的技術(shù)革新對社會將產(chǎn)生深遠的影響。郭全中指出ChatGPT的出現(xiàn)將帶來通用人工智能(Artificial General Intelligence,AGI)領(lǐng)域的產(chǎn)業(yè)升級。喻國明等人進一步指出ChatGPT將在信息層面、個體層面、連接傳播層面激發(fā)傳播生態(tài)格局的變化,社會的治理邏輯也會隨之改變。方興東等人著重分析了智能傳播時代與之前相比的革命性變革。除了對技術(shù)原理與技術(shù)引發(fā)的影響展開研究外,對技術(shù)采納者的關(guān)注也是傳播學研究的經(jīng)典問題,這類研究中比較有代表性的是強月新等人運用扎根理論分析了ChatGPT使用者采納新技術(shù)的社會動因和文化動因,對于新技術(shù)的革新、沖擊和缺陷,采納者采用了推崇、接受和包容的態(tài)度,新技術(shù)采納既是知識階層構(gòu)建身份認同的原材料,也是認同表達的符號和象征。整體而言,目前國內(nèi)對ChatGPT的研究方向主要集中在ChatGPT的技術(shù)特質(zhì)、社會影響及采納者特質(zhì),對更廣泛的公眾圍繞ChatGPT關(guān)注的焦點議題與情緒變化趨勢尚缺乏了解。而此類研究的開展,將為學界更好地探索ChatGPT提供參考。
為了探究ChatGPT發(fā)布以來公眾的輿論焦點與情緒態(tài)度,本研究以微博作為文本收集對象,以主題模型分析和情感分析作為研究方法展開分析。
1.主題模型分析。隱含迪利克雷分布(Latent Dirichlet Allocation)主題模型方法(簡稱LDA)是一種數(shù)據(jù)分析模型。這一方法已替代傳統(tǒng)內(nèi)容分析方法,成為提煉海量數(shù)據(jù)主題的主流方法,近兩年已有中國學者將其應(yīng)用于國內(nèi)微博用戶討論話題的主題聚類研究,顯著提高了海量數(shù)據(jù)處理效率和精準度。ChatGTP誕生之初亦有海外研究者運用該模型分析了推特用戶對其討論的主題分布。本研究以“ChatGPT”為關(guān)鍵詞在新浪微博上收集了從2022年11月30日到2023年4月30日的82502條原創(chuàng)微博文本,經(jīng)過分詞、停用詞處理、文本向量化、困惑度分析等步驟得出可視化圖表。為了更好地呈現(xiàn)公眾對ChatGPT的動態(tài)關(guān)注狀況,本研究在LDA主題模型分析基礎(chǔ)上引入了動態(tài)主題分析模型——DTM(Dynamic Topic Model),用以分析輿論主題的動態(tài)變化。
2.情感分析。情感分析(Sentiment Analysis)指利用自然語言處理技術(shù)對帶有情感傾向的主觀性文本進行分析,本研究對收集到的微博文本進行情感分析,其中情緒值大于0的表示文本顯示積極態(tài)度(最大值為50),情緒值小于0的表示文本表達消極態(tài)度(最小值為-50),且數(shù)值越大所代表的相關(guān)情緒詞數(shù)量越多(見表1)。
表1 ChatGPT微博文本情緒值示例
通過主題模型分析和情感分析,本研究總結(jié)出了公眾對ChatGPT的主要輿論焦點和具體的情緒態(tài)度狀況。
1.公眾關(guān)注ChatGPT的五個輿論主題。本研究利用代表性詞語和其所對應(yīng)的推文進行了LDA主題模型分析,得出公眾對ChatGPT的關(guān)注方向主要聚焦于網(wǎng)絡(luò)安全、股票、投資、科技、使用體驗這五個方面(見表2)。
表2 公眾關(guān)注ChatGPT的LDA主題內(nèi)容
在“網(wǎng)絡(luò)安全”主題中,關(guān)于“AI賦能網(wǎng)絡(luò)安全”領(lǐng)域,公眾認為人們在未來可以利用AI技術(shù)使網(wǎng)絡(luò)環(huán)境更加安全,如微博某博文認為“云是安全的未來,AI/ML早就成為現(xiàn)代化網(wǎng)絡(luò)安全的核心基礎(chǔ)技術(shù)。微軟安全其實賣的就是全球領(lǐng)先的AI/ML技術(shù),以及無與倫比的安全情報和大數(shù)據(jù)。”但并不是所有用戶都對此表示贊同。關(guān)于“AI造成安全問題”領(lǐng)域,公眾認為AI技術(shù)可能會導致網(wǎng)絡(luò)環(huán)境安全性下降。如有外國媒體報道了歐洲警察組織的警告:“像ChatGPT這樣的大型語言模型(LLM)是危險的,因為它們使犯罪分子更容易采取行動?!标P(guān)于“監(jiān)管措施”領(lǐng)域,公眾主要討論了對人工智能的監(jiān)管問題。如微博某博文引用新華社的報道:“政府和運營商都在加強相關(guān)管控趨勢,建議將倫理道德融入人工智能全生命周期?!?/p>
在“股票”主題中,關(guān)于“股票資訊”領(lǐng)域,公眾從理財方面關(guān)注其股票資訊,如“財經(jīng)婉兒”發(fā)布文章:“世界著名的生命未來研究所,日前向全社會發(fā)出一封‘暫停大型人工智能研究’的公開信,呼吁所有人工智能研究室,立即暫停比ChatGPT更強大的人工智能系統(tǒng)的訓練?!标P(guān)于“股市評價及預測”領(lǐng)域,公眾討論了關(guān)于股票資訊的評價,以及未來股市的預測。如“ChatGPT概念股午后探底回升,多股漲超10%……而深證與創(chuàng)業(yè)板隨著今天的沖高,個人認為,短期也應(yīng)有一定的整理需求?!?/p>
在“投資”主題中,關(guān)于“投資方及看法”領(lǐng)域,主要包含馬斯克、巴菲特、馬云以及網(wǎng)上的公知等人對ChatGPT的投資前景的判斷以及做法,如“馬斯克領(lǐng)銜,1000多位硅谷企業(yè)家和科學家簽名呼吁:立刻停下所有AI研究。這一突如其來的呼吁,主要是由于科學家們發(fā)現(xiàn)AI已經(jīng)出現(xiàn)其無法解釋的推理能力?!标P(guān)于“投資風向及政策”領(lǐng)域,主要指對于投資人工智能領(lǐng)域的政策指向,如工信部近日的區(qū)塊鏈與分布式計算征求意見稿:“如果允許公鏈及其token的發(fā)展,那國內(nèi)的區(qū)塊鏈技術(shù)將會有很大的提升?!?/p>
在“科技”主題中,關(guān)于“ChatGPT的簡單發(fā)展過程和運作模式”領(lǐng)域,主要是簡單介紹ChatGPT的發(fā)展過程和工作原理,例如,“GPT-3代表自然語言處理領(lǐng)域新的技術(shù)突破,直接給模型輸入一些例子,通過這些例子改變模型的內(nèi)部狀態(tài),生成所需要的答案?!标P(guān)于“ChatGPT技術(shù)優(yōu)缺點及其社會問題”領(lǐng)域,集中在對ChatGPT優(yōu)缺點的討論,如正面評價有“當通過國內(nèi)大佬建立的鏡像站,看到ChatGPT生成出的文字出現(xiàn)在我的電腦屏幕上,我就仿佛是第一次見到550c的圖恒宇”。關(guān)于“ChatGPT的未來發(fā)展方向以及中國版ChatGPT可行性”領(lǐng)域,聚焦于對ChatGPT次生問題的擔憂,“最近看了很多ChatGPT的話題和討論,再結(jié)合三體里描述的場景,我對未來AI應(yīng)用,甚至可能取代自己的職業(yè)產(chǎn)生了深深的焦慮”。
在“使用體驗”主題中,關(guān)于“ChatGPT的使用方向”領(lǐng)域,主要討論了ChatGPT平時的使用過程,如“我很早就注冊了ChatGPT賬號,除了嘗鮮外,主要還是為了娃寫畢業(yè)論文。玩過一段時間就沒管了…… ”關(guān)于“對ChatGPT的使用感受”領(lǐng)域,主要討論了對ChatGPT使用感受的評價,如“當你被別人欺負時,如果你哭著告訴你爸爸,他會很不耐煩地對你說,你有沒有種啊,你還是不是我兒子?你去把他們揍一頓!但如果你告訴這個白左ChatGPT,它會告訴你欺負別人是不對的,報復別人也是不對的,然后你的性格會越來越懦弱?!?/p>
值得注意的是,國外學者Viriya曾做過相關(guān)研究,他收集了推特上的約23萬條ChatGPT主題推文進行LDA主題分析,并將推文分為一般主題、功能領(lǐng)域和潛在影響三大主題,一般主題主要涵蓋新聞、科技、反應(yīng)三個分支主題;功能主題主要涵蓋創(chuàng)意寫作、論文寫作、提示性寫作、代碼編寫、回答問題五個分支主題;潛在影響主要下轄影響科技和影響人類兩個分支主題。通過橫向?qū)Ρ葒庀嚓P(guān)研究,對中外網(wǎng)民討論的主題差異進行比較,可發(fā)現(xiàn)中國網(wǎng)民對ChatGPT應(yīng)用引發(fā)的信息安全問題更加關(guān)注,同時也較多注意到其在股市和投資方面將產(chǎn)生怎樣的影響;而國外網(wǎng)民關(guān)注的更多是ChatGPT在日常生活中可以有哪些應(yīng)用這一較為微觀的主題。
2.公眾關(guān)注ChatGPT輿論主題的動態(tài)變化過程。本研究通過DTM模型分析,用以反映公眾對ChatGPT輿論主題的動態(tài)變化過程并以桑基圖(如圖1)的方式加以呈現(xiàn)。
圖1 ChatGPT微博主題流動桑基圖
?;鶊D(Sankey Diagram)是流程圖的一種,在金融、能源等領(lǐng)域中常用此圖來對數(shù)據(jù)流量變化進行可視化分析,其中線條的寬窄代表特定數(shù)據(jù)的流量大小。本文的?;鶊D通過DataViz進行制作,圖中線條的走向代表數(shù)據(jù)流走向,線條的寬度變化代表數(shù)據(jù)變化情況;圖中的第一到第五階段分別對應(yīng)著2022年12月到2023年4月的數(shù)據(jù)。從圖中我們不難看出,自12月到次年1月由于ChatGPT剛剛向公眾開放不久,數(shù)據(jù)量較少,在2月到4月期間信息安全和使用體驗主題的討論度較高,科技創(chuàng)新主題整體的討論度呈上升趨勢,是討論的重點和熱點;投資話題的整體變化不大,對股票的關(guān)注度呈現(xiàn)先升后降的趨勢。
通過詳細分析各階段關(guān)注主題的內(nèi)容變化趨勢可以發(fā)現(xiàn),隨著開放時間的推進,信息安全的討論重心由AI可能造成哪些安全問題,演化為如何通過法制監(jiān)管、倫理規(guī)范來避免AI危害信息安全等問題。使用體驗主題的討論內(nèi)容,從初次使用時對這項技術(shù)表示震驚和贊嘆演化為對使用中遇到問題的質(zhì)疑??萍紕?chuàng)新主題討論最初主要對什么是AIGC技術(shù)進行科普和相關(guān)科技產(chǎn)品功能進行介紹,國內(nèi)相關(guān)技術(shù)公司科技進展情況,能否及時趕上國外水平等話題,討論中對國內(nèi)AIGC技術(shù)與國外技術(shù)差距表達擔憂。在此之后,科技創(chuàng)新的討論主題主要演化為AI 技術(shù)可能引發(fā)的社會變革,包括技術(shù)革新引發(fā)的就業(yè)危機、政務(wù)危機、教育危機、產(chǎn)業(yè)變革、國防科技變革、演化為將ChatGPT的出現(xiàn)比作蒸汽機的發(fā)明,對中國錯過智能革命的擔憂,對技術(shù)是否會毀滅人類的討論,面對科技進步個人應(yīng)該做出何種改變 ,隨著國內(nèi)類似技術(shù)模型的發(fā)布,話題主要轉(zhuǎn)換為對國內(nèi)類似產(chǎn)品的對比和評測。隨著時間的推移,投資話題的關(guān)注重點從對投資方的介紹和評價演化為對投資政策環(huán)境進行討論。股票主題的關(guān)注重點從近期的股票介紹與投資建議演化為對遠期將影響的股票進行評估。從演化趨勢來看,未來國內(nèi)將進一步關(guān)注信息安全體系的建設(shè),以及AI技術(shù)對個人生活、產(chǎn)業(yè)變革方面的深遠影響,以及在此基礎(chǔ)上投資者需要如何作出判斷,以及政府需要做出怎樣的管理和規(guī)制。
3.公眾對ChatGPT的情緒態(tài)度。通過對公眾的情感分析,本研究發(fā)現(xiàn):在公眾對ChatGPT的網(wǎng)絡(luò)情緒表達中,負面情緒占據(jù)了多數(shù)位置(41.1%),其中代表性的負面評價可以被分為“職業(yè)焦慮”和“使用不便”兩類,如“光看B站上各種ChatGPT取代各種職業(yè)的焦慮向視頻就已經(jīng)覺得廢物的人生已經(jīng)沒有什么過下去的必要了?!薄癈hatGPT真的廢物,課堂測驗搜題告訴我modelsim沒有被西門子收購,果然錯了?!?/p>
通過情緒分布圖(如圖2)我們可以看到情緒值大于20的微博數(shù)量要遠超過情緒值小于-20的微博數(shù)量。情緒值越大其代表的文本相關(guān)情緒詞含量越多,那么文本長度也就越長,從這一點上我們可以推測,除了一般網(wǎng)民在使用ChatGPT或與ChatGPT的相關(guān)信息接觸的過程中會留下對ChatGPT的評價之外,也存在許多專門為ChatGPT或者其國內(nèi)鏡像網(wǎng)站的而寫的報道和軟文。其中,包括行業(yè)報告、某公司的業(yè)務(wù)介紹等,如“AI通過與各行各業(yè)結(jié)合,賦能各行各業(yè)。人工智能的技術(shù)創(chuàng)新和應(yīng)用落地是行業(yè)智能化的推手?!碑斎贿€存在一些中性的微博,但此類大多為股票、投資等資訊類以及一些旁觀視角的娛樂性質(zhì)評論,如“ChatGPT相關(guān)板塊早盤一度反彈,CPO、算力方向領(lǐng)漲”以及“已有企業(yè)在用ChatGPT取代員工建議代替微博審核員”??梢?,在有關(guān)ChatGPT的微博輿論中仍然不乏質(zhì)疑焦慮的情緒表達。
圖2 公眾在微博中對ChatGPT的情緒態(tài)度概況
本研究發(fā)現(xiàn)當下人們對ChatGPT的輿論焦點主要包括網(wǎng)絡(luò)安全、股票、投資、科技和使用體驗五個方面。隨著時間的推進,信息安全的討論重心由具體的安全問題演化為如何通過法制監(jiān)管、倫理規(guī)范來避免安全問題的討論。使用體驗主題的討論內(nèi)容從初次使用轉(zhuǎn)化為對問題的質(zhì)疑??萍紕?chuàng)新主題討論最初主要對什么是AIGC技術(shù)進行科普和相關(guān)科技產(chǎn)品功能進行介紹,演化關(guān)注AI 技術(shù)可能引發(fā)的社會變革,投資話題的關(guān)注重點從對投資方的介紹和評價演化為對投資政策環(huán)境進行討論。股票主題的關(guān)注重點從近期的股票介紹與投資建議演化為對遠期將影響的股票進行評估。在公眾對ChatGPT的網(wǎng)絡(luò)情緒表達中,負面情緒占據(jù)了多數(shù),相對于積極正向的情緒態(tài)度,網(wǎng)民對ChatGPT更多地呈現(xiàn)出質(zhì)疑焦慮的情緒表達。整體上,安全性和使用體驗兩大話題中網(wǎng)民的情緒波動更為明顯,尤其是ChatGPT的應(yīng)用對網(wǎng)絡(luò)安全帶來的新挑戰(zhàn)備受關(guān)注并引發(fā)了激烈討論。
我國網(wǎng)民已經(jīng)開始看到生成式人工智能技術(shù)進步帶來的機遇,以及它所帶來的潛在風險。技術(shù)的高速更新與產(chǎn)品的短周期研發(fā)是智能化時代的鮮明特征,靠既有理論與規(guī)范一勞永逸地應(yīng)對一切風險已無可能,因風險的存在而抵制新技術(shù)的做法更是因噎廢食。風險社會的到來必然要求規(guī)范的不斷擴容以實現(xiàn)對失范行為的精準規(guī)制。ChatGPT的出現(xiàn)既非奇跡,也非偶然,而是人類社會智能化的應(yīng)然產(chǎn)物。