劉 偉
(上海立信會計(jì)金融學(xué)院,統(tǒng)計(jì)與數(shù)學(xué)學(xué)院,上海 201209)
2013年9月7日,中國國家主席習(xí)近平在哈薩克斯坦演說時(shí)首次提出了共建“絲綢之路經(jīng)濟(jì)帶”;同年10月,習(xí)主席在印度尼西亞演說時(shí)提出共建“21世紀(jì)海上絲綢之路”的倡議,至此,“一帶一路”(the Belt and Road)的雛形形成。2015年3月27日,海南博鰲亞洲論壇上中國國家發(fā)展改革委、外交部和商務(wù)部聯(lián)合發(fā)布了《推動共建絲綢之路經(jīng)濟(jì)帶和21世紀(jì)海上絲綢之路的愿景與行動》,該文件的發(fā)布標(biāo)志著 “一帶一路”項(xiàng)目正式進(jìn)入全面建設(shè)階段。
“一帶一路”是一個(gè)充分依靠中國與有關(guān)國家既有的雙多邊機(jī)制,借助既有的行之有效的區(qū)域合作平臺,使各國實(shí)現(xiàn)合作發(fā)展的理念和倡議?!耙粠б宦贰背h全面推動以來,得到世界各個(gè)國家和地區(qū)的廣泛響應(yīng),國內(nèi)外新聞媒體對“一帶一路”相關(guān)活動進(jìn)行了大量報(bào)道,而關(guān)于此類報(bào)道的細(xì)致量化分析仍不多見。近年來,隨著互聯(lián)網(wǎng)及大數(shù)據(jù)技術(shù)的發(fā)展,使得以Latent Dirichlet Allocatio(LDA)模型為基礎(chǔ),從新聞報(bào)道中提煉主題并跟蹤某一主題的發(fā)展成為可能。本文將主要基于LDA模型,對“一帶一路”倡議下的國內(nèi)外新聞輿情演化進(jìn)行研究。
縱觀國內(nèi)關(guān)于“一帶一路”的已有文獻(xiàn),主要集中在以下三個(gè)方面:
第一,立足經(jīng)濟(jì)貿(mào)易,分析“一帶一路”倡議對中國與沿線各國貿(mào)易往來的影響。例如:許和連等利用UNComtrade2012 年的HS6分位貿(mào)易數(shù)據(jù)綜合構(gòu)建“一帶一路” 沿線65個(gè)國家的高端制造業(yè)貿(mào)易網(wǎng)絡(luò),并通過指數(shù)隨機(jī)圖模型探討貿(mào)易網(wǎng)絡(luò)形成的主要影響因素[1];鄒嘉齡等利用投入產(chǎn)出表,分析了中國與“一帶一路”沿線國家的貿(mào)易互相依賴關(guān)系以及中國各省市的出口對其經(jīng)濟(jì)增長的貢獻(xiàn)[2];張會清等基于貿(mào)易強(qiáng)度指數(shù)模型,從進(jìn)口貿(mào)易和出口貿(mào)易兩方面深入分析中國與“一帶一路”沿線國家和地區(qū)的貿(mào)易聯(lián)系問題,并通過動態(tài)對比評估了中國與“一帶一路”地區(qū)的貿(mào)易進(jìn)展情況[3];李彬彬?qū)嵶C檢驗(yàn)了影響中國高新技術(shù)產(chǎn)品出口阿拉伯國家的原因,測算了相關(guān)出口潛力,并據(jù)此提出了政策建議[4]。
第二,立足金融市場,探索“一帶一路”倡議下各類經(jīng)濟(jì)指標(biāo)之間的聯(lián)動關(guān)系。例如:曹偉等將鄰國效應(yīng)引入?yún)R率與貿(mào)易關(guān)系理論框架,研究了匯率變動、鄰國效應(yīng)對中國與“一帶一路”國家雙邊貿(mào)易的影響[5];保建云從海外投資的金融影響、市場約束和風(fēng)險(xiǎn)入手,提出了“一帶一路”沿線國家金融機(jī)構(gòu)的合作機(jī)制[6];趙明亮結(jié)合“一帶一路”海外投資戰(zhàn)略要求及投資實(shí)踐,就風(fēng)險(xiǎn)因素對中國OFDI的潛在影響機(jī)理進(jìn)行了分析[7]。
第三,立足具體行業(yè),研究各行業(yè)在“一帶一路”倡議下的機(jī)遇與挑戰(zhàn)。例如:楊麗花等從博弈論視角分析絲路基金吸引投資者參與“一帶一路”PPP項(xiàng)目建設(shè)的作用機(jī)制[8];龔靜等構(gòu)建異質(zhì)性隨機(jī)前沿模型,研究鐵路建設(shè)對中國“一帶一路”倡議的貿(mào)易效應(yīng)[9];蔡中華等基于行業(yè)層面相似度指數(shù),分析了國家專利與出口結(jié)構(gòu)之間的關(guān)系[10];劉總理等從波特鉆石模型入手,對“一帶一路”倡議下的中國有色金屬產(chǎn)業(yè)的合作模型進(jìn)行了研究[11]。
以上研究主要從經(jīng)濟(jì)主體出發(fā),對“一帶一路”倡議下的市場活動變化展開探索,但少有文獻(xiàn)對“一帶一路”倡議下的國內(nèi)外新聞輿情展開研究。
LDA主題研究屬于大數(shù)據(jù)科學(xué)范疇。Blei等提出LDA主題模型,該模型按時(shí)間將原始文本進(jìn)行切片,在每個(gè)時(shí)間窗口中進(jìn)行LDA建模,得到話題強(qiáng)度和內(nèi)容在時(shí)間上的演化[12];Griffiths等提出后離散分析方法,該方法忽略時(shí)間影響,將LDA模型應(yīng)用到原始文本集中,重點(diǎn)在于發(fā)現(xiàn)熱話題和冷話題[13];Blei等之后又提出了ILDA模型,采用Gibbs抽樣方法,在每個(gè)時(shí)間窗口話題數(shù)可變的情況下研究話題的演化[14]。在話題關(guān)聯(lián)和演化研究方面,通常利用KL距離來衡量主題間相似性,并基于此得到話題內(nèi)容的演化結(jié)果,王少楠、陳興蜀、王婷婷等學(xué)者也對此進(jìn)行了相關(guān)應(yīng)用研究[15-16]。
本文利用國內(nèi)外新聞數(shù)據(jù)進(jìn)行LDA主題建模分析,研究國內(nèi)外“一帶一路”沿線國家和地區(qū)對該項(xiàng)目的關(guān)注重點(diǎn)及強(qiáng)度,同時(shí)根據(jù)關(guān)注點(diǎn)的演化路徑,探索“一帶一路”建設(shè)規(guī)律。針對國內(nèi)新聞輿情展開以上研究,將有利于指導(dǎo)國內(nèi)企業(yè)與組織調(diào)整發(fā)展戰(zhàn)略,優(yōu)化資源配置;針對國外新聞輿情展開上述研究,將有利于中國針對不同國家的國情以及需求制定相應(yīng)的合作策略,以達(dá)到與世界各國相互合作、共同發(fā)展的目標(biāo)。
LDA模型是近年來提出的一種具有本文主題表示能力的非指導(dǎo)學(xué)習(xí)模型。作為一種產(chǎn)生式模型,LDA模型已經(jīng)成功地應(yīng)用到文本分類、信息檢索等諸多文本分析領(lǐng)域。
LDA模型的建模過程是一個(gè)文檔生成的過程。對于語料庫中的每一篇文檔,LDA模型定義了如下生成過程:第一步,以一定的概率在若干個(gè)主題中選取某個(gè)主題;第二步,以一定的概率在選中的主題中選取某個(gè)詞語,不斷地選擇N個(gè)詞語,得到一片長度為N的文檔。
比較話題的相似度,主要在于衡量其主題在詞匯空間的概率分布的相似性,因此可視之為兩個(gè)主題在詞匯空間上分布的距離,又因?yàn)閮蓚€(gè)向量屬于相同維度上的分布,本文采用KL距離作為衡量標(biāo)準(zhǔn):
其中D(t1‖t2)為t1與t2間的KL距離,t1與t2分別為主題1與主題2在詞匯空間V上的分布。
對于不同文本集建模所得到的主題,其詞匯分布不盡相同,由此造成KL距離計(jì)算的限制。為解決該問題,本文引入話題在未出現(xiàn)訓(xùn)練文本集上的平滑技術(shù),通過平滑可構(gòu)建話題在新詞匯空間的分布,然后根據(jù)新詞匯空間中不同話題的分布來衡量其相似度,采取的數(shù)據(jù)平滑算法包括拉普拉斯平滑和古德圖靈平滑算法。
LDA建模過程中,Gibbs Sampling方法的參數(shù)推理結(jié)果如下:
其中wi為原詞匯空間V上的詞,wnew為未在V中出現(xiàn)而在V′中出現(xiàn)的詞匯,由此完成主題在詞匯分布的平滑,便于分析主題間的關(guān)聯(lián)性。
四、“一帶一路”新聞輿情實(shí)證分析
本文采用Python3.5爬蟲技術(shù)收集數(shù)據(jù)。關(guān)于國內(nèi)新聞輿情,選擇中國新聞媒體門戶網(wǎng)站“新浪新聞”,以“一帶一路”為關(guān)鍵詞,爬取自2015年3月至2017年5月有關(guān)“一帶一路”的所有新聞報(bào)道;關(guān)于國際新聞輿情數(shù)據(jù),選擇可獲取相關(guān)信息的 “一帶一路”沿線國家的英文新聞門戶網(wǎng)站,以“the Belt and Road Initiatives” 或“ One Belt One Road”為關(guān)鍵詞,獲得了俄羅斯、印度、巴基斯坦等共計(jì)15個(gè)國家的新聞數(shù)據(jù)。
本文對收集數(shù)據(jù)進(jìn)行清洗與整理,包括對獲取新聞文本數(shù)據(jù)進(jìn)行時(shí)間、地區(qū)分類等,同時(shí)為便于開展LDA建模分析,對數(shù)據(jù)進(jìn)行分詞處理。采用R軟件及相關(guān)程序包,實(shí)現(xiàn)文本數(shù)據(jù)處理和LDA主題建模過程,具體步驟如下:
第一步,確定分詞。本文使用數(shù)據(jù)包含中文和英文兩種:英文處理方式是將單詞按空格分割,再提取單詞詞干(還原各類動詞的一般形式);中文文本由于缺乏明顯分割界限,需根據(jù)不同單詞的具體語義概念予以區(qū)分。本文采用R軟件JiebaR程輯包的Jieba分詞引擎,該算法以單詞查找樹編寫為基礎(chǔ),基于Trie樹結(jié)構(gòu)對整個(gè)詞匯空間進(jìn)行遍歷,分詞結(jié)果高效且準(zhǔn)確。
第二步,過濾停用詞。本文中文停用詞結(jié)合“哈工大停用詞詞庫”和“百度停用詞表”,提煉出一份較完整的中文停用詞表;英文停用詞表采用通用英文停用詞詞庫。
基于實(shí)證數(shù)據(jù),數(shù)據(jù)預(yù)處理的分詞結(jié)果見圖1。
圖1 國內(nèi)新聞輿情分詞效果一圖
圖1是未去除停用詞的分詞詞云展示,從中可看到JiebaR的分詞效果準(zhǔn)確率較高。若進(jìn)一步研究新聞輿情對“一帶一路”的關(guān)注側(cè)重點(diǎn),還需要加入更具體的內(nèi)容。進(jìn)行去除停用詞處理后,所得結(jié)果見圖2。
圖2 國內(nèi)新聞輿情分詞效果二圖
由圖2可看出,改進(jìn)后的分詞結(jié)果更加明顯地展現(xiàn)了“一帶一路”的關(guān)注重點(diǎn),所有新聞均圍繞“合作”這個(gè)中心詞而關(guān)注國際間的發(fā)展建設(shè)。國際新聞輿情的詞云效果見圖3。
圖3 國際新聞輿情分詞效果圖
從圖3可看到,在國際新聞輿情方面,關(guān)于“一帶一路”的報(bào)道均緊緊圍繞“China”這個(gè)關(guān)鍵詞,關(guān)注重點(diǎn)在“cooperation(合作)”、“development(發(fā)展)”、“trade(貿(mào)易)”等方面。
基于國內(nèi)媒體關(guān)于“一帶一路”的新聞報(bào)道,本文嘗試探究不同時(shí)段內(nèi)新聞輿情對于“一帶一路”的關(guān)注重點(diǎn)有何不同,同時(shí)探尋“一帶一路”建設(shè)進(jìn)程中的相關(guān)話題如何沿時(shí)間演化。
1.國內(nèi)“一帶一路”輿情熱點(diǎn)主題分布。將數(shù)據(jù)按不同時(shí)間劃分到不同跨度的時(shí)間窗口中,并對各個(gè)時(shí)間窗口數(shù)據(jù)分別進(jìn)行LDA主題建模,按照主題對關(guān)鍵詞的覆蓋率不低于90%以及主題間關(guān)鍵詞出現(xiàn)頻率差別最大化的原則,將主題數(shù)設(shè)置為10,建模結(jié)果所得各主題關(guān)鍵詞見表1。
表1 2016年第一季度各主題關(guān)鍵詞表
根據(jù)各主題關(guān)鍵詞可推斷:熱點(diǎn)主題3與中國和中東地區(qū)的戰(zhàn)略合作有關(guān);熱點(diǎn)主題9與兩會中討論地方城市如何加強(qiáng)國際交流與合作以對接“一帶一路”的話題有關(guān);熱點(diǎn)主題10與長江經(jīng)濟(jì)帶和“一帶一路”倡議對接有關(guān),據(jù)此分析各時(shí)間窗口中的熱點(diǎn)主題排行,得到不同時(shí)段新聞輿情對于“一帶一路”的關(guān)注熱點(diǎn)的分布。2016年四季度不同主題概率強(qiáng)度分布見表2。
表2可以看到,一季度新聞輿情熱點(diǎn)為主題3、10、9;二季度熱點(diǎn)為主題10、1、3;三季度熱點(diǎn)為主題3、8、7;四季度熱點(diǎn)為主題4、8、3,話題強(qiáng)度具體計(jì)算公式為:
其中P(ti|Ωi)為時(shí)間窗口Ωi內(nèi)主題ti的概率,d表示該時(shí)間窗口內(nèi)的各篇文檔。
基于上述分析方法,本文對2015年3月至2017年5月新聞文本按季度進(jìn)行分析,得到“一帶一路”新聞中排名前三的熱點(diǎn)話題,見圖4(1)~(2)。
圖4(2) 2015年3月至2017年5月各季度“一帶一路”新聞熱點(diǎn)話題排名前三位圖
從圖4(1)~(2)結(jié)果可以看出,不同熱點(diǎn)話題在時(shí)間軸上的分布呈現(xiàn)不同特點(diǎn),其中有關(guān)基礎(chǔ)設(shè)施建設(shè)合作的熱點(diǎn)話題貫穿整個(gè)時(shí)間軸,但每季度的具體特點(diǎn)各不相同:2015年第一季度的關(guān)注重點(diǎn)在于亞洲國家之間的基礎(chǔ)設(shè)施建設(shè)合作;2015年第四季度的關(guān)注重點(diǎn)則與金融相關(guān),是基礎(chǔ)設(shè)施建設(shè)投資方面的合作;2016年第二季度關(guān)于基建的關(guān)注重點(diǎn)是企業(yè)參與國家間的基礎(chǔ)設(shè)施建設(shè)合作;2017年第一季度關(guān)注重點(diǎn)是“一帶一路”沿線國家的基礎(chǔ)設(shè)施的互聯(lián)互通;2017年4月、5月重點(diǎn)關(guān)注的則是中歐班列的開通以及“一帶一路”沿線的旅游合作。由此可見,在“一帶一路”倡議下國際間基礎(chǔ)設(shè)施的建設(shè)合作在不斷深化與推進(jìn)。
2.國內(nèi)“一帶一路”輿情熱點(diǎn)話題演化。在得到每季度熱點(diǎn)話題分布之后,本文進(jìn)一步探究相鄰時(shí)間周期內(nèi)熱點(diǎn)話題的演化情況,即某一熱點(diǎn)話題因人們關(guān)注重點(diǎn)隨時(shí)間如何演化成為其他熱點(diǎn)話題,具體方法為:衡量相鄰兩季度不同主題之間的相似程度,然后以量化相似度為標(biāo)準(zhǔn),將相似度最高的兩個(gè)主題建立關(guān)聯(lián),并認(rèn)為二者之間存在著演化關(guān)系,該研究將有助于更好追蹤輿情變化情況,在一定程度上也可幫助預(yù)測熱點(diǎn)話題的未來演化情況。限于篇幅,此處僅對上述排名前三的熱點(diǎn)話題演化過程進(jìn)行分析。
利用LDA建模結(jié)果得出三個(gè)主題在詞匯空間的分布,見圖5。由圖5可看出,主題1與主題2在詞匯空間上分布相似度較高,主題3則與其相似度較低。
圖5 主題相似度圖
利用KL距離及數(shù)據(jù)平滑算法衡量三個(gè)主題的相似度,見表3所示。
表3 主題之間KL距離表
KL距離的計(jì)算結(jié)果與圖5所示結(jié)果相吻合,說明用KL距離來衡量主題的相似性可行。按時(shí)間順序,對話題強(qiáng)度排名前三的熱點(diǎn)話題進(jìn)行了演化關(guān)聯(lián)分析,得到結(jié)果見圖6(1)~(2)。
從演化分析結(jié)果可以看到,熱點(diǎn)話題之間的演化關(guān)系存在一定的規(guī)律:
第一,基礎(chǔ)設(shè)施建設(shè)相關(guān)話題的演化。2015年第三季度中的中國-東盟合作規(guī)劃是由2015年第一季度亞洲基礎(chǔ)設(shè)施建設(shè)合作的熱點(diǎn)話題發(fā)酵而成的,其后2015年第四季度的中國-東盟產(chǎn)能合作又是由第三季度中的合作規(guī)劃話題演化而來,這證明了圍繞“一帶一路”各方面的合作在不斷地向前推進(jìn)并具體化。
第二,文化交流合作方面的話題演化。從2015年第一季度熱點(diǎn)話題中的留學(xué)生交流學(xué)習(xí)演化至絲路沿線文化交流,從中國-中東歐經(jīng)貿(mào)合作演化到重要節(jié)點(diǎn)城市間的溝通交流,其間涉及絲路沿線的文化融合;而后熱點(diǎn)話題聚焦于科技創(chuàng)新的協(xié)同推動與共同發(fā)展,該路徑有力說明了文化交流一直是新聞輿情中關(guān)注的重要面,不論是以經(jīng)貿(mào)合作為主題還是以城市間的溝通交流為主題,或者涉及留學(xué)生交流以及人才教育培養(yǎng)等方面,其間均包含著對于文化交流的關(guān)注。
圖6(2) 話題演化過程圖
為探究不同國家和地區(qū)對于“一帶一路”相關(guān)新聞報(bào)道的關(guān)注側(cè)重面有何不同,本文將獲取到的不同國家與地區(qū)的新聞文本數(shù)據(jù)進(jìn)行LDA主題建模,比較各個(gè)主題在不同國家和地區(qū)的新聞報(bào)道中出現(xiàn)的概率,以此確定各個(gè)國家對于“一帶一路”倡議的新聞輿情關(guān)注重點(diǎn);再根據(jù)關(guān)注重點(diǎn)將國家進(jìn)行聚類,并根據(jù)分類結(jié)果為不同國家制定投資合作策略提供決策參考。
1.“一帶一路”國際新聞的LDA主題建模。依據(jù)國家官方網(wǎng)站信息量的可獲取度,從“一帶一路”沿線64個(gè)國家中篩選出15個(gè)國家,依次為俄羅斯、阿聯(lián)酋、巴基斯坦、菲律賓、哈薩克斯坦、卡塔爾、馬來西亞、沙特阿拉伯、泰國、新加坡、伊朗、以色列、印度、印度尼西亞、越南,為后文論述方便將其分別記為數(shù)字1~15。
本文將來自以上15個(gè)國家官方網(wǎng)站的“一帶一路”主題新聞?wù)沓蔀?5份文檔,其中所包含的英文新聞數(shù)量不盡相同:沙特阿拉伯、以色列、哈薩克斯坦為200篇左右;菲律賓、巴基斯坦、俄羅斯為100篇左右;新加坡、伊朗為50篇左右;阿聯(lián)酋、馬來西亞、印度、卡塔爾、泰國、印度尼西亞、越南約為20篇左右,對其進(jìn)行LDA主題建模分析,按照主題對關(guān)鍵詞的覆蓋率不低于90%以及主題間關(guān)鍵詞出現(xiàn)頻率差別最大化的原則,將主題數(shù)設(shè)置為8。對文檔進(jìn)行LDA主題建模后,各主題在不同國家的強(qiáng)度概率分布見圖7所示,圖7橫軸代表國家,縱軸代表各主題分布強(qiáng)度。
各主題中關(guān)鍵詞分布見表4。
表4 各主題關(guān)鍵詞分布表
主題1中包含billion(十億)、trade(貿(mào)易)、business(商業(yè))等詞匯,可推斷主題1與“一帶一路”框架下國家間的商貿(mào)合作有關(guān)。由圖7可看出,主題1在阿聯(lián)酋、馬來西亞、泰國和新加坡的新聞報(bào)道中出現(xiàn)概率最高,因此可推斷這些國家的關(guān)注重點(diǎn)在國際商貿(mào)合作領(lǐng)域;類似可大致推斷,主題2與基礎(chǔ)設(shè)施建設(shè)有關(guān),關(guān)注這一熱點(diǎn)的國家包括俄羅斯、越南、伊朗;主題3與國家間政策溝通有關(guān),主要關(guān)注國家有沙特阿拉伯;主題4與國家間交流有關(guān),主要關(guān)注國家包括阿聯(lián)酋、巴基斯坦、卡塔爾、泰國;主題5的關(guān)鍵詞基本為城市名稱,可推斷主題5與城市間溝通交流有關(guān),主要關(guān)注國家有印度;主題6與政府間合作有關(guān),主要關(guān)注國家包括哈薩克斯坦、馬來西亞、印度;主題7出現(xiàn)的關(guān)鍵詞均與印度尼西亞有關(guān),主要關(guān)注國家也是印度尼西亞;主題8與國家間合作平臺或組織有關(guān),主要關(guān)注國家包括俄羅斯與哈薩克斯坦。
2.基于“一帶一路”國際新聞輿情的聚類分析。本文采用層次聚類的方法,對各個(gè)國家和地區(qū)的文檔依據(jù)在不同主題的概率分布將其聚類,結(jié)果見表5。
表5 關(guān)于各國新聞輿情主題分布的聚類分析結(jié)果表
由表5聚類結(jié)果可見,同一類的國家和地區(qū)存在著一定程度上的相似性??紤]各國的GDP總量(如圖8所示),俄羅斯、哈薩克斯坦、伊朗、越南都屬于陸上與中國合作較為密切的國家,回顧前述主題分析結(jié)論,發(fā)現(xiàn)該類國家主要關(guān)注主題2和主題6,即基礎(chǔ)設(shè)施建設(shè)和政府間合作;阿聯(lián)酋、馬來西亞、新加坡屬于經(jīng)濟(jì)發(fā)展?fàn)顩r排名中游且較為相似的國家,主要關(guān)注主題1,即國家間的商貿(mào)合作交流;菲律賓、巴基斯坦、卡塔爾、泰國屬于經(jīng)濟(jì)發(fā)展?fàn)顩r排名相對較為靠后的國家,主要關(guān)注主題4,即國家間相互交流合作;沙特阿拉伯、以色列、印度則屬于經(jīng)濟(jì)發(fā)展?fàn)顩r良好且GDP排名靠前的國家和地區(qū),主要關(guān)注國家間的政策溝通與城市間交流;印度尼西亞屬于經(jīng)濟(jì)發(fā)展水平較高的群島國家,對于“一帶一路”倡議的合作項(xiàng)目與陸上國家均有所區(qū)別,在聚類結(jié)果中被單獨(dú)列為一類。
圖8 各國GDP總量圖
綜上所述,以LDA主題建模結(jié)果進(jìn)行層次聚類,大致將對“一帶一路”關(guān)注側(cè)面不同的國家和地區(qū)進(jìn)行區(qū)分,該結(jié)果將為“一帶一路”沿線國家采取差異化決策提供數(shù)據(jù)支持。
本文針對國內(nèi)“一帶一路”建設(shè)進(jìn)程中相關(guān)新聞的統(tǒng)計(jì)分析,有以下幾點(diǎn)發(fā)現(xiàn):第一,盡管不同時(shí)段的新聞輿情的關(guān)注重點(diǎn)各有不同,但核心主題均圍繞“合作”而展開,基礎(chǔ)設(shè)施建設(shè)合作與各國文化交流溝通作為熱點(diǎn)話題貫穿始終,這與“一帶一路”倡議中平等文化框架下談合作的精神十分契合;第二,不同時(shí)段中,熱點(diǎn)話題的演化尤其是新熱點(diǎn)話題的出現(xiàn),在很大程度上受某一熱點(diǎn)事件被廣泛報(bào)道的影響。
本文對于國內(nèi)新聞輿情的分析,有助于了解“一帶一路”倡議的關(guān)注重點(diǎn)以及最新熱點(diǎn)事件及其影響,對于各類組織和企業(yè)及時(shí)調(diào)整戰(zhàn)略方向和目標(biāo)、優(yōu)化資源配置、更好配合推動“一帶一路”倡議實(shí)施、增強(qiáng)與各個(gè)國家和地區(qū)的交流與溝通,具有較強(qiáng)的指導(dǎo)意義。
本文針對國際社會對“一帶一路”倡議的新聞報(bào)道進(jìn)行分析,基于關(guān)注主題對沿線國家和地區(qū)進(jìn)行聚類和區(qū)分,有助于明確各國家和地區(qū)對于“一帶一路”倡議的差異化期望與需求,有針對性開展項(xiàng)目合作,真正做到沿線國家間的優(yōu)勢互補(bǔ)、溝通協(xié)作和互聯(lián)互通,為沿線國家提供互利共贏的合作機(jī)會和國際合作新平臺。
本文采用LDA主題模型建模分析、層次聚類等統(tǒng)計(jì)方法,對國內(nèi)外在“一帶一路”建設(shè)進(jìn)程中的新聞輿情進(jìn)行分析,提煉出各類新聞報(bào)道的主題內(nèi)涵,明晰了相關(guān)新聞輿情演化路徑。
本文的研究結(jié)果,可在一定程度上反映國家或地區(qū)對“一帶一路”倡議的關(guān)注重點(diǎn)和強(qiáng)度,以期對衡量“一帶一路”建設(shè)項(xiàng)目在該地區(qū)的進(jìn)展速度及建設(shè)成效提供評價(jià)與借鑒。
參考文獻(xiàn):
[1] 許和連,孫天陽,成麗紅.“一帶一路” 高端制造業(yè)貿(mào)易格局及影響因素研究——基于復(fù)雜網(wǎng)絡(luò)的指數(shù)隨機(jī)圖分析[J].財(cái)貿(mào)經(jīng)濟(jì),2015(12).
[2] 鄒嘉齡,劉春臘,尹國慶,唐志鵬.中國與“一帶一路”沿線國家貿(mào)易格局及其經(jīng)濟(jì)貢獻(xiàn)[J].地理科學(xué)進(jìn)展,2015(5).
[3] 張會清,唐海燕.中國與“一帶一路”沿線地區(qū)的貿(mào)易聯(lián)系問題研究——基于貿(mào)易強(qiáng)度指數(shù)模型的分析[J].國際經(jīng)貿(mào)探索,2017(3).
[4] 李彬彬.“一帶一路”倡議背景下中國高新技術(shù)產(chǎn)品對阿拉伯國家出口流量及潛力分析[J].統(tǒng)計(jì)與信息論壇,2017(6).
[5] 曹偉,言方榮,鮑曙明.人民幣匯率變動、鄰國效應(yīng)與雙邊貿(mào)易——基于中國與“一帶一路”沿線國家空間面板模型的實(shí)證研究[J].金融研究,2016(9).
[6] 保建云.論我國“一帶一路”海外投資的全球金融影響,市場約束及 “敵意風(fēng)險(xiǎn)” 治理[J].中國軟科學(xué),2017(3).
[7] 趙明亮.國際投資風(fēng)險(xiǎn)因素是否影響中國在“一帶一路”國家的OFDI——基于擴(kuò)展投資引力模型的實(shí)證檢驗(yàn)[J].國際經(jīng)貿(mào)探索,2017(2).
[8] 楊麗花,周麗萍,翁東玲.絲路基金、PPP與“一帶一路”建設(shè)——基于博弈論的視角[J].亞太經(jīng)濟(jì),2016(2).
[9] 龔靜,尹忠明.鐵路建設(shè)對我國“一帶一路”戰(zhàn)略的貿(mào)易效應(yīng)研究——基于運(yùn)輸時(shí)間和運(yùn)輸距離視角的異質(zhì)性隨機(jī)前沿模型分析[J].國際貿(mào)易問題,2016(2).
[10] 蔡中華,王一帆,董廣巍.中國在“一帶一路”國家專利與出口結(jié)構(gòu)關(guān)系的研究——基于行業(yè)層面相似度指數(shù)的分析[J].國際貿(mào)易問題,2016(7).
[11] 劉總理,陳璇.我國有色金屬產(chǎn)業(yè)參與“一帶一路”多邊經(jīng)濟(jì)戰(zhàn)略合作模研究[J].西安財(cái)經(jīng)學(xué)院學(xué)報(bào),2017(3).
[12] Blei D M,Ng A Y,Jordan M I.Latent Dirichlet Allocation[J].Journal of Machine Learning Research,2003,3(1).
[13] Griffiths T L,Steyvers M.Finding Scientific Topics[J].Proceedings of the National Academy of Sciences,2004,(1).
[14] Blei D M,Lafferty J D.A Correlated Topic Model of Science[J].The Annals of Applied Statistics,2007,1(2).
[15] 王少楠,宗成慶.雙通道LDA模型的漢語詞義表示與歸納方法[J].計(jì)算機(jī)學(xué)報(bào),2016(8).
[16] 陳興蜀,羅梁,王海洲,王文賢,高悅.基于ICE-LDA模型的中英文跨語言話題發(fā)現(xiàn)研究[J].工程科學(xué)與技術(shù),2017(3).