黃義兵 劉玉林
內(nèi)容摘要:本文以中國知網(wǎng)654篇商貿(mào)流通業(yè)文獻為實證數(shù)據(jù),進行描述性分析討論商貿(mào)流通業(yè)研究活躍度,并基于Python分詞對文獻摘要分詞并構(gòu)建詞袋模型,在詞袋模型基礎(chǔ)上對高頻詞應(yīng)用復雜網(wǎng)絡(luò)技術(shù)可視化,然后對高頻詞網(wǎng)絡(luò)進行拓撲特性研究,以此探討商貿(mào)流通業(yè)文獻研究熱點的表現(xiàn)。
關(guān)鍵詞:商貿(mào)流通業(yè) ? Python ? 詞袋模型 ? 復雜網(wǎng)絡(luò)算法 ? 熱點
改革開放歷經(jīng)40余年,我國商業(yè)流通領(lǐng)域的理論研究和實踐探索都取得了可喜成績。此時,采集中國知網(wǎng)收錄的文獻并進行熱點分析,有力于厘清商貿(mào)流通業(yè)的研究現(xiàn)狀,總結(jié)發(fā)展經(jīng)驗和討論未來的發(fā)展趨勢。
數(shù)據(jù)準備
在對中國知網(wǎng)以“商貿(mào)流通業(yè)”為篇名檢索后,在“中國學術(shù)期刊網(wǎng)絡(luò)出版總庫”中共計654篇文章,時期跨度為1995年至2018年共24年時間。
首先,以年維度進行分組后匯總?cè)鐖D1所示,在對商貿(mào)流通業(yè)研究方面,我國自1995年開始,總體上呈現(xiàn)出逐年增長的態(tài)勢,2017年收錄文獻達152篇,說明商貿(mào)流通業(yè)成為經(jīng)濟管理研究的熱門領(lǐng)域之一。
其次,在檢索文章基金方面,圖2顯示30%的文獻比例是有基金項目支持的,并且在有基金支持的文獻中6%來自國家自然或者社科基金。從圖3年分布角度看,2002年以前文獻沒有任何基金支持,從2002年開始逐年增長,2012年占比近50%,2017年基本占比超過40%??梢妵?、企事業(yè)單位等對商貿(mào)流通業(yè)問題研究給予了很大重視和支持。
最后,在作者發(fā)表文獻數(shù)量方面,表1顯示654篇文獻共有作者63位,平均每位作者發(fā)表10.38篇,長期研究作者(3篇及其以上)僅7位(占比3.17%),反應(yīng)出我國在商貿(mào)流通業(yè)問題研究持續(xù)性方面還有待于進一步提升。
復雜網(wǎng)絡(luò)可視化分析
在對商貿(mào)流通業(yè)文獻研究內(nèi)容分析時,最主要的數(shù)據(jù)來源是摘要。摘要是對論文的高度概括,其中往往表明作者對論文的研究目的、研究內(nèi)容、研究方法和結(jié)論等具體闡述。以往對文獻計量研究較多集中在關(guān)鍵詞、參考文獻等方面,雖然也能體現(xiàn)文獻信息的豐富性,但均不及摘要對于研究內(nèi)容的關(guān)鍵性強。本文以中國知網(wǎng)654篇商貿(mào)流通業(yè)文獻摘要為實證對象,利用Python分詞技術(shù),進行詞袋模型分析,識別文獻與詞袋模型的關(guān)聯(lián)關(guān)系,并建立復雜網(wǎng)絡(luò),從高頻詞網(wǎng)絡(luò)圖中分別對網(wǎng)絡(luò)形態(tài)和拓撲性質(zhì)進行分析,探析商貿(mào)流通業(yè)文獻研究熱點。
(一)Python詞袋模型分析
在Python編程中調(diào)用jieba分詞進行高頻詞統(tǒng)計,在利用高頻詞進行詞袋模型制表時,首先設(shè)置詞頻閾值為100,其次人工刪除“本文”、“相關(guān)”、“基于”等無實際意義高頻詞,以及“商貿(mào)流通業(yè)”等檢索性質(zhì)高頻詞,最終總結(jié)出48個高頻詞用于詞袋模型分析,具體見表2所示。
基于篩選高頻詞建立的詞袋模型見表3所示。在表3中對文獻根據(jù)發(fā)表時間進行編號,從1-654號。每個高頻詞作為列,如果在文獻摘要中出現(xiàn)記數(shù)字1,不出現(xiàn)記數(shù)字0。
(二)基于詞袋模型的高頻詞研究熱點網(wǎng)絡(luò)
利用表3中的詞袋模型分別對高頻詞復雜網(wǎng)絡(luò)化,通過網(wǎng)絡(luò)拓撲性質(zhì)進行高頻詞拓撲特性研究。
圖4高頻詞網(wǎng)絡(luò)拓撲圖顯示出48個高頻詞具有非常緊密的關(guān)聯(lián)性,在商貿(mào)流通業(yè)研究網(wǎng)絡(luò)中呈現(xiàn)緊密合作關(guān)系。具體表現(xiàn)在:連通性檢查為高頻詞網(wǎng)絡(luò)為連通圖,說明48個高頻詞在654篇商貿(mào)流通業(yè)文獻中為高度連通性,即兩兩節(jié)點均能實現(xiàn)連接;網(wǎng)絡(luò)密度density=0.193,說明實際邊連接數(shù)與最大連接數(shù)之比為19.3%,同時平均路徑長度為2.37,兩個數(shù)值在復雜網(wǎng)絡(luò)中較好,呈現(xiàn)出較好的網(wǎng)絡(luò)連接性,說明高頻詞合作性較強;圖5顯示高頻詞網(wǎng)絡(luò)度分布集中在40-50區(qū)間,說明每個高頻詞均有較強的熱點表現(xiàn);同配系數(shù)r= -0.05818,說明高頻詞網(wǎng)絡(luò)中變現(xiàn)出較小的異配性,即總體上度大的高頻詞節(jié)點有微弱傾向于連接度小的高頻詞,即不存在巨型關(guān)鍵詞,48個高頻詞均表現(xiàn)出較好的關(guān)鍵性;利用割集理念對圖3進行路勁分割計算,使表4成為不連通網(wǎng)絡(luò)需要分割的節(jié)點數(shù)為42,這進一步說明高頻詞的高度緊密性。
當然,通過對高頻詞網(wǎng)絡(luò)進行最小生成樹算法,結(jié)果如圖6所示,圖6表明雖然48個高頻詞均有較好的表現(xiàn),但“城鄉(xiāng)”高頻詞節(jié)點變現(xiàn)出較好的中心性,是網(wǎng)絡(luò)中連通的最佳節(jié)點。
研究熱點分析
通過對654篇商貿(mào)流通業(yè)文獻摘要詞袋模型和網(wǎng)絡(luò)化分析,總結(jié)研究熱點如下:
城鄉(xiāng)商貿(mào)流通業(yè)被高度關(guān)注。隨著我國城鎮(zhèn)化進程加快,城鄉(xiāng)商貿(mào)流通業(yè)協(xié)調(diào)發(fā)展獲得研究的高度關(guān)注,是熱點之一。例如,李秀麗淺析我國城鎮(zhèn)化與商貿(mào)流通業(yè)的互動發(fā)展,韓英討論我國商貿(mào)流通業(yè)城鄉(xiāng)市場分割的表現(xiàn)及統(tǒng)籌發(fā)展途徑,方維研究城鄉(xiāng)商貿(mào)統(tǒng)籌背景下我國商貿(mào)流通業(yè)的轉(zhuǎn)型升級問題,柳春巖基于農(nóng)村商貿(mào)流通業(yè)的農(nóng)產(chǎn)品供應(yīng)鏈研究商貿(mào)流通業(yè)城鄉(xiāng)協(xié)調(diào)發(fā)展戰(zhàn)略等。
互聯(lián)網(wǎng)流通成為新熱點?;ヂ?lián)網(wǎng)購物作為“中國新四大發(fā)明”之一,發(fā)展迅速,影響力廣,并且極大帶動了商貿(mào)流通業(yè)發(fā)展,因此互聯(lián)網(wǎng)流通成為新研究熱點之一。例如,方巍巍研究“互聯(lián)網(wǎng)+”背景下我國商貿(mào)流通業(yè)與GDP增長的協(xié)同發(fā)展情況,郭莉娜思考“互聯(lián)網(wǎng)+”背景下商貿(mào)流通業(yè)發(fā)展戰(zhàn)略選擇,張文宏研究基于“互聯(lián)網(wǎng)+”與消費升級環(huán)境的商貿(mào)流通業(yè)發(fā)展路徑,黃巖比較“互聯(lián)網(wǎng)+”背景下我國商貿(mào)流通業(yè)競爭力等。
商貿(mào)流通業(yè)問題和實證研究一直受青睞。商貿(mào)流通業(yè)發(fā)展和改革中的具體問題和實證研究,一直備受研究界關(guān)注,比如,殷少明特別研究新疆商貿(mào)流通業(yè)發(fā)展的現(xiàn)狀、問題與對策,謝紅對拉薩市商貿(mào)流通業(yè)發(fā)展進行關(guān)注和思考,馮丹探索江蘇省商貿(mào)流通業(yè)競爭力提升路徑,王雪鋒關(guān)注四川商貿(mào)流通業(yè)發(fā)展的現(xiàn)狀、問題及對策。
商貿(mào)流通業(yè)技術(shù)創(chuàng)新不斷被提及。技術(shù)、創(chuàng)新是變革商貿(mào)流通業(yè)的重要力量,受到學者持續(xù)性關(guān)注和研究。例如,沈飛認為投入服務(wù)化技術(shù)創(chuàng)新可以影響商貿(mào)流通業(yè)碳生產(chǎn)率,王曉棟探索互聯(lián)網(wǎng)技術(shù)對商貿(mào)流通業(yè)協(xié)同發(fā)展影響,學者俞靜認為技術(shù)創(chuàng)新提高商貿(mào)流通業(yè)轉(zhuǎn)型升級的作用一直呈遞增趨勢。
結(jié)論
本文通過對中國知網(wǎng)1995-2018年654篇商貿(mào)流通業(yè)文獻進行采集和數(shù)據(jù)預處理,基于描述性分析發(fā)現(xiàn)商貿(mào)流通業(yè)研究呈現(xiàn)出持續(xù)向好的局勢,包括數(shù)量的提升、基金的支持等。本文通過以商貿(mào)流通業(yè)文獻摘要為基礎(chǔ),利用Python分詞技術(shù)構(gòu)建詞袋模型,并設(shè)置閾值和人工篩選出48個高頻詞,基于詞袋模型和復雜網(wǎng)絡(luò)技術(shù)討論48個關(guān)鍵詞在654篇商貿(mào)流通業(yè)文獻中的活躍表現(xiàn),得出“緊密合作,高度影響”的現(xiàn)狀,并基于48個高頻詞定性剖析出四大研究熱點,即城鄉(xiāng)商貿(mào)流通業(yè)被高度關(guān)注、互聯(lián)網(wǎng)流通成為新熱點、商貿(mào)流通業(yè)問題和實證研究一直受青睞、商貿(mào)流通業(yè)技術(shù)創(chuàng)新不斷被提及。
參考文獻:
1.李秀麗.淺析我國城鎮(zhèn)化與商貿(mào)流通業(yè)的互動發(fā)展[J].商業(yè)經(jīng)濟研究,2015(19)
2.韓英.我國商貿(mào)流通業(yè)城鄉(xiāng)市場分割的表現(xiàn)及統(tǒng)籌發(fā)展途徑[J].商業(yè)經(jīng)濟研究,2016(2)
3.方維.城鄉(xiāng)商貿(mào)統(tǒng)籌背景下我國商貿(mào)流通業(yè)的轉(zhuǎn)型升級[J].商業(yè)經(jīng)濟研究,2016(13)
4.柳春巖.基于農(nóng)村商貿(mào)流通業(yè)的農(nóng)產(chǎn)品供應(yīng)鏈—商貿(mào)流通業(yè)城鄉(xiāng)協(xié)調(diào)發(fā)展戰(zhàn)略研究(之一)[J].中國市場,2007(49)
5.方巍巍.“互聯(lián)網(wǎng)+”背景下我國商貿(mào)流通業(yè)與GDP增長的協(xié)同發(fā)展研究[J].價格月刊,2017(3)
6.郭莉娜.“互聯(lián)網(wǎng)+”背景下商貿(mào)流通業(yè)發(fā)展戰(zhàn)略選擇與思考[J].商業(yè)經(jīng)濟研究,2017(5)
7.張文宏.基于“互聯(lián)網(wǎng)+”與消費升級環(huán)境的商貿(mào)流通業(yè)發(fā)展路徑轉(zhuǎn)變[J].商業(yè)經(jīng)濟研究, 2017(16)
8.黃巖,武云亮.“互聯(lián)網(wǎng)+”背景下我國商貿(mào)流通業(yè)競爭力比較分析[J].商業(yè)經(jīng)濟研究,2017(19)
9.殷少明.新疆流通業(yè)發(fā)展的特征與對策[J].中國商貿(mào),2014(19)
10.謝紅,唐雨虹.關(guān)于拉薩市商貿(mào)流通業(yè)發(fā)展問題和對策的思考[J].中國商論,2017(27)
11.馮丹.江蘇省商貿(mào)流通業(yè)競爭力提升路徑研究[J].物流技術(shù),2015(21)
12.王雪鋒.四川商貿(mào)流通業(yè)發(fā)展的現(xiàn)狀、問題及對策[J].中國商貿(mào),2013(28)
13.沈飛.投入服務(wù)化技術(shù)創(chuàng)新背景下商貿(mào)流通業(yè)碳生產(chǎn)率時空演進及影響因素研究—基于長三角的實證[J].商業(yè)經(jīng)濟研究,2017(23)
14.王曉棟.互聯(lián)網(wǎng)技術(shù)與商貿(mào)流通業(yè)協(xié)同發(fā)展對技術(shù)創(chuàng)新的影響—基于省級面板數(shù)據(jù)[J].商業(yè)經(jīng)濟研究,2018(2)
15.俞靜,單濤.技術(shù)創(chuàng)新對商貿(mào)流通業(yè)轉(zhuǎn)型升級的影響[J].商業(yè)經(jīng)濟研究,2018(17)