胡熳華,王 翀,韓顯男
(1.中國農(nóng)村技術(shù)開發(fā)中心,北京 100045;2.浙江農(nóng)林大學(xué),浙江 臨安 311300;3.中經(jīng)社控股有限公司,北京 100053)
科普宣傳是利用公眾易于理解、接受和參與的方式來更好地普及自然科學(xué)和社會科學(xué)知識,在傳播科學(xué)思想的同時更好地弘揚科學(xué)精神和推廣科學(xué)技術(shù)??破招麄鞯母灸康氖谴龠M公眾理解和掌握科學(xué)技術(shù),提高科學(xué)素質(zhì)??破招麄鞯膬?nèi)容和時間比較自由,可以隨時把最新科學(xué)思想和最新科技成果向公眾傳播。科普宣傳的形式多樣,途徑靈活,因需施普,科普是具有群眾性和參與性的。因此,作為傳播信息的介質(zhì)媒體在科普宣傳過程中起到了至關(guān)重要的作用。
隨著新一代數(shù)字技術(shù)、網(wǎng)絡(luò)技術(shù)、信息技術(shù)的發(fā)展和應(yīng)用,承載信息介質(zhì)的物質(zhì)形態(tài)發(fā)生了革命性的變革,信息傳播途徑由報刊、戶外、廣播和電視等傳統(tǒng)媒體衍生出了新技術(shù)支撐體系下的新媒體[1]。微博、微信、數(shù)字雜志、數(shù)字報紙、移動電視、網(wǎng)絡(luò)、觸摸媒體等一系列新媒體的出現(xiàn)在迅速地改變著信息世界的接發(fā)方式。以微博為例,其設(shè)計理念是引導(dǎo)人們關(guān)注他感興趣的“人”,并與其建立“關(guān)注”與“被關(guān)注”的關(guān)系。人們在微博平臺上,圍繞包羅萬象的話題,建立起由“人”匯聚成的社區(qū),并在社區(qū)里相互分享信息、新聞、創(chuàng)意和觀點。微博具備了信息傳播迅速及時、傳播面廣、反饋速度快、不受時空限制、傳播行為個性化等優(yōu)勢??破招麄骼梦⒉┒绦 ⒓皶r、點對面的宣傳特點,微博圈內(nèi)的每個人都成為科學(xué)精神宣傳的小喇叭[2-3]。在科普宣傳過程中,也可以通過建立主題微博圈,開展微訪談等多項微博活動。這些豐富多樣的創(chuàng)新模式可以更加廣泛地、系統(tǒng)地、高效地、全方位地宣傳貼近基層和百姓的科普活動[4-5]。
基于受眾廣泛性和參與深入性的特征,將新媒體應(yīng)用于科普活動中會產(chǎn)生巨大的影響。同時,由于新媒體使得傳媒走向了基于數(shù)據(jù)庫的網(wǎng)絡(luò)運行平臺,如何充分挖掘數(shù)據(jù)信息反作用于科普宣傳,便成了輿情研究的重要課題。
目前國內(nèi)較為權(quán)威的觀點認為,“輿情”是由個人及各種社會群體構(gòu)成的公眾,在一定的歷史階段和社會空間內(nèi),對自己關(guān)心或與自身利益緊密相關(guān)的各種公共事務(wù)所持有的多種情緒、意愿、態(tài)度和意見交錯的總和。天津社會科學(xué)院輿情研究所的劉毅認為:網(wǎng)絡(luò)輿情是通過互聯(lián)網(wǎng)表達和傳播的,公眾對自己關(guān)心或與自身利益緊密相關(guān)的各種公共事務(wù)所持有的多種情緒、態(tài)度和意見交錯的總和[6]。
輿情分析需要將定性分析與定量分析相結(jié)合,充分利用人工分析和軟件的應(yīng)用,對網(wǎng)絡(luò)言論進行挖掘和剖析,了解公眾輿論走勢與心理偏好。微博作為互聯(lián)網(wǎng)傳播方式具體形態(tài)之一,微博的輿情反饋對工作的順利開展具有重要意義。同時,通過實驗、示范、培訓(xùn)、交流、服務(wù),把科普與社會生活、生產(chǎn)實踐結(jié)合起來,可直接為社會和經(jīng)濟發(fā)展服務(wù)。根據(jù)社會和經(jīng)濟生活中的熱點問題開展科普是當前有效的、比較流行的方式,因此科普的社會性是顯著的,科普與人文科學(xué)相結(jié)合、突出對人的關(guān)愛是科普形式發(fā)展的又一新趨勢。
文本挖掘又稱為文字知識發(fā)現(xiàn) (Knowledge Discovery from Text,KDT)或是文件信息勘探(Document Information Mining),特別著重于利用信息檢索、信息萃取、計算語言學(xué)、自然語言處理數(shù)據(jù)挖掘等技術(shù),自非結(jié)構(gòu)或半結(jié)構(gòu)的文字中挖掘出先前未知、隱含而有用的信息,Dan Sullivan(2001)定義文本挖掘為“一種編輯、組織及分析大量文件的過程,為了提供特定用戶特定的信息,以及發(fā)現(xiàn)某些特征及其間的關(guān)聯(lián)”。
在對文本數(shù)據(jù)進行分析之前,需要對文本原始數(shù)據(jù)進行預(yù)處理,以排除原始數(shù)據(jù)中的一些無用或冗余的信息。最常用的方法有分詞技術(shù)與詞干提取。分詞 (tokenization)是將一段文本劃分為多個詞項,并去除文本中不表達任何語義信息的停止詞 (stop word)。停止詞指文中出現(xiàn)頻率較高,但是對確定文本主題幾乎沒有用處的詞,如英文文本中的a、the、that和中文文本中的“的”、 “是”、 “得”等。詞干提取(stemming)指去除單詞的詞綴,以得到單詞最一般寫法的過程,如將英文單詞復(fù)數(shù)“boxes”還原為單數(shù)“box”,或者將動詞的不同時態(tài)還原,如“stopped”還原為“stop”等。詞干提取可以避免同一個單詞的不同表示形式對文本分析的影響。
對文檔進行分詞和詞干提取處理后,得到表示該文檔的一組詞項稱為詞袋 (bag of words)。各種文本挖掘任務(wù)可以對提取的關(guān)鍵詞、標記或者語義信息進行,包括文本聚類、分類、信息提取、關(guān)聯(lián)分析和趨勢分析等。
基于關(guān)鍵詞的關(guān)聯(lián)分析輸入的是文檔中關(guān)鍵詞或詞的集合;此類分析收集頻繁一起出現(xiàn)的關(guān)鍵詞或詞匯,然后找出其關(guān)聯(lián)或相互聯(lián)系。關(guān)聯(lián)挖掘過程有助于找出復(fù)合關(guān)聯(lián) (compound associate),即領(lǐng)域相關(guān)的術(shù)語或短語,或非復(fù)合關(guān)聯(lián),如[美元,股票,交易,總額,證券]。
文檔自動分類是文本挖掘的重要任務(wù)。文檔分類已經(jīng)用在自動主題標記、主題目錄構(gòu)建、文檔寫作風格識別,以及對與文檔集合相關(guān)聯(lián)的超鏈接分類中。
文檔聚類是無監(jiān)督方式組織文檔的最關(guān)鍵技術(shù)之一。最著名的聚類技術(shù)主要包括光譜聚類、混合模型聚類、使用潛在語義標引聚類和使用保持局部性標引聚類。其中,光譜聚類方法首先對原始數(shù)據(jù)運行光譜嵌入,然后對維度歸約后的文檔空間運用傳統(tǒng)的聚類算法。光譜聚類表明了處理高度非線性數(shù)據(jù) (數(shù)據(jù)空間在每個局部區(qū)域都有比較高的曲率)的能力。與微分幾何學(xué)的緊密聯(lián)系使它能夠發(fā)現(xiàn)文檔空間中的流形結(jié)構(gòu)。
通過對挖掘得到的信息進行綜合分析和評價來預(yù)測和評估輿情態(tài)勢。綜合評價是對總體中每個個體多方面特征指標的綜合比較,其基本方法是將反映每個個體的各個方面特征的多個指標綜合為一個可概括全面且便于比較的綜合指標,以反映其綜合水平。若將每個個體的綜合指標值按大小順序排隊,則可得到每個個體綜合發(fā)展水平的順序名次,為綜合評比提供了客觀依據(jù),也能綜合反映輿情的關(guān)注熱點排名及趨勢。
本文所使用的文本信息為2012年“科技列車青海行”的新媒體數(shù)據(jù)資料。文本信息參與源類別為:“科技列車行”官方微博、三個支持單位官方微博和參與人員個人微博組成。其中,“科技列車青海行”微博活動的參與人員共有61人,占本次活動總?cè)藬?shù)117人的52.14%。工作人員、記者、農(nóng)業(yè)專家及科普專家開通微博的人數(shù)占各類總?cè)藬?shù)的百分比均超過50%。在各類專家中,農(nóng)業(yè)專家開通且使用微博的人數(shù)比例最大,達到了65.22%。由于醫(yī)療專家的職業(yè)特殊性,開通并且發(fā)布微博的人數(shù)占醫(yī)療專家總?cè)藬?shù)23人的17.39%(見表1)。
表1 “科技列車青海行”微博活動的參與人員統(tǒng)計表
文本信息質(zhì)量和數(shù)量方面,所有科普活動參與人員在發(fā)布微博時都堅持“客觀、真實、準確”的原則,文明上網(wǎng)、理性發(fā)言。截至2012年5月30日,科技列車青海行微博圈中61位參與人員及3個微博支持單位共發(fā)布微博920條,連同網(wǎng)友共發(fā)布微博1200多條,“科技列車行”官方微博聽眾達35000余人。
微訪談是利用微博進行科普宣傳活動的一個重要內(nèi)容,體現(xiàn)出了科普宣傳與時俱進、敢于創(chuàng)新的思路。活動期間,科技部中國農(nóng)村技術(shù)開發(fā)中心邀請了14名列車行專家和相關(guān)領(lǐng)導(dǎo),圍繞科技列車行回顧、農(nóng)居抗震、兩彈精神、日常保健、農(nóng)戶儲糧等主題開展了5場微訪談,有針對性地與網(wǎng)友開展互動話題。為了能夠更好地比較這五次微訪談的輿情和效果,采用綜合評價的方法進行測度。
(1)構(gòu)建科普微訪談效果評價指標體系。評價指標體系的構(gòu)成是進行綜合評價的首要環(huán)節(jié)。選取評價指標體系應(yīng)以綜合評價的目的為依據(jù),對所要考察的總體按評價的目的將所涉及的各方面指標進行收集,并篩選出最重要最具有代表性的若干個指標組成綜合評價的指標體系。
根據(jù)評價目標和數(shù)據(jù)可得性,通過對微博文本信息的分析將提問問題的數(shù)量、對問題的評論和轉(zhuǎn)發(fā)數(shù)量、專家回答問題數(shù)量、對回答評論和轉(zhuǎn)發(fā)數(shù)量這四個指標作為測量維度。同時,采用總和合成法建立綜合評價模型。
(2)各評價指標無量綱處理。對評價指標體系中各個觀測指標的無量綱處理,就是通過某種變換將各個觀測指標的計量單位消掉并使其數(shù)量級統(tǒng)一的變換過程。本文采用規(guī)格化變換方法來對各指標原始數(shù)據(jù)進行處理:
設(shè)xij為第i場微訪談的第j個指標,其中i=1,2,3,4,5;j=1,2,3,4。記觀測變量 xj在每個個體上的最小觀測值為xmin,最大觀測值為xmax,則規(guī)格化變換公式為:
經(jīng)過規(guī)格化變換,消除了觀測變量的計量單位,變換后的指標值均在0和1之間。
(3)權(quán)數(shù)的確定:層次分析法。層次分析法是美國運籌學(xué)家T.L.Saaty教授于20世紀70年代初提出的一種定性和定量相結(jié)合的多目標決策方法,它把一個復(fù)雜問題分解成若干組成因素,并按支配關(guān)系形成層次結(jié)構(gòu),然后應(yīng)用兩兩比較的方法確定各因素的相對重要性,然后計算各因素的權(quán)重,并以此為基礎(chǔ)實現(xiàn)排序。層次分析法簡便、靈活而實用,是一種系統(tǒng)化、層次化的分析方法,它為復(fù)雜評價問題的決策和排序提供了一種簡潔而實用的建模方法。
首先建立評價指標體系中各指標之間相對重要程度的判斷矩陣,設(shè)該判斷矩陣為A,則有A=(bij)m*m,其中元素bij為評價指標,zi對評價指標zj相對重要程度的比例標度,一般采用評分規(guī)則為:
若指標zi與zj同樣重要,則取bij=1,bji=1;
若指標zi比zj稍微重要,則取bij=3,bji=1/3;
若指標zi比zj明顯重要,則取bij=5,bji=1/5;
若指標zi比zj強烈重要,則取bij=7,bji=1/7;
若指標zi比zj極端重要,則取bij=9,bji=1/9;
若指標zi與zj比較,二者的重要性介于上述各相鄰判斷之間,則取bij=2,4,6,8;bji=1/2,1/4,1/6,1/8。
可將各個評價指標的重要性權(quán)數(shù)用一個向量表示,向量 W=(w1,w2,...wm)T,該向量是判斷矩陣的特征向量。
設(shè)向量V為判斷矩陣A與特征向量W的乘積,即:
得到計算結(jié)果見表2。
表2 層次分析法計算結(jié)果
因此,判斷矩陣的最大特征根λmax值為:
判斷矩陣的一般一致性指標CI為:
平均隨機一致性指標為RI=0.90,則判斷矩陣的隨機一致性比率CR為:
所以可認為判斷矩陣滿足一致性要求,故所求出的評價指標權(quán)數(shù)是合適的。
(4)計算綜合評價指數(shù)值。加權(quán)總和合成法是用加總求和的方法將無量綱化后的各個評價指標合成為一個綜合指標。計算公式為:
通過計算得到這五次微訪談的輿情效果綜合得分,對得分按照從大到小的順序進行排名,具體數(shù)據(jù)及結(jié)果見表3。
(5)微訪談輿情效果分析。結(jié)合綜合得分可以看出,關(guān)于“原子彈與脊梁”專題訪談得到了最多的關(guān)注度,網(wǎng)友共提出了26個問題,專家有針對性地回答了12個問題,回答問題率達到了46.15%?!稗r(nóng)戶儲糧技術(shù)、雜糧營養(yǎng)和加工技術(shù)”的微訪談關(guān)注度排名第二,在網(wǎng)友提出的18個問題中有12個問題是關(guān)于農(nóng)業(yè)方面的技術(shù)知識,專家的回答率在五個微訪談中是最高的,達到了66.67%。
以網(wǎng)友提出問題的內(nèi)容進行分類,可以將問題分為技術(shù)類、政策類、支持條件類、“科技列車青海行”活動的信息類及其他共五大類。通過計算得到五次微訪談中不同類別問題數(shù)量占問題總數(shù)的百分比,具體數(shù)據(jù)見表4。
表3 綜合評價表
表4 微訪談信息類型分類表 (單位:%)
微博圈里每個人在第一時間報道活動內(nèi)容,第一時間反饋網(wǎng)友提問,第一時間交流團隊內(nèi)部信息,進一步提升這次活動與大眾的互動性,搭建了一個跨時空的新媒體科普服務(wù)平臺。微博圈的宣傳也遠遠超過了預(yù)期目標,它可以進一步提升科普活動與大眾的互動性,搭建了一個跨時空的新媒體科普服務(wù)平臺[7]。同時,通過微博中的圖片可以直觀了解活動情況、知識圖解等內(nèi)容,更好地理解所傳遞的信息,增強了科學(xué)普及效果。
通過建立“科技列車青海行”主題頁面并向網(wǎng)友推薦促進了微博圈的形成,將專家及參與人員 (專家、記者、工作人員等)的個人微博納入并組建“微博圈”,發(fā)揮整體集群效應(yīng),使專家、網(wǎng)友、媒體記者、工作人員等緊緊聯(lián)系在了一起,每個人既是信息的發(fā)布者又是信息的接收者,以點對面,使活動組織者在第一時間了解各位專家開展服務(wù)的進展,大大增進了活動參與者之間的信息溝通與情感交流。
微博點對面的多級放大傳播方式突破了以往專家一對一、一對幾傳授知識的局限,通過微博這一新媒體跨時空、跨地域地傳播科普知識,擴大了科技服務(wù)和科學(xué)普及的范圍。另外,參與者在發(fā)布微博的同時還能上傳圖片,在普及科學(xué)的同時也使受教者能夠通過圖片直觀地了解活動情況、知識圖解等,能夠更好地理解所接受的信息,增強了科學(xué)普及的效果。
[1]王元,許曄.迎接“第五媒體”重大技術(shù)變革的挑戰(zhàn)[J].中國科技論壇,2010,(6):5-8.
[2]許曄.微博正在改變世界的創(chuàng)新應(yīng)用[J].中國科技論壇,2012,(8):23-27.
[3]鄭婧伶.公安微博的功能與角色定位[J].傳媒:MEDIA,2012,6:73-74.
[4]張光斌.科普期刊的微博內(nèi)容分析及其應(yīng)用研究——以新浪微博為例[J].科技與出版,2012,6:106-109.
[5]廖金寶.微博輔助思政課教學(xué)的實踐探究[J].恩施職業(yè)技術(shù)學(xué)院學(xué)報(綜合版),2011,23(3):21-23.
[6]劉毅.網(wǎng)絡(luò)輿情研究概論[M].天津:天津人民出版社.2007.
[7]曲彬赫,冷盈盈.新媒體時代的科普信息傳播[J].科協(xié)論壇,2011,3:46-48.