• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    面向資源建設(shè)的微信公眾號(hào)學(xué)術(shù)文章特征框架構(gòu)建與實(shí)證研究

    2019-12-04 02:18:10
    關(guān)鍵詞:賬號(hào)檢索公眾

    自互聯(lián)網(wǎng)誕生之日起,學(xué)術(shù)界就在不斷推進(jìn)關(guān)于媒體融合的構(gòu)想。隨著互聯(lián)網(wǎng)技術(shù)和移動(dòng)終端的發(fā)展、人們閱讀習(xí)慣的轉(zhuǎn)變、生活節(jié)奏的加快和以微信為代表的新媒體的蓬勃發(fā)展,自2013年起,學(xué)術(shù)期刊和各大高校、科研院所都陸續(xù)開(kāi)設(shè)了微信公眾號(hào),用以宣傳和傳播學(xué)界動(dòng)態(tài)與思想。截至2017年9月,全網(wǎng)微信公眾號(hào)的注冊(cè)總量已超過(guò)2 000多萬(wàn)個(gè),其中活躍的公眾號(hào)數(shù)量為350萬(wàn)個(gè)[1]。2018年,微信公眾平臺(tái)月活躍粉絲數(shù)為7.97億[2],全國(guó)微信1 000強(qiáng)共發(fā)布文章約41.80萬(wàn)次,推送文章170.03萬(wàn)篇,收獲675.30億次閱讀、10.92億次點(diǎn)贊。其中,閱讀數(shù)達(dá)到“10萬(wàn)+”的文章共有21.54萬(wàn)篇,約占12.67%;原創(chuàng)文章達(dá)27.73萬(wàn)篇,約占16.31%[3]。據(jù)不完全統(tǒng)計(jì),目前每天新入庫(kù)公眾號(hào)多達(dá)數(shù)百個(gè)。微信公眾平臺(tái)因其高效、開(kāi)放、便捷、高度自由、生動(dòng)易讀和互動(dòng)性強(qiáng)等特質(zhì),也迅速成為學(xué)術(shù)傳播與交流的重要渠道,發(fā)布在該平臺(tái)上的學(xué)術(shù)信息與日俱增。

    微信公眾平臺(tái)學(xué)術(shù)信息交流和信息服務(wù)提供的功能已得到普遍認(rèn)可,然而目前學(xué)界關(guān)于微信公眾號(hào)與平臺(tái)內(nèi)學(xué)術(shù)資源的研究主要是從全領(lǐng)域內(nèi)或某個(gè)行業(yè)公眾號(hào)的開(kāi)通情況、運(yùn)營(yíng)、功能設(shè)置、服務(wù)范圍、信息內(nèi)容等角度展開(kāi)的,其研究對(duì)象也以高校、圖書(shū)館、期刊、出版社等科研機(jī)構(gòu)為主,尚未涉及學(xué)術(shù)自媒體及學(xué)術(shù)機(jī)構(gòu)公眾號(hào)所發(fā)布內(nèi)容的學(xué)術(shù)性分析。以往學(xué)者關(guān)于微信公眾號(hào)學(xué)術(shù)信息的研究大多是從文章所刊載賬號(hào)的層面入手,借鑒新榜或其他大數(shù)據(jù)服務(wù)商系統(tǒng)自動(dòng)劃分出的“學(xué)術(shù)”類(lèi)榜單上的賬號(hào)或?qū)W術(shù)期刊運(yùn)營(yíng)的賬號(hào)[4],亦或是以某個(gè)學(xué)科領(lǐng)域的賬號(hào)[5]進(jìn)行內(nèi)容或運(yùn)營(yíng)現(xiàn)狀上的分析。

    微信公眾號(hào)上的學(xué)術(shù)資源(以下簡(jiǎn)稱(chēng)“微信學(xué)術(shù)資源”),應(yīng)是由學(xué)者或領(lǐng)域內(nèi)專(zhuān)業(yè)人員發(fā)布在微信平臺(tái)上的面向?qū)I(yè)用戶(hù)的,以促進(jìn)知識(shí)積累、傳播、交流與創(chuàng)新為目的,具有及時(shí)性、開(kāi)放性、交互性的學(xué)術(shù)資源,包括科研進(jìn)展、科技文摘、轉(zhuǎn)載的學(xué)術(shù)論文、技能/工作經(jīng)驗(yàn)交流,以及學(xué)者在網(wǎng)上使用學(xué)術(shù)資源的痕跡及在網(wǎng)絡(luò)平臺(tái)發(fā)布的個(gè)人論述[6]。集中揭示質(zhì)量較高的學(xué)術(shù)信息資源,不僅有助于拓展信息資源建設(shè)內(nèi)涵,更可利用知識(shí)組織相關(guān)方法和工具對(duì)富含的知識(shí)單元進(jìn)行識(shí)別和計(jì)算,便于后續(xù)開(kāi)展熱點(diǎn)話題識(shí)別與跟蹤、個(gè)性化學(xué)術(shù)信息推薦等服務(wù),進(jìn)一步滿(mǎn)足用戶(hù)需求。

    1 現(xiàn)狀概述

    1.1 微信文章檢索有待發(fā)展

    研究微信公眾號(hào)文章檢索目前有搜索引擎和大數(shù)據(jù)服務(wù)商“新榜”開(kāi)發(fā)的“號(hào)內(nèi)搜”兩類(lèi)機(jī)構(gòu)。以“搜狗”為代表的現(xiàn)行搜索引擎可提供基于關(guān)鍵詞的微信文章搜索和基于公眾號(hào)的一周發(fā)文回溯,但其檢索結(jié)果成分復(fù)雜、冗余度高,不能滿(mǎn)足專(zhuān)業(yè)用戶(hù)的檢索需求;“號(hào)內(nèi)搜”服務(wù)則需要在移動(dòng)端通過(guò)微信公眾號(hào)的服務(wù)窗口進(jìn)入,未提供PC端接口,提交檢索只能在特定的公眾號(hào)內(nèi)進(jìn)行,不適用于廣泛檢索。另外,市面上缺少服務(wù)于專(zhuān)業(yè)學(xué)術(shù)用戶(hù)的微信文章檢索平臺(tái),也沒(méi)有收集微信學(xué)術(shù)信息的專(zhuān)門(mén)數(shù)據(jù)庫(kù)。

    1.2 微信學(xué)術(shù)資源無(wú)固定文體格式

    傳統(tǒng)意義上的學(xué)術(shù)文章具有規(guī)范嚴(yán)謹(jǐn)?shù)膶?xiě)作體例和明確的文體特征,如每篇文章必須注明其標(biāo)題、著者、責(zé)任者、主題、關(guān)鍵詞等信息,內(nèi)容上表達(dá)了新的學(xué)術(shù)觀點(diǎn)、提出了新的研究方法和新的數(shù)據(jù)或結(jié)論,具有科學(xué)性。

    然而對(duì)于自由言論下的產(chǎn)物——微信公眾號(hào)文章而言,自由就是其最大的特點(diǎn)。該平臺(tái)上發(fā)布的文章雖然可能會(huì)由于作者的寫(xiě)作習(xí)慣、學(xué)科背景等而保留學(xué)術(shù)論文的痕跡,但更多的是隨筆與思考類(lèi)、資訊類(lèi)、文摘推薦類(lèi)等,與傳統(tǒng)意義上的學(xué)術(shù)文章存在差別。但這些文章在傳遞新學(xué)術(shù)觀點(diǎn)、研究方法、新數(shù)據(jù)或結(jié)論、科學(xué)嚴(yán)謹(jǐn)性等方面也可以達(dá)到學(xué)術(shù)文章的要求。因此,應(yīng)將微信公眾號(hào)上的學(xué)術(shù)文章定義為在微信公眾號(hào)上由學(xué)者或?qū)W術(shù)信息服務(wù)提供商發(fā)布的學(xué)者所關(guān)注的與科學(xué)相關(guān)的文章,其主題類(lèi)型包括科研資訊、學(xué)術(shù)會(huì)議通知與紀(jì)實(shí)、科技文摘、學(xué)術(shù)論文、技能交流及科普性文章等。

    1.3 現(xiàn)行學(xué)術(shù)文章描述框架不足以滿(mǎn)足需求

    目前用于描述用戶(hù)原創(chuàng)內(nèi)容(User Generated Content,UGC)網(wǎng)絡(luò)資源的元數(shù)據(jù)標(biāo)準(zhǔn)包括都柏林核心元數(shù)據(jù)元素集(The Dublin Core Metadata Initiative,DCMI,以下簡(jiǎn)稱(chēng)“DC”)、基于MARC21的元數(shù)據(jù)對(duì)象描述模式[7](Metadata Object Description Schema,MODS)和綜合參考了DC和MODS的WH/T 50-2012 網(wǎng)絡(luò)資源元數(shù)據(jù)規(guī)范等。但以上元數(shù)據(jù)標(biāo)準(zhǔn)均是建立在目標(biāo)對(duì)象均具有同等參考價(jià)值的基礎(chǔ)上的。然而新媒體環(huán)境下,用戶(hù)生成內(nèi)容質(zhì)量存在很大差異,在利用過(guò)程中,服務(wù)系統(tǒng)需要智能推薦和檢索結(jié)果排序等,但當(dāng)前的描述模型并沒(méi)有把這些相關(guān)功能所需的元數(shù)據(jù)考慮在內(nèi)。

    總體上,微信學(xué)術(shù)文章的分布呈現(xiàn)相對(duì)集中、絕對(duì)分散的狀態(tài),主要表現(xiàn)為同學(xué)科機(jī)構(gòu)賬號(hào)之間的集群性分布和學(xué)者個(gè)人賬號(hào)的分散性分布。

    集群性即從事同一研究領(lǐng)域、隸屬類(lèi)似機(jī)構(gòu)的公眾號(hào)所發(fā)布的文章趨近,且賬號(hào)之間的轉(zhuǎn)載互動(dòng)更為頻繁,可以通過(guò)文章流傳產(chǎn)生的連接關(guān)系發(fā)現(xiàn)更多學(xué)術(shù)資源。傳統(tǒng)的框架中對(duì)文章之間的引用關(guān)系、所屬關(guān)系等進(jìn)行了詳細(xì)的描述。微信平臺(tái)上的轉(zhuǎn)載雖類(lèi)似于傳統(tǒng)學(xué)術(shù)文章的引用機(jī)制但又不同,目前2個(gè)平臺(tái)文章之間的引用關(guān)系尚未被描述。國(guó)內(nèi)外有學(xué)者提出替代計(jì)量學(xué),考慮將社交媒體上的學(xué)術(shù)行為納入科研產(chǎn)出評(píng)價(jià)體系,促使兩個(gè)平臺(tái)數(shù)據(jù)之間的互通,然而當(dāng)前的描述框架未做相關(guān)設(shè)計(jì)。

    分散性是指那些相對(duì)獨(dú)立的學(xué)者個(gè)人公眾號(hào),與其他賬號(hào)之間互動(dòng)較少,發(fā)布頻次也較低,在網(wǎng)域內(nèi)很難將這部分資源與其他學(xué)術(shù)資源聯(lián)系串聯(lián)起來(lái)。但是同屬于一個(gè)學(xué)科,其發(fā)布內(nèi)容的主題也必然是相關(guān)的。話題性也是UGC內(nèi)容的重要特征,對(duì)于同一社會(huì)事件,不同領(lǐng)域用戶(hù)會(huì)從多方面發(fā)表看法,因此可以考慮從“話題/熱點(diǎn)事件”入手進(jìn)行這部分資源的揭示。但如何從話題層面揭示相關(guān)文章也是傳統(tǒng)框架所欠缺的。

    筆者認(rèn)為對(duì)于微信公眾號(hào)學(xué)術(shù)信息而言,如何在元數(shù)據(jù)層面為后續(xù)服務(wù)提供評(píng)價(jià)指標(biāo)參考,如何對(duì)公共話題文章進(jìn)行串聯(lián)揭示,是本文提出框架的著力點(diǎn)。

    網(wǎng)絡(luò)學(xué)術(shù)資源的組織建設(shè)無(wú)論從理論層面還是從實(shí)踐層面上講都很有意義,能夠在前人實(shí)踐基礎(chǔ)上汲取經(jīng)驗(yàn)教訓(xùn)將會(huì)事半功倍。國(guó)外關(guān)于UGC內(nèi)容的組織建設(shè)比較有借鑒意義的有:現(xiàn)已停止更新維護(hù)的主要用于主題檢索的主題信息服務(wù)的資源組織和發(fā)現(xiàn)[8](Resource Organisation And Discovery in Subject-based services,ROADS)及基于ROADS理念開(kāi)發(fā)的社會(huì)學(xué)信息門(mén)戶(hù)(Social Science Information Gateway,SOSIG),二者都是圖情領(lǐng)域關(guān)于網(wǎng)絡(luò)學(xué)術(shù)資源建設(shè)的嘗試。

    SOSIG支持關(guān)鍵詞檢索和分類(lèi)后的瀏覽式查找,是基于信息的學(xué)科或主題屬性參考UDC分類(lèi)來(lái)進(jìn)行分類(lèi)和遴選,在諸多網(wǎng)絡(luò)資源建設(shè)方法中是較為嚴(yán)謹(jǐn)?shù)?,但最終因?yàn)橘Y源模型維護(hù)復(fù)雜和昂貴,資金缺失,不得不停止服務(wù)[9]。因此,筆者認(rèn)為應(yīng)從現(xiàn)有框架出發(fā),盡可能減少額外開(kāi)發(fā)支出,增強(qiáng)框架的適用性。

    2 描述框架構(gòu)建

    2.1 功能分析

    本文所需的元數(shù)據(jù)框架是能夠?qū)崿F(xiàn)微信學(xué)術(shù)信息的組織和索引,以服務(wù)于專(zhuān)業(yè)用戶(hù)的專(zhuān)業(yè)模糊檢索需求,其涵蓋的元數(shù)據(jù)應(yīng)能輔助系統(tǒng)實(shí)現(xiàn)以下功能。

    文章查找包括通過(guò)關(guān)鍵詞/主題詞檢索、通過(guò)文章刊載公眾號(hào)檢索、通過(guò)文章發(fā)布時(shí)間檢索,這是任何檢索系統(tǒng)都應(yīng)具備的基本功能。

    信息識(shí)別包括根據(jù)文章標(biāo)題/關(guān)鍵詞/摘要識(shí)別、根據(jù)文章作者及其所屬機(jī)構(gòu)識(shí)別、根據(jù)文章刊載平臺(tái)識(shí)別。對(duì)文章外部特征進(jìn)行充分揭示,有助于為用戶(hù)辨別和篩選有用信息節(jié)省時(shí)間,提高檢索效率。

    信息選擇與獲取包括按文獻(xiàn)類(lèi)型、主體、內(nèi)容選擇文獻(xiàn),檢索結(jié)果按時(shí)間、熱度等自定義排序,全文獲取方式與URI。對(duì)檢索結(jié)果進(jìn)行二次篩選和排序有助于用戶(hù)更快定位到所需信息,提高用戶(hù)體驗(yàn)。

    文獻(xiàn)分析評(píng)價(jià)包括數(shù)據(jù)庫(kù)內(nèi)收錄文章間的互相引用與轉(zhuǎn)載關(guān)系、關(guān)于同一文獻(xiàn)的文摘/評(píng)述性文章匯總、關(guān)于同一社會(huì)熱點(diǎn)事件相關(guān)文獻(xiàn)的匯總,這一功能來(lái)源于微信文章強(qiáng)關(guān)聯(lián)與“分享平臺(tái)”的特性。該平臺(tái)上的文章以報(bào)道、摘要、導(dǎo)讀等二、三次文獻(xiàn)居多,同一領(lǐng)域的不同賬號(hào)可能會(huì)對(duì)同一研究進(jìn)展或熱點(diǎn)文章進(jìn)行評(píng)述推送。這種文摘/報(bào)道不僅有助于對(duì)重要文章的發(fā)掘,也有利于擴(kuò)展文獻(xiàn)評(píng)價(jià)的外延。而依托于大眾媒體的本質(zhì)不僅為其帶來(lái)了時(shí)效性強(qiáng)的特點(diǎn),更為其所發(fā)布的文章帶去了話題性,也就是說(shuō)微信公眾號(hào)上的文章對(duì)社會(huì)熱點(diǎn)的反饋會(huì)更靈敏或呈“扎堆”現(xiàn)象。但來(lái)自不同領(lǐng)域的作者們對(duì)同一熱點(diǎn)事件會(huì)有不同的切入角度,以事件為集結(jié)點(diǎn)有助于協(xié)助用戶(hù)進(jìn)行更全面的認(rèn)知。

    2.2 框架構(gòu)建

    參考FRBR模型[10]將描述元素分為產(chǎn)品(work, expression, manifestation, and item)、產(chǎn)品從創(chuàng)作到傳播再到保存各個(gè)流程中的責(zé)任者(person and corporate body)、產(chǎn)品的主題內(nèi)容(concept, object, event, and place)三大類(lèi)的理念。基于微信公眾號(hào)文章的特點(diǎn),根據(jù)元數(shù)據(jù)設(shè)計(jì)模塊化原則,筆者將微信公眾號(hào)一篇文章可能涉及的元素及其相關(guān)關(guān)系進(jìn)行了梳理。其大致框架如圖1所示。

    網(wǎng)絡(luò)環(huán)境下,信息發(fā)布者多使用代稱(chēng)或機(jī)構(gòu)名稱(chēng)而非真實(shí)姓名,同一個(gè)微信賬號(hào)的作者也來(lái)自于不同領(lǐng)域。因此在本框架中弱化了著者的比重,將作者/編輯/所屬機(jī)構(gòu)合并在一起,統(tǒng)稱(chēng)為貢獻(xiàn)者,而文章中也可以不涉及其貢獻(xiàn)者,其限制字段為“0..*”,即可以有0個(gè)或多個(gè)貢獻(xiàn)者。

    每個(gè)被采集的文章都會(huì)有一個(gè)刊載賬號(hào),而這個(gè)賬號(hào)下也會(huì)至少有1篇文章,限制字段為“1..*”,即一個(gè)公眾號(hào)可以有1篇或多篇文章??d賬號(hào)的質(zhì)量可在一定程度上反映文章的質(zhì)量,因此本框架引入了指數(shù)元素,對(duì)賬號(hào)的發(fā)文數(shù)量、篇均閱讀量、篇均點(diǎn)贊/在看數(shù)、WCI指數(shù)等進(jìn)行標(biāo)引??d賬號(hào)的各項(xiàng)運(yùn)營(yíng)指數(shù)可反映賬號(hào)的運(yùn)營(yíng)情況,而刊載賬號(hào)的質(zhì)量又在很大程度上決定文章的質(zhì)量,因此運(yùn)營(yíng)指數(shù)項(xiàng)為必備項(xiàng),以默認(rèn)的限制字段“1”,即必備且不重復(fù)。

    圖1 微信公眾號(hào)文章的學(xué)術(shù)特征框架

    文章外部特征的描述包括指數(shù)、全文、參考文獻(xiàn)、圖表和其他多媒體資料。其中,指數(shù)元素集在此主要是描述文章的閱讀數(shù)量和點(diǎn)贊數(shù)量,而此數(shù)據(jù)又是不斷變動(dòng)的,因此在子元素中增加了數(shù)據(jù)更新時(shí)間。指數(shù)元素是每篇文章必備的,其默認(rèn)限制字段為“1”,即必備且不重復(fù)。

    文章的內(nèi)部特征描述是本框架的核心,主要包括主題/分類(lèi)/關(guān)鍵詞元素集、相關(guān)文章元素集和事件元素集。文章間的相關(guān)關(guān)系包括引用關(guān)系、轉(zhuǎn)載與被轉(zhuǎn)載、評(píng)述與被評(píng)述、同一作者、同一刊載賬號(hào)、共同話題等;事件元素集是微信公眾號(hào)學(xué)術(shù)信息獨(dú)有的,通常用來(lái)描述文章中所涉及的社會(huì)事件/現(xiàn)象、學(xué)術(shù)會(huì)議/論壇等。其限制字段為“0..*”,即可以有0條或多條相關(guān)記錄。

    2.3 元素選擇與定義

    微信公眾號(hào)的文章一直是基于HTML頁(yè)面的格式以純網(wǎng)絡(luò)資源的形式存在。要想對(duì)數(shù)量龐大的推文進(jìn)行收錄和標(biāo)引,筆者認(rèn)為應(yīng)從原文件的描述方式出發(fā)尋找可以用作識(shí)別項(xiàng)的元素信息。因此,本框架的元素集是以便于網(wǎng)絡(luò)爬蟲(chóng)抓取為前提,結(jié)合微信文章特性,參考DC元數(shù)據(jù)[11]15個(gè)基本項(xiàng),對(duì)微信文章的HTML源代碼標(biāo)簽項(xiàng)進(jìn)行抽取和歸納,并對(duì)網(wǎng)頁(yè)源代碼中無(wú)法獲取但對(duì)于實(shí)現(xiàn)檢索需求所必需的元素進(jìn)行自定義補(bǔ)充得出的。對(duì)本框架涉及的主要元素的選擇與定義的簡(jiǎn)要說(shuō)明見(jiàn)表1。

    其中,本框架主要元素與傳統(tǒng)學(xué)術(shù)資源的主要描述字段存在明顯區(qū)別的部分在于文章摘要是否應(yīng)是必備字段。本文的框架中,文章摘要為必備元素,學(xué)術(shù)型文章與非學(xué)術(shù)型文章在摘要的內(nèi)容和形式上存在明顯差別。學(xué)術(shù)類(lèi)文章的摘要多以陳述句為主,內(nèi)容客觀豐富,主要是對(duì)文章內(nèi)容作大致總結(jié);非學(xué)術(shù)類(lèi)文章則多以啟發(fā)性的、疑問(wèn)句等形式呈現(xiàn),內(nèi)容基本無(wú)實(shí)質(zhì)意義。即便是當(dāng)發(fā)布者未填寫(xiě)摘要,系統(tǒng)默認(rèn)選取文章的前15個(gè)字作為該文章摘要時(shí),學(xué)術(shù)類(lèi)文章的開(kāi)篇也大多是對(duì)該文章涉及話題和論點(diǎn)或主要內(nèi)容的闡釋。因此即便是機(jī)器自動(dòng)獲取的摘要,也足以達(dá)到輔助分辨文章內(nèi)容性質(zhì)的作用。

    表1 主要元素說(shuō)明

    3 實(shí)證分析

    經(jīng)過(guò)前期調(diào)研,筆者根據(jù)新榜(newrank.com)發(fā)布的學(xué)術(shù)類(lèi)微信公眾號(hào)排行榜,結(jié)合“西瓜數(shù)據(jù)”的科技類(lèi)周榜初步選定了微信傳播指數(shù)(WCI)[13]靠前的、運(yùn)營(yíng)主體類(lèi)型各不相同的、具有代表性的幾個(gè)科技類(lèi)微信公眾號(hào)作為研究對(duì)象,分別是物理學(xué)領(lǐng)域的科研機(jī)構(gòu)公眾號(hào)——中國(guó)科學(xué)院物理研究所運(yùn)營(yíng)的“中科院物理所”(ID:cas-iop),德才皆倍(北京)科技有限公司管理運(yùn)營(yíng)的“知識(shí)分子”(ID:The-Intellectual)和國(guó)際知名的科學(xué)雜志《科學(xué)美國(guó)人》中文版《環(huán)球科學(xué)》運(yùn)營(yíng)的“環(huán)球科學(xué)”(ID:huanqiukexue)。采樣區(qū)間為2019年1月1日至2019年5月31日。3個(gè)公眾號(hào)共推送文章1 409篇,其中“環(huán)球科學(xué)”496篇、“中科院物理所”573篇、“知識(shí)分子”340篇。

    以下涉及的單篇文章數(shù)據(jù)均是使用fiddler抓包工具獲取的,主賬號(hào)相關(guān)信息為人工收集,但也可以利用爬蟲(chóng)工具自動(dòng)抓取。

    3.1 外部特征

    3.1.1 賬號(hào)基本信息

    表2是樣本公眾號(hào)的基本信息,采集時(shí)間為2019年6月21日,數(shù)據(jù)來(lái)自清博數(shù)據(jù)(http://www.gsdata.cn/)。其中,總排名、WCI指數(shù)、預(yù)估活躍粉絲數(shù)都是隨時(shí)間不斷變動(dòng)的,因此僅作為參考。能夠準(zhǔn)確定位到某一特定公眾號(hào)的是賬號(hào)名(nickname)和微信號(hào)(user_name/WeChat_ID)。其中,user_name是微信后臺(tái)賦予每個(gè)公眾號(hào)的唯一識(shí)別碼,永久有效,可復(fù)用JATS1.2-journal-id。賬號(hào)認(rèn)證信息相當(dāng)于出品商,可復(fù)用JATS 1.2- contrib-group。

    認(rèn)證機(jī)構(gòu)的性質(zhì)一定程度上會(huì)決定其運(yùn)營(yíng)公眾號(hào)的性質(zhì)。從表面認(rèn)證信息來(lái)看,用戶(hù)可直觀地推斷出“中科院物理所”與“環(huán)球科學(xué)”為學(xué)術(shù)類(lèi)微信公眾號(hào)。

    表2 樣本公眾號(hào)基本信息

    3.1.2 賬號(hào)指數(shù)numbers

    目前業(yè)內(nèi)通常使用清博數(shù)據(jù)的微信傳播指數(shù)(WCI)作為衡量一個(gè)公眾號(hào)整體傳播力和影響力的評(píng)分。WCI指數(shù)[13]是從“整體傳播力”“篇均傳播力”“頭條傳播力”“峰值傳播力”4個(gè)維度對(duì)公眾號(hào)所發(fā)布文章的閱讀數(shù)和在看數(shù)進(jìn)行系統(tǒng)的配比計(jì)算得出的數(shù)值,它可以更好地反饋出公眾號(hào)的整體質(zhì)量。預(yù)估活躍粉絲數(shù)并非該公眾號(hào)后臺(tái)實(shí)際粉絲數(shù),它通常是根據(jù)行業(yè)、打開(kāi)時(shí)間、文章位置、閱讀、點(diǎn)贊、評(píng)論等多個(gè)因素綜合計(jì)算得出的一個(gè)虛擬數(shù)值,相較于后臺(tái)實(shí)際粉絲數(shù)更能體現(xiàn)公眾號(hào)的影響力和實(shí)際受眾規(guī)模。

    從表2可以看出,學(xué)術(shù)類(lèi)微信公眾號(hào)擁有數(shù)量較為龐大的用戶(hù)群體,在數(shù)以十萬(wàn)計(jì)的微信公眾號(hào)中仍能排在前1%,且“中科院物理所”與“知識(shí)分子”曾多次入圍新榜發(fā)布的中國(guó)微信月榜500強(qiáng),說(shuō)明其關(guān)注度和影響力不容小覷。

    從采集到的數(shù)據(jù)來(lái)看,除去除夕以外,這3個(gè)公眾號(hào)都保持了每日更新,且日更篇數(shù)為1~5篇,平均每天推送2.06篇。其中,“環(huán)球科學(xué)”平均日更篇數(shù)為1.82篇,“知識(shí)分子”平均日更篇數(shù)為1.71篇,“中科院物理所”的平均日更篇次為2.47篇。

    與傳統(tǒng)期刊較為復(fù)雜的評(píng)價(jià)標(biāo)準(zhǔn)相較而言,微信公眾號(hào)所發(fā)布文章的閱讀數(shù)和點(diǎn)贊數(shù)可以更為直觀及時(shí)地反映出該公眾號(hào)的運(yùn)營(yíng)情況及其影響力,一定程度上也可以體現(xiàn)文章的認(rèn)可度與價(jià)值。樣本賬號(hào)的篇均贊閱數(shù)統(tǒng)計(jì)見(jiàn)表3。由于“中科院物理所”發(fā)布的文章頻率更高、總數(shù)更多,因此篇均閱讀人次較其他賬號(hào)較少,但從篇均點(diǎn)贊人數(shù)與過(guò)篇均線總文章占比的比例可以推測(cè):該賬號(hào)發(fā)布的文章雜質(zhì)較多,用戶(hù)反饋存在明顯分層,但該賬號(hào)不乏優(yōu)秀文章。

    表3 各賬號(hào)樣本篇均贊閱數(shù)

    根據(jù)上述推斷,筆者又對(duì)各公眾號(hào)發(fā)布文章的類(lèi)型進(jìn)行了分析(表4)。

    表4 公眾號(hào)各類(lèi)型文章分布

    其中,點(diǎn)贊數(shù)未超過(guò)100次的有科研進(jìn)展類(lèi)52篇,占總數(shù)(共59篇)的88%;推廣類(lèi)8篇,占總數(shù)(共10篇)的80%;活動(dòng)通知與會(huì)議資訊類(lèi)30篇,占總數(shù)(共36篇)的83%??蒲羞M(jìn)展類(lèi)為物理所各課題組的最近研究進(jìn)展的文摘,已在其他學(xué)術(shù)平臺(tái)上公開(kāi)發(fā)布。

    綜上,筆者認(rèn)為賬號(hào)的各項(xiàng)指數(shù)能夠使用戶(hù)大致了解該賬號(hào)發(fā)布內(nèi)容的質(zhì)量水平,可以作為信息篩選時(shí)的參考項(xiàng)。

    3.1.3 刊載文章質(zhì)量

    從采集到的1 409篇文章的統(tǒng)計(jì)數(shù)據(jù)來(lái)看,文章閱讀量(read_count)超過(guò)10萬(wàn)次的有34篇,占比約2.4%,篇均閱讀數(shù)(read_count_avg)為23 990.25人次;點(diǎn)贊/在看數(shù)(like_count)超過(guò)1 000次的共有35篇,占比約2.5%,總篇均點(diǎn)贊/在看數(shù)(like_count_avg)為200.71次。相較于傳統(tǒng)期刊的電子版在學(xué)術(shù)論文服務(wù)商頁(yè)面上顯示的下載量和引用量,文章閱讀量與點(diǎn)贊在看數(shù)充分體現(xiàn)了微信平臺(tái)提供的“即點(diǎn)即得”閱讀模式給文章的曝光帶來(lái)的優(yōu)勢(shì)。這34篇閱讀過(guò)10萬(wàn)次的文章版權(quán)狀態(tài)分布如表5所示。其中“原創(chuàng)”(html腳本中版權(quán)狀態(tài)屬性值為1,即copyright_stat =″1″)意為該文章申請(qǐng)了微信平臺(tái)的原創(chuàng)保護(hù);“轉(zhuǎn)載”(html腳本中版權(quán)狀態(tài)屬性值為2,即copyright_stat =″2″)意為該文章是以原文轉(zhuǎn)載的形式轉(zhuǎn)發(fā)的其他公眾號(hào)發(fā)布的文章;“普通狀態(tài)”(html腳本中版權(quán)狀態(tài)屬性值為0,即copyright_stat =″0″)意為文章既不是轉(zhuǎn)載自其他賬號(hào),也未申請(qǐng)微信文章原創(chuàng)保護(hù)。

    表5 閱贊數(shù)量超過(guò)10萬(wàn)的文章版權(quán)狀態(tài)分析

    根據(jù)上述數(shù)據(jù)可以看出,轉(zhuǎn)載類(lèi)文章在影響力較大的文章中占有相當(dāng)大的比重,閱讀量(read_count)超過(guò)10萬(wàn)的文章里轉(zhuǎn)載類(lèi)占比超過(guò)29.4%;而點(diǎn)贊/在看數(shù)(like_count)排名靠前的文章中,轉(zhuǎn)載文章的比重甚至超過(guò)45.7%。因此,筆者嘗試對(duì)這些高影響力的轉(zhuǎn)載文章進(jìn)行來(lái)源回溯,發(fā)現(xiàn)雖然閱贊數(shù)排名靠前的文章中轉(zhuǎn)載文章所占比例很大,但是在大多數(shù)情況下,原文的關(guān)注者對(duì)于該文章的反饋卻遠(yuǎn)不如轉(zhuǎn)載者(圖2)。

    從圖2可以看到,粉色高亮底框?yàn)檗D(zhuǎn)載文章與原文閱讀數(shù)較高者,橙色高亮底框?yàn)檗D(zhuǎn)載文章與原文點(diǎn)贊/在看數(shù)較高者,綠色高亮底框?yàn)槲丛谇宀?shù)據(jù)或新榜等主流新媒體大數(shù)據(jù)平臺(tái)認(rèn)證或注冊(cè)的賬號(hào)。

    圖2閱讀數(shù)超過(guò)10萬(wàn)或點(diǎn)贊/在看數(shù)超過(guò)1000次的轉(zhuǎn)載文章與原文數(shù)據(jù)對(duì)比

    因此,筆者認(rèn)為一篇文章的質(zhì)量(是否具有學(xué)術(shù)價(jià)值)或性質(zhì)不應(yīng)單取決于其所依托的發(fā)布平臺(tái)或者創(chuàng)作者,原賬號(hào)的性質(zhì)與受眾群體可能會(huì)制約其被發(fā)現(xiàn)、被閱讀的可能。這些被轉(zhuǎn)載自傳統(tǒng)意義上不被認(rèn)為是學(xué)術(shù)類(lèi)賬號(hào)的文章的廣受追捧,正好說(shuō)明除了我們所熟識(shí)的學(xué)術(shù)類(lèi)微信公眾號(hào)所發(fā)布的學(xué)術(shù)文章以外,在微信平臺(tái)上還存在大量未被發(fā)掘的優(yōu)質(zhì)學(xué)術(shù)信息。因此用戶(hù)在進(jìn)行文章檢索時(shí),應(yīng)提供以閱讀量(read_count)或點(diǎn)贊數(shù)(like_count)為篩選條件的排序入口。

    3.2 篇章層面

    3.2.1 全文(full-text)

    除了公告和招聘啟事以外,1 409篇文章無(wú)一例外都采用了圖文結(jié)合的呈現(xiàn)方式,篇均使用圖片數(shù)量為12.2張,明顯多于傳統(tǒng)期刊文章的圖片數(shù)量。除圖像、文字等平面呈現(xiàn)方式外,微信公眾號(hào)還提供了視頻、音頻的表達(dá)形式。

    在樣本中有超過(guò)7.7%(109篇)的文章使用了視頻文件作為輔助呈現(xiàn)手段,如此數(shù)量龐大的附件資源說(shuō)明對(duì)文章圖表、多媒體資料進(jìn)行索引收錄是很有必要的。

    樣本文章的篇均字?jǐn)?shù)為3 423.12字,最大值為49 441字,其中大于10 000字的文章為49篇,字?jǐn)?shù)在2 000~5 000之間的文章數(shù)量為795篇,超過(guò)總數(shù)的56.4%。而傳統(tǒng)的期刊論文字?jǐn)?shù)一般在5 000字以上。

    按照內(nèi)容可以將樣本文章大致分為科普知識(shí)、科研消息、學(xué)術(shù)探究等(表6)。

    表6 文章類(lèi)型分布

    從表6可以看出,微信公眾號(hào)作為門(mén)檻低、更新頻率高、信息生命周期短的媒介,其所發(fā)布的內(nèi)容也明顯傾向于說(shuō)明型的科普類(lèi)文章以及公告型的科研進(jìn)展與科技資訊類(lèi)文章。而我們更愿查看的觀點(diǎn)類(lèi)文章僅占不到四分之一。盡管該類(lèi)文章在整個(gè)微信公眾號(hào)環(huán)境下,相對(duì)占比較小,但是絕對(duì)數(shù)量上遠(yuǎn)遠(yuǎn)超過(guò)了傳統(tǒng)學(xué)術(shù)產(chǎn)出。另外,這類(lèi)文章的篇均字?jǐn)?shù)約在3 728字,相較于同類(lèi)型的期刊論文,篇幅上大幅減少。在讀者有限的時(shí)間內(nèi)盡可能更及時(shí)地傳遞更多的信息,也正是微信公眾號(hào)這類(lèi)新媒體平臺(tái)的核心價(jià)值所在。

    另外,不同文體類(lèi)型的文章篇均字?jǐn)?shù)存在明顯分層,記敘類(lèi)如歷史事件、人物、論文導(dǎo)讀等篇均字?jǐn)?shù)均在5 000字以上,觀點(diǎn)議論型如社論、理論探究類(lèi)篇均字?jǐn)?shù)大多是3 500~4 000字,而資訊類(lèi)通常在3 000字及以下。因此,筆者認(rèn)為文章字?jǐn)?shù)也可以作為輔助文章分類(lèi)的一個(gè)依據(jù)。

    3.2.2 版權(quán)與著者(copytight&contributor)

    關(guān)于著者項(xiàng),1 409篇樣本文章中,未明確標(biāo)注出品人或責(zé)任者的文章有121篇,除去推廣、會(huì)議通知、論文導(dǎo)讀等無(wú)指向性文章外,僅余29篇文章沒(méi)有責(zé)任者信息,約占2%;其余推文都會(huì)對(duì)文章的著者、編輯或出品人等進(jìn)行說(shuō)明。另外,以組織或公眾號(hào)名稱(chēng)為作者的文章約占35%,還有796篇文章是采用了具有明確指向性的個(gè)人代號(hào)或昵稱(chēng)、姓名等作為文章作者項(xiàng)的。如“中科院物理所”發(fā)布的文章中,以“Frions”為名的作者發(fā)布的均是科普類(lèi)的文章;“知識(shí)分子”發(fā)布的文章中,以“楊雪”為名的作者發(fā)布的均是社論性的文章。筆者認(rèn)為著錄文章作者可以在一定程度上起到文章辨別與索引的效果,但并不能起決定性作用,因此在框架中并未將著者項(xiàng)作為核心著錄元素。

    關(guān)于版權(quán)狀態(tài),約35.4%轉(zhuǎn)載自其他微信公眾號(hào),35.3%是首發(fā)于微信平臺(tái)且申請(qǐng)了原創(chuàng)保護(hù),另外還有29.3%或是分享自其他賬號(hào)或是在其他媒體上公布過(guò)。如“中科院物理所”發(fā)布的所內(nèi)其他各小組的研究進(jìn)展信息,雖然是該機(jī)構(gòu)原創(chuàng),但只是作為文摘或論文導(dǎo)讀的形式發(fā)布于公眾號(hào)上。另外,筆者還發(fā)現(xiàn)在29.3%的文章中,超過(guò)42篇文章在內(nèi)容中明確標(biāo)注了轉(zhuǎn)載自其他微信公眾號(hào),綜合整個(gè)平臺(tái)的轉(zhuǎn)載率超過(guò)38%。雖然一方面體現(xiàn)了原創(chuàng)力不足,但側(cè)面也可以說(shuō)明信息的流通性、曝光可能性更高。而轉(zhuǎn)載通常發(fā)生于同一類(lèi)型或同一領(lǐng)域的賬號(hào)之間,文章的互相轉(zhuǎn)載為有效學(xué)術(shù)信息的曝光提供更多可能,同時(shí)也說(shuō)明了微信平臺(tái)上文章之間的聯(lián)系較為密切。

    筆者以作者字段為篩選條件,將各公眾號(hào)轉(zhuǎn)載文章來(lái)源做了統(tǒng)計(jì),發(fā)現(xiàn)“中科院物理所”轉(zhuǎn)發(fā)“狂丸”23篇、“把科學(xué)帶回家”16篇、“共工”12篇、“環(huán)球科學(xué)”12篇;而“環(huán)球科學(xué)”轉(zhuǎn)載了“把科學(xué)帶回家”21篇、“科研圈”16篇、“Nature自然科研”12篇;“知識(shí)分子”則轉(zhuǎn)載了“豌豆Echo”11篇、“嚴(yán)肅的人口八卦學(xué)”5篇、“豌豆公益”4篇。筆者認(rèn)為,與線下的學(xué)術(shù)團(tuán)體相對(duì)應(yīng)的線上存在虛擬學(xué)術(shù)集群,對(duì)已認(rèn)定為學(xué)術(shù)類(lèi)微信公眾號(hào)相關(guān)的其他賬號(hào)所發(fā)布的內(nèi)容以及已認(rèn)定為學(xué)術(shù)相關(guān)文章的其他來(lái)源文章或參考文章應(yīng)當(dāng)予以關(guān)注。因此,在信息交互的語(yǔ)境下,將相關(guān)文章作為本框架描述的重點(diǎn)是很有必要的。

    3.2.3 熱點(diǎn)話題與事件(topic&event)

    創(chuàng)作來(lái)源于生活又高于生活。與傳統(tǒng)學(xué)術(shù)出版類(lèi)似,社交媒體上的信息發(fā)布也具有很強(qiáng)的話題性,不同學(xué)科領(lǐng)域與不同定位的賬號(hào)會(huì)對(duì)同一主題/話題/概念/客體從各自不同的角度進(jìn)行闡釋。

    2019年春節(jié)賀歲檔的科幻大片《流浪地球》,因其大膽的想象和精美制作受到業(yè)內(nèi)外的廣泛關(guān)注,學(xué)術(shù)界也不例外。筆者嘗試以“流浪地球”為關(guān)鍵詞對(duì)1 409篇樣本文章標(biāo)題進(jìn)行檢索,得到4篇文章;而后又分別以“流浪”“地球”為關(guān)鍵詞對(duì)樣本標(biāo)題進(jìn)行檢索,剔除重復(fù)與無(wú)關(guān)文章,共得到6篇(表7)。3個(gè)不同領(lǐng)域的公眾號(hào)分別從天文學(xué)、物理學(xué)、社會(huì)學(xué)、航天信息學(xué)等角度對(duì)這一話題進(jìn)行了深入剖析。同是與“流浪地球”相關(guān)的文章,由于作者的不同寫(xiě)作方式,致使檢索結(jié)果在不同時(shí)間有不同反饋。因此,筆者認(rèn)為應(yīng)將文章涉及主題/概念/事件等單獨(dú)進(jìn)行標(biāo)引。

    表7 “流浪地球”話題相關(guān)文章

    4 結(jié)語(yǔ)

    微信公眾號(hào)內(nèi)的學(xué)術(shù)文章在傳播學(xué)術(shù)資訊、增進(jìn)學(xué)科理解、促進(jìn)學(xué)術(shù)走進(jìn)生活等方面舉足輕重,了解微信學(xué)術(shù)資源的特點(diǎn)是我們進(jìn)行網(wǎng)絡(luò)學(xué)術(shù)資源整合與利用的基礎(chǔ)。本文對(duì)領(lǐng)域內(nèi)3個(gè)具有代表性的學(xué)術(shù)類(lèi)微信公眾號(hào)從賬號(hào)層面和發(fā)布內(nèi)容的篇章層面進(jìn)行了全面分析,發(fā)現(xiàn)賬號(hào)的運(yùn)營(yíng)主體性質(zhì)對(duì)賬號(hào)發(fā)布內(nèi)容屬性起決定性作用,賬號(hào)影響力指數(shù)可以在一定程度上反映出賬號(hào)發(fā)布內(nèi)容的認(rèn)可度和價(jià)值,不同類(lèi)型文章的字?jǐn)?shù)存在明顯分層,文章之間的轉(zhuǎn)載關(guān)系常發(fā)生于相近的學(xué)科賬號(hào)間以及微信文章具有強(qiáng)話題性。綜上所述,通過(guò)文章的責(zé)任者、具體內(nèi)容參數(shù)(如主題、關(guān)鍵詞、類(lèi)型等)、相關(guān)文章等屬性可以較為高效地描述和關(guān)聯(lián)到目標(biāo)文章,驗(yàn)證了前文中所提出的學(xué)術(shù)文章描述框架。

    根據(jù)文章特點(diǎn)進(jìn)行描述框架設(shè)計(jì)是構(gòu)建資源庫(kù)的第一步,對(duì)特征屬性值的確立及對(duì)微信文章關(guān)鍵詞和主題的抽取、文章類(lèi)型的詳細(xì)劃分,將是下一步工作的主要任務(wù)。同時(shí),微信學(xué)術(shù)文章相關(guān)關(guān)系的多樣性也是它的獨(dú)特之處,對(duì)同類(lèi)型文章的發(fā)掘具有關(guān)鍵作用,對(duì)文章之間與賬號(hào)之間相關(guān)關(guān)系、賬號(hào)之間引用動(dòng)機(jī)的研究也是隨后值得探討的課題。

    猜你喜歡
    賬號(hào)檢索公眾
    彤彤的聊天賬號(hào)
    公眾號(hào)3月熱榜
    施詐計(jì)騙走游戲賬號(hào)
    派出所工作(2021年4期)2021-05-17 15:19:10
    公眾號(hào)9月熱榜
    公眾號(hào)8月熱榜
    公眾號(hào)5月熱榜
    2019年第4-6期便捷檢索目錄
    專(zhuān)利檢索中“語(yǔ)義”的表現(xiàn)
    Google Play游戲取消賬號(hào)綁定沒(méi)有Google賬號(hào)也能玩
    CHIP新電腦(2016年3期)2016-03-10 14:52:50
    國(guó)際標(biāo)準(zhǔn)檢索
    遵化市| 华亭县| 白山市| 大安市| 达孜县| 丁青县| 福安市| 玉山县| 永德县| 通榆县| 宜都市| 黔南| 辽阳市| 澄迈县| 万山特区| 黄大仙区| 运城市| 横峰县| 昔阳县| 梅河口市| 安溪县| 东阳市| 宁津县| 正蓝旗| 阿勒泰市| 中超| 丰宁| 盐津县| 仁寿县| 凭祥市| 垣曲县| 宁海县| 万荣县| 彩票| 西吉县| 卓尼县| 阳朔县| 黑龙江省| 云霄县| 大宁县| 西畴县|