• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中文社交媒體中學(xué)術(shù)論文的使用行為研究— 以知乎為例

      2022-04-01 01:57:20劉曉娟孫鏝莉
      圖書(shū)情報(bào)知識(shí) 2022年1期
      關(guān)鍵詞:學(xué)術(shù)論文編碼社交

      劉曉娟 孫鏝莉

      (北京師范大學(xué)政府管理學(xué)院,北京,100875)

      1 引言

      Altmetrics是基于社交網(wǎng)絡(luò)發(fā)展新型學(xué)術(shù)計(jì)量標(biāo)準(zhǔn)的學(xué)科[1]。相比于傳統(tǒng)引文分析,Altmetrics的計(jì)量指標(biāo)更多、測(cè)量對(duì)象更廣、評(píng)價(jià)速度更快[2]。越來(lái)越多的科研人員通過(guò)社交媒體進(jìn)行非正式的學(xué)術(shù)交流,以提高研究的關(guān)注度和可信度[3];科研管理人員也可以借助Altmetrics更全面、多元、及時(shí)地了解研究者的學(xué)術(shù)工作及影響力[4]。常用的Altmetrics整合工具包括Altmetric.com、PLOS ALM、Plum Analytics等,其Altmetrics指標(biāo)多來(lái)自社交媒體網(wǎng)站、文獻(xiàn)管理軟件和新聞媒體網(wǎng)站等[5]。然而,這些工具往往由于商業(yè)利益考慮或技術(shù)壁壘,所選取的指標(biāo)數(shù)據(jù)來(lái)源是存在傾向性的,比如Twitter、Facebook等在中國(guó)大陸普及率極低的社交媒體是其中重要的指標(biāo)數(shù)據(jù)來(lái)源,而中文社交媒體幾乎未被納入這些整合工具[6],僅有Altmetric.com從2014年開(kāi)始支持新浪微博,但由于登錄限制,自2015年已停止跟蹤。因此當(dāng)前主流的Altmetrics指標(biāo)具有一定的偏向性,很難公平地評(píng)價(jià)中文研究成果的影響力,且無(wú)法捕捉中文用戶(hù)對(duì)于學(xué)術(shù)成果的認(rèn)可度[7]。為進(jìn)一步完善Altmetrics指標(biāo)體系,提升Altmetrics在學(xué)術(shù)評(píng)價(jià)中應(yīng)用的可行性,有必要深入探討中文社交媒體納入Altmetrics的可行性。

      2010年底向公眾開(kāi)放的“知乎”網(wǎng)站(http://www.zhihu.com/)是目前國(guó)內(nèi)最受歡迎的網(wǎng)絡(luò)問(wèn)答社區(qū),用戶(hù)通過(guò)提問(wèn)、回答、專(zhuān)欄文章等形式分享彼此的知識(shí)、經(jīng)驗(yàn)和見(jiàn)解,在交流過(guò)程中,用戶(hù)會(huì)因討論、評(píng)價(jià)或介紹某個(gè)話(huà)題,或者為了證明某個(gè)觀(guān)點(diǎn)而提及學(xué)術(shù)論文。在研究用戶(hù)的學(xué)術(shù)交流行為時(shí),相較于其他中文社交媒體,知乎具有獨(dú)特的優(yōu)勢(shì)。如微信由于私密性較強(qiáng),用戶(hù)的學(xué)術(shù)交流行為數(shù)據(jù)不易獲?。欢醯墓_(kāi)度較高,用戶(hù)交流數(shù)據(jù)便于獲取。微博的話(huà)題屬于平級(jí)結(jié)構(gòu),用戶(hù)在一條微博中需自主添加多個(gè)標(biāo)簽才能提高討論的關(guān)注度;而知乎用戶(hù)在發(fā)文時(shí)則必須綁定話(huà)題,該平臺(tái)的全部話(huà)題通過(guò)父子關(guān)系構(gòu)成樹(shù)形結(jié)構(gòu),如機(jī)器學(xué)習(xí)的父話(huà)題包括人工智能算法和數(shù)據(jù)科學(xué)等,子話(huà)題包括社會(huì)網(wǎng)絡(luò)分析和貝葉斯統(tǒng)計(jì)等,子話(huà)題中的內(nèi)容會(huì)被推送至父話(huà)題討論頁(yè)面,這種信息組織形式使學(xué)術(shù)交流效率得以提高,也便于話(huà)題相關(guān)數(shù)據(jù)的抓取。由于社交媒體的開(kāi)放性特點(diǎn),用戶(hù)使用論文的場(chǎng)景、形式、動(dòng)機(jī)、內(nèi)容等各不相同,而這些多樣性體現(xiàn)了用戶(hù)對(duì)學(xué)術(shù)論文的多種觀(guān)點(diǎn)和態(tài)度,以及被使用論文的價(jià)值所在。通過(guò)調(diào)研發(fā)現(xiàn),在知乎中,用戶(hù)對(duì)學(xué)術(shù)論文的提及和討論等使用行為比較活躍,適合作為樣本展開(kāi)研究?;谝陨媳尘埃疚囊灾鯙槔?,對(duì)中文社交媒體中用戶(hù)使用學(xué)術(shù)論文的行為進(jìn)行深入研究,探索用戶(hù)的行為特點(diǎn),從用戶(hù)行為的角度探討將知乎用于補(bǔ)充Altmetrics數(shù)據(jù)源、評(píng)價(jià)論文影響力的價(jià)值。

      2 相關(guān)研究

      2.1 學(xué)術(shù)論文中的引用行為

      對(duì)于學(xué)術(shù)論文中的引用行為,相關(guān)研究已經(jīng)相對(duì)成熟,對(duì)引用行為進(jìn)行了全面和深入的挖掘,特別是對(duì)引用動(dòng)機(jī)、情感傾向等方面的討論。Moravcsik等[8]從四個(gè)維度對(duì)引用行為進(jìn)行分類(lèi)—概念性或操作性、陳述性或敷衍性、擴(kuò)展或同質(zhì)、肯定或否定;Shadish等[9]通過(guò)問(wèn)卷調(diào)查和因子分析研究心理學(xué)領(lǐng)域的引用行為,發(fā)現(xiàn)了6種主要的引用動(dòng)機(jī):舉例式、負(fù)面性、支持型、創(chuàng)造性、基于個(gè)人影響力、基于社會(huì)原因的引用;邱均平等[10]將引用動(dòng)機(jī)分為內(nèi)在引用動(dòng)機(jī)和外在引用動(dòng)機(jī)兩個(gè)大類(lèi),以及知識(shí)主張、價(jià)值感知、信息源便利性、引用輸出、引用重要性五個(gè)子類(lèi),通過(guò)問(wèn)卷調(diào)查和數(shù)據(jù)分析,研究引用動(dòng)機(jī)對(duì)引用行為以及不同引用動(dòng)機(jī)間的影響關(guān)系;趙蓉英等人[11]提出全文本引文分析法,即以施引文獻(xiàn)的全文數(shù)據(jù)為研究對(duì)象,量化和識(shí)別引用行為所反映的文獻(xiàn)之間的影響關(guān)系,進(jìn)而更加全面、準(zhǔn)確地計(jì)算和評(píng)價(jià)學(xué)術(shù)影響力;胡志剛[12]通過(guò)開(kāi)發(fā)系統(tǒng)提取論文的引用行為信息,包括引用位置、引用次數(shù)和引用語(yǔ)境,揭示引用行為的規(guī)律和特征,從而發(fā)現(xiàn)作者的引用動(dòng)機(jī),以及被引文獻(xiàn)在原文中的功能和作用。

      2.2 社交媒體中的論文使用行為

      本研究所指的社交媒體中的論文使用行為是指在各種平臺(tái)上通過(guò)某種手段(如鏈接、標(biāo)識(shí)符、特定操作等)提及科研文獻(xiàn)的行為[13]。社交媒體中的論文使用行為與學(xué)術(shù)論文中的引用行為具有相似性,其動(dòng)機(jī)可能是為了證明自己的觀(guān)點(diǎn)、梳理相關(guān)主題的研究動(dòng)向和借鑒研究方法與結(jié)論等。在對(duì)這兩種行為開(kāi)展的研究中,多是通過(guò)調(diào)查、歸納等方法建立論文的使用或引用行為的分類(lèi)體系,通過(guò)內(nèi)容分析法對(duì)行為展開(kāi)研究。

      相對(duì)于發(fā)表學(xué)術(shù)論文的科研人員來(lái)說(shuō),社交媒體用戶(hù)的職業(yè)種類(lèi)更多、科研水平差異更大,使用論文的行為和情境更復(fù)雜。已有不少研究對(duì)社交媒體上的論文使用行為展開(kāi)研究。Shema等人通過(guò)對(duì)科學(xué)類(lèi)博客ResearchBlogging.org進(jìn)行研究,發(fā)現(xiàn)該博客的用戶(hù)傾向于使用高影響力的期刊論文[14],而在博客中被使用的論文,其被引頻次也要高于同年內(nèi)同一期刊中未被使用的論文[15]。Thelwall等[16]對(duì)270條鏈接到學(xué)術(shù)論文的推文進(jìn)行動(dòng)機(jī)分析,發(fā)現(xiàn)大部分推文只是復(fù)述論文標(biāo)題或提供摘要,95%的用戶(hù)對(duì)論文不發(fā)表意見(jiàn),很難通過(guò)推文內(nèi)容深入了解用戶(hù)對(duì)論文的看法。2015年,Shema等人[17]針對(duì)博客上的學(xué)術(shù)論文使用行為,創(chuàng)建了一個(gè)較為通用的動(dòng)機(jī)分類(lèi)方案,包括討論、批判、建議、轉(zhuǎn)發(fā)、延伸、自引等十大類(lèi)和若干子類(lèi),通過(guò)對(duì)391篇健康類(lèi)博客文章進(jìn)行內(nèi)容分析,發(fā)現(xiàn):自引現(xiàn)象極少,存在少量對(duì)論文的批評(píng),且博文作者試圖與廣泛的非學(xué)術(shù)受眾進(jìn)行互動(dòng)。Na基于上述Shema等人的分類(lèi)方案,使用內(nèi)容分析法先后對(duì)Twitter[18]和Facebook[19]上與論文相關(guān)的討論進(jìn)行研究,發(fā)現(xiàn)將近一半的討論只是簡(jiǎn)單分享論文,并沒(méi)有深入討論學(xué)術(shù)問(wèn)題,且推文的情感多是中性的,很少有負(fù)面情緒表露。

      2.3 Altmetrics指標(biāo)的可用性研究

      社交媒體是否能成為Altmetrics數(shù)據(jù)源取決于其指標(biāo)在評(píng)價(jià)論文影響力時(shí)的有效性,以往研究常通過(guò)對(duì)社交媒體的Altmetrics指標(biāo)和論文影響力評(píng)價(jià)的傳統(tǒng)指標(biāo)進(jìn)行相關(guān)性分析而加以判斷。常用的社交媒體指標(biāo)包括Mendeley讀者數(shù),Altmetric Attention Score,以及Twitter、Blog、Facebook和Google+的提及數(shù)等;常用的論文影響力評(píng)價(jià)傳統(tǒng)指標(biāo)包括Web of Science被引頻次、谷歌學(xué)術(shù)被引頻次和h指數(shù)等。通過(guò)相關(guān)性分析,Eysenbach[20]指出論文發(fā)表后三天內(nèi)在推特上的討論度可以預(yù)測(cè)其是否會(huì)成為高被引論文;郝若揚(yáng)[6]認(rèn)為高Altmetrics指標(biāo)的論文同時(shí)具有較高的學(xué)術(shù)影響力;黃曉等人[21]指出高被引論文的被引頻次與大多數(shù)Altmetrics指標(biāo)都具有顯著相關(guān)性,但相關(guān)屬性和程度有所差別。以往研究發(fā)現(xiàn)Altmetrics指標(biāo)與傳統(tǒng)的引文指標(biāo)在評(píng)價(jià)結(jié)果上既有相似性也有差異性,認(rèn)為所分析的Altmetrics指標(biāo)可以體現(xiàn)論文的社會(huì)影響力,不能取代傳統(tǒng)引文指標(biāo),但可以對(duì)論文影響力評(píng)價(jià)起補(bǔ)充作用[22-24]。

      3 研究設(shè)計(jì)

      本文主要借助內(nèi)容分析法對(duì)社交媒體中用戶(hù)的論文使用行為進(jìn)行研究。通過(guò)調(diào)查和歸納,對(duì)用戶(hù)的論文使用行為構(gòu)建分類(lèi)體系,由兩位編碼員共同編碼,并對(duì)編碼的信度進(jìn)行檢驗(yàn)?;诰幋a結(jié)果對(duì)用戶(hù)的論文使用行為進(jìn)行分析,并將論文使用次數(shù)、所獲總點(diǎn)贊數(shù)和評(píng)論數(shù)等用戶(hù)行為數(shù)據(jù)分別與常用的論文影響力評(píng)價(jià)指標(biāo)進(jìn)行相關(guān)性分析,從而發(fā)現(xiàn)用戶(hù)行為規(guī)律,在此基礎(chǔ)上討論知乎作為Altmetrics數(shù)據(jù)源的可能性。

      3.1 數(shù)據(jù)集

      3.1.1 數(shù)據(jù)源選擇及數(shù)據(jù)處理

      作為廣受歡迎的中文社交媒體,知乎通過(guò)問(wèn)答、專(zhuān)欄文章等方式為用戶(hù)提供話(huà)題交流平臺(tái),并向用戶(hù)推薦相關(guān)話(huà)題的討論內(nèi)容,根據(jù)點(diǎn)贊數(shù)、評(píng)論數(shù)對(duì)討論進(jìn)行排序,其內(nèi)容推送與評(píng)價(jià)機(jī)制可以使討論及時(shí)地被更多用戶(hù)瀏覽和回應(yīng)、鼓勵(lì)用戶(hù)積極參與交流、提高學(xué)術(shù)交流的效率。在良好的網(wǎng)絡(luò)社區(qū)生態(tài)中,用戶(hù)的交流意愿也較高。以“機(jī)器學(xué)習(xí)”話(huà)題為例,截至2021年1月,該話(huà)題有106萬(wàn)左右的關(guān)注者和4.4萬(wàn)左右的問(wèn)題,因話(huà)題具有專(zhuān)業(yè)性和前沿性,其中用戶(hù)的學(xué)術(shù)交流較為頻繁。由于研究者的學(xué)科領(lǐng)域會(huì)對(duì)其社交媒體中的學(xué)術(shù)交流活動(dòng)產(chǎn)生影響[25-27],論文的學(xué)科領(lǐng)域會(huì)對(duì)Altmetrics的覆蓋率產(chǎn)生影響[21,28],因此在研究社交媒體上的論文使用行為時(shí),應(yīng)對(duì)學(xué)科因素進(jìn)行控制。綜合以上因素,本研究將知乎的“機(jī)器學(xué)習(xí)”話(huà)題內(nèi)容作為研究對(duì)象,在討論頁(yè)面(https://www.zhihu.com/topic/19559450/hot)抓取了共1,267篇回答和專(zhuān)欄文章,數(shù)據(jù)最終獲取時(shí)間為2020年1月16日,抓取的字段為回答或?qū)谖恼碌臉?biāo)題、鏈接,以及作者的主頁(yè)鏈接、昵稱(chēng)、簡(jiǎn)介、關(guān)注數(shù)、被關(guān)注數(shù)和成就。

      對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,若回答或?qū)谖恼轮谐霈F(xiàn)了學(xué)術(shù)論文的標(biāo)題或鏈接,即視為存在論文使用行為,并以此為標(biāo)準(zhǔn)進(jìn)行人工篩選和摘錄,最終得到424篇有論文使用行為的回答和專(zhuān)欄文章,以及共計(jì)3,882條論文使用行為記錄,并通過(guò)去重得到3,301篇被使用的學(xué)術(shù)論文。

      在進(jìn)行預(yù)處理時(shí),發(fā)現(xiàn)所抓取的回答和專(zhuān)欄文章中,有6組共15篇內(nèi)容幾乎相同,涉及到260條被使用的論文數(shù)據(jù),占總體的6.70%。這種情況多是因?yàn)樽髡咿D(zhuǎn)載并發(fā)布了同一來(lái)源的內(nèi)容,或者作者一稿多投等,但考慮到這些回答和專(zhuān)欄文章的點(diǎn)贊數(shù)、評(píng)論數(shù)和發(fā)布作者都不同,數(shù)據(jù)占比較低,且此現(xiàn)象是社交媒體上用戶(hù)行為的體現(xiàn),故未對(duì)重復(fù)數(shù)據(jù)進(jìn)行嚴(yán)格剔除。

      3.1.2 回答和專(zhuān)欄文章數(shù)據(jù)基本情況

      對(duì)所獲取的424篇回答和專(zhuān)欄文章的數(shù)據(jù)發(fā)布時(shí)間進(jìn)行統(tǒng)計(jì)分析,結(jié)果如圖1(a)所示。由于知乎話(huà)題頁(yè)面只提供近期內(nèi)容以供瀏覽,因此本研究所獲取數(shù)據(jù)的發(fā)布時(shí)間主要集中在2019年10月-2020年1月。

      對(duì)所獲取數(shù)據(jù)的點(diǎn)贊數(shù)和評(píng)論數(shù)的分布進(jìn)行分析,結(jié)果分別如圖1(b)、1(c)所示。由于數(shù)據(jù)的發(fā)布時(shí)間與獲取時(shí)間相隔較近,故整體數(shù)值偏低;點(diǎn)贊數(shù)和評(píng)論數(shù)大多集中在較低值范圍,較高值范圍的數(shù)據(jù)很少。

      對(duì)所獲取回答和專(zhuān)欄文章的作者情況進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)大多數(shù)作者沒(méi)有公開(kāi)身份,在可獲取用戶(hù)身份的回答和專(zhuān)欄文章中,超過(guò)一半均是碩博研究生發(fā)布的。這表明社交媒體中的用戶(hù)更傾向于保持匿名狀態(tài),試圖使學(xué)術(shù)交流更關(guān)注內(nèi)容而非用戶(hù)本人;而在公開(kāi)身份的用戶(hù)中,處于科研成長(zhǎng)期的用戶(hù)的學(xué)術(shù)交流行為更為活躍。

      3.1.3 論文數(shù)據(jù)基本情況

      對(duì)被使用的3,301篇論文展開(kāi)分析,這些論文的公開(kāi)發(fā)表時(shí)間如圖2(a)所示,論文發(fā)表時(shí)間跨度較大,最早可至1948年,絕大多數(shù)論文的發(fā)表時(shí)間集中在2013-2020年。

      對(duì)近五年發(fā)表且能獲取發(fā)表月份的2,911篇論文展開(kāi)分析,其發(fā)表月份分布如圖2(b)所示。從圖中可知,2015-2019年被使用的論文逐漸增多;論文的發(fā)表月份相對(duì)均衡,但2019年9月、2019年12月、2020年1月的論文相對(duì)較多,尤其是2019年12月的論文達(dá)到了極高值772篇。多數(shù)論文的發(fā)表時(shí)間與回答和專(zhuān)欄文章的發(fā)布時(shí)間接近,這體現(xiàn)了社交媒體中用戶(hù)使用論文的及時(shí)性。

      3.2 編碼設(shè)計(jì)與實(shí)施

      3.2.1 構(gòu)建編碼體系

      在借鑒以往研究的基礎(chǔ)上,結(jié)合知乎網(wǎng)站的實(shí)際情況,本研究將用戶(hù)的學(xué)術(shù)論文使用行為分為三個(gè)方面:使用場(chǎng)景、使用形式和使用語(yǔ)境,其中使用形式又細(xì)分為提及方式和詳細(xì)程度,使用語(yǔ)境又分為情感態(tài)度和使用動(dòng)機(jī),共五大類(lèi),每類(lèi)又細(xì)分了若干子類(lèi)進(jìn)行編碼。分類(lèi)及具體說(shuō)明見(jiàn)表1。

      圖2 ?被使用論文的發(fā)表時(shí)間情況Fig.2 Publication Time of the Used Papers

      表1 知乎用戶(hù)的論文使用行為分類(lèi)編碼體系Table1 Classification and Coding System of Zhihu Users' Papers Usage Behaviors

      使用場(chǎng)景是指用戶(hù)撰寫(xiě)回答或?qū)谖恼碌哪康?,編碼單位是回答或?qū)谖恼拢瑢?duì)其性質(zhì)進(jìn)行區(qū)分,從而發(fā)現(xiàn)論文使用行為的整體背景。

      使用形式包括提及方式和詳細(xì)程度,其編碼單位是回答或?qū)谖恼轮忻恳黄皇褂玫膶W(xué)術(shù)論文。提及方式指用戶(hù)在回答或?qū)谖恼轮刑峒罢撐臅r(shí),給出的論文信息形式。了解用戶(hù)使用論文時(shí)的提及方式,可以探索社交媒體用戶(hù)使用論文的主要形式和規(guī)范意識(shí),同時(shí)討論在知乎捕獲論文使用行為時(shí)所需采用的手段及其可行性。詳細(xì)程度指回答或?qū)谖恼轮袑?duì)論文介紹的詳細(xì)程度,分為列舉、簡(jiǎn)單提及和有一定篇幅的使用三類(lèi)。

      使用語(yǔ)境包括情感態(tài)度和使用動(dòng)機(jī),編碼單位是回答或?qū)谖恼轮忻恳黄皇褂玫膶W(xué)術(shù)論文。情感態(tài)度主要分為四類(lèi),用來(lái)描述作者對(duì)所使用論文的情感偏向。使用動(dòng)機(jī)從三個(gè)角度進(jìn)行分類(lèi):使用原因側(cè)重于描述論文得以吸引用戶(hù)使用的特質(zhì),如新穎度、主題相關(guān)度、認(rèn)可度等;使用內(nèi)容側(cè)重于描述用戶(hù)使用的具體內(nèi)容,若使用了正文內(nèi)容,則可進(jìn)一步細(xì)分為四類(lèi);自引側(cè)重于用戶(hù)使用自己所發(fā)表論文的情況。了解用戶(hù)使用論文時(shí)的詳細(xì)程度,并結(jié)合使用場(chǎng)景、使用語(yǔ)境等信息,可對(duì)用戶(hù)行為規(guī)律進(jìn)行更深入的分析,從而發(fā)現(xiàn)社交媒體中被使用論文的價(jià)值所在。

      由于用戶(hù)的使用行為具有復(fù)雜性和多樣性,在編碼時(shí),A、B、C、D四類(lèi)每一類(lèi)都只選擇一個(gè)子類(lèi)標(biāo)注,E類(lèi)可以選擇一到三個(gè)子類(lèi)進(jìn)行標(biāo)注。

      3.2.2 預(yù)編碼

      本研究采用兩位編碼員共同編碼的形式,在正式編碼前學(xué)習(xí)編碼體系、進(jìn)行預(yù)編碼并驗(yàn)證信度。由于部分回答或?qū)谖恼麓嬖诙嗥信e型論文使用行為,即在同一篇回答或?qū)谖恼轮杏脩?hù)以列舉形式使用多篇論文、且未對(duì)每篇論文展開(kāi)介紹的情況,而這類(lèi)行為在數(shù)據(jù)中占比較大、標(biāo)注規(guī)則又較為統(tǒng)一,因此編碼員抽取了非多篇列舉型論文使用行為的10%進(jìn)行預(yù)編碼。完成預(yù)編碼后,編碼員再次進(jìn)行討論和學(xué)習(xí),明確并細(xì)化了編碼規(guī)則,得到預(yù)編碼中使用場(chǎng)景、使用形式和使用語(yǔ)境各類(lèi)的一致性系數(shù)均超過(guò)90%。

      3.2.3 正式編碼

      對(duì)未進(jìn)行預(yù)編碼的3,692條數(shù)據(jù)進(jìn)行正式編碼,除使用場(chǎng)景、提及方式、詳細(xì)程度、情感態(tài)度和使用動(dòng)機(jī)外,需要標(biāo)注的字段還有每篇回答或?qū)谖恼碌狞c(diǎn)贊數(shù)、評(píng)論數(shù)、發(fā)布時(shí)間,以及每篇論文的公開(kāi)發(fā)表時(shí)間。前三項(xiàng)數(shù)據(jù)的獲取截止日期為2020年3月1日,第四項(xiàng)數(shù)據(jù)采用論文公開(kāi)發(fā)表的時(shí)間也是論文最早開(kāi)始產(chǎn)生影響的時(shí)間,包括以非正式的形式發(fā)表在預(yù)收錄、學(xué)術(shù)交流或公開(kāi)評(píng)審平臺(tái)(如arXiv、ResearchGate、OpenReview等)的時(shí)間。完成正式編碼后,研究人員隨機(jī)抽取了50條數(shù)據(jù)進(jìn)行二次編碼,得到各類(lèi)編碼一致性系數(shù)均超過(guò)了95%,再次證明了本次內(nèi)容編碼的可信度。編碼示例如表2所示。

      4 知乎用戶(hù)學(xué)術(shù)論文使用行為編碼結(jié)果分析

      通過(guò)內(nèi)容編碼,對(duì)使用行為中使用場(chǎng)景、使用形式、使用語(yǔ)境、使用次數(shù)的編碼結(jié)果進(jìn)行分析,并結(jié)合各類(lèi)之間的交叉分析,發(fā)現(xiàn)不同類(lèi)別之間可能存在的聯(lián)系,以對(duì)知乎用戶(hù)的使用行為進(jìn)行原因探索和規(guī)律總結(jié)。

      4.1 使用場(chǎng)景

      對(duì)424篇有論文使用行為的回答或?qū)谖恼碌氖褂脠?chǎng)景進(jìn)行分析,結(jié)果如圖3(a)所示。使用了論文的回答或?qū)谖恼麓蠖嗍桥c某些研究問(wèn)題、主題等相關(guān)(42.93%),以及整篇偏向于對(duì)論文的討論、解讀、評(píng)價(jià)等(39.62%);相比于其他使用場(chǎng)景,在與論文討論相關(guān)的場(chǎng)景中,使用行為對(duì)論文描述的詳細(xì)程度更高、對(duì)論文的情感態(tài)度更明確。因介紹期刊而使用論文的情況極少(0.47%),而因介紹學(xué)術(shù)會(huì)議而使用論文的情況稍多一些(4.95%),這可能是因?yàn)樵跈C(jī)器學(xué)習(xí)領(lǐng)域,部分會(huì)議論文相較于期刊論文更受到關(guān)注和認(rèn)可,許多學(xué)者也更偏向于在學(xué)術(shù)會(huì)議上分享自己最新的研究成果和進(jìn)展。此外,存在論文使用行為的424篇回答或?qū)谖恼轮?,與職業(yè)、學(xué)習(xí)和資源提供相關(guān)的場(chǎng)景占10.85%,但該類(lèi)別中的論文使用行為卻在3,882條使用行為中占據(jù)48.43%,且這些使用行為中93.62%為簡(jiǎn)單的列舉、98.67%持中性的情感態(tài)度,可見(jiàn)該類(lèi)回答或?qū)谖恼鲁J褂么罅空撐牡凑归_(kāi)介紹或評(píng)價(jià)。

      知乎用戶(hù)通常在討論某個(gè)主題或論文時(shí)使用論文,說(shuō)明用戶(hù)在知乎使用論文的行為并不是無(wú)目的、無(wú)意義或隨機(jī)的,而是期望形成有效的專(zhuān)業(yè)交流,這也表明知乎存在較多愿意進(jìn)行學(xué)術(shù)交流的用戶(hù)和有利于學(xué)術(shù)交流的環(huán)境,其中的論文使用行為在一定程度上能夠反映中文社交媒體用戶(hù)對(duì)論文的關(guān)注度和認(rèn)可度。

      圖3 ?用戶(hù)論文使用行為的編碼結(jié)果分析Fig.3 Analysis of Coding Results of Users’Paper Usage Behaviors

      4.2 使用形式

      對(duì)3,882條使用行為對(duì)論文的提及方式進(jìn)行分析,結(jié)果如圖3(b)所示。提及論文時(shí),使用標(biāo)準(zhǔn)引文格式的行為占16.41%;使用形似引文格式、但信息不全的非標(biāo)準(zhǔn)引文格式的行為占15.77%;其他不太規(guī)范的使用行為中,使用標(biāo)題和鏈接的情況較多(51.70%)??梢?jiàn)在對(duì)論文引用格式并無(wú)嚴(yán)格規(guī)定的知乎,大多數(shù)情況下用戶(hù)對(duì)論文的提及方式不是標(biāo)準(zhǔn)的引文格式,而是傾向于多種不規(guī)范的形式,這體現(xiàn)了用戶(hù)在知乎發(fā)布內(nèi)容時(shí)的隨意性,可能會(huì)給捕獲論文使用行為、準(zhǔn)確統(tǒng)計(jì)論文使用情況等帶來(lái)困難。

      對(duì)3,882條使用行為對(duì)論文使用的詳細(xì)程度進(jìn)行分析,結(jié)果如圖3(c)所示。大部分論文被使用的詳細(xì)程度為簡(jiǎn)單的列舉(68.11%),除了論文的部分題錄信息,對(duì)論文幾乎沒(méi)有更多的解釋或說(shuō)明;除標(biāo)題、作者等信息外,對(duì)論文還有簡(jiǎn)要介紹的占比為20.38%;對(duì)論文有一定篇幅的解讀、評(píng)價(jià)或說(shuō)明的情況占比最少,為11.51%。由此可見(jiàn),相比于學(xué)術(shù)論文中的引用行為,知乎用戶(hù)在使用論文時(shí),較少對(duì)論文展開(kāi)詳細(xì)介紹,因此有時(shí)需結(jié)合回答或?qū)谖恼碌母鄡?nèi)容對(duì)其使用目的進(jìn)行識(shí)別和分類(lèi)。

      4.3 使用語(yǔ)境

      對(duì)3,882條使用行為的情感態(tài)度進(jìn)行分析,結(jié)果如圖3(d)所示。證明、解答、客觀(guān)討論、解讀等中性的評(píng)價(jià)占了絕大多數(shù)(92.50%);明確的推薦、贊賞等正面評(píng)價(jià)占比6.88%;而批評(píng)、質(zhì)疑和反對(duì)等負(fù)面評(píng)價(jià)僅占0.23%,少于雙向評(píng)價(jià)(0.39%)??梢?jiàn)用戶(hù)在知乎使用論文時(shí)極少表露明確的情感態(tài)度。

      對(duì)3,882條使用行為的使用動(dòng)機(jī)進(jìn)行分析, 結(jié)果如圖3(e)所示。從編碼結(jié)果看,絕大多數(shù)對(duì)論文的使用動(dòng)機(jī)是論文與某個(gè)問(wèn)題或主題相關(guān)(87.87%),這種情況在各種使用場(chǎng)景下的回答或?qū)谖恼轮芯休^高占比。由于論文的新穎性而使用論文的行為占26.46%,其中超過(guò)90%發(fā)生在提供資源的回答或?qū)谖恼轮校覂H以列舉形式使用,說(shuō)明知乎用戶(hù)會(huì)積極分享近期新發(fā)表的論文,但很少進(jìn)行介紹和評(píng)價(jià)。由于論文被認(rèn)可而使用論文的情況僅占6.16%,其中64.83%均對(duì)論文有所介紹,說(shuō)明用戶(hù)傾向于對(duì)受到認(rèn)可的論文進(jìn)行更詳細(xì)的描述。部分行為使用了論文內(nèi)容,24.76%使用了論文的正文內(nèi)容,對(duì)論文摘要信息、論文的實(shí)踐應(yīng)用的使用占比很少,分別為2.60%和2.37%。相對(duì)于其他場(chǎng)景而言,用戶(hù)更傾向于在介紹論文的回答或?qū)谖恼轮惺褂谜撐膬?nèi)容,尤其是正文內(nèi)容,而在與職業(yè)、學(xué)習(xí)和資源提供相關(guān)的場(chǎng)景中極少使用論文內(nèi)容,這可能是由于用戶(hù)在解讀論文時(shí)更容易使用論文的內(nèi)容加以說(shuō)明,而在提供資源時(shí)不會(huì)介紹太多。自引行為極為少見(jiàn),機(jī)構(gòu)自引與作者自引的情況分別為0.80%、0.77%,均不超過(guò)1.00%,但自引在各類(lèi)回答或?qū)谖恼轮卸加谐霈F(xiàn),大多數(shù)均傾向于對(duì)論文展開(kāi)介紹,作者自引的介紹篇幅整體多于機(jī)構(gòu)自引;作者自引中對(duì)論文持正面態(tài)度的多于機(jī)構(gòu)自引,占28.57%,其余均為中性態(tài)度,沒(méi)有負(fù)面評(píng)價(jià)。

      表2 ?知乎用戶(hù)的論文使用行為編碼示例Table 2 Examples of Coding of Paper Usage Behavior of Zhihu Users

      在961條使用了論文正文內(nèi)容的使用行為中,大多數(shù)使用行為都使用了論文的理論、模型、算法和方法等內(nèi)容(73.78%),使用了論文中的結(jié)果、結(jié)論和觀(guān)點(diǎn)等內(nèi)容的行為占比也高達(dá)50.16%,提及論文數(shù)據(jù)的行為較少,僅占6.87%,說(shuō)明用戶(hù)更關(guān)心論文的主體內(nèi)容。

      結(jié)合使用語(yǔ)境、使用形式和使用場(chǎng)景共同分析,發(fā)現(xiàn)在使用論文時(shí),對(duì)論文介紹的詳細(xì)程度越高,正面、負(fù)面或雙向等非中性的情感態(tài)度越有可能表露,使用動(dòng)機(jī)越有可能得到較多體現(xiàn)。因此,詳細(xì)程度、使用場(chǎng)景、使用動(dòng)機(jī)不同的論文使用行為中,被使用論文所體現(xiàn)的價(jià)值可能有所差別,論文產(chǎn)生的影響力也不同,在進(jìn)行論文影響力評(píng)價(jià)時(shí)可用加權(quán)等方法對(duì)其指標(biāo)稍作調(diào)節(jié)。

      4.4 使用次數(shù)

      對(duì)論文在3,882條使用行為中的被使用次數(shù)進(jìn)行統(tǒng)計(jì),發(fā)現(xiàn)絕大多數(shù)論文都只被使用了一次(88.25%),被使用2次的論文占8.21%;而被使用較高頻次的論文極少,5次以上的總計(jì)只有16篇。在相關(guān)研究中,也曾發(fā)現(xiàn)多個(gè)Altmetrics數(shù)據(jù)源存在高頻使用論文為極少數(shù)的現(xiàn)象[28]?;趦?nèi)容編碼的結(jié)果,分別對(duì)數(shù)據(jù)集內(nèi)被使用了1-2次和被使用了5-15次的論文對(duì)應(yīng)的使用行為進(jìn)行分析,以比較對(duì)于低頻和高頻使用的論文,用戶(hù)在使用時(shí)的行為特征。

      低頻使用的論文較多地出現(xiàn)在與職業(yè)、學(xué)習(xí)和資源提供相關(guān)的場(chǎng)景中(52.30%),這些使用行為大部分是列舉形式(72.19%),詳細(xì)程度較低。高頻使用的論文較多出現(xiàn)在與研究問(wèn)題、主題、方向、領(lǐng)域等相關(guān)的場(chǎng)景中(61.00%),這些使用行為多數(shù)會(huì)對(duì)論文展開(kāi)介紹(67.00%),詳細(xì)程度稍高;在動(dòng)機(jī)方面,這些論文會(huì)因得到某種認(rèn)可而被使用(23.00%),其正文內(nèi)容更多地被使用(41.00%),但極少因新穎度而被使用。

      論文被使用的次數(shù)在一定程度上反映了論文在知乎的關(guān)注度,高頻和低頻使用的論文在被使用過(guò)程中存在的用戶(hù)行為差異,表明知乎用戶(hù)有識(shí)別論文質(zhì)量和影響力的能力,從而說(shuō)明論文的知乎關(guān)注度可以部分體現(xiàn)論文的影響力。

      5 論文使用行為數(shù)據(jù)與常用影響力指標(biāo)的相關(guān)性分析

      5.1 論文使用行為數(shù)據(jù)與常用Altmetrics指標(biāo)的關(guān)系

      從3,301篇論文中抽取樣本,在置信度為95%、誤差為5%的情況下,通過(guò)Z檢驗(yàn)計(jì)算得到樣本量為344,再以論文被使用次數(shù)作為分層標(biāo)準(zhǔn)進(jìn)行分層抽樣。由于部分論文存在難以獲取DOI等信息、未被追蹤等問(wèn)題,無(wú)法通過(guò)Altmetric.com得到論文的AAS和使用了對(duì)應(yīng)論文的推特?cái)?shù),因此用于相關(guān)性分析的最終樣本量為286。對(duì)樣本論文在所獲知乎數(shù)據(jù)中所有使用行為的點(diǎn)贊數(shù)和評(píng)論數(shù)求和,得到每篇論文的總點(diǎn)贊數(shù)和總評(píng)論數(shù)。

      對(duì)286篇樣本論文所獲得的總點(diǎn)贊數(shù)、總評(píng)論數(shù)、知乎使用次數(shù)、AAS和推特?cái)?shù)分別進(jìn)行K-S檢驗(yàn),得知這五項(xiàng)均不符合正態(tài)分布,因此分別對(duì)論文的AAS和提及該論文的推特?cái)?shù)與所獲取知乎數(shù)據(jù)中對(duì)這篇論文的總點(diǎn)贊數(shù)、總評(píng)論數(shù)和使用次數(shù)進(jìn)行Spearman相關(guān)性分析。

      由表3、表4可知,推特?cái)?shù)、AAS分別與總點(diǎn)贊數(shù)、總評(píng)論數(shù)、使用次數(shù)均通過(guò)了相關(guān)性的顯著檢驗(yàn),其中與總點(diǎn)贊數(shù)的相關(guān)程度更高。這表明,上述三種論文使用行為數(shù)據(jù)一方面能在一定程度上與現(xiàn)有的常用Altmetrics指標(biāo)共同反映論文的社會(huì)影響力,另一方面也可能關(guān)注到這些Altmetrics指標(biāo)未反映的情況,從而有可能提供新的Altmetrics數(shù)據(jù)源和評(píng)價(jià)指標(biāo)。

      5.2 論文使用行為數(shù)據(jù)與WoS被引頻次的關(guān)系

      同樣地,完成樣本抽取后,由于部分論文無(wú)法通過(guò)Web of Science獲取到被引頻次,因此用于相關(guān)性分析的最終樣本量為174。

      對(duì)174篇樣本論文所獲得的總點(diǎn)贊數(shù)、總評(píng)論數(shù)、使用次數(shù)和被引頻次分別進(jìn)行K-S檢驗(yàn),得知這四項(xiàng)均不符合正態(tài)分布,因此將論文的被引頻次分別與所獲取知乎數(shù)據(jù)中對(duì)這篇論文的總點(diǎn)贊數(shù)、總評(píng)論數(shù)和使用次數(shù)進(jìn)行Spearman相關(guān)性分析。

      由表5可知,被引頻次與總點(diǎn)贊數(shù)、總評(píng)論數(shù)具有顯著相關(guān)性,但與使用次數(shù)不具有相關(guān)關(guān)系??梢?jiàn)上述三種論文使用行為數(shù)據(jù)中,總點(diǎn)贊數(shù)和總評(píng)論數(shù)能在一定程度上反映論文的學(xué)術(shù)價(jià)值。

      6 結(jié)論與展望

      當(dāng)前主流的Altmetrics指標(biāo)對(duì)中文社交媒體的關(guān)注較少,在評(píng)價(jià)中文研究成果和反映中文用戶(hù)觀(guān)點(diǎn)時(shí)存在缺漏之處,因此需探索中文社交媒體上的論文使用行為,挖掘行為的屬性、動(dòng)機(jī)與模式。作為用戶(hù)眾多、交流活躍、內(nèi)容豐富的專(zhuān)業(yè)平臺(tái),知乎具有較高的研究?jī)r(jià)值。因此,本研究以中文社交媒體知乎為例,針對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的用戶(hù),對(duì)其學(xué)術(shù)論文使用行為展開(kāi)研究,討論在該平臺(tái)發(fā)展Altmetrics指標(biāo)的可能性,為Altmetrics數(shù)據(jù)源的補(bǔ)充和學(xué)術(shù)論文影響力的評(píng)價(jià)提供參考。同時(shí),本研究也為此類(lèi)問(wèn)題增加了研究實(shí)例,為后續(xù)基于社交媒體的學(xué)術(shù)交流行為研究提供理論、方法等方面的借鑒和參考。本研究的主要發(fā)現(xiàn)如下:

      (1)知乎用戶(hù)對(duì)學(xué)術(shù)論文的使用行為具有多樣性和復(fù)雜性,也存在一定的規(guī)律性。用戶(hù)在各種場(chǎng)景的回答或?qū)谖恼轮芯赡苁褂谜撐模乙杂懻撗芯恐黝}或論文的場(chǎng)景為主;用戶(hù)對(duì)論文的提及方式有多種形式,且通常不使用規(guī)范的引文格式;用戶(hù)對(duì)論文介紹的詳細(xì)程度、使用論文的情感態(tài)度和動(dòng)機(jī)各有不同,大多數(shù)情況下,論文使用行為的詳細(xì)程度較低、情感態(tài)度為中性、動(dòng)機(jī)是論文與主題相關(guān);用戶(hù)的使用行為之間具有關(guān)聯(lián)性,比如用戶(hù)在介紹某篇論文,特別是該論文已得到廣泛認(rèn)可時(shí),往往會(huì)對(duì)論文進(jìn)行更為詳細(xì)的描述。

      (2)知乎是一個(gè)適合開(kāi)展學(xué)術(shù)交流的中文社交媒體,用戶(hù)在交流中使用論文的行為可以反映他們對(duì)論文的關(guān)注和各種態(tài)度。知乎用戶(hù)會(huì)積極且及時(shí)地在社交媒體上使用或分享論文,從而增加新論文的關(guān)注度,但對(duì)論文的討論不太深入和具體,能形成高討論度的內(nèi)容也較少。該平臺(tái)還存在一些不足,如用戶(hù)提及論文時(shí)其格式缺少統(tǒng)一或規(guī)范,使用行為不易捕獲和統(tǒng)計(jì);用戶(hù)對(duì)論文的介紹或討論篇幅較短,不便于分析情感態(tài)度和使用動(dòng)機(jī)等。

      (3)結(jié)合相關(guān)性分析來(lái)看,針對(duì)機(jī)器學(xué)習(xí)領(lǐng)域的論文,知乎作為中文社交媒體,有成為各Altmetrics聚合平臺(tái)的新數(shù)據(jù)源的可能性,可以補(bǔ)充現(xiàn)有主流Altmetrics評(píng)價(jià)體系,從而更加全面地評(píng)價(jià)學(xué)術(shù)論文的社會(huì)影響力。

      表3 ?推特?cái)?shù)與總點(diǎn)贊數(shù)、總評(píng)論數(shù)、使用次數(shù)的相關(guān)性Table 3 Correlation Between the Number of Tweets and Total Likes, Total Comments, and the Number of Usage

      表4 ?AAS與總點(diǎn)贊數(shù)、總評(píng)論數(shù)、使用次數(shù)的相關(guān)性Table 4 Correlation Between AAS and Total Likes, Total Comments, and the Number of Usage

      表5 ?被引頻次與總點(diǎn)贊數(shù)、總評(píng)論數(shù)、使用次數(shù)的相關(guān)性Table 5 Correlation Between Citations Frequency and Total Likes, Total Comments, and the Number of Usage

      結(jié)合以上分析和發(fā)現(xiàn),本文對(duì)于將知乎作為新Altmetrics數(shù)據(jù)源評(píng)價(jià)學(xué)術(shù)論文的社會(huì)影響力提出以下建議。

      首先,知乎網(wǎng)站官方可以考慮為用戶(hù)對(duì)學(xué)術(shù)論文的使用提供一些輔助手段,如論文特殊標(biāo)識(shí)符、論文信息格式規(guī)范等,同時(shí)提供API接口、開(kāi)放部分?jǐn)?shù)據(jù),這樣不僅能為論文使用行為的識(shí)別、Altmetrics聚合平臺(tái)的數(shù)據(jù)獲取與統(tǒng)計(jì)提供便利,還能幫助用戶(hù)更高效地使用論文,一定程度上可以吸引更多用戶(hù)在知乎上進(jìn)行學(xué)術(shù)交流,有利于提高知乎的學(xué)術(shù)內(nèi)容質(zhì)量;其次,由于點(diǎn)贊數(shù)和評(píng)論數(shù)的浮動(dòng)性,應(yīng)對(duì)使用論文的行為進(jìn)行持續(xù)關(guān)注和更新,以更好地反映論文的即時(shí)影響力;再次,考慮到不同用戶(hù)的影響力差異,在必要時(shí)應(yīng)將用戶(hù)的關(guān)注度作為調(diào)節(jié)系數(shù)適當(dāng)?shù)丶{入影響力評(píng)價(jià)中,但該調(diào)節(jié)系數(shù)應(yīng)根據(jù)具體情況決定調(diào)節(jié)的方向(正向或負(fù)向);最后,在可能的情況下,應(yīng)將用戶(hù)在社交媒體中的論文使用行為分類(lèi),為每個(gè)類(lèi)別賦予不同的權(quán)重后,再將數(shù)據(jù)納入Altmetrics指標(biāo)體系,計(jì)算論文的社會(huì)影響力。

      本研究也存在一些不足之處。第一,由于知乎的網(wǎng)頁(yè)限制,所獲取的數(shù)據(jù)在時(shí)間上相對(duì)集中,研究中的分析和結(jié)論是基于特定時(shí)間內(nèi)的數(shù)據(jù),但在一定程度上依然反映了社交媒體用戶(hù)的論文使用行為規(guī)律。第二,本研究的數(shù)據(jù)僅從知乎“機(jī)器學(xué)習(xí)”話(huà)題抓取,其中的分析與結(jié)論僅能反映這一領(lǐng)域的情況,是否能夠推廣至其他領(lǐng)域還需要更多的研究驗(yàn)證。第三,由于所獲取數(shù)據(jù)中被使用的論文多是因近期發(fā)表而未被收錄的,其在Web of Science上的被引頻次無(wú)法獲得,因此在對(duì)知乎論文使用行為數(shù)據(jù)與被引頻次做相關(guān)性分析時(shí),樣本數(shù)據(jù)存在一定缺失,可能導(dǎo)致分析結(jié)果略有偏差。最后,本研究對(duì)社交媒體上用戶(hù)行為的分類(lèi)還有進(jìn)一步細(xì)化的空間。

      作者貢獻(xiàn)說(shuō)明

      劉曉娟:提出研究思路與框架,論文最終版本修訂;

      孫鏝莉:設(shè)計(jì)研究方案,數(shù)據(jù)獲取、處理及分析,論文撰寫(xiě)及修改。

      支撐數(shù)據(jù)

      支撐數(shù)據(jù)由作者自存儲(chǔ),Email:202021260065@mail.bnu.edu.cn。

      1、孫鏝莉. All data.xlsx. 用戶(hù)的論文使用數(shù)據(jù)及編碼結(jié)果.

      猜你喜歡
      學(xué)術(shù)論文編碼社交
      學(xué)術(shù)論文征集啟事
      學(xué)術(shù)論文征集啟事
      社交之城
      學(xué)術(shù)論文征集啟示
      學(xué)術(shù)論文征集啟事
      社交牛人癥該怎么治
      意林彩版(2022年2期)2022-05-03 10:25:08
      基于SAR-SIFT和快速稀疏編碼的合成孔徑雷達(dá)圖像配準(zhǔn)
      《全元詩(shī)》未編碼疑難字考辨十五則
      社交距離
      子帶編碼在圖像壓縮編碼中的應(yīng)用
      電子制作(2019年22期)2020-01-14 03:16:24
      威信县| 锡林浩特市| 历史| 公主岭市| 陈巴尔虎旗| 隆子县| 昌平区| 兴国县| 邯郸市| 景德镇市| 新干县| 婺源县| 东明县| 盱眙县| 临安市| 新昌县| 泗阳县| 吉安县| 怀柔区| 黄冈市| 苍山县| 平和县| 天台县| 九台市| 元江| 饶平县| 樟树市| 左云县| 康马县| 蚌埠市| 江城| 尼木县| 益阳市| 禹城市| 黔江区| 繁昌县| 太康县| 台湾省| 临武县| 万宁市| 东港市|