遲秀銘 房旭輝 郭順利
摘? 要:梳理中外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究熱點(diǎn)及其發(fā)展脈絡(luò),總結(jié)國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的異同,以期為我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究提供新思路和指導(dǎo)。以Web of Science和CNKI為文獻(xiàn)來(lái)源,運(yùn)用CiteSpace軟件對(duì)國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究熱點(diǎn)進(jìn)行可視化比較分析。我國(guó)未來(lái)網(wǎng)絡(luò)問(wèn)答社區(qū)研究需要深化完善已有的研究領(lǐng)域,擴(kuò)大研究范圍,創(chuàng)新研究方法,增強(qiáng)創(chuàng)新意識(shí),將研究成果應(yīng)用到網(wǎng)絡(luò)問(wèn)答社區(qū)運(yùn)營(yíng)管理實(shí)踐中。
關(guān)鍵詞:?jiǎn)柎鹕鐓^(qū);CiteSpace;比較分析;科學(xué)知識(shí)圖譜
中圖分類號(hào):TP391? 文獻(xiàn)標(biāo)識(shí)碼:A? 文章編號(hào):2096-4706(2023)04-0125-05
Visual Analysis and Enlightenment of the Research on Network Q&A Community Based on CiteSpace
CHI Xiuming1, FANG Xuhui2, GUO ShunLi2
(1.Laishan Library, Yantai? 264003, China; 2.School of Communication, Qufu Normal University, Rizhao? 276826, China)
Abstract: This paper sorts out the research hotspots and development context of the network Q&A community at home and abroad, and summarizes the similarities and differences of the research of the network Q&A community at home and abroad, with a view to providing new ideas and guidance for the research of the network Q&A community in China. It takes Web of Science and CNKI as the source of literature, and uses CiteSpace software to visually compare and analyze the research hotspots of network Q&A community at home and abroad. In the future, China's network Q&A community research needs to deepen and improve the existing research fields, expand the research scope, innovate research methods, enhance innovation awareness, and apply the research results to the operation and management of network Q&A community.
Keywords: Q&A community; CiteSpace; comparative analysis; scientific knowledge graph
0? 引? 言
網(wǎng)絡(luò)問(wèn)答社區(qū)作為Web 2.0模式下“用戶驅(qū)動(dòng)”的典型代表,成了互聯(lián)網(wǎng)用戶獲取相關(guān)信息與知識(shí)的主要途徑[1]。根據(jù)2021年新知青年大會(huì)的數(shù)據(jù),網(wǎng)絡(luò)問(wèn)答社區(qū)代表知乎的年訪問(wèn)人次超過(guò)30億,成為網(wǎng)民獲取知識(shí)的主要途徑之一。網(wǎng)絡(luò)問(wèn)答社區(qū)的發(fā)展和興起,成為學(xué)術(shù)界關(guān)注的熱點(diǎn)和研究對(duì)象。國(guó)內(nèi)外許多學(xué)者從不同的角度和維度對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)開(kāi)展了研究,涌現(xiàn)出大量有價(jià)值的研究。已有學(xué)者對(duì)相關(guān)成果進(jìn)行了梳理分析。例如:Gazan對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)的研究文獻(xiàn)進(jìn)行了回顧和分析[2];姜雯梳理了網(wǎng)絡(luò)問(wèn)答社區(qū)信息質(zhì)量評(píng)價(jià)方面的相關(guān)研究[3]等。綜上所述,從內(nèi)容上看,國(guó)內(nèi)外已有對(duì)于問(wèn)答社區(qū)的綜述類研究都偏向于某一方面文獻(xiàn)的梳理,鮮有學(xué)者關(guān)注國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的差異性,缺乏系統(tǒng)性的比較分析。就方法而言,以主觀的內(nèi)容解讀為主,運(yùn)用科學(xué)計(jì)量工具的客觀分析不多,而基于知識(shí)圖譜視角的量化研究則可以更為客觀地反映某一領(lǐng)域的研究熱點(diǎn)及趨勢(shì)。全面把握、對(duì)比剖析中外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究熱點(diǎn)及其發(fā)展脈絡(luò),對(duì)于促進(jìn)國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)方面的理論研究及實(shí)踐創(chuàng)新具有重大意義。
鑒于此,本文采用文獻(xiàn)計(jì)量學(xué)方法,運(yùn)用CiteSpace可視化工具,對(duì)國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究領(lǐng)域的文獻(xiàn)進(jìn)行可視化的對(duì)比分析。綜合共詞分析、聚類分析等方法,對(duì)比分析國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究熱點(diǎn)。以期為我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究提供新思路和指導(dǎo)。
1? 數(shù)據(jù)來(lái)源與檢索策略
為保證所收集數(shù)據(jù)的權(quán)威性和科學(xué)性,國(guó)外文獻(xiàn)選自Web of Science數(shù)據(jù)庫(kù)下的Web of Science核心合集,國(guó)內(nèi)文獻(xiàn)源于中國(guó)知網(wǎng)(CNKI)的期刊數(shù)據(jù)庫(kù)。在Web of Science核心合集數(shù)據(jù)庫(kù)中,采用主題檢索,以“TS=(Community Question Answer)OR TS=(Social Question Answer)OR TS=(Online Question Answer)”為檢索式,文獻(xiàn)類型為Articles、時(shí)間跨度為所有年份進(jìn)行檢索。在中國(guó)知網(wǎng)使用高級(jí)檢索,以“主題=問(wèn)答社區(qū)OR問(wèn)答網(wǎng)站OR問(wèn)答平臺(tái)”進(jìn)行檢索,檢索范圍為學(xué)術(shù)期刊,不設(shè)置時(shí)間跨度。檢索時(shí)間為2022年4月15日。篩選檢索后的文獻(xiàn),剔除關(guān)聯(lián)較小的文獻(xiàn),最終將421篇國(guó)外文獻(xiàn)和451篇國(guó)內(nèi)文獻(xiàn)納入分析樣本。
2? 國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的發(fā)展脈絡(luò)
國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)年發(fā)文量如圖1所示。根據(jù)圖1可以將國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的發(fā)展脈絡(luò)劃分為以下三個(gè)時(shí)期。
2.1? 萌芽時(shí)期(2007年—2012年)
這一時(shí)期,國(guó)內(nèi)外對(duì)于網(wǎng)絡(luò)問(wèn)答社區(qū)研究處于起步階段,發(fā)文量均比較少。該階段隨著用戶需求的增長(zhǎng)和互聯(lián)網(wǎng)的發(fā)展,社會(huì)化問(wèn)答網(wǎng)站應(yīng)運(yùn)而生。國(guó)內(nèi)外互聯(lián)網(wǎng)企業(yè)陸續(xù)上線了一些問(wèn)答服務(wù)產(chǎn)品和平臺(tái)。學(xué)者們對(duì)于這種新興的知識(shí)獲取獲取方式開(kāi)展了初步的研究。國(guó)內(nèi)學(xué)者們多是對(duì)這些國(guó)內(nèi)外的問(wèn)答平臺(tái)進(jìn)行比較分析,找出不足并提出改進(jìn)建議。國(guó)外學(xué)者多是分析網(wǎng)絡(luò)問(wèn)答社區(qū)的運(yùn)作機(jī)制,探索網(wǎng)絡(luò)問(wèn)答社區(qū)的未來(lái)發(fā)展模式。
2.2? 發(fā)展時(shí)期(2013年—2018年)
這一時(shí)期隨著移動(dòng)通信技術(shù)、智能終端技術(shù)以及Web技術(shù)的飛速發(fā)展,發(fā)文數(shù)量逐漸增多,吸引了大規(guī)模的用戶群體。國(guó)內(nèi)外的年發(fā)文量持續(xù)增長(zhǎng),引起了多個(gè)領(lǐng)域?qū)W者廣泛關(guān)注,涉及了用戶、問(wèn)題、答案及網(wǎng)絡(luò)問(wèn)答社區(qū)建設(shè)等多個(gè)方面。新技術(shù)和方法被應(yīng)用于網(wǎng)絡(luò)問(wèn)答社區(qū)的知識(shí)管理和服務(wù)方面。理論和技術(shù)研究推動(dòng)了網(wǎng)絡(luò)問(wèn)答社區(qū)實(shí)踐的發(fā)展,從而使得網(wǎng)絡(luò)問(wèn)答社區(qū)相關(guān)研究也持續(xù)向前發(fā)展。
2.3? 穩(wěn)定時(shí)期(2019年—至今)
這一時(shí)期國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究年發(fā)文量均保持在了一個(gè)較高水平,是一個(gè)相對(duì)穩(wěn)定時(shí)期。在這一時(shí)期,網(wǎng)絡(luò)問(wèn)答社區(qū)用戶規(guī)模激增,網(wǎng)絡(luò)上用戶生成內(nèi)容呈現(xiàn)指數(shù)性增長(zhǎng)。隨著深度學(xué)習(xí)、大數(shù)據(jù)、文本挖掘等技術(shù)的廣泛應(yīng)用,國(guó)內(nèi)外學(xué)者們對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)的研究更加深入。在未來(lái)幾年,隨著新技術(shù)的不斷進(jìn)步及相關(guān)理論方法的不斷豐富,國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究將繼續(xù)穩(wěn)定下去,并迎來(lái)飛躍式的發(fā)展。
3? 國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究熱點(diǎn)比較分析
3.1? 國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)研究熱點(diǎn)分析
通過(guò)CiteSpace軟件生成國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)研究的關(guān)鍵詞聚類圖譜,如圖2所示。關(guān)鍵詞聚類圖譜共生成12個(gè)聚類主題,除檢索詞外,可以將剩余的11個(gè)聚類主題歸納為五大熱點(diǎn)主題,如表1所示。分別為網(wǎng)絡(luò)問(wèn)答社區(qū)用戶的需求及行為研究、網(wǎng)絡(luò)問(wèn)答社區(qū)的知識(shí)內(nèi)容質(zhì)量及專家研究、網(wǎng)絡(luò)問(wèn)答社區(qū)知識(shí)付費(fèi)研究、網(wǎng)絡(luò)問(wèn)答社區(qū)內(nèi)容傳播研究、網(wǎng)絡(luò)問(wèn)答社區(qū)內(nèi)容組織及挖掘研究。
3.1.1? 網(wǎng)絡(luò)問(wèn)答社區(qū)用戶的需求及行為研究
該主題包含的聚類有#1用戶需求、#3用戶行為,包含的主要關(guān)鍵詞有影響因素、需求分析、需求聚合、演化分析、激勵(lì)機(jī)制、實(shí)證研究等。
網(wǎng)絡(luò)問(wèn)答社區(qū)用戶需求研究主要集中在對(duì)用戶需求的分析、演化、聚合等方面。在用戶需求分析方面,學(xué)者們多采用文本挖掘技術(shù)分析用戶需求[4,5]。周國(guó)韜等[6]則通過(guò)LDA模型分析網(wǎng)絡(luò)問(wèn)答社區(qū)用戶健康信息需求的演進(jìn)趨勢(shì)。用戶需求聚合研究方面,郭順利等[7]提出了融合GMM和K-Means聚類算法的用戶信息需求聚合方法。對(duì)于用戶行為的研究主要集中在知識(shí)采納、知識(shí)分享、知識(shí)共享、知識(shí)貢獻(xiàn)、知識(shí)隱藏、持續(xù)使用意愿、激勵(lì)機(jī)制及對(duì)策等方面。學(xué)者們多從社會(huì)交換理論、自我決定理論、社會(huì)認(rèn)知等理論視角出發(fā),運(yùn)用結(jié)構(gòu)方程模型、扎根理論等實(shí)證分析方法分析用戶行為。
3.1.2? 網(wǎng)絡(luò)問(wèn)答社區(qū)的知識(shí)內(nèi)容質(zhì)量及專家研究
該主題包含的聚類有#4專家發(fā)現(xiàn)、#7質(zhì)量評(píng)價(jià),包含的主要關(guān)鍵詞有專家推薦、推薦算法、內(nèi)容質(zhì)量、評(píng)價(jià)標(biāo)準(zhǔn)、質(zhì)量預(yù)測(cè)等。
網(wǎng)絡(luò)問(wèn)答社區(qū)中內(nèi)容的質(zhì)量評(píng)價(jià)及預(yù)測(cè)多集中于答案的評(píng)價(jià)、排序及預(yù)測(cè)。學(xué)者們對(duì)于答案評(píng)價(jià)研究多是利用各種方法理論構(gòu)建答案質(zhì)量評(píng)價(jià)體系或答案質(zhì)量評(píng)價(jià)模型[8]。在答案排序方面,學(xué)者們通常在構(gòu)建答案質(zhì)量排序體系后,采用機(jī)器學(xué)習(xí)、系統(tǒng)工程等技術(shù)方法實(shí)現(xiàn)對(duì)答案的排序[9]。網(wǎng)絡(luò)問(wèn)答社區(qū)專家發(fā)現(xiàn)方面,學(xué)者們多是應(yīng)用自然語(yǔ)言處理、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)領(lǐng)域的算法來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)問(wèn)答社區(qū)中的專家發(fā)現(xiàn)或?qū)<彝扑]。例如:高逸飛[10]基于Meta LDA的改進(jìn)算法實(shí)現(xiàn)了網(wǎng)絡(luò)問(wèn)答社區(qū)中各領(lǐng)域內(nèi)專家用戶的發(fā)現(xiàn)。黃輝等[11]提出了一種基于用戶-標(biāo)簽異構(gòu)網(wǎng)絡(luò)的專家發(fā)現(xiàn)方法。
3.1.3? 網(wǎng)絡(luò)問(wèn)答社區(qū)知識(shí)付費(fèi)研究
網(wǎng)絡(luò)問(wèn)答社區(qū)知識(shí)付費(fèi)方面研究包含的聚類有#2知識(shí)付費(fèi),包含的主要關(guān)鍵詞有付費(fèi)意愿、付費(fèi)圍觀、懸賞機(jī)制等。在網(wǎng)絡(luò)問(wèn)答社區(qū)知識(shí)付費(fèi)研究中,學(xué)者們多是對(duì)影響用戶知識(shí)付費(fèi)行為、知識(shí)付費(fèi)產(chǎn)品、知識(shí)付費(fèi)運(yùn)營(yíng)模式等方面開(kāi)展研究。例如:盧恒等[12]在理性與偏差視角下,構(gòu)建影響用戶知識(shí)付費(fèi)意愿的潛在變量,運(yùn)用模糊集的定性比較分析方法分析變量間的因果關(guān)系,探討知識(shí)付費(fèi)意愿的構(gòu)型。趙菲菲等[13]通過(guò)文獻(xiàn)調(diào)研,構(gòu)建了用戶知識(shí)付費(fèi)意愿影響因素模型。
3.1.4? 網(wǎng)絡(luò)問(wèn)答社區(qū)內(nèi)容傳播研究
該主題包含的聚類有#9知識(shí)傳播、#10意見(jiàn)領(lǐng)袖,包含的主要關(guān)鍵詞有、社交媒體、傳播網(wǎng)絡(luò)、輿論、突發(fā)事件等。在知識(shí)傳播研究方面,對(duì)于知識(shí)傳播模型、知識(shí)傳播效果、知識(shí)傳播機(jī)制的研究相對(duì)較多。學(xué)者們多是基于某種理論視角或技術(shù)方法來(lái)研究知識(shí)傳播模型、評(píng)價(jià)知識(shí)傳播效果以及探析知識(shí)傳播機(jī)制。例如:王志英等[14]基于精細(xì)加工可能性模型,對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)信息安全突發(fā)事件應(yīng)急知識(shí)傳播模型進(jìn)行了研究。王忠義等[15]結(jié)合社會(huì)網(wǎng)絡(luò)分析方法和熵權(quán)法,分析了網(wǎng)絡(luò)問(wèn)答社區(qū)的社會(huì)網(wǎng)絡(luò)結(jié)構(gòu)和知識(shí)傳播機(jī)制。
3.1.5? 網(wǎng)絡(luò)問(wèn)答社區(qū)內(nèi)容組織及挖掘研究
該主題包含的聚類有#5問(wèn)題分類、#6主題模型、#8索引服務(wù)、#11知識(shí)推薦,包含的主要關(guān)鍵詞有機(jī)器學(xué)習(xí)、數(shù)據(jù)分析、語(yǔ)義相似度、知識(shí)抽取、知識(shí)圖譜、深度學(xué)習(xí)等。對(duì)于問(wèn)答社區(qū)內(nèi)容的組織及挖掘,一般都是基于自然語(yǔ)言處理技術(shù)并結(jié)合文本挖掘、機(jī)器學(xué)習(xí)、深度學(xué)習(xí)等技術(shù)方法進(jìn)行研究,可以分為對(duì)問(wèn)題的組織及挖掘和對(duì)答案的組織及挖掘。
網(wǎng)絡(luò)問(wèn)答社區(qū)中對(duì)問(wèn)題的組織及挖掘研究主要集中在對(duì)問(wèn)題的分類、聚類、抽取、推薦等方面。例如:蔣競(jìng)等[16]應(yīng)用LDA主題模型對(duì)中文軟件問(wèn)答社區(qū)開(kāi)展了主題分析研究。唐曉波等[17]融合了賦詞標(biāo)引和抽詞標(biāo)引方法,提出了一種基于BERT和TF-IDF的網(wǎng)絡(luò)問(wèn)答社區(qū)問(wèn)句自動(dòng)標(biāo)引模型。對(duì)于網(wǎng)絡(luò)問(wèn)答社區(qū)中答案組織及挖掘研究主要集中在對(duì)于答案文本的摘要生成、聚合、集成、推薦研究。例如:陶興等[18]提出了一種改進(jìn)的W2V-MMR自動(dòng)摘要生成算法,實(shí)現(xiàn)了對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)內(nèi)用戶生成問(wèn)答文本的自動(dòng)摘要。
3.2? 國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究熱點(diǎn)分析
通過(guò)CiteSpace軟件生成國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的關(guān)鍵詞聚類圖譜,如圖3所示。在關(guān)鍵詞聚類圖譜中共生成14個(gè)聚類主題。根據(jù)研究對(duì)象的不同,可以將這14個(gè)聚類主題劃分為用戶、專家、問(wèn)題及答案4個(gè)大類,如表2所示。
3.2.1? 網(wǎng)絡(luò)問(wèn)答社區(qū)用戶方面的研究
國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究中關(guān)于用戶的研究共包括3個(gè)聚類主題,分別是#0 intention、#7 behavior、#13 payment。研究主要集中在用戶行為、用戶意愿以及用戶付費(fèi)方面的研究。其中關(guān)于用戶行為、用戶意愿的研究成果相對(duì)較多。
對(duì)于用戶行為的研究主要是對(duì)于網(wǎng)絡(luò)問(wèn)答社區(qū)中用戶信息行為的研究,如用戶的持續(xù)參與行為、知識(shí)貢獻(xiàn)行為、價(jià)值創(chuàng)造行為以及信息采納行為等。學(xué)者們多基于某種理論或框架開(kāi)展研究,并通過(guò)實(shí)證研究來(lái)得出結(jié)果或驗(yàn)證假設(shè)是否成立。例如:Fang等[19]基于計(jì)劃行為理論,通過(guò)對(duì)網(wǎng)絡(luò)問(wèn)答社區(qū)的在線調(diào)查,探究了激勵(lì)用戶持續(xù)參與網(wǎng)絡(luò)問(wèn)答社區(qū)的因素以及潛伏者、詢問(wèn)者和回答者之間持續(xù)參與因素的差異。Yang等[20]運(yùn)用自我決定理論和刺激-有機(jī)體-反應(yīng)框架研究了網(wǎng)絡(luò)問(wèn)答社區(qū)中用戶的價(jià)值創(chuàng)造行為。而學(xué)者們對(duì)于用戶意愿的研究則更多的是對(duì)于用戶知識(shí)共享意愿的研究。
3.2.2? 網(wǎng)絡(luò)問(wèn)答社區(qū)專家方面研究
國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)專家方面的研究共包括3個(gè)聚類主題,分別是#1 expert recommendation、#5 expert ranking、#7 expert finding。對(duì)于網(wǎng)絡(luò)問(wèn)答社區(qū)中專家的研究一直以來(lái)都是國(guó)外問(wèn)答社區(qū)中的研究熱點(diǎn),研究主要集中在專家發(fā)現(xiàn)、專家排名、專家推薦以及專家預(yù)測(cè)等方面。
學(xué)者們對(duì)于專家發(fā)現(xiàn)、專家推薦的研究通常采用基于深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)專家發(fā)現(xiàn)或推薦。例如:Liu等[21]基于圖卷積神經(jīng)網(wǎng)絡(luò)提出了GCN Doc和GCN Lstm兩種模型來(lái)進(jìn)行專家識(shí)別。Wang等[22]基于卷積神經(jīng)網(wǎng)絡(luò)提出了一種對(duì)新提出問(wèn)題推薦專家的方法,從而減少了提問(wèn)者的等待時(shí)間,提高了答案的質(zhì)量。在專家預(yù)測(cè)方面,學(xué)者們一般采用機(jī)器學(xué)習(xí)或者深度學(xué)習(xí)的方法來(lái)實(shí)現(xiàn)預(yù)測(cè)。例如:Xiong等[23]基于機(jī)器學(xué)習(xí)算法設(shè)計(jì)了一個(gè)可視化分析系統(tǒng),用來(lái)識(shí)別潛在的專家。
3.2.3? 網(wǎng)絡(luò)問(wèn)答社區(qū)提問(wèn)問(wèn)題研究
國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)提問(wèn)問(wèn)題方面的研究共包括4個(gè)聚類主題,分別是#2 question retrieval、#3 duplicate question detection、#9 question recommendation、#11 question classification。國(guó)外對(duì)于網(wǎng)絡(luò)問(wèn)答社區(qū)中提問(wèn)問(wèn)題的研究主要集中在問(wèn)題組織、問(wèn)題檢索、問(wèn)題推薦等方面。
對(duì)于問(wèn)題組織研究最多的是問(wèn)題分類方面,學(xué)者們多采用分類算法來(lái)實(shí)現(xiàn)分類。Li等[24]提出了一種基于集成學(xué)習(xí)的半監(jiān)督問(wèn)題分類方法,提高了對(duì)于未標(biāo)記問(wèn)題進(jìn)行分類的準(zhǔn)確性。Momtazi[25]提出了一種基于無(wú)監(jiān)督LDA算法的問(wèn)答社區(qū)問(wèn)題分類方法。在對(duì)于問(wèn)題檢索方面研究,一方面是解決問(wèn)題檢索中的詞匯空缺問(wèn)題,另一方面是估計(jì)問(wèn)題之間的相關(guān)性。在網(wǎng)絡(luò)問(wèn)答社區(qū)對(duì)問(wèn)題進(jìn)行檢索時(shí),詞匯空缺會(huì)影響問(wèn)題的檢索。因此,有學(xué)者提出了不同的檢索模型來(lái)解決此問(wèn)題。例如,Zhou等[26]使用基本的類別驅(qū)動(dòng)模型MB-NET和增強(qiáng)的類別驅(qū)動(dòng)模型ME-NET,利用網(wǎng)絡(luò)問(wèn)答社區(qū)頁(yè)面中類別信息的元數(shù)據(jù)對(duì)分布式單詞表示進(jìn)行建模和學(xué)習(xí),來(lái)用于問(wèn)題檢索。同時(shí),推薦任務(wù)也是人工智能領(lǐng)域的研究熱點(diǎn)。學(xué)者們多通過(guò)構(gòu)建基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)模型來(lái)實(shí)現(xiàn)問(wèn)題的推薦。
3.2.4? 網(wǎng)絡(luò)問(wèn)答社區(qū)的答案方面研究
國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究中關(guān)于答案方面的研究共包括4個(gè)聚類主題,分別是#4 answer ranking、#8 answer selection、#10 answer quality evaluation、#12 answer quality features。國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)的答案方面研究主要集中在對(duì)于答案質(zhì)量、答案組織以及答案選擇的研究。對(duì)于答案質(zhì)量的研究,可以分為答案質(zhì)量預(yù)測(cè)、答案質(zhì)量評(píng)價(jià)、影響答案質(zhì)量的因素等研究方向。學(xué)者們一般基于技術(shù)方法構(gòu)建答案質(zhì)量預(yù)測(cè)模型,來(lái)選擇最佳答案。在答案質(zhì)量評(píng)價(jià)研究中,學(xué)者們關(guān)注答案質(zhì)量評(píng)價(jià)的標(biāo)準(zhǔn)及影響答案質(zhì)量評(píng)價(jià)的因素。對(duì)于答案組織的研究涵蓋了答案的排序、推薦、匹配等方面。Zhu等[27]采用異構(gòu)信息組織技術(shù)作為外部知識(shí)產(chǎn)生器,提出了一種基于領(lǐng)域空間模型的排序方案,將問(wèn)題中的領(lǐng)域術(shù)語(yǔ)集成在一起對(duì)答案進(jìn)行了排序。在答案選擇的研究中,學(xué)者們一般基于深度學(xué)習(xí)模型來(lái)實(shí)現(xiàn)網(wǎng)絡(luò)問(wèn)答社區(qū)中的答案選擇。
3.3? 國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究熱點(diǎn)比較與啟示
通過(guò)比較國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究熱點(diǎn)發(fā)現(xiàn):首先,國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究?jī)?nèi)容幾乎都涵蓋了問(wèn)答社區(qū)中的用戶、專家、問(wèn)題和答案這四個(gè)主要領(lǐng)域。專家預(yù)測(cè)是國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的熱點(diǎn)之一,而國(guó)內(nèi)研究中卻缺乏對(duì)專家預(yù)測(cè)的研究,同樣國(guó)內(nèi)對(duì)于重復(fù)問(wèn)題檢測(cè)以及答案選擇的研究亦是不足。在其他方面,知識(shí)付費(fèi)與知識(shí)傳播是國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)研究的熱門領(lǐng)域,而國(guó)外關(guān)于這兩個(gè)領(lǐng)域的研究相對(duì)較少。其次,在研究方法及技術(shù)上,可以看到國(guó)外關(guān)于網(wǎng)絡(luò)問(wèn)答社區(qū)中的研究大都偏向于技術(shù)方面的研究,如算法的改進(jìn)、模型的構(gòu)建、新技術(shù)的提出與應(yīng)用等,而采用理論方法的研究相對(duì)較少。而在國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)研究中,技術(shù)性研究與理論性研究是并重的。另外,值得注意的是,在技術(shù)性研究中,國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)最近的研究中都應(yīng)用了深度學(xué)習(xí)技術(shù)。最后,從研究者的專業(yè)背景及發(fā)文期刊來(lái)看,圖情領(lǐng)域的學(xué)者是國(guó)內(nèi)網(wǎng)絡(luò)問(wèn)答社區(qū)研究中的主要力量,其研究成果也大都發(fā)表在圖情領(lǐng)域的期刊上。而具有計(jì)算機(jī)學(xué)科背景的研究者則是國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的中堅(jiān)力量,國(guó)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究發(fā)表在計(jì)算機(jī)科學(xué)與信息科學(xué)領(lǐng)域期刊上的成果相對(duì)較多。
比較分析中外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究熱點(diǎn)及其發(fā)展脈絡(luò),針對(duì)我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究具有以下啟示:
首先在研究?jī)?nèi)容上,即要深化完善已有的研究領(lǐng)域,又要擴(kuò)大研究范圍。雖然我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究在用戶行為、質(zhì)量評(píng)價(jià)、知識(shí)付費(fèi)、內(nèi)容組織及挖掘等研究中已取得不少研究成果,但還是應(yīng)當(dāng)繼續(xù)深化完善這些研究。以網(wǎng)絡(luò)問(wèn)答社區(qū)問(wèn)題的組織及挖掘研究為例,我國(guó)學(xué)者在問(wèn)題的分類、聚類、檢索、推薦等方面都有研究成果,但總的來(lái)說(shuō),成果還是相對(duì)較少,要繼續(xù)深化這些研究;再是通過(guò)對(duì)比國(guó)外的研究,我們還缺乏一些方向的研究,要完善這一部分的研究。另一方面,隨著網(wǎng)絡(luò)問(wèn)答社區(qū)的不斷發(fā)展,網(wǎng)絡(luò)問(wèn)答社區(qū)的建設(shè)會(huì)出現(xiàn)新的內(nèi)容,會(huì)帶來(lái)新的問(wèn)題,使得研究范圍不斷擴(kuò)大。學(xué)者們要不斷地去探究這些新現(xiàn)象的原理,不斷地去解決新問(wèn)題。
其次從研究方法來(lái)看,越來(lái)越多的研究方法被學(xué)者們應(yīng)用到網(wǎng)絡(luò)問(wèn)答社區(qū)的研究中,這些研究方法大致可以分為理論研究方法和技術(shù)研究方法。在應(yīng)用理論方法的研究中,既要不斷地創(chuàng)新網(wǎng)絡(luò)問(wèn)答社區(qū)研究中已有的研究方法,又要善于將其他領(lǐng)域中成熟的、能夠促進(jìn)網(wǎng)絡(luò)問(wèn)答社區(qū)研究發(fā)展的方法應(yīng)用到網(wǎng)絡(luò)問(wèn)答社區(qū)的研究中。同時(shí)還要借鑒國(guó)外的一些理論研究方法,從而促進(jìn)我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究的發(fā)展。在應(yīng)用技術(shù)方法的研究中,將深度學(xué)習(xí)技術(shù)應(yīng)用到網(wǎng)絡(luò)問(wèn)答社區(qū)的研究中是不可避免的趨勢(shì),這在國(guó)外應(yīng)用技術(shù)方法的研究中都有體現(xiàn)。深度學(xué)習(xí)在很多方面是要優(yōu)于傳統(tǒng)的機(jī)器學(xué)習(xí)方法的,所以要將深度學(xué)習(xí)技術(shù)應(yīng)用到網(wǎng)絡(luò)問(wèn)答社區(qū)的研究中。
最后,學(xué)者們研究過(guò)程中要以用戶為中心,從用戶需求出發(fā),將以用戶為中心的理念貫穿到網(wǎng)絡(luò)問(wèn)答社區(qū)的研究中。同時(shí),也要將研究成果要應(yīng)用于實(shí)踐中,這有利于提升網(wǎng)絡(luò)問(wèn)答社區(qū)的服務(wù)質(zhì)量,減少用戶獲取知識(shí)的成本,促進(jìn)網(wǎng)絡(luò)問(wèn)答社區(qū)的發(fā)展。網(wǎng)絡(luò)問(wèn)答社區(qū)是一個(gè)不斷生長(zhǎng)著的有機(jī)體,對(duì)于網(wǎng)絡(luò)問(wèn)答社區(qū)的研究要與時(shí)俱進(jìn),要積極探尋新的研究方向,同時(shí)也要注意網(wǎng)絡(luò)問(wèn)答社區(qū)在發(fā)展中所出現(xiàn)的問(wèn)題,總結(jié)經(jīng)驗(yàn)教訓(xùn),促進(jìn)網(wǎng)絡(luò)問(wèn)答社區(qū)的發(fā)展與網(wǎng)絡(luò)問(wèn)答社區(qū)研究的突破。
4? 結(jié)? 論
本文以Web of Science和CNKI為文獻(xiàn)來(lái)源,通過(guò)發(fā)文量分析了國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的發(fā)展脈絡(luò)。采用文獻(xiàn)計(jì)量學(xué)方法,運(yùn)用CiteSpace可視化工具對(duì)國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究領(lǐng)域的文獻(xiàn)進(jìn)行可視化的對(duì)比分析。在全面分析了中外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究熱點(diǎn)及其發(fā)展脈絡(luò)的基礎(chǔ)上,根據(jù)國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究在研究熱點(diǎn)及其發(fā)展脈絡(luò)上的異同,提出針對(duì)我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究的啟示和思路。然而,本研究還存在著一定的不足,僅梳理了國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)研究的發(fā)展脈絡(luò)及研究熱點(diǎn),并沒(méi)有預(yù)測(cè)和分析國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究前沿和趨勢(shì)。未來(lái)筆者將進(jìn)一步分析國(guó)內(nèi)外網(wǎng)絡(luò)問(wèn)答社區(qū)的研究前沿,以期預(yù)測(cè)網(wǎng)絡(luò)問(wèn)答社區(qū)研究未來(lái)的發(fā)展方向,從而為我國(guó)網(wǎng)絡(luò)問(wèn)答社區(qū)研究的發(fā)展提供參考。
參考文獻(xiàn):
[1] 沈旺,李世鈺,劉嘉宇,等.問(wèn)答社區(qū)回答質(zhì)量評(píng)價(jià)體系優(yōu)化方法研究 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2021,5(2):83-93.
[2] GAZAN R. Social Q&A [J].Advances in Information Science,2011,62(12):2301-2312.
[3] 姜雯,許鑫.在線問(wèn)答社區(qū)信息質(zhì)量評(píng)價(jià)研究綜述 [J].現(xiàn)代圖書情報(bào)技術(shù),2014(6):41-50.
[4] 趙雪芹,王青青.在線問(wèn)答平臺(tái)用戶旅游信息需求研究—以途牛問(wèn)答社區(qū)為例 [J].農(nóng)業(yè)圖書情報(bào)學(xué)報(bào),2020,32(10):47-55.
[5] 劉爍,陳盼,楊冰香,等.基于知乎抑郁癥問(wèn)答社區(qū)的用戶健康信息需求分析 [J].護(hù)理研究,2021,35(13):2273-2279.
[6] 周國(guó)韜,龔栩,鄧勝利.基于主題分析的用戶養(yǎng)生健康信息需求演化趨勢(shì)研究 [J].情報(bào)科學(xué),2022,40(4):118-126+137.
[7] 郭順利,步輝,何宏國(guó).基于G-Kmeans的網(wǎng)絡(luò)問(wèn)答社區(qū)話題用戶信息需求聚合方法及應(yīng)用研究 [J].情報(bào)理論與實(shí)踐,2022,45(6):170-178.
[8] 郭順利,張向先,陶興,等.社會(huì)化問(wèn)答社區(qū)用戶生成答案質(zhì)量自動(dòng)化評(píng)價(jià)研究——以“知乎”為例 [J].圖書情報(bào)工作,2019,63(11):118-130.
[9] 易明,張婷婷.大眾性問(wèn)答社區(qū)答案質(zhì)量排序方法研究 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2019,3(6):12-20.
[10] 高逸飛.基于主題模型的問(wèn)答社區(qū)專家發(fā)現(xiàn)方法研究 [D].北京:北京交通大學(xué),2020.
[11] 黃輝,劉永堅(jiān),解慶.基于用戶-標(biāo)簽異構(gòu)網(wǎng)絡(luò)的社區(qū)問(wèn)答專家發(fā)現(xiàn)方法 [J].計(jì)算機(jī)工程,2020,46(2):53-58.
[12] 盧恒,張向先,張莉曼,等.理性與偏差視角下在線問(wèn)答社區(qū)用戶知識(shí)付費(fèi)意愿影響因素構(gòu)型研究 [J].圖書情報(bào)工作,2020,64(19):89-98.
[13] 趙菲菲,渠性怡,周慶山.在線問(wèn)答社區(qū)用戶知識(shí)付費(fèi)意愿影響因素實(shí)證研究 [J].情報(bào)資料工作,2019,40(1):89-97.
[14] 王志英,鄧航宇,王念新,等.問(wèn)答社區(qū)信息安全突發(fā)事件應(yīng)急知識(shí)傳播模型研究 [J].情報(bào)雜志,2019,38(10):136-145.
[15] 王忠義,張鶴銘,黃京,等.基于社會(huì)網(wǎng)絡(luò)分析的網(wǎng)絡(luò)問(wèn)答社區(qū)知識(shí)傳播研究 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2018,2(11):80-94.
[16] 蔣競(jìng),呂江楓,張莉.中文軟件問(wèn)答社區(qū)主題分析研究 [J].軟件學(xué)報(bào),2020,31(4):1143-1161.
[17] 唐曉波,劉江南.基于BERT和TF-IDF的問(wèn)答社區(qū)問(wèn)句自動(dòng)標(biāo)引研究——以金投網(wǎng)問(wèn)答社區(qū)為例 [J].情報(bào)科學(xué),2021,39(3):3-10.
[18] 陶興,張向先,郭順利,等.學(xué)術(shù)問(wèn)答社區(qū)用戶生成內(nèi)容的W2V-MMR自動(dòng)摘要方法研究 [J].數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn),2020,4(4):109-118.
[19] FANG C C,ZHANG J T. Users' continued participation behavior in social Q&A communities: A motivation perspective [J].Computers in Human Behavior,2019,92:87-109.
[20] YANG X C,SUI Y. Value cocreation behavior of users in an online social question-andanswer community [J].Social Behavior and Personality,2021,49(5):1-14.
[21] LIU C,HAO Y C,SHAN W,et al. Identifying Experts in Community Question Answering Website Based on Graph Convolutional Neural Network [J].IEEE Access,2020,8:137799-137811.
[22] WANG J,SUN J Q,LIN H F,et al. Convolutional neural networks for expert recommendation in community question answering [J/OL].Science China-Information Sciences,2017,60(11).[2022-09-28].https://link.springer.com/article/10.1007/s11432-016-9197-0#citeas.
[23] XIONG X X,F(xiàn)U M,ZHU M,et al. Visual potential expert prediction in question and answering communities [J].Journal of Visual Languages and Computing,2018,48:70-80.
[24] LI Y Y,SU L,CHEN J,et al. Semi-supervised learning for question classification in CQA [J].Natural Computing,2017,16(4):567-577.
[25] MOMTAZI S. Unsupervised Latent Dirichlet Allocation for supervised question classification [J].Information Processing & Manahement,2018,54(3):380-393.
[26] ZHOU G Y,HUANG J X J. Modeling and Learning Distributed Word Representation with Metadata for Question Retrieval [J].IEEE Transactions on Knowledge and Data Engineering,2017,29(6):1226-1239.
[27] ZHU N N,ZHANG Z J,MA H Q. Ranking answers of comparative questions using heterogeneous information organization from social media [J].Signal Image and Video Processing,2019,13(7):1267-1274.
作者簡(jiǎn)介:遲秀銘(1988—),女,漢族,山東煙臺(tái)人,館員,碩士,研究方向:數(shù)字圖書館、信息管理;房旭輝(1997—),男,漢族,山東德州人,碩士研究生在讀,研究方向:信息管理、知識(shí)服務(wù);郭順利(1989—),男,漢族,山東臨沂人,副教授,博士,研究方向:信息管理、知識(shí)服務(wù)。
收稿日期:2022-10-18
基金項(xiàng)目:國(guó)家社會(huì)科學(xué)基金青年項(xiàng)目(20CTQ028)