丁楠 曹瑋倬 相甍甍
摘要:[目的/意義]目前在技術(shù)問答社區(qū)知識交流方面的研究尚不完善,旨在采用數(shù)據(jù)包絡(luò)分析法研究技術(shù)問答社區(qū)知識交流效率,從而發(fā)現(xiàn)其不同板塊之間存在的差異和變化規(guī)律,為改進(jìn)社區(qū)管理和提高知識交流效率提供參考。[方法/過程]在構(gòu)建知識交流效率評價指標(biāo)體系的基礎(chǔ)上,以“開源中國”社區(qū)15個熱門板塊為研究樣本,基于SBM模型與Malmquist指數(shù)計算其知識交流的靜態(tài)和動態(tài)效率值并進(jìn)行深度分析。[結(jié)果/結(jié)論] “開源中國”社區(qū)15個熱門板塊之間的平均知識交流效率良好,但板塊間差距較大,且總體知識交流效率處于上升趨勢,主要是由于技術(shù)進(jìn)步變化指數(shù)呈現(xiàn)19.50%的上漲幅度,說明技術(shù)振興是“開源中國”社區(qū)知識交流效率上升的主要原因,但出現(xiàn)一定程度管理不當(dāng)現(xiàn)象并且資源利用率較低。
關(guān)鍵詞:技術(shù)問答社區(qū) ? ?SBM模型 ? ?Malmquist指數(shù) ? ?知識交流效率 ? ?開源中國
分類號:G202
引用格式:丁楠, 曹瑋倬, 相甍甍. 基于SBM-Malmquist的技術(shù)問答社區(qū)知識交流效率測度研究[J/OL]. 知識管理論壇, 2022, 7(2): 101-115[引用日期]. http://www.kmf.ac.cn/p/278/.
1 ?引言
隨著網(wǎng)絡(luò)技術(shù)的蓬勃發(fā)展,信息交流和傳播的方式開始多樣化,越來越多的人在論壇和博客上通過發(fā)文(帖)和回文(帖)來表達(dá)觀點、共享信息和獲取知識,人際交流突破了時空的局限。用戶提出問題后,社區(qū)吸引、發(fā)動來自各個領(lǐng)域的其他用戶解答問題或提出對策,從而圍繞一個主題不斷地達(dá)成共識,形成了類似于現(xiàn)實中社區(qū)的網(wǎng)絡(luò)團(tuán)體——虛擬社區(qū)。近年來,虛擬社區(qū)逐漸成為人們通過互聯(lián)網(wǎng)交流和獲得知識的重要媒介,這使一些搜索引擎無法直接檢索到的、存儲在人腦當(dāng)中的知識得以展現(xiàn)。專業(yè)性的網(wǎng)絡(luò)論壇作為一類特殊的虛擬社區(qū),是知識交流的重要工具之一,用戶一問一答之間,便發(fā)生了信息交換和知識交流[1],例如技術(shù)問答社區(qū)是把IT技術(shù)作為論壇的主題,為技術(shù)人員提供知識交流的虛擬社區(qū),其鼓勵相關(guān)用戶都能積極參與開放性討論并分享創(chuàng)作過程,逐漸成為個人或團(tuán)體開展知識交流和共享的有效平臺。近年來,隨著IT技術(shù)的廣泛應(yīng)用,技術(shù)問答社區(qū)的規(guī)模也逐漸擴(kuò)大[2],本文主要對技術(shù)問答社區(qū)的知識交流效率進(jìn)行研究,根據(jù)實際得到的數(shù)據(jù)結(jié)果,有針對性地提出優(yōu)化和管理措施,從而增強(qiáng)用戶知識交流效果以及創(chuàng)新力度,助力技術(shù)問答社區(qū)的持續(xù)發(fā)展。
“開源中國”社區(qū)是目前國內(nèi)最大的開源技術(shù)社區(qū)[3],自2008年創(chuàng)辦以來,致力于為IT開發(fā)者提供發(fā)現(xiàn)、使用和交流IT技術(shù)的問答平臺,本文選取“開源中國”社區(qū)中最熱門的15個標(biāo)簽板塊作為用戶知識交流的數(shù)據(jù)來源。首先,在梳理和總結(jié)已有文獻(xiàn)成果的基礎(chǔ)上,為測算技術(shù)問答社區(qū)知識交流效率投入產(chǎn)出值構(gòu)建相應(yīng)的評價指標(biāo)體系;其次,采用數(shù)據(jù)包絡(luò)分析方法中的SBM(Slack Based Measure)模型和Malmquist指數(shù)計算知識交流靜態(tài)和動態(tài)效率值;再次,根據(jù)測算結(jié)果,對影響技術(shù)問答社區(qū)知識交流效率的主要因素進(jìn)行分析;最后,根據(jù)所得出的結(jié)論,提出合理化建議,以期為促進(jìn)技術(shù)問答平臺知識交流,提高其知識創(chuàng)新水平提供參考意見。
2 ?相關(guān)研究
2.1 ?問答社區(qū)
目前,國內(nèi)外學(xué)者對于問答社區(qū)的研究主要關(guān)注用戶信息行為、用戶問答質(zhì)量以及社區(qū)間的對比等方面。關(guān)于用戶信息行為的研究主要集中于知識貢獻(xiàn)方面,例如,劉雨農(nóng)等以知乎網(wǎng)“疫苗”話題為樣本,研究虛擬知識社區(qū)的社會網(wǎng)絡(luò)結(jié)構(gòu)特征及影響因素,發(fā)現(xiàn)其用戶關(guān)系是多層次、塊狀分布的,存在知識生產(chǎn)者和需求者兩個中心,其中核心用戶比邊緣用戶更傾向于貢獻(xiàn)知識[4]。Z. Liu等研究發(fā)現(xiàn)知識貢獻(xiàn)行為是用戶在問答社區(qū)中獲得所需信息的前提條件,其中用戶的參與、興趣和關(guān)聯(lián)性等因素對用戶的回答意愿有重要的影響[5]。J. H. Jin等研究發(fā)現(xiàn)用戶的自我呈現(xiàn)、其他成員的認(rèn)知和社會學(xué)習(xí)機(jī)會對知識貢獻(xiàn)行為都有正向影響[6]。關(guān)于問答質(zhì)量方面的研究主要以影響因素的特征為主,例如,沈洪洲等以知乎社區(qū)為研究對象,總結(jié)了10個對回答內(nèi)容質(zhì)量具有潛在影響的基本特征,回答內(nèi)容的標(biāo)注數(shù)量越多,重點內(nèi)容及結(jié)構(gòu)就越清晰,回答內(nèi)容質(zhì)量越高,同時,用戶更易認(rèn)同情感傾向積極的回答[7]。王偉等以知乎社區(qū)為研究對象,著重挖掘了答案及其編寫者的特征,并通過邏輯回歸、支持向量機(jī)和隨機(jī)森林3種方法構(gòu)建特征模型,對答案質(zhì)量進(jìn)行全面預(yù)測[8]。關(guān)于社區(qū)間對比方面的研究主要集中在中外社區(qū)運(yùn)營視角的功能建設(shè)上,例如,李丹選取Quora和知乎進(jìn)行對比,著重從產(chǎn)品性能、運(yùn)營管理和用戶特征3個層面展開分析,結(jié)果發(fā)現(xiàn)Quora擁有十分精準(zhǔn)的功能定位、更簡潔的功能區(qū)劃分,相比知乎具有更多優(yōu)勢和成功經(jīng)驗[9]。萬莉通過測度小木蟲和人大經(jīng)濟(jì)論壇8門學(xué)科的知識交流效率,發(fā)現(xiàn)人大經(jīng)濟(jì)論壇知識交流效率和規(guī)模效率低于小木蟲論壇,純技術(shù)效率高于小木蟲論壇[10]。
通過現(xiàn)有研究成果可以發(fā)現(xiàn),國內(nèi)外學(xué)者關(guān)于問答社區(qū)的研究主要集中于信息行為中知識貢獻(xiàn)的研究,少數(shù)學(xué)者對問答質(zhì)量的影響因素展開了研究,而對于社區(qū)間對比的研究較為匱乏且時間較為久遠(yuǎn),并未涉及近年來的發(fā)展?fàn)顟B(tài)。其中,知識貢獻(xiàn)主要涵蓋了提出問題和瀏覽信息[11],而提問量與瀏覽量即可代表問答社區(qū)的活躍度[2],因此,本研究把問答社區(qū)中研究相對成熟的知識貢獻(xiàn)作為指標(biāo)體系,把能夠反映主題使用情況的熱門精選板塊作為決策單元,以此為基礎(chǔ)利用數(shù)據(jù)包絡(luò)分析法對技術(shù)問答社區(qū)知識交流效率的測度展開研究,以期豐富問答社區(qū)的研究。
2.2 ?知識交流效率
目前,國內(nèi)外學(xué)者尚未就問答社區(qū)知識交流效率展開研究,由龐建剛等[12]對虛擬學(xué)術(shù)社區(qū)的定義可知,問答社區(qū)可以被視為虛擬學(xué)術(shù)社區(qū)的一個子類。當(dāng)前,對虛擬社區(qū)知識交流效率的研究主要集中于效率測度與影響因素兩個方面。對于效率測度方面的研究主要基于數(shù)據(jù)包絡(luò)分析法,例如,宗乾進(jìn)等在2014年首次提出了知識交流效率評價指標(biāo)體系,以科學(xué)網(wǎng)博客8個學(xué)科為例,采用數(shù)據(jù)包絡(luò)分析法(Data Envelopment Analysis,DEA)方法進(jìn)行了靜態(tài)分析[13];晉升在DEA方法的基礎(chǔ)上進(jìn)一步拓展了Malmquist指數(shù)方法對小木蟲論壇12個板塊的知識交流效率進(jìn)行研究[14];楊瑞仙等以在線健康社區(qū)“丁香園論壇”為對象,剔除外生因素后基于三階段DEA模型對其中5個板塊進(jìn)行了研究[15]。也有少數(shù)學(xué)者采用其他研究方法,例如,龐建剛等選取經(jīng)管之家論壇的3個區(qū)域為對象,采用隨機(jī)前沿分析法(Stochastic Frontier Analysis,SFA)及Kernel方法對知識交流效率及其動態(tài)演化進(jìn)行研究[12];胡德華等以4個學(xué)術(shù)虛擬社區(qū)的16個版塊為樣本,運(yùn)用遺傳投影尋蹤算法進(jìn)行知識交流效率的綜合評估[16]。關(guān)于影響因素的研究主要通過結(jié)合效率測度進(jìn)行綜合分析,例如,吳佳玲采用Super-SBM方法及Tobit模型對小木蟲論壇的知識交流效率及影響因素進(jìn)行了分析[17];袁永旭等以丁香園論壇為研究對象,運(yùn)用SBM(Slack Based Measure)模型和Tobit模型進(jìn)行知識交流效率和影響因素的研究[18]。
綜上,對于虛擬社區(qū)知識交流效率的研究以效率測度為主,且大多具有鮮明的學(xué)科特色,例如理工類學(xué)科的小木蟲論壇、經(jīng)管類學(xué)科的經(jīng)管之家論壇和醫(yī)學(xué)類的丁香園論壇等,而針對近年來活躍高的技術(shù)問答社區(qū)的研究較少。同時,在運(yùn)用數(shù)據(jù)包絡(luò)分析方法進(jìn)行知識交流效率測度時,普遍采用CCR(Charnes & Cooper & Rhodes)模型以及BCC(Banker & Chames & Cooper)模型,對于SBM模型結(jié)合Malmquist指數(shù)的運(yùn)用較少。針對此現(xiàn)狀,本文基于SBM模型和Malmquist指數(shù)相結(jié)合的評價方法,對技術(shù)問答社區(qū)知識交流進(jìn)行測度,并提出合理化建議。
3 ?研究設(shè)計
3.1 ?數(shù)據(jù)來源
本文選擇“開源中國”社區(qū)中最熱門的15個標(biāo)簽板塊作為決策單元(Decision Making Units,DMU),其中包括“Java”“Android”和“PHP”等,于2021年1月借助“八爪魚采集器”工具,分別對2018-2020年15個板塊的數(shù)據(jù)進(jìn)行相應(yīng)指標(biāo)體系數(shù)據(jù)的收集,并對采集到的發(fā)帖、回帖數(shù)據(jù)以及時間、投票和作者進(jìn)行整理統(tǒng)計,以反映實際的知識交流情況。
3.2 ?研究方法
3.2.1 ?SBM模型
DEA模型于1978年被A. Charnes、W. W. Cooper和E. Rhodes提出,是一種用于評價多投入、多產(chǎn)出指標(biāo)距離生產(chǎn)前沿面有效性的非參數(shù)方法[19]。傳統(tǒng)的DEA模型為規(guī)模報酬不變的CCR模型和規(guī)模報酬可變的BCC模型,自問世便被廣泛應(yīng)用。但傳統(tǒng)的DEA模型屬于“徑向”和“角度”的雙度量[20],“徑向”要求投入與產(chǎn)出同比例變化,“角度”通常只能考慮一個投入或產(chǎn)出的導(dǎo)向角度,忽略了DMU中松弛變量引起計算結(jié)果偏差問題[21]。經(jīng)過學(xué)者們多年不斷探究,在傳統(tǒng)模型的基礎(chǔ)上加入更多的限定條件,不斷衍生出超效率DEA、SBM以及EBM等模型。本文使用K. Tone[22]于2001年提出的在目標(biāo)函數(shù)中引入松弛變量的SBM(Slack Based Measure)模型,與傳統(tǒng)模型相比,其規(guī)避了徑向和角度問題的影響,且充分考慮了投入和產(chǎn)出的松弛度,使所得相對效率值介于[0,1],提升了效率評價的可信度和準(zhǔn)確度,更偏重于知識交流效率最大化的考慮[19]。故本文運(yùn)用SBM模型對技術(shù)問答社區(qū)知識交流效率進(jìn)行測算,能夠?qū)夹g(shù)問答社區(qū)的投入和產(chǎn)出松弛變量進(jìn)一步優(yōu)化,即將最小化的松弛變量作為目標(biāo)函數(shù),用以表明技術(shù)問答社區(qū)的知識投入冗余和產(chǎn)出不足越少,知識交流效率值則越高。
SBM模型如公式(1)所示:
公式(1)
其中,ρ*代表DMU的相對效率值,S1和S2為期望及非期望產(chǎn)出要素個數(shù);x0、y0分別代表DMU的投入和產(chǎn)出向量;X、Y分別代表DMU的投入和產(chǎn)出矩陣。當(dāng)且僅當(dāng)ρ*=1時,DMU有效;當(dāng)0 ≤ ρ* <1時,DMU無效。
3.2.2 ?Malmquist指數(shù)
Malmquist指數(shù)由瑞典經(jīng)濟(jì)學(xué)家S. Malmquist在1953年提出,隨后R. F?re等將其與數(shù)據(jù)包絡(luò)分析法相結(jié)合,用來測算生產(chǎn)和經(jīng)營效率等問題,使其在金融、醫(yī)療和工業(yè)等領(lǐng)域應(yīng)用廣泛[14]。Malmquist指數(shù)是通過對比決策單元在t時期和t+1時期的距離函數(shù)比值來判定其效率變化情況和發(fā)展趨勢,彌補(bǔ)了傳統(tǒng)DEA無法測算動態(tài)效率的缺陷[23]。故本文運(yùn)用Malmquist指數(shù)考量技術(shù)問答社區(qū)知識交流全要素生產(chǎn)率的演化趨勢,其能夠與數(shù)據(jù)包絡(luò)分析法充分結(jié)合,進(jìn)而對技術(shù)問答社區(qū)知識交流的動態(tài)效率進(jìn)行測算,以便更好地分析社區(qū)的變化趨勢。
Malmquist指數(shù)如公式(2)所示:
公式(2)
其中,xt和xt+1分別表示t和t+1時期研發(fā)投入量;yt和yt+1分別表示t和t+1時期研發(fā)產(chǎn)出量;tfpch、effch、techch、pech和sech分別代表全要素生產(chǎn)率、技術(shù)效率變動、技術(shù)進(jìn)步、純技術(shù)效率變動和規(guī)模報酬變動指數(shù)。若tfpch>1,則表示全要素生產(chǎn)率有所提高,整體呈上升趨勢;tfpch=1,則全要素生產(chǎn)率不變,整體趨勢穩(wěn)定;tfpch<1,則全要素生產(chǎn)率降低,整體呈退步狀態(tài)。
3.3 ?指標(biāo)體系構(gòu)建
技術(shù)問答社區(qū)是專門進(jìn)行技術(shù)交流的問答社區(qū),用戶通過網(wǎng)絡(luò)便可以實現(xiàn)知識共享、交流和創(chuàng)新。在技術(shù)問答社區(qū)中,知識提供者[24]通過發(fā)帖將隱性知識外化提供給使用者,知識使用者通過瀏覽來獲取所需信息,同時可以結(jié)合自身知識儲備使知識進(jìn)一步外化,知識反饋者通過投票、評論等行為對知識提供者進(jìn)行反饋,整個過程實現(xiàn)了知識共享、交流和創(chuàng)新[10]。本文基于萬莉[10]的研究成果,并結(jié)合技術(shù)問答社區(qū)知識交流的特征構(gòu)建技術(shù)問答社區(qū)知識交流效率的指標(biāo)體系,如表1所示:
(1)投入指標(biāo)X1——用戶數(shù)量。用戶是技術(shù)問答社區(qū)開展知識交流的主體,知識的提供和傳播都依賴于這一主體。本文統(tǒng)計的用戶數(shù)量為實際參與到知識交流中的人員數(shù)量,即各板塊參與發(fā)帖和回帖的人員數(shù)量,不包括僅注冊或投票的人員,本文認(rèn)為這兩類用戶不能視作知識交流投入。
(2)投入指標(biāo)X2——發(fā)帖數(shù)量。用戶依據(jù)所探討的主題選擇相應(yīng)板塊進(jìn)行發(fā)帖,發(fā)帖數(shù)量充分說明用戶在這一領(lǐng)域知識交流精力的投入程度。
(3)投入指標(biāo)X3——討論時間。即從發(fā)帖到采集時獲取到的最后回帖的時間跨度,衡量知識交流的持續(xù)時間,反映了用戶在整個知識交流過程中的時間投入情況。
(4)產(chǎn)出指標(biāo)Y1——瀏覽數(shù)量。即各個板塊中每篇帖子截止到統(tǒng)計時間的瀏覽數(shù)量,直觀反映出用戶對帖子主題的關(guān)注程度,帖子的瀏覽數(shù)量越大,信息傳播范圍越廣泛。
(5)產(chǎn)出指標(biāo)Y2——回復(fù)數(shù)量。即用戶對感興趣的帖子進(jìn)行相關(guān)內(nèi)容的回復(fù)數(shù)量,其中一個用戶針對不同帖子進(jìn)行回復(fù)按帖子數(shù)量計數(shù),針對同一帖子多次回復(fù)按1次計數(shù)。帖子的持續(xù)回復(fù)是將主題進(jìn)一步內(nèi)化和吸收的過程,直觀反映了話題熱度,回帖數(shù)量越多說明知識交流的程度越高,傳播的影響力越大。
(6)產(chǎn)出指標(biāo)Y3——投票數(shù)量。即用戶針對答案的準(zhǔn)確與否投贊成票和反對票,每人每帖限投一票,票數(shù)的高低與帖子的優(yōu)劣程度息息相關(guān),有助于用戶快速甄別更優(yōu)質(zhì)的帖子,是技術(shù)問答社區(qū)知識交流效率評價的核心指標(biāo)。
4 ?結(jié)果分析與討論
4.1 ?描述性統(tǒng)計分析
本文通過對“開源中國”社區(qū)15個熱門標(biāo)簽板塊的數(shù)據(jù)依指標(biāo)體系進(jìn)行整理與統(tǒng)計,結(jié)果如表2所示:
如表2所示,不同板塊間指標(biāo)差異較大,總的來說,投入指標(biāo)數(shù)量越多其產(chǎn)出指標(biāo)數(shù)量也相應(yīng)越多,如Java板塊3個投入指標(biāo)數(shù)量均為最高,其3個產(chǎn)出指標(biāo)數(shù)量也最高;用戶數(shù)量與發(fā)帖數(shù)量基本呈正比關(guān)系,如Java板塊用戶與發(fā)帖量均為最高,而用戶量較少的jQuery和Ubuntu板塊發(fā)帖量也較少;發(fā)帖量越多其討論時間也越長,如Java板塊發(fā)帖量的均值高達(dá)23 846.33篇,而Ubuntu板塊僅為389.33篇。
4.2 ?基于SBM模型分析知識交流靜態(tài)效率
本文基于MaxDEA PRO 6.3件中的SBM無導(dǎo)向模型對“開源中國”社區(qū)15個熱門板塊的投入和產(chǎn)出數(shù)據(jù)進(jìn)行測算,分別得到綜合技術(shù)效率、純技術(shù)效率和規(guī)模效率。綜合技術(shù)效率是衡量現(xiàn)有投入資源是否達(dá)到最優(yōu)產(chǎn)出狀態(tài)[25],測量技術(shù)問答社區(qū)中知識交流的整體管理水平;純技術(shù)效率是指投入規(guī)模一致時各板塊最佳的投入產(chǎn)出效果,由此評估技術(shù)問答社區(qū)在技術(shù)和管理等方面的客觀狀況;規(guī)模效率為綜合技術(shù)效率與純技術(shù)效率之比[26],是指技術(shù)因素保持不變時投入指標(biāo)的增長所導(dǎo)致的效率變化,反映了技術(shù)問答社區(qū)的資源配置狀況。
根據(jù)表3所示,“開源中國”社區(qū)15個熱門板塊的平均綜合技術(shù)效率指數(shù)介于[0.652,1],平均值為0.841,處于良好水平。2018-2020年間,每年分別有6個、9個、7個板塊知識交流效率達(dá)到DEA有效(綜合效率指數(shù)為1),而各板塊知識交流綜合技術(shù)效率變化趨勢各異,本文將其劃分為以下4個類型:①成熟型,包括Java、JFinal和Apache Echarts板塊。這3個板塊每年均達(dá)到DEA有效,說明這些板塊整體管理水平達(dá)最優(yōu)狀態(tài),投入與產(chǎn)出要素的組合與規(guī)模合理,目前正處在生產(chǎn)前沿面上,知識交流效率達(dá)到理想效果。②成長型,包括PHP、Linux和CentOS板塊。2018年這3個板塊綜合技術(shù)效率值均較低,但隨著時間的變化不斷發(fā)展,均逐步達(dá)到DEA有效狀態(tài)。③波動型,包括Android、MySQL、Spring、Eclipse、jQuery、Apache Tomcat和Android SDK板塊。這7個板塊的綜合技術(shù)效率發(fā)展趨勢不穩(wěn)定,均呈現(xiàn)出起伏狀態(tài),其中MySQL和Apache Tomcat板塊在2019年出現(xiàn)最低值,表現(xiàn)為開口向上的具有凹折點的折線,其余5個板塊在2019年均出現(xiàn)最高值,表現(xiàn)為開口向下的具有凸折點的折線,且Spring、jQuery和Android SDK 3個板塊在2019年達(dá)DEA有效狀態(tài)。 ? ?④衰退型,包括Python和Ubuntu板塊。這兩個板塊均在2018年達(dá)DEA有效狀態(tài),且Ubuntu板塊在2019年也達(dá)DEA有效狀態(tài),但2020年二者均出現(xiàn)大幅下降趨勢,說明其要積極尋找原因并借鑒成熟型板塊的管理制度與發(fā)展模式,對投入產(chǎn)出要素的資源配置進(jìn)行優(yōu)化。
除此之外,從各板塊知識交流綜合技術(shù)效率三年均值來看,無效單元占比高達(dá)80.00%,即大部分板塊未達(dá)到理想狀態(tài),頂尖水平與下游水平板塊數(shù)量相差較大,說明各板塊知識交流的差距較大。其中,Android板塊和Eclipse板塊三年來效率值均未達(dá)到有效,Eclipse板塊效率值最低,僅為0.652,說明這兩個板塊在投入、產(chǎn)出以及管理上均存在較大問題,是未來關(guān)注的重點對象。
由圖1可知,在2018年各板塊效率均值為0.829,存在9個板塊效率值高于均值;2019年各板塊效率均值達(dá)0.927,相較于2018年出現(xiàn)顯著提升,存在11個板塊效率值高于均值;2020年各板塊效率均值達(dá)0.767,出現(xiàn)大幅度下降趨勢,存在8個板塊效率值高于均值。15個板塊知識交流效率均值呈現(xiàn)一定的波動變化,且在2020年最為明顯,Eclipse板塊出現(xiàn)0.423的極低值,說明2020年由于疫情等重大事件造成社區(qū)內(nèi)各板塊的知識交流效率差異較大。
根據(jù)表4可知,導(dǎo)致單元無效的原因可以分為3類:①板塊的純技術(shù)效率有效而規(guī)模效率無效,如2018年P(guān)HP、Spring、Linux和Apache Tomcat板塊,2019年P(guān)ython板塊以及2020年MySQL、jQuery和Ubuntu板塊的純技術(shù)效率均達(dá)1,而規(guī)模效率無效且范圍處于[0.427,0.966],板塊間無效值差距較大,說明此類板塊現(xiàn)有的技術(shù)與管理水平相對完善,在規(guī)模保持不變的前提下,充分利用了技術(shù)投入來保證知識交流效率的有效,但存在由于規(guī)模結(jié)構(gòu)不合理產(chǎn)生的投入冗余現(xiàn)象,導(dǎo)致資源無法充分利用,且板塊間實際規(guī)模與理想規(guī)模間存在不同程度的差距,只有對規(guī)模結(jié)構(gòu)進(jìn)行合理改善,才能有效提升綜合技術(shù)效率,從而達(dá)到DEA有效狀態(tài);②板塊規(guī)模效率有效而純技術(shù)效率無效,目前只有Android板塊在2019年規(guī)模效率達(dá)1,而純技術(shù)效率無效,說明其規(guī)模結(jié)構(gòu)較為合理,資源配置能力較高,對于投入要素的利用較充分且產(chǎn)出效率較高,但當(dāng)前的技術(shù)和管理水平較差,是制約綜合技術(shù)效率達(dá)有效的關(guān)鍵所在,該板塊需要強(qiáng)化內(nèi)部管理,引入較為先進(jìn)的技術(shù)和設(shè)備,建立一定的技術(shù)壁壘,從而提高純技術(shù)效率;③板塊的純技術(shù)效率和規(guī)模效率均無效,在2018-2020年間每年的板塊數(shù)分別占比55.56%、66.67%和62.50%,說明此類板塊資源配置與技術(shù)管理同時出現(xiàn)問題,二者均需加強(qiáng)。在第三類板塊中,只有2018年jQuery板塊出現(xiàn)純技術(shù)效率較高,而規(guī)模效率較低情況,其余板塊均為純技術(shù)效率較低,規(guī)模效率較高,且規(guī)模效率范圍處于[0.827,0.986],無效值較為集中且與有效值差距較小,說明其規(guī)模效率方面易改進(jìn),可以完善投入產(chǎn)出的合理配置,進(jìn)行社區(qū)的精耕細(xì)作,從而實現(xiàn)知識交流綜合技術(shù)效率有效。而純技術(shù)效率方面的改進(jìn)空間較大,社區(qū)內(nèi)制度和技術(shù)管理水平均需要加強(qiáng),同時應(yīng)采取積極措施增加用戶數(shù)量及發(fā)帖數(shù)量的投入,減少不必要產(chǎn)出,并提升發(fā)帖質(zhì)量,促進(jìn)投入要素的有效利用,以不斷提升純技術(shù)效率。值得一提的是,Android和Eclipse板塊三年來從未達(dá)到過有效水平。
可以發(fā)現(xiàn),“開源中國”社區(qū)DEA無效板塊普遍存在規(guī)模效率較低的問題,這說明在知識交流過程中,忽視了規(guī)模的擴(kuò)大,在今后的發(fā)展中應(yīng)多加關(guān)注知識投入和產(chǎn)出的合理配置。此外,雖多個板塊出現(xiàn)純技術(shù)效率有效情況,但相較于規(guī)模效率值所處范圍,社區(qū)內(nèi)板塊的技術(shù)管理水平較高,但兩極化現(xiàn)象依舊嚴(yán)峻,制約著綜合技術(shù)效率的提升,未來應(yīng)不斷加強(qiáng)技術(shù)管理水平和制度的約束,建立起能夠激發(fā)用戶參與的互惠政策,促使投入資源得到合理利用,提高知識交流的質(zhì)量。
4.3 ?基于Malmquist指數(shù)分析知識交流動態(tài)效率
上文基于SBM模型對“開源中國”社區(qū)知識交流效率的分析是時間點上的靜態(tài)分析,為了進(jìn)一步探究知識交流效率變動的內(nèi)在因素和趨勢,本文根據(jù)“開源中國”社區(qū)15個熱門板塊在2018-2020年間的投入與產(chǎn)出數(shù)據(jù),采用MaxDEA8軟件測算出其全要素生產(chǎn)率指數(shù)(tfpch)、技術(shù)效率變化指數(shù)(effch)和技術(shù)進(jìn)步變化指數(shù)(techch)[27],其中effch衡量DMU相對于生產(chǎn)前沿面的接近程度,用來反映社區(qū)內(nèi)各板塊對現(xiàn)有資源的有效利用能力,可由純技術(shù)效率(pech)和規(guī)模效率(sech)決定[28],techch代表各個時期最佳效率值的變化規(guī)律,用來衡量社區(qū)內(nèi)各板塊的技術(shù)創(chuàng)新是否隨生產(chǎn)前沿變化,上述指標(biāo)可以直觀反映出各板塊知識交流動態(tài)效率的客觀情況。
表5為“開源中國”社區(qū)2018-2020年各生產(chǎn)率指數(shù)變動情況。從全要素生產(chǎn)率來看,整個階段均值為1.156,年平均增長率為15.60%,且每個周期指數(shù)均大于1,說明知識交流效率處于上升趨勢;從技術(shù)效率來看,整個階段均值為0.967,說明其總體技術(shù)效率變化呈現(xiàn)下降趨勢,主要由于2019-2020年下降了25.90%;從技術(shù)進(jìn)步來看,整個階段均值為1.195,上升了19.50%,說明總體技術(shù)進(jìn)步變化指數(shù)呈現(xiàn)上漲趨勢,主要得益于2019-2020年上漲了41.40%,這表明技術(shù)振興是“開源中國”社區(qū)知識交流效率上升的主要原因;從純技術(shù)效率和規(guī)模效率來看,均處于下降趨勢,平均降幅為1.30%和2.00%,二者在一定程度上限制了技術(shù)效率的改善,這與表3中所得結(jié)果相符。
綜合前面分析發(fā)現(xiàn),“開源中國”社區(qū)知識交流效率良好且2018-2020年間全要素生產(chǎn)率處于上升趨勢,為探索其深層次原因,下文分別對15個熱門板塊的全時段和分時段Malmquist指數(shù)進(jìn)行分析。
表6為“開源中國”社區(qū)15個熱門板塊全時段Malmquist指數(shù)情況,約66.67%板塊的全要素生產(chǎn)率呈現(xiàn)增長態(tài)勢,15個板塊平均增幅為15.60%,其中技術(shù)效率變化指數(shù)平均降幅3.30%,但技術(shù)進(jìn)步變化指數(shù)平均增幅19.50%,從而拉高了全要素生產(chǎn)率。從圖2可以明顯看出“開源中國”社區(qū)全要素生產(chǎn)率增長的動力來源是技術(shù)進(jìn)步,這也得益于近年來我國IT技術(shù)產(chǎn)業(yè)技術(shù)水平的顯著提升。15個板塊中表現(xiàn)突出的是JFinal板塊,全要素生效率增幅高達(dá)107.8%,高增長態(tài)勢主要歸因于技術(shù)進(jìn)步增幅高達(dá)107.8%。技術(shù)效率呈現(xiàn)下降趨勢,即使是呈現(xiàn)全要素生產(chǎn)效率上升狀態(tài)的板塊中也有約33.33%出現(xiàn)了技術(shù)效率下降的情況,說明技術(shù)產(chǎn)業(yè)各種資源的協(xié)調(diào)不夠優(yōu)化,現(xiàn)有的技術(shù)潛能也沒有得到最大程度的釋放,管理水平有待進(jìn)一步提高。全要素生產(chǎn)率呈下降趨勢的33.3%板塊中,Java和Apache Echarts主要是技術(shù)進(jìn)步出現(xiàn)下降,Python和Eclipse為技術(shù)效率退步,而Spring技術(shù)進(jìn)步和技術(shù)效率均呈現(xiàn)降態(tài)。由圖3可以發(fā)現(xiàn),雖然純技術(shù)效率和規(guī)模效率對技術(shù)效率存在絕對影響作用,但絕大多數(shù)技術(shù)效率呈現(xiàn)下降的板塊,其規(guī)模效率也同時呈現(xiàn)下降趨勢,而純技術(shù)效率卻沒有呈現(xiàn)類似的變化情況,說明應(yīng)加大對于現(xiàn)有資源結(jié)構(gòu)和規(guī)模的整合,提高創(chuàng)新水平,將具有創(chuàng)新性的投入應(yīng)用于研發(fā)關(guān)鍵技術(shù)和核心信息,提高資源配置狀況,從而推動其各板塊技術(shù)效率進(jìn)步。
表7為“開源中國”社區(qū)分時段各板塊Malmquist指數(shù)動態(tài)變動情況,2018-2019年間,53.33%的板塊全要素生產(chǎn)率呈現(xiàn)增長態(tài)勢,其中半數(shù)以上漲幅超過50%,15個板塊平均漲幅11.20%,并且觀察到其技術(shù)效率與技術(shù)進(jìn)步均呈同步增漲態(tài)勢,說明此階段管理得當(dāng),技術(shù)水平發(fā)展良好,15個板塊中以Android板塊最為突出,全要素生產(chǎn)率高達(dá)2.887。2019-2020年間,53.33%的板塊全要素生產(chǎn)率的增長態(tài)勢,但技術(shù)效率呈下降趨勢,技術(shù)進(jìn)步呈上升趨勢,均變化明顯,技術(shù)效率的退步是由于純技術(shù)效率和規(guī)模效率分別出現(xiàn)6.90%和9.20%的退步所致,說明雖然在此期間技術(shù)發(fā)展水平持續(xù)升高,但受制于資源利用率水平較低,導(dǎo)致發(fā)展不平衡,出現(xiàn)了一定程度管理不當(dāng)現(xiàn)象。圖4和圖5為各指數(shù)2019-2020年與2018-2019年兩個時段的差值,也佐證了第二時段綜合發(fā)展情況突出,但技術(shù)效率發(fā)展限制了“開源中國”社區(qū)的整體發(fā)展水平。
5 ?結(jié)論與建議
本文在已有研究的基礎(chǔ)上,基于SBM-Malmquist對技術(shù)問答社區(qū)知識交流效率進(jìn)行測度評價,結(jié)果表明:2018-2020年間“開源中國”社區(qū)15個熱門板塊平均知識交流效率良好,但板塊間的差距較大,每年僅有3個板塊達(dá)到DEA有效,并且板塊知識交流效率均值呈現(xiàn)“先上升后下降”的波動變化,以2020年最為明顯,說明如疫情等重大事件可能會造成社區(qū)知識交流出現(xiàn)明顯下降;無效單元中僅存在Android板塊在2019年規(guī)模效率有效,說明板塊資源配置水平參差不齊,投入資源并未得到優(yōu)化配置,投入冗余而導(dǎo)致資源得不到充分利用;全要素生產(chǎn)率處于上升趨勢,平均漲幅15.60%,技術(shù)效率變化呈現(xiàn)下降趨勢,技術(shù)進(jìn)步變化指數(shù)呈現(xiàn)19.50%的上漲幅度,且2019-2020年間上漲了41.40%,充分說明技術(shù)振興是“開源中國”社區(qū)知識交流效率上升的主要原因,但存在管理不夠完善及資源利用率不夠高的問題仍亟待解決。
基于上述研究結(jié)果,本文從運(yùn)營管理角度出發(fā),為提高技術(shù)問答社區(qū)知識交流效率提出以下建議:
第一,整合技術(shù)問答社區(qū)資源管理。社區(qū)管理者應(yīng)根據(jù)自身定位,積極對標(biāo)國外先進(jìn)技術(shù)問答社區(qū),結(jié)合自身實際情況吸納有效改進(jìn)措施。同時,合理定位用戶群體,針對Java、JFinal和Apache Echarts等每年均達(dá)到DEA有效的板塊設(shè)置相應(yīng)的門檻,保證用戶質(zhì)量與數(shù)量的同時打造出其特有的文化氛圍。另外,技術(shù)問答社區(qū)的有序運(yùn)行不僅依賴于用戶的發(fā)帖、投票和瀏覽,社區(qū)管理者應(yīng)主動引導(dǎo),例如定期發(fā)起時效性強(qiáng)的熱點內(nèi)容吸引用戶參與并討論,同時規(guī)避由于技術(shù)問答社區(qū)的不斷發(fā)展而引發(fā)的信息激增現(xiàn)象,這會導(dǎo)致內(nèi)容重復(fù)、低相關(guān)性和低質(zhì)量的信息大量堆積,從而影響用戶體驗效果。
第二,優(yōu)化技術(shù)問答社區(qū)資源配置。可以采用集約式管理,針對資源配置水平較低的板塊從量的提升逐步過渡到質(zhì)的把控,有針對性地根據(jù)內(nèi)容對帖子進(jìn)行篩選,例如管理員可通過選取精華帖子并邀請具有較高活躍度和榮譽(yù)值的用戶進(jìn)行回帖,同時為回帖和發(fā)帖質(zhì)量等級相對較高的用戶提供一定的激勵,如社區(qū)虛擬金幣等。同時,優(yōu)化投票機(jī)制,同一回帖者下的再回帖者和發(fā)帖者均設(shè)置投票功能,并對得票數(shù)量高的用戶給予一定的物質(zhì)和精神獎勵,從而不斷調(diào)整社區(qū)的內(nèi)部激勵機(jī)制。除此之外,社區(qū)可以在主頁或功能欄為新用戶設(shè)置實操性較強(qiáng)案例的教程,提高用戶信息素養(yǎng),提升用戶黏性,從而優(yōu)化技術(shù)問答社區(qū)單位投入的所得產(chǎn)出量。
第三,推動技術(shù)問答社區(qū)技術(shù)創(chuàng)新??梢栽O(shè)置同類問題的推送功能,例如根據(jù)用戶的發(fā)帖、瀏覽與回帖等情況鎖定用戶所感興趣問題的搜索進(jìn)程和軌跡,通過對用戶深度挖掘并聚類構(gòu)建用戶畫像,可以更精準(zhǔn)地進(jìn)行同類問題的推送并及時推薦可參考的相關(guān)評論,同時設(shè)置內(nèi)部監(jiān)管,屏蔽不良信息,使用戶盡可能多地獲得有用信息。另外,人工智能技術(shù)的進(jìn)步可以促進(jìn)技術(shù)問答社區(qū)人機(jī)對話模式的形成,匹配數(shù)據(jù)庫將同類問題的答案自動回復(fù)給用戶,并可以根據(jù)用戶所提關(guān)鍵詞引導(dǎo)用戶進(jìn)入相關(guān)領(lǐng)域或展現(xiàn)類似知識圖譜的推薦功能,激發(fā)用戶進(jìn)一步思考并提升知識交流效率。
本文所選取的研究對象和方法具有一定的創(chuàng)新性,但也存在著一定的不足和局限,在指標(biāo)體系的構(gòu)建中,根據(jù)技術(shù)問答社區(qū)自身特征加入了“帖子投票數(shù)量”這一新指標(biāo),但只從微觀層面對知識交流效率進(jìn)行了測度,對于宏觀層面上影響知識交流效率的因素有待進(jìn)一步研究,因此在未來持續(xù)跟進(jìn)研究中,可將數(shù)據(jù)包絡(luò)分析法與其他方法相結(jié)合,在測度知識交流效率的同時,進(jìn)一步分析知識交流效率的影響因素,從而對技術(shù)問答社區(qū)提出更深層次改善建議。
參考文獻(xiàn):
[1] 彭紅彬, 王軍.虛擬社區(qū)中知識交流的特點分析——基于CSDN技術(shù)論壇的實證研究[J]. 現(xiàn)代圖書情報技術(shù), 2009(4): 44-49.
[2] 李勝利, 鐘瀅.中外技術(shù)問答社區(qū)的實證對比研究與啟示——以CSDN和Stack Overflow為例[J]. 情報學(xué)報, 2020, 39(9): 989-1000.
[3] 蔣競, 呂江楓, 張莉.中文軟件問答社區(qū)主題分析研究[J]. 軟件學(xué)報, 2020, 31(4): 1143-1161.
[4] 劉雨農(nóng), 劉敏榕.虛擬知識社區(qū)的社會網(wǎng)絡(luò)結(jié)構(gòu)及影響因素——以知乎網(wǎng)為例[J]. 圖書情報工作, 2018, 62(4): 89-96.
[5] LIU Z, JANSEN B J. Questioner or question: predicting the response rate in social question and answering on Sina Weibo[J]. Information processing & management, 2018, 54(2): 159-174.
[6] JIN J H, LI Y J, ZHONG X J, et al. Why users contribute knowledge to online communities: an empirical study of an online social Q&A community[J]. Information & management, 2015, 52(7): 840-849.
[7] 沈洪洲, 史俊鵬, 馬巧慧.社會化問答社區(qū)回答內(nèi)容質(zhì)量影響特征研究——以“知乎”為例[J]. 情報雜志, 2020, 39(10): 169-175, 202.
[8] 王偉, 冀宇強(qiáng), 王洪偉, 等.中文問答社區(qū)答案質(zhì)量的評價研究:以知乎為例[J]. 圖書情報工作, 2017, 61(22): 36-44.
[9] 李丹.中美網(wǎng)絡(luò)問答社區(qū)的對比研究——以Quora和知乎為例[J]. 青年記者, 2014(26): 19-20.
[10] 萬莉.學(xué)術(shù)虛擬社區(qū)知識交流效率測度研究[J]. 情報雜志, 2015, 34(9): 170-173.
[11] 閆安, 李添秀.虛擬社區(qū)中知識獲取方式對獲取結(jié)果的影響研究——以知乎社區(qū)為例[J]. 圖書館理論與實踐, 2020(1): 65-71, 87.
[12] 龐建剛, 吳佳玲.基于SFA方法的虛擬學(xué)術(shù)社區(qū)知識交流效率研究[J]. 情報科學(xué), 2018, 36(5): 104-109.
[13] 宗乾進(jìn), 呂鑫, 袁勤儉, 等.學(xué)術(shù)博客的知識交流效果評價研究[J]. 情報科學(xué), 2014, 32(12): 72-76.
[14] 晉升.基于DEA方法的學(xué)術(shù)虛擬社區(qū)知識交流效率研究[D]. 鄭州:鄭州大學(xué), 2019.
[15] 楊瑞仙, 黃書瑞, 王元鋒.基于三階段DEA模型的在線健康社區(qū)知識交流效率評價研究[J]. 情報理論與實踐, 2020, 43(10): 122-129.
[16] 胡德華, 張又月, 羅愛靜.基于遺傳投影尋蹤算法的學(xué)術(shù)虛擬社區(qū)知識交流效率研究[J]. 圖書館論壇, 2019, 39(4): 67-73, 83.
[17] 吳佳玲.虛擬學(xué)術(shù)社區(qū)知識交流效率研究[D]. 綿陽:西南科技大學(xué), 2019.
[18] 袁永旭, 張亞飛, 馬瑞敏, 等.基于SBM-Tobit模型的在線健康社區(qū)知識交流效率研究[J]. 情報科學(xué), 2021, 39(5): 106-114.
[19] 魏權(quán)齡.數(shù)據(jù)包絡(luò)分析[M]. 北京:科學(xué)出版社, 2004.
[20] 陳曉紅, 易國棟, 劉翔.基于三階段SBM-DEA模型的中國區(qū)域碳排放效率研究[J]. 運(yùn)籌與管理, 2017, 26(3): 115-122.
[21] 萬莉, 程慧平.管理科學(xué)部重要期刊知識交流效率評價——基于Super-SBM與SFA模型的實證研究[J]. 現(xiàn)代情報, 2017, 37(11): 69-73.
[22] TONE K. A slacks-based measure of efficiency in data envelopment analysis[J]. European journal of operational research, 2001, 130(3): 498-509.
[23] 孫紅蕾, 馬巖, 鄭建明.城市信息基礎(chǔ)設(shè)施效率測評研究[J]. 圖書館論壇, 2017, 37(5): 1-9.
[24] 楊瑞仙, 張廣軼.學(xué)術(shù)虛擬社區(qū)知識交流過程與機(jī)理研究[J]. 現(xiàn)代情報, 2020, 40(10): 52-61.
[25] 王俊俊.基于SBM-Malmquist的廣西旅游生態(tài)效率研究[D]. 桂林:桂林理工大學(xué), 2020.
[26] 方葉林.中國省域旅游業(yè)效率及演化機(jī)理研究[D]. 南京:南京師范大學(xué), 2014.
[27] 洪圖, 李飚.我國農(nóng)業(yè)類上市公司研發(fā)效率測度與劃分——基于SBM-Malmquist模型和企業(yè)生命周期的實證分析[J]. 經(jīng)濟(jì)問題探索, 2020(9): 65-77.
[28] 陳明紅, 謝曉惠.網(wǎng)絡(luò)信息資源生態(tài)化配置效率評價研究[J]. 情報理論與實踐, 2020, 43(10): 81-87.
作者貢獻(xiàn)說明:
丁 ?楠:設(shè)計和改進(jìn)研究方案,修改論文;
曹瑋倬:提出研究選題,搜集與分析數(shù)據(jù),撰寫與修改論文;
相甍甍:參與研究方案、研究思路設(shè)計。
Research on Knowledge Exchange Efficiency Measurement of Technical Question-Answering Community Based on SBM-Malmquist
Ding Nan ?Cao Weizhuo ?Xiang Mengmeng
School of Management Science and Information Engineering, Jilin University of Finance and Economics, Changchun ?130117
Abstract: [Purpose/Significance] The current research on knowledge exchange in technical Q&A communities is not perfect. This article uses data envelopment analysis method to study the efficiency of knowledge exchange in technical Q&A communities, and finds the differences and changing laws between different sectors to provide references for improving community management and improving the efficiency of knowledge exchange. [Method/Process] Based on the construction of the knowledge exchange efficiency evaluation index system, 15 popular sections of the “OSCHINA” community were used as the research samples, and the static and dynamic efficiency values of the knowledge exchange are calculated and analyzed deeply based on the SBM model and the Malmquist index. [Result/Conclusion] The average knowledge exchange efficiency among the 15 popular sections of the “OSCHINA” community is good, but the gap between the sections is large, and the overall knowledge exchange efficiency is on the rise trend, mainly because the technological progress change index increases 19.50%. The increasing rate indicates that technological revitalization is the main reason for the increase in the efficiency of knowledge exchange in the “OSCHINA” community, but a certain degree of mismanagement has occurred and the utilization of resources is low.
Keywords: technical question-answering community ? ?SBM model ? ?Malmquist index ? ? knowledge exchange efficiency ? ?OSCHINA
作者簡介:丁楠,講師,博士,碩士生導(dǎo)師;曹瑋倬,碩士研究生,通信作者,E-mail: cancer_0001@163.com;相甍甍,講師,博士,碩士生導(dǎo)師。
收稿日期:2021-10-22 ? ? ? ?發(fā)表日期:2022-03-10 ? ? ? ?本文責(zé)任編輯:劉遠(yuǎn)穎