白如江,秦明艷,張玉潔
(山東理工大學(xué) 信息管理研究院,山東 淄博 255000)
科研數(shù)據(jù)(Science Research Data)指在科研活動(dòng)中產(chǎn)生的有價(jià)值的、數(shù)字形式的數(shù)據(jù)集合,包括通過調(diào)查、觀察、實(shí)驗(yàn)等科研活動(dòng)直接獲取的原始數(shù)據(jù),經(jīng)清洗、加工等優(yōu)化后的預(yù)支撐論文數(shù)據(jù),以及直接支撐論文結(jié)論的最終數(shù)據(jù)等[1]??蒲袛?shù)據(jù)通常以圖表形式存在于論文中。目前,國(guó)內(nèi)外對(duì)學(xué)術(shù)不端具體含義的界定尚未完全統(tǒng)一,但已在“學(xué)術(shù)不端是主觀故意違反學(xué)術(shù)道德”方面達(dá)成共識(shí)。根據(jù)我國(guó)首個(gè)學(xué)術(shù)不端行為行業(yè)標(biāo)準(zhǔn)《學(xué)術(shù)出版規(guī)范——期刊學(xué)術(shù)不端行為界定(CY/T174—2019)》可知,學(xué)術(shù)不端行為包含剽竊、偽造、篡改、不當(dāng)署名、一稿多投、重復(fù)發(fā)表6種類型[2]。本文結(jié)合科研數(shù)據(jù)概念、學(xué)術(shù)不端含義共識(shí)及我國(guó)學(xué)術(shù)不端行為行業(yè)標(biāo)準(zhǔn),認(rèn)為科研數(shù)據(jù)學(xué)術(shù)不端指科研人員主觀故意剽竊、偽造、篡改論文中有價(jià)值的、數(shù)字形式的數(shù)據(jù)集合的行為。
自2002年以來,國(guó)際學(xué)術(shù)界科研數(shù)據(jù)學(xué)術(shù)不端丑聞層出不窮[3-4],且呈顯著上升趨勢(shì)[5-6]??萍紓惱硎情_展科學(xué)研究、技術(shù)創(chuàng)新活動(dòng)時(shí)應(yīng)遵守的行為準(zhǔn)則和價(jià)值理念,是推動(dòng)科技事業(yè)積極發(fā)展的基礎(chǔ)保障。當(dāng)前科研數(shù)據(jù)學(xué)術(shù)不端事件時(shí)有發(fā)生,嚴(yán)重?cái)_亂科研倫理秩序,長(zhǎng)此以往將阻礙科技事業(yè)健康發(fā)展。
針對(duì)科研數(shù)據(jù)學(xué)術(shù)不端問題,相關(guān)機(jī)構(gòu)嘗試了各類防范舉措。例如,美國(guó)科研誠(chéng)信辦公室、艾普蕾公司相繼開發(fā)“Droplets”程序、“貓圖鷹”系統(tǒng),用于檢測(cè)圖片篡改、造假[7];聯(lián)合國(guó)教科文組織期望科研數(shù)據(jù)能在一天之內(nèi)公開到“Zika Open”平臺(tái)[8];《Science》成立數(shù)據(jù)編委會(huì)專門負(fù)責(zé)論文科研數(shù)據(jù)審查[9];《Scientific Data》《humanities and social sciences communications》《數(shù)據(jù)分析與知識(shí)發(fā)現(xiàn)》等國(guó)內(nèi)外眾多期刊強(qiáng)烈建議甚至強(qiáng)制要求作者提交并共享科研數(shù)據(jù)[10-11]。國(guó)內(nèi)外學(xué)者也就此展開熱烈討論,相關(guān)文獻(xiàn)主要借助案例分析、文獻(xiàn)計(jì)量、經(jīng)驗(yàn)總結(jié)、調(diào)研實(shí)證、模型構(gòu)建等方法,分析科研數(shù)據(jù)學(xué)術(shù)不端類型及其行為特征[12-13]、分布規(guī)律及造假風(fēng)險(xiǎn)[14]等,并在此基礎(chǔ)上探討期刊防范科研數(shù)據(jù)學(xué)術(shù)不端的方法[15]。李侗桐(2019)等通過分析科研數(shù)據(jù)偽造案例,將科研數(shù)據(jù)偽造劃分為捏造科研數(shù)據(jù)、虛報(bào)樣本量、篡改科研數(shù)據(jù)3類,并總結(jié)其主要表征;劉勝利[14]等首次提出基于信息約束量與科研數(shù)據(jù)形式間關(guān)聯(lián)規(guī)則計(jì)量評(píng)估論文科研數(shù)據(jù)造假風(fēng)險(xiǎn)的方法,以及憑借期刊影響因子、撤稿指數(shù)計(jì)量評(píng)估科研人員科研數(shù)據(jù)造假可能性的方法;Steen[13]等借助撤稿論文計(jì)量分析科研數(shù)據(jù)偽造、篡改類學(xué)術(shù)不端論文分布特征;Sebastian[15]等展示了如何使用聚類分析法識(shí)別偽造的科研調(diào)查數(shù)據(jù)。
綜上,相關(guān)機(jī)構(gòu)為防范科研數(shù)據(jù)學(xué)術(shù)不端嘗試了多種方法,相關(guān)學(xué)者也提出了一些完善的意見。但以下兩個(gè)方面仍需進(jìn)一步探討:一是突破事后識(shí)別思路,更注重事前預(yù)防。當(dāng)前探討的科研數(shù)據(jù)學(xué)術(shù)不端防范措施主要適用于論文完成后、出版前期刊對(duì)科研數(shù)據(jù)學(xué)術(shù)不端辨識(shí)環(huán)節(jié),但由于科研數(shù)據(jù)學(xué)術(shù)不端行為的難辨性[12],很難保證相關(guān)論文被成功攔截。即使成功避免了科研數(shù)據(jù)學(xué)術(shù)不端論文的出版、傳播,但科技資源、期刊資源已被浪費(fèi)。如何從源頭上約束科研人員科研數(shù)據(jù)學(xué)術(shù)不端苗頭,預(yù)防科研數(shù)據(jù)學(xué)術(shù)不端論文大量出現(xiàn),是亟需努力的方向。二是深入研究科研數(shù)據(jù)學(xué)術(shù)不端影響因素。當(dāng)前研究大多探討科研數(shù)據(jù)學(xué)術(shù)不端類型及其行為特征,鮮少對(duì)科研數(shù)據(jù)學(xué)術(shù)不端影響因素進(jìn)行研究,缺乏一套對(duì)科研數(shù)據(jù)學(xué)術(shù)不端影響因素進(jìn)行系統(tǒng)分析的模型及方法。
故此,本文集成決策實(shí)驗(yàn)室分析法、解釋結(jié)構(gòu)模型法,構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素多級(jí)遞階結(jié)構(gòu)模型,識(shí)別我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端關(guān)鍵影響因素,厘清因素間邏輯層次關(guān)系,并基于此為構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端預(yù)防機(jī)制提供對(duì)策建議,以期從源頭上預(yù)防科研數(shù)據(jù)學(xué)術(shù)不端論文,優(yōu)化我國(guó)科研生態(tài)環(huán)境,促進(jìn)科技事業(yè)健康發(fā)展。
本文共包含3個(gè)研究階段:一是基于匿名反饋函詢法,構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系,抽取影響因素集;二是基于決策實(shí)驗(yàn)室分析法構(gòu)建綜合影響矩陣,識(shí)別關(guān)鍵影響因素;三是基于解釋結(jié)構(gòu)模型法,構(gòu)建影響因素多級(jí)遞階結(jié)構(gòu)模型,厘清因素間邏輯層次關(guān)系。具體研究思路如圖1所示。
圖1 我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素研究思路Fig.1 Research ideas of influencing factors of academic misconduct in scientific research data in China
匿名反饋函詢法,亦稱專家調(diào)查法,是一種基于函詢方式調(diào)查專家建議、結(jié)構(gòu)化匿名反饋調(diào)查結(jié)果、多輪修改直至協(xié)調(diào)認(rèn)同的直觀預(yù)測(cè)法[16]。該方法充分借助專家知識(shí)經(jīng)驗(yàn),集思廣益,調(diào)查結(jié)果具備廣泛代表性,準(zhǔn)確性高。本文基于匿名反饋函詢法構(gòu)建影響因素體系,有利于科研管理部門全面了解我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素,也為后期影響因素模型建立提供數(shù)據(jù)保障。
1.1.1 因素調(diào)研
在中國(guó)知網(wǎng)期刊數(shù)據(jù)庫(kù)中,以“數(shù)據(jù)學(xué)術(shù)不端”“數(shù)據(jù)造假”“圖表學(xué)術(shù)不端”“圖表數(shù)據(jù)造假”為主題詞,檢索到66篇核心期刊研究論文,刪除不相關(guān)文獻(xiàn),剩余37篇。逐一閱讀文獻(xiàn),初步提取出160個(gè)影響因素。專家小組成員刪除不相關(guān)和低頻次因素,合并名稱相似及含義相近因素,從個(gè)人、組織、期刊、社會(huì)4個(gè)維度歸納出12個(gè)影響因素,分別是科研數(shù)據(jù)素養(yǎng)、學(xué)術(shù)道德素養(yǎng)、學(xué)術(shù)能力、學(xué)術(shù)自尊、科研誠(chéng)信教育、科研誠(chéng)信環(huán)境、科研評(píng)價(jià)壓力、監(jiān)督懲治機(jī)制、數(shù)據(jù)公開、數(shù)據(jù)審查、數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)、論文代寫代發(fā)。
1.1.2 專家選擇
為提高因素體系合理性,本文邀請(qǐng)?jiān)擃I(lǐng)域?qū)<矣薪M織地、反復(fù)多次修正影響因素,以形成認(rèn)同度高、準(zhǔn)確性強(qiáng)的因素體系。專家選擇是匿名反饋函詢法中影響研究結(jié)果準(zhǔn)確性的重要環(huán)節(jié)。本文依據(jù)廣泛性原則和代表性原則,選擇來自多省份、多學(xué)科的代表性科研人員作為函詢對(duì)象。專家的代表性和廣泛性既能體現(xiàn)意見專業(yè)性,也利于多視角意見的提出。專家基本信息如表1所示。
表1 專家基本信息Tab.1 Basic information of experts
1.1.3 專家咨詢表設(shè)計(jì)
在文獻(xiàn)參考和小組討論的基礎(chǔ)上,反復(fù)修改專家咨詢表結(jié)構(gòu)和措辭,形成專家咨詢表,包含4個(gè)部分:一是簡(jiǎn)介,主要包括研究背景、內(nèi)容、目的等;二是填表說明,主要包括相關(guān)說明、注意事項(xiàng)等;三是專家信息,主要包括專家基本信息(性別、學(xué)歷、所在學(xué)校/單位、所學(xué)專業(yè))和專家自評(píng)(判斷依據(jù)、熟悉程度);四是指標(biāo)意見,主要包含因素重要程度意見和修改意見(添加、刪除、合并指標(biāo)或其內(nèi)涵)。
咨詢表中各變量評(píng)分標(biāo)準(zhǔn)和賦分含義如下:影響因素重要性測(cè)量采用李克特五級(jí)量表,即非常重要、比較重要、一般重要、不太重要、不重要,分別賦分5、4、3、2、1,代表影響因素的重要程度,如“5”代表某專家認(rèn)為某影響因素對(duì)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端的影響程度非常大,即該影響因素非常重要;熟悉程度分為非常熟悉、較熟悉、一般熟悉、不太熟悉、不熟悉,分別賦分0.9、0.7、0.5、0.3、0.1,代表專家對(duì)該課題的熟悉程度,如“0.1”代表該專家對(duì)本課題不熟悉。本文參考何宇[17]在專家咨詢表中描述的“判斷依據(jù)”內(nèi)容,將本文判斷依據(jù)分為實(shí)踐經(jīng)驗(yàn)、理論分析、參考國(guó)內(nèi)外數(shù)據(jù)、直覺感覺4種。判斷依據(jù)測(cè)量量表采用三級(jí)評(píng)分,分為實(shí)踐經(jīng)驗(yàn)(大、中、小)、理論分析(大、中、小)、參考國(guó)內(nèi)外數(shù)據(jù)(大、中、小)、直覺感覺(大、中、小),對(duì)應(yīng)賦分為實(shí)踐經(jīng)驗(yàn)(0.5、0.4、0.3)、理論分析(0.3、0.2、0.1)、參考國(guó)內(nèi)外數(shù)據(jù)(0.1、0.1、0.1)、直覺感覺(0.1、0.1、0.1)。其中,“大、中、小”代表專家在判定影響因素重要性時(shí)基于該依據(jù)的程度,比如實(shí)踐經(jīng)驗(yàn)“大”代表專家很大程度上基于實(shí)踐經(jīng)驗(yàn)對(duì)影響因素重要性作出判斷。分值代表專家打出的影響因素重要性分值的可信度,如實(shí)踐經(jīng)驗(yàn)0.5代表專家給出的影響因素重要性分值的可信度最高。各變量評(píng)分標(biāo)準(zhǔn)如表2所示。
1.1.4 評(píng)價(jià)指標(biāo)設(shè)定
(1)專家積極程度(Y)。專家積極程度指專家對(duì)研究問題的關(guān)心程度。Y值越大,表示專家對(duì)該研究的關(guān)心程度越高。一般來講,Y≥0.70時(shí),認(rèn)為專家積極程度高。m表示回收問卷數(shù),q表示發(fā)出問卷數(shù),計(jì)算公式如下:
(1)
(2)專家權(quán)威系數(shù)(CR)。專家權(quán)威系數(shù)指專家在該研究方向的權(quán)威程度,CR值越大說明專家權(quán)威性越高,評(píng)價(jià)結(jié)果可靠性越高。一般來講,CR≥0.70時(shí),認(rèn)為專家權(quán)威程度高。CR由專家自評(píng)時(shí)得到的指標(biāo)判斷依據(jù)Ca和熟悉程度Cb決定,計(jì)算公式如下:
(2)
(3)專家集中程度。專家集中程度反映指標(biāo)重要性分值的集中趨勢(shì),該值越大,表示該指標(biāo)越重要。常用的專家集中程度計(jì)量指標(biāo)有均值、滿分頻率,其中,均值是所有專家打分總數(shù)與打分專家人數(shù)之比,計(jì)算公式如下:
(3)
式中,Mi指第i個(gè)指標(biāo)的重要性得分均值,mi指評(píng)價(jià)第i個(gè)指標(biāo)的專家人數(shù),Bij指第i個(gè)指標(biāo)的第j個(gè)專家打出的重要性評(píng)分。一般而言,重要性均值大于3才滿足要求。
滿分頻率是指標(biāo)滿分?jǐn)?shù)與專家人數(shù)之比,計(jì)算公式如下:
(4)
式中,Zi指第i個(gè)指標(biāo)的滿分頻率,mi指評(píng)價(jià)第i個(gè)指標(biāo)的專家人數(shù),ni指第i個(gè)指標(biāo)的滿分?jǐn)?shù)。Zi值越大,表明該指標(biāo)越重要。
(4)專家協(xié)調(diào)程度。專家協(xié)調(diào)程度指專家對(duì)同一指標(biāo)重要性意見的波動(dòng)程度,通常由變異系數(shù)CV表示。變異系數(shù)是消除量綱影響后,客觀比較測(cè)量值變異程度的統(tǒng)計(jì)量,計(jì)算公式如下:
(5)
式中,CVi指第i個(gè)指標(biāo)的變異系數(shù),SDi指第i個(gè)指標(biāo)的標(biāo)準(zhǔn)偏差,Mi指第i個(gè)指標(biāo)的均數(shù),該值越大,表明專家對(duì)同一指標(biāo)重要性認(rèn)知差距越大。一般而言,CV≤0.25時(shí)滿足要求,否則應(yīng)重新調(diào)研直到滿足需求。
表2 影響因素重要性、判斷依據(jù)與熟悉程度評(píng)分標(biāo)準(zhǔn)Tab.2 Importance of influencing factors, judgment basis and scoring criteria of familiarity
1.1.5 函詢結(jié)果分析
(1)第一輪匿名反饋函詢結(jié)果分析。在第一輪專家咨詢中,以函詢方式邀請(qǐng)25位專家對(duì)12個(gè)因素的重要性進(jìn)行打分,收回22份問卷,專家積極系數(shù)為0.88(>0.70),說明專家對(duì)該研究關(guān)心程度高,符合要求;22位專家中有3位專家權(quán)威系數(shù)小于0.7,說明這3位專家對(duì)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素熟悉度較低、判斷依據(jù)的主觀性更強(qiáng),填寫數(shù)據(jù)的可信度、準(zhǔn)確性受到影響,因而將這3份問卷視為無效問卷。在剩余19份有效問卷中,專家權(quán)威系數(shù)均≥0.7,均值為0.77;因素重要性均值除學(xué)術(shù)自尊外均符合大于3的要求,總體均值為4.20,其中,學(xué)術(shù)道德素養(yǎng)均數(shù)值最高,說明學(xué)術(shù)道德素養(yǎng)最重要;變異系數(shù)均值為0.21,其中,學(xué)術(shù)自尊、科研誠(chéng)信教育、科研誠(chéng)信環(huán)境、監(jiān)督懲罰機(jī)制、論文代寫代發(fā)5個(gè)因素變異系數(shù)大于0.25,說明專家認(rèn)同度不夠,其中,學(xué)術(shù)自尊既不符合均數(shù)要求也未滿足變異系數(shù)標(biāo)準(zhǔn),因而將其刪除,其余4個(gè)指標(biāo)在下一輪專家咨詢中再次尋求專家建議。第一輪匿名反饋函詢結(jié)果如表3所示。
(2)第二輪匿名反饋函詢結(jié)果分析。在向各位專家反饋第一輪函詢結(jié)果并更新咨詢表內(nèi)容的基礎(chǔ)上形成第二輪專家咨詢表,發(fā)送給原19位專家,回收19份問卷,回收率100%;無效問卷1份,剩余18份有效問卷的專家權(quán)威系數(shù)均大于0.7,均值約為0.86,符合要求且較上一輪提升0.09;指標(biāo)均數(shù)全部大于3,總體均數(shù)為4.65,高出第一輪0.45;變異系數(shù)均值為0.11,協(xié)同程度較上一輪提升0.10。第二輪匿名反饋函詢結(jié)果如表4所示。
鑒于第二輪匿名反饋函詢結(jié)果中各因素評(píng)價(jià)指標(biāo)均符合要求且較上一輪函詢結(jié)果均有所提高,故不再進(jìn)行第三輪函詢。
1.1.6 我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系構(gòu)建
本文采用科隆巴赫信度系數(shù)法(Cronbach's α),檢驗(yàn)內(nèi)在一致性信度。如表5所示,Cronbach's α=0.701(>0.7),說明量表整體的可靠性較高,信度較高。同時(shí),采用內(nèi)容效度指數(shù)S-CVI/Ave評(píng)價(jià)量表內(nèi)容效度,一般而言,平均效度指數(shù)大于0.9,說明量表內(nèi)容效度滿足要求[18]。編制“我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素問卷內(nèi)容效度分析”問卷,并在第二輪函詢專家中抽選8位專家對(duì)問卷內(nèi)容效度進(jìn)行打分,選項(xiàng)采用四等級(jí)評(píng)分,即不相關(guān)、弱相關(guān)、較強(qiáng)相關(guān)、非常相關(guān),分別賦分1、2、3、4。效度檢驗(yàn)結(jié)果如表6所示,評(píng)分總次數(shù)為88,得分均為3或4。依據(jù)式(6)可知,S-CVI/Ave=1(>0.9),符合要求。
(6)
式中,d代表評(píng)分為3或4的總次數(shù),e代表評(píng)分總次數(shù)。
表3 第一輪匿名反饋函詢結(jié)果Tab.3 Rresults of the first round of anonymous feedback correspondence
表4 第二輪匿名反饋函詢結(jié)果Tab.4 Results of the second round of anonymous feedback correspondence
表5 信度檢驗(yàn)結(jié)果Tab.5 Reliability test results
鑒于第二輪匿名反饋函詢結(jié)果和問卷信效度檢驗(yàn)結(jié)果均符合要求,故據(jù)此形成我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系,如表7所示。
表6 效度檢驗(yàn)結(jié)果Tab.6 Validity test results
表7 我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系Tab.7 Influencing factor system of scientific research data academic misconduct in China
決策實(shí)驗(yàn)室分析法(Decision-making Trial and Evaluation Laboratory,DEMATEL)是一種借助矩陣論和圖論原理分析復(fù)雜系統(tǒng)因素間影響關(guān)系的方法。本文借助DEMATEL法,構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素綜合影響矩陣,定量計(jì)算、比較分析各因素的原因度、中心度、被影響度、影響度,識(shí)別我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端關(guān)鍵影響因素。
1.2.1 數(shù)據(jù)收集
首先,根據(jù)表7中的科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系,抽取影響因素集Ai={A1,A2,…,A11}。其次,編制“我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素間直接影響關(guān)系調(diào)查問卷”,將影響程度劃分為5個(gè)等級(jí),即無影響、較弱影響、一般影響、較強(qiáng)影響、強(qiáng)影響,分別賦值1、2、3、4、5。最后,邀請(qǐng)對(duì)問卷效度打分的原8位專家,對(duì)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素間直接影響關(guān)系進(jìn)行打分,得到8份有效問卷。
1.2.2 直接影響矩陣B
將問卷數(shù)據(jù)按平均法處理,得到直接影響矩陣B=[Bij]n×n,如表8所示。其中,n表示因素個(gè)數(shù),n=11。Bij表示因素Ai對(duì)因素Aj的直接影響程度,當(dāng)i=j時(shí),Bij=0。
1.2.3 直接影響矩陣B*規(guī)范化
為統(tǒng)一量綱,采用“行和最大值法”對(duì)原始矩陣進(jìn)行歸一化處理。將原始矩陣中各因素Bij除以該矩陣中的行和最大值,得到規(guī)范化影響矩陣B*。
(7)
式中,max代表原始矩陣B中因素行和最大值。
表8 直接影響矩陣B Tab.8 Matrix B of direct impact
1.2.4 綜合影響矩陣C
復(fù)雜系統(tǒng)不僅受到眾多因素影響,而且因素之間也因受到反饋性和非線性影響而存在包含直接影響關(guān)系和間接影響關(guān)系的復(fù)雜關(guān)系[19]。故此,在規(guī)范化直接影響矩陣B*的基礎(chǔ)上,根據(jù)公式(8),得到同時(shí)反映系統(tǒng)要素間直接和間接影響關(guān)系的綜合影響矩陣C,如表9所示。
(8)
式中,I為單位矩陣。
1.2.5 “四度”計(jì)算
以綜合影響矩陣C為基礎(chǔ),計(jì)算“四度”,明晰因素因果屬性和重要程度,為識(shí)別我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端關(guān)鍵影響因素奠定基礎(chǔ)。
影響度D值是因素行之和,指該因素對(duì)其它因素的綜合影響程度,計(jì)算公式見式(9)。被影響度E值是因素列之和,指其它因素對(duì)該因素的綜合影響程度,計(jì)算公式見式(10)。中心度F值是影響度與被影響度之和,指該因素在系統(tǒng)中的重要程度,該值越大,說明該因素在系統(tǒng)中越重要,計(jì)算公式見式(11)。原因度G值是影響度與被影響度之差,指該因素對(duì)其它要素的影響情況,原因度值大于0說明該因素對(duì)其它因素綜合影響更大,原因度小于0說明該因素受其它因素的綜合影響更大,計(jì)算公式見式(12)。計(jì)算結(jié)果如表10所示。
(9)
(10)
Fi=Di+Ei(i=1,2,...,n)
(11)
Gi=Di-Ei(i=1,2,...,n)
(12)
表9 綜合影響矩陣C Tab.9 Matrix C of comprehensive influence
表10 影響度、被影響度、中心度與原因度計(jì)算結(jié)果Tab.10 Calculation results of influence degree, affected degree, centrality degree and cause degree
1.2.6 因素關(guān)系圖、因果關(guān)系圖繪制
我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素關(guān)系圖,如圖2所示。以表9數(shù)據(jù)為基礎(chǔ),將中心度F作為x軸,將原因度G作為y軸,繪制我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素因果關(guān)系圖,如圖3所示。
解釋結(jié)構(gòu)模型法(Interpretative Structural Modeling Method,ISM)是一種在保證系統(tǒng)整體功能完整的前提下,以最簡(jiǎn)有向拓?fù)鋱D形式展示系統(tǒng)結(jié)構(gòu)的研究方法。本文借助ISM模型優(yōu)勢(shì),劃分我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素間邏輯關(guān)系,并借助層級(jí)圖使影響因素間邏輯層次、關(guān)系結(jié)構(gòu)一目了然。
1.3.1 整體影響矩陣H計(jì)算
鑒于綜合影響矩陣C未考慮因素對(duì)自身的影響,故引入單位矩陣I,形成整體影響矩陣H[20]。計(jì)算公式如式(13)。
H=C+I
(13)
1.3.2 可達(dá)矩陣K計(jì)算
鑒于決策實(shí)驗(yàn)室法采用1~5五級(jí)賦分法劃分因素間影響程度,而解釋結(jié)構(gòu)模型采用二級(jí)法,用1和0代表因素間有無關(guān)系[21],故引入閾值λ篩除整體影響矩陣H因素間弱影響關(guān)系,簡(jiǎn)化關(guān)系層次。本文在遵循數(shù)據(jù)內(nèi)在規(guī)律的基礎(chǔ)上,借助統(tǒng)計(jì)分布的均值和標(biāo)準(zhǔn)差確定閾值λ。根據(jù)綜合影響矩陣C,計(jì)算得出α=0.511 5,β=0.118 0。
λ=α+β
(14)
式中,λ∈[0,1], α和β分別代表綜合影響矩陣C中所有因素的均值、標(biāo)準(zhǔn)差。根據(jù)公式(14)計(jì)算得出,λ=0.629 5。
根據(jù)公式(15),得到可達(dá)矩陣K,如表11所示。
(15)
圖2 我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素間關(guān)系Fig.2 Relationship between influencing factors of academic misconduct in scientific research data in China
圖3 我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素間因果關(guān)系Fig.3 Causal relationship of influencing factors of academic misconduct in scientific research data in China
表11 可達(dá)矩陣K Tab.11 Reachable matrix K
1.3.3 多級(jí)遞階結(jié)構(gòu)模型構(gòu)建
以可達(dá)矩陣K為基礎(chǔ),根據(jù)公式(16)、(17)、(18),依次形成可達(dá)集L、先行集M及其交集R。
L(ai)={aj|aj∈A,Kij=1}(i=1,2,...,n)
(16)
M(ai)={aj|aj∈A,Kji=1}(i=1,2,...,n)
(17)
R(ai)=L(ai)∩M(ai)(i=1,2,...,n)
(18)
可達(dá)集L是可達(dá)矩陣中要素ai所在行中值為1的列要素集合,集合中所有因素ai都能到達(dá);先行集M是可達(dá)矩陣中要素ai所在列中值為1的行要素的集合,集合中所有因素ai都能到達(dá);交集R表示可達(dá)集合L和先行集合M的交集,結(jié)果如表12所示。
當(dāng)因素ai滿足L(ai)=R(ai)時(shí),代表可達(dá)集L中的因素ai都能在先行集M中找到前因。故此,因素ai被劃分到最頂層O1。從可達(dá)集和交集中刪除之前滿足條件的因素,再重復(fù)以上步驟迭代劃分,直到所有因素都被確定層級(jí)。依據(jù)層級(jí)劃分結(jié)果,構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素多級(jí)遞階結(jié)構(gòu)模型,如圖4所示。
表12 可達(dá)集L、先行集M、交集R Tab.12 Reachable set L, antecedent set M and intersection R
圖4 我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素多級(jí)遞階結(jié)構(gòu)模型Fig.4 Multi-level hierarchical structure model of the factors affecting the academic misconduct of scientific research data in China
本文基于匿名反饋函詢法,識(shí)別出我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素11個(gè)。其中,個(gè)人維度包含3個(gè)因素,分別是數(shù)據(jù)素養(yǎng)(A1)、學(xué)術(shù)道德素養(yǎng)(A2)、學(xué)術(shù)能力(A3);組織維度包含4個(gè)因素,分別是科研誠(chéng)信教育(A4)、科研誠(chéng)信環(huán)境(A5)、監(jiān)督懲治機(jī)制(A6)、科研評(píng)價(jià)壓力(A7);期刊維度包含2個(gè)因素,分別是數(shù)據(jù)公開(A8)、數(shù)據(jù)審查(A9);社會(huì)維度包含2個(gè)因素,分別是數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)(A10)、論文代寫代發(fā)(A11)。
在11個(gè)因素中因素A6的影響度最高,說明監(jiān)督懲治機(jī)制對(duì)其它因素的綜合影響程度最高。按影響度排序?yàn)?A6>A9>A8>A4>A7>A10>A5>A11>A2>A1>A3。因素A11、A5、A10、A6、A2、A9的被影響度排名較高,說明它們更易受其它因素影響。從綜合影響度和被影響度來看,因素A6、A9、A10排名較高,說明完善監(jiān)督懲治機(jī)制、加強(qiáng)數(shù)據(jù)審查、改進(jìn)數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)有助于防范我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端。
由圖3可知,11個(gè)影響因素共坐落于4個(gè)象限。其中,位于第一象限的A6、A9原因度大于0且中心度大于平均數(shù),說明監(jiān)督懲治機(jī)制、數(shù)據(jù)審查不僅對(duì)其它因素的綜合影響程度大于受其它因素的綜合影響程度,而且在系統(tǒng)中發(fā)揮關(guān)鍵作用,屬于“原因型關(guān)鍵因素”。第二象限的A4、A7、A8原因度大于0但中心度低于平均水平,說明科研誠(chéng)信教育、科研評(píng)價(jià)壓力、數(shù)據(jù)公開雖更易影響其它因素但發(fā)揮的作用有限,屬于“影響型因素”。第三象限因素原因度小于0且中心度小于平均值,說明數(shù)據(jù)素養(yǎng)、學(xué)術(shù)道德素養(yǎng)、學(xué)術(shù)能力更易受其它因素影響且在系統(tǒng)中重要程度較低,屬于“結(jié)果型因素”。位于第四象限的A5、A10、A11原因度小于0但中心度高于平均水平,說明科研誠(chéng)信環(huán)境、數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)、論文代寫代發(fā)更易受其它因素影響但在系統(tǒng)中發(fā)揮關(guān)鍵作用,屬于“結(jié)果型關(guān)鍵因素”。
綜上,我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端關(guān)鍵影響因素有5個(gè),按中心度排序依次為:數(shù)據(jù)審查>數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)>科研誠(chéng)信環(huán)境>監(jiān)督懲治機(jī)制>論文代寫代發(fā)。
我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素分為淺表層、過渡層、本質(zhì)層,3個(gè)層次從上到下代表影響因素對(duì)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端的影響程度逐漸加深,3個(gè)層次從下到上代表我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素間因果邏輯關(guān)系,其中,層級(jí)1(O1)屬于淺表層,是影響我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端的直接因素,包含數(shù)據(jù)素養(yǎng)(A1)、學(xué)術(shù)能力(A3)、論文代寫代發(fā)(A11)3個(gè)因素;層級(jí)2(O2)、層級(jí)3(O3)、層級(jí)4(O4)屬于過渡層,是影響我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端的間接因素,包含學(xué)術(shù)道德素養(yǎng)(A2)、科研誠(chéng)信環(huán)境(A5)、科研評(píng)價(jià)壓力(A7)、科研誠(chéng)信教育(A4)、數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)(A10)、監(jiān)督懲治機(jī)制(A6)6個(gè)因素。層級(jí)5(O5)屬于本質(zhì)層,是影響我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端的根源因素,包含數(shù)據(jù)公開(A8)、數(shù)據(jù)審查(A9)兩個(gè)因素。
同時(shí),本文發(fā)現(xiàn)各因素不是獨(dú)立作用于我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端,而是在作用過程中交互影響,形成有向鏈條結(jié)構(gòu)。這種交互作用主要體現(xiàn)在跨級(jí)因素間,比如本質(zhì)層的數(shù)據(jù)公開因素跨級(jí)影響過渡層的監(jiān)督懲治機(jī)制、淺表層的論文代寫代發(fā)。再比如,層級(jí)4的監(jiān)督懲治機(jī)制跨級(jí)影響層級(jí)3的數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)、層級(jí)2的科研誠(chéng)信環(huán)境。
先前研究側(cè)重在論文完成后、出版前環(huán)節(jié)探討防范科研數(shù)據(jù)學(xué)術(shù)不端的方法,而本文力求探尋科研數(shù)據(jù)學(xué)術(shù)不端的關(guān)鍵影響因素和因素間邏輯層次關(guān)系,基于此構(gòu)建預(yù)防機(jī)制,可以從源頭上遏制科研數(shù)據(jù)學(xué)術(shù)不端苗頭,減少科研數(shù)據(jù)學(xué)術(shù)不端現(xiàn)象,對(duì)預(yù)防我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端,減少科研資源浪費(fèi),優(yōu)化學(xué)術(shù)生態(tài)環(huán)境具有一定指導(dǎo)意義。
(1)采用匿名反饋函詢法構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系,抽取影響因素集,發(fā)現(xiàn)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端受多元因素綜合影響,包含個(gè)人、組織、期刊、社會(huì)4個(gè)維度11個(gè)因素。
(2)利用DEMATEL法生成綜合影響矩陣,計(jì)算并分析影響因素“四度”,明晰因素因果屬性及其重要程度,識(shí)別出科研誠(chéng)信環(huán)境、監(jiān)督懲治機(jī)制、數(shù)據(jù)審查、數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)、論文代寫代發(fā)屬于我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端關(guān)鍵影響因素。
(3)基于ISM模型構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素多級(jí)遞階結(jié)構(gòu)模型,形成最簡(jiǎn)層次化有向拓?fù)鋱D,深入分析因素間邏輯層次關(guān)系,將因素劃分為5個(gè)層級(jí)、3個(gè)層次(淺表層、過渡層、本質(zhì)層)。
根據(jù)以上研究結(jié)論,對(duì)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端預(yù)防機(jī)制構(gòu)建提出以下思路。
3.2.1 綜合多元因素,協(xié)調(diào)多方配合
由我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素體系可知,我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端受到多元因素、多個(gè)主體交互作用。因此,建議采用反饋控制理論方法進(jìn)行動(dòng)態(tài)閉環(huán)管理,即在監(jiān)測(cè)科研數(shù)據(jù)學(xué)術(shù)不端動(dòng)態(tài)的基礎(chǔ)上,根據(jù)階段性變化特征,動(dòng)員多方主體,綜合多元因素,系統(tǒng)性地調(diào)動(dòng)影響因素,預(yù)防科研數(shù)據(jù)學(xué)術(shù)不端行為。具體而言,我國(guó)科研人員應(yīng)提高自身數(shù)據(jù)素養(yǎng)、學(xué)術(shù)道德素養(yǎng)、學(xué)術(shù)能力,堅(jiān)守學(xué)術(shù)道德底線;科研人員所在組織單位應(yīng)加強(qiáng)科研誠(chéng)信教育、改善科研誠(chéng)信環(huán)境、完善監(jiān)督懲治機(jī)制、優(yōu)化科研評(píng)價(jià)體制,打造良好的科研誠(chéng)信氛圍和動(dòng)力機(jī)制;期刊應(yīng)完善數(shù)據(jù)公開、審查制度,對(duì)科研人員數(shù)據(jù)學(xué)術(shù)不端行為產(chǎn)生震懾;社會(huì)層面應(yīng)注重改進(jìn)科研數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù),遏止論文代寫代發(fā)發(fā)展。
3.2.2 把握關(guān)鍵制控點(diǎn),強(qiáng)化推動(dòng)作用
把握關(guān)鍵制控點(diǎn),發(fā)揮重要推動(dòng)作用,重點(diǎn)關(guān)注科研誠(chéng)信環(huán)境、監(jiān)督懲治機(jī)制、數(shù)據(jù)審查、數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)、論文代寫代發(fā)5個(gè)關(guān)鍵因素??蒲姓\(chéng)信環(huán)境,會(huì)潛移默化地影響科研人員的學(xué)術(shù)道德素養(yǎng)和學(xué)術(shù)價(jià)值觀。完善匿名舉報(bào)制度,切實(shí)保障舉報(bào)人信息安全,有效改善我國(guó)科研人員誠(chéng)信環(huán)境;監(jiān)督懲治機(jī)制是約束我國(guó)科研人員數(shù)據(jù)學(xué)術(shù)不端行為的有力手段,需要科研單位、科研誠(chéng)信主管部門、基金項(xiàng)目負(fù)責(zé)部門、期刊出版機(jī)構(gòu)和數(shù)據(jù)庫(kù)機(jī)構(gòu)等多方主體聯(lián)合執(zhí)行,通過提高科研數(shù)據(jù)學(xué)術(shù)不端成本,達(dá)到減少科研數(shù)據(jù)學(xué)術(shù)不端事件的目的;期刊應(yīng)規(guī)范論文數(shù)據(jù)審查流程,增設(shè)數(shù)據(jù)審查環(huán)節(jié),提高編輯數(shù)據(jù)審查能力;算法研究人員、軟件開發(fā)者和數(shù)據(jù)庫(kù)機(jī)構(gòu)應(yīng)協(xié)同研發(fā)檢測(cè)精度更優(yōu)、檢測(cè)效率更高、學(xué)科適用性更強(qiáng)的科研數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù),提高防范數(shù)據(jù)學(xué)術(shù)不端的能力;論文代寫代發(fā)產(chǎn)業(yè)依托互聯(lián)網(wǎng)技術(shù)、網(wǎng)絡(luò)交易平臺(tái),利用行政制裁短板、民事制裁漏洞,形成灰色產(chǎn)業(yè)鏈,應(yīng)采用高額罰款方式懲治論文賣家,采用行政罰款和名譽(yù)懲治方式懲治買家,使得買賣雙方有所忌憚,對(duì)買賣論文望而卻步。
3.2.3 立足層次關(guān)系,開展階梯管理
基于我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端影響因素多樣化、結(jié)構(gòu)層次化、作用差異化特征,建議立足層級(jí)關(guān)系,遵循因素自身作用規(guī)律,采用階梯式向下深入和分類管理方式。具體而言,依據(jù)淺表層影響因素對(duì)我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端的直接作用,采用全面鋪開、逐個(gè)引導(dǎo)的方式,即相關(guān)機(jī)構(gòu)全面關(guān)注數(shù)據(jù)素養(yǎng)、學(xué)術(shù)能力、論文代寫代發(fā)3個(gè)因素,不能顧此失彼,且鑒于因素間獨(dú)立性,需逐個(gè)引導(dǎo)單個(gè)因素往積極方向發(fā)揮作用,達(dá)到快速生效的目標(biāo);鑒于過渡層影響因素的間接作用,采用集中火力、重點(diǎn)落實(shí)的方式,即在適度引導(dǎo)學(xué)術(shù)道德素養(yǎng)、科研誠(chéng)信教育、科研評(píng)價(jià)壓力、科研數(shù)據(jù)學(xué)術(shù)不端檢測(cè)技術(shù)等因素的同時(shí),有針對(duì)性地重點(diǎn)控制與多因素存在因果關(guān)聯(lián)的科研誠(chéng)信環(huán)境和監(jiān)督懲治機(jī)制,實(shí)現(xiàn)高效解決的目標(biāo);鑒于本質(zhì)層影響因素的根源性作用,采用追本溯源的高質(zhì)量分析方式,即完善數(shù)據(jù)公開、數(shù)據(jù)審查制度,從源頭遏止,達(dá)到長(zhǎng)期穩(wěn)固的治標(biāo)目標(biāo)。這種階梯式分類管理方式可以解決以往忽視因素間作用差異性的問題,將3種層次的管理方式融合為一個(gè)有機(jī)整體,共同構(gòu)建我國(guó)科研數(shù)據(jù)學(xué)術(shù)不端預(yù)防機(jī)制。并且,不同管理方式相互配合,既有引導(dǎo)又有懲治,協(xié)同發(fā)揮作用,形成良性循環(huán)。