李艷娜,毛 星,董 里
(《消防科學(xué)與技術(shù)》編輯部 天津300381)
隨著信息檢索技術(shù)的發(fā)展,信息的透明化和公開化逐步增強(qiáng),學(xué)術(shù)不端行為被發(fā)現(xiàn)的幾率也越來越大。近年來不斷有學(xué)術(shù)不端行為被曝光,涉及人員包括在校生、教授甚至院士等各類群體,由此也引發(fā)了關(guān)于學(xué)術(shù)不端的大討論。
學(xué)術(shù)不端一般指不符合學(xué)術(shù)道德或規(guī)范的學(xué)術(shù)行為。美國聯(lián)邦學(xué)術(shù)不端行為政策(The US Federal Research Misconduct Policy)中,將學(xué)術(shù)不端定義為“在提出觀點(diǎn)、實(shí)施研究或總結(jié)研究成果的過程中,偽造、篡改或抄襲的行為”[1]。其他學(xué)術(shù)不端還包括:把屬于同一研究成果的素材“支解”為多篇“香腸論文”、同行評議造假、故意刪除數(shù)據(jù)、在文章中掛名等行為。Joeri等[2]對比利時幾所醫(yī)學(xué)機(jī)構(gòu)的315名學(xué)術(shù)人員進(jìn)行問卷調(diào)查時,將學(xué)術(shù)不端行為分為12種,并按照嚴(yán)重程度分為3類,包括學(xué)術(shù)欺騙行為(偽造數(shù)據(jù)、篡改、剽竊)、嚴(yán)重學(xué)術(shù)不端行為及一般學(xué)術(shù)不端行為。結(jié)果發(fā)現(xiàn)15%的應(yīng)答者承認(rèn)近3年內(nèi)有過偽造、篡改或剽竊數(shù)據(jù)的行為,學(xué)術(shù)欺騙行為在年輕學(xué)者中更加普遍。另外,72%的應(yīng)答者表示發(fā)表成果的壓力太大。作者認(rèn)為,發(fā)表成果的壓力和學(xué)術(shù)不端現(xiàn)象的嚴(yán)重程度之間有較強(qiáng)的相關(guān)性。
關(guān)于學(xué)術(shù)不端的討論由來已久。在CNKI中以“Scientific misconduct”為篇名檢索得到的結(jié)果中,最早的文獻(xiàn)發(fā)表于1985年,早期文獻(xiàn)以外文為主,且多見于醫(yī)學(xué)類期刊,內(nèi)容多涉及臨床試驗方面學(xué)術(shù)成果的學(xué)術(shù)不端現(xiàn)象。1996年,陳民[3]介紹了美國當(dāng)時關(guān)于學(xué)術(shù)不端行為如何界定的爭議。這是早期關(guān)于學(xué)術(shù)不端的介紹性質(zhì)的中文文獻(xiàn)。2000年后,關(guān)于學(xué)術(shù)不端討論的中文文獻(xiàn)逐漸增多,反映了國內(nèi)學(xué)術(shù)界對于學(xué)術(shù)不端行為關(guān)注的變化,如圖1所示。2003年,洪明苑[4]針對科學(xué)活動中的不端行為進(jìn)行討論,分析當(dāng)時學(xué)術(shù)和社會環(huán)境下學(xué)術(shù)不端行為產(chǎn)生的原因,并從有效監(jiān)督方面提出治理學(xué)術(shù)不端行為的建議。2003年5月7日,科學(xué)技術(shù)部、教育部、中國科學(xué)院、中國工程院、國家自然科學(xué)基金委員會聯(lián)合發(fā)布《關(guān)于改進(jìn)科學(xué)技術(shù)評價工作的決定》,明確提出:加強(qiáng)科學(xué)道德建設(shè),營造良好的創(chuàng)新文化,堅決反對任何形式的學(xué)術(shù)不端行為。并進(jìn)一步提出:對于浮夸、剽竊、抄襲、造假和拼湊數(shù)據(jù)的單位或個人,以及借評價之虛、行謀取私利之實(shí)的學(xué)術(shù)不軌行為,一經(jīng)查實(shí),除相關(guān)管理部門給予行政處分和公開通報之外,要禁止直接責(zé)任者在未來一段時間申請政府投資的任何科技項目。
2009年初,中國學(xué)術(shù)期刊(光盤版)電子雜志社與同方知網(wǎng)共同開發(fā)的“科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”面世,期刊編輯部逐步采用該系統(tǒng)對投稿文章進(jìn)行檢測,由此也引發(fā)了關(guān)于學(xué)術(shù)不端檢測系統(tǒng)使用的爭議。從圖1中2009年后幾年間相關(guān)文獻(xiàn)量的大幅度增加也可以看出這一點(diǎn)。
圖1 知網(wǎng)2002—2020年“學(xué)術(shù)不端”文獻(xiàn)發(fā)文量變化Fig.1 Number of papers about 'academic misconduct'from 2002 to 2020 in CNKI
筆者擬結(jié)合目前國內(nèi)主流的2種文獻(xiàn)檢測系統(tǒng)——CNKI、萬方檢測,對比系統(tǒng)檢測功能,結(jié)合檢測結(jié)果與編輯部對檢測結(jié)果的使用,以及因復(fù)制比高而催生的洗稿、拼湊等行為,對學(xué)術(shù)不端檢測系統(tǒng)的利與弊進(jìn)行探討。
學(xué)術(shù)不端檢測系統(tǒng)是應(yīng)對學(xué)術(shù)不端行為而誕生的,系統(tǒng)主要針對學(xué)術(shù)不端中的剽竊、偽造、篡改、不當(dāng)署名、一稿多投等行為進(jìn)行檢測。用戶將文章上傳到檢測系統(tǒng)后,文章會被與系統(tǒng)數(shù)據(jù)庫中已有的成百上千萬學(xué)術(shù)文章、書籍、會議論文、學(xué)位論文,以及海量網(wǎng)頁內(nèi)容進(jìn)行比對,按照一定的算法得到文章的相似度數(shù)值,并生成詳細(xì)的檢測報告,顯示與已有文獻(xiàn)疑似重合的內(nèi)容以及是如何重復(fù)的。最終,用戶可以根據(jù)檢測結(jié)果判斷文章的原創(chuàng)性。
隨著學(xué)術(shù)不端檢測系統(tǒng)在各期刊編輯部的使用日益廣泛,一定程度上遏制了論文抄襲行為,保證了文章的原創(chuàng)性。以筆者所在的《消防科學(xué)與技術(shù)》期刊為例,2012—2019年投稿文章相似度(知網(wǎng)檢測)變化見表1??梢钥闯觯嗨票雀哂?0%的投稿及占比均隨時間呈現(xiàn)下降趨勢,從側(cè)面也反映了檢測系統(tǒng)對學(xué)術(shù)不端行為的抑制作用。
表1 《消防科學(xué)與技術(shù)》2012—2019年投稿統(tǒng)計Tab.1 Statistics of contributions of Fire Science and Technology from 2012 to 2019
文章通過對國內(nèi)使用較為廣泛的兩大檢測系統(tǒng)的功能進(jìn)行對比,主要從比對范圍、相似比計算方法、參數(shù)定義、檢測報告等方面進(jìn)行分析,以進(jìn)一步探討檢測系統(tǒng)使用中存在的問題。
知網(wǎng)針對期刊論文的檢測系統(tǒng)為“科技期刊學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)”(簡稱AMLC)。萬方針對期刊論文的檢測系統(tǒng)為“學(xué)術(shù)預(yù)審版”(Academic Plaglarism Prevention Service,簡稱APPS)。兩者均是面向期刊論文檢測的,文獻(xiàn)檢測范圍對比見表2。
從表2可以看出,兩者收錄資源豐富,均涵蓋了學(xué)術(shù)期刊、博碩士論文全文、會議、專利、互聯(lián)網(wǎng)資源、英文數(shù)據(jù)庫等。其中圖書資源和源代碼庫為ALMC的檢索范圍,APPS不包括;而“中國標(biāo)準(zhǔn)全文數(shù)據(jù)庫”為ASSP的檢索范圍,AMLC不包括。另外,與期刊論文檢索相關(guān)性最大的為期刊庫。CNKI檢索期刊庫范圍為中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫(即通常所說的CNKI數(shù)據(jù)庫),出版內(nèi)容以學(xué)術(shù)、技術(shù)、政策指導(dǎo)、高等科普及教育類期刊為主,內(nèi)容覆蓋自然科學(xué)、工程技術(shù)、農(nóng)業(yè)、哲學(xué)、醫(yī)學(xué)、人文等各個領(lǐng)域。ASSP檢索期刊庫范圍為中國學(xué)術(shù)期刊數(shù)據(jù)庫,該數(shù)據(jù)庫是萬方數(shù)據(jù)知識服務(wù)平臺的重要組成部分,集納了多種科技及人文和社會科學(xué)期刊的全文內(nèi)容。分析發(fā)現(xiàn),兩者均全文收錄國內(nèi)大部分期刊文獻(xiàn)資源。區(qū)別在于,萬方與知網(wǎng)數(shù)據(jù)庫均有獨(dú)家與唯一授權(quán)期刊,即獨(dú)家與唯一授權(quán)數(shù)據(jù)庫進(jìn)行數(shù)字出版的期刊。其中,知網(wǎng)獨(dú)家與唯一授權(quán)期刊見圖2。
表2 AMLC和APPS文獻(xiàn)檢測范圍對比Tab.2 Comparison of literature test range of AMLC and APPS
綜合上述分析,兩者的查重數(shù)據(jù)庫有重疊交叉,但并不完全相同,而且具體到某領(lǐng)域來看差別并不小。以筆者所在期刊為例,與期刊欄目有交叉重疊的期刊中,將近一半為知網(wǎng)獨(dú)家授權(quán)期刊。即假如論文抄襲了某知網(wǎng)獨(dú)家授權(quán)期刊的內(nèi)容,但是用戶使用的檢測系統(tǒng)為萬方檢測的話,那么極有可能檢測不到相似部分,導(dǎo)致檢測結(jié)果不準(zhǔn)確,失去參考意義。筆者將某篇文章分別在2個系統(tǒng)中進(jìn)行檢測,得到的結(jié)果如圖2所示。可以看出,知網(wǎng)檢測相似比遠(yuǎn)遠(yuǎn)高于萬方的檢測結(jié)果,原因就是《安全與環(huán)境工程》為知網(wǎng)獨(dú)家授權(quán)期刊,所以知網(wǎng)的檢測范圍中包含了這篇被重復(fù)文獻(xiàn),而萬方則未包括,因此未檢出,導(dǎo)致兩者的檢測結(jié)果差距較大。筆者認(rèn)為,取消獨(dú)家,學(xué)術(shù)資源知識共享,打破學(xué)術(shù)信息的壟斷才是解決之道。
圖2 同一文獻(xiàn)的檢測結(jié)果對比Fig.2 Comparison of test results of same literature
AMLC提供簡潔、全文(標(biāo)明引文)、去除本人文獻(xiàn)、全文對照4種類型的檢測報告單。ASSP提供原文標(biāo)注報告、詳細(xì)片段報告和全文比對報告3種類型的檢測報告單。鑒于AMLC的全文對照報告和ASSP的詳細(xì)片段報告展示的內(nèi)容較為詳盡,下面僅對這兩者進(jìn)行對比分析。將同一篇文獻(xiàn)分別上傳至2個檢測系統(tǒng)進(jìn)行檢測,得到的檢測報告中相似比詳細(xì)指標(biāo)如圖3所示。
圖3 AMLC和APPS檢測報告詳細(xì)指標(biāo)Fig.3 Detailed index of AMLC and APPS test reports
對比圖3(a)和圖3(b)可以看出,雖然指標(biāo)的名稱不同,但主要指標(biāo)的含義是相同的,均包括了引用復(fù)制比、去除自引復(fù)制比、單篇最大文字復(fù)制比等指標(biāo)。針對同一篇文獻(xiàn),AMLC的綜合檢測結(jié)果為1.2%,而ASSP的綜合檢測結(jié)果為5.14%。分析原因發(fā)現(xiàn),兩者檢測得到的“單篇最大文字復(fù)制比重復(fù)文獻(xiàn)”并非同一篇文獻(xiàn)。進(jìn)一步針對重復(fù)內(nèi)容進(jìn)行對比,如圖4、圖5所示,可以看出,萬方檢測單篇最大重復(fù)內(nèi)容為英文部分,包括作者單位的英文及英文摘要。而在知網(wǎng)檢測中,文章的英文部分不參與檢測。筆者認(rèn)為,這一點(diǎn)上知網(wǎng)的處理更加合理。
圖4 知網(wǎng)檢測單篇最大重復(fù)內(nèi)容Fig.4 Content of maximum repetition of a single article by CNKI
圖5 萬方檢測單篇最大重復(fù)內(nèi)容Fig.5 Content of maximum repetition of a single article by APPS
圖6 為待檢測文章重復(fù)相同文獻(xiàn)的萬方檢測結(jié)果。對比圖4和圖6可以看出,知網(wǎng)對句子是否重復(fù)的認(rèn)定更加靈活,連續(xù)的幾句話中,即使有個別地方內(nèi)容不一致,只要大部分內(nèi)容被檢測為重復(fù),則會認(rèn)定為連續(xù)重復(fù)。
圖6 相同文獻(xiàn)萬方檢測結(jié)果Fig.6 Test results of same literature by APPS
AMLC和ASSP的檢測報告均以不同顏色標(biāo)示了文字復(fù)制部分和引用部分。不同的是,AMLC中,系統(tǒng)會對自動識別待檢測文獻(xiàn)的題目、作者、單位及參考文獻(xiàn)、原創(chuàng)性聲明等信息,并在檢測時將這些內(nèi)容排除在外。而ASSP檢測時只排除參考文獻(xiàn),其他內(nèi)容全部參與檢測,其他內(nèi)容全部相同的情況下更容易出現(xiàn)檢測結(jié)果相對較高的情況。
此外,AMLC新增加了對表格、公式及圖片OCR識別處理后的檢測功能,一定程度上提高了文獻(xiàn)檢測的準(zhǔn)確率。
近年來,為嚴(yán)厲打擊學(xué)術(shù)造假、學(xué)術(shù)不端等行為,維護(hù)期刊形象,贏得讀者信任,對投稿文章的復(fù)制比檢測成為編輯部審核稿件的第一關(guān)。相似比幾乎成為作者投稿的“敲門磚”[5]。然而,機(jī)器查重也有局限性,由于是基于算法的對文字重復(fù)的簡單計算,簡短語句的相同也會被認(rèn)定為重復(fù),而這種重復(fù)在論文寫作中是無法避免的。因此,重復(fù)率的高低不能完全界定一篇文章的質(zhì)量,過度依賴重復(fù)率也是一種偷懶的做法,甚至?xí)?dǎo)致作者為了降低重復(fù)率而采用一些不合理的手段,如顛倒語序、同義詞替換、長句拆分、將文字轉(zhuǎn)換為圖片格式等。反之,重復(fù)率低也未必沒有抄襲的可能,從洗稿服務(wù)已由前些年的人工洗稿發(fā)展到AI智能洗稿可見一斑。技術(shù)是中立的,關(guān)鍵在于使用的人,正確對待查重結(jié)果,保證人工審核的質(zhì)量才是解決問題的最好辦法。