■李小燕 鄭軍衛(wèi) 張蕾春 田 欣 王曉晨
中國(guó)科學(xué)院西北生態(tài)環(huán)境資源研究院文獻(xiàn)情報(bào)中心《天然氣地球科學(xué)》編輯部,甘肅省蘭州市城關(guān)區(qū)天水中路8號(hào) 730000
近年來(lái),學(xué)術(shù)不端現(xiàn)象頻出,對(duì)全世界科技期刊、學(xué)術(shù)界造成極為惡劣的影響。Springer Nature旗下的TumorBiology雜志撤銷了2012—2016年發(fā)表的涉嫌造假論文,涉及中國(guó)125家醫(yī)療機(jī)構(gòu)和高校醫(yī)學(xué)部的524名作者[1]。據(jù)統(tǒng)計(jì),因?qū)W術(shù)不端引起的撤稿數(shù)量持續(xù)上升,近幾年中國(guó)SCI論文撤稿數(shù)量占所有SCI論文撤稿的比例達(dá)44%[2]。目前,科技期刊界防范學(xué)術(shù)不端主要依靠學(xué)術(shù)不端檢測(cè)系統(tǒng),其次借助學(xué)術(shù)倫理規(guī)范的引導(dǎo)、同行評(píng)議專家的學(xué)術(shù)判斷,以及讀者或同行監(jiān)督等[3]。我國(guó)最早基于全文的科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)(Academic Misconduct Literature Check,AMLC)系統(tǒng)由《中國(guó)學(xué)術(shù)期刊(光盤版)》電子雜志社和同方知網(wǎng)(北京)技術(shù)有限公司共同研發(fā),2009年3月開始投入使用[4]。學(xué)術(shù)不端檢測(cè)系統(tǒng)的啟用有效遏制了抄襲、一稿多投、偽造、篡改、重復(fù)發(fā)表等學(xué)術(shù)不端行為的發(fā)生,但其檢測(cè)結(jié)果不一定完全準(zhǔn)確,加上相關(guān)機(jī)構(gòu)過度依賴學(xué)術(shù)不端檢測(cè)系統(tǒng)并設(shè)置過低的“文字復(fù)制比”,新的導(dǎo)向性問題出現(xiàn),進(jìn)而影響學(xué)術(shù)繼承性、創(chuàng)新性發(fā)展。2022年4月11日,設(shè)置“篇名=‘學(xué)術(shù)不端’并且‘檢測(cè)系統(tǒng)’,數(shù)據(jù)庫(kù)為文獻(xiàn)跨庫(kù)檢索”檢索條件,在CNKI數(shù)據(jù)庫(kù)中進(jìn)行檢索。共檢索到671篇文獻(xiàn),與學(xué)術(shù)不端檢測(cè)系統(tǒng)有關(guān)的文獻(xiàn)499篇,絕大多數(shù)為編輯部啟用學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)的公告,專門研究相關(guān)問題的文獻(xiàn)約80篇,與科技期刊有關(guān)的僅11篇,且發(fā)布時(shí)間集中在2009—2014年。本文基于大量文獻(xiàn)調(diào)研及實(shí)踐,系統(tǒng)梳理國(guó)內(nèi)外學(xué)術(shù)不端檢測(cè)系統(tǒng)特點(diǎn)、局限性及爭(zhēng)議,針對(duì)科技期刊提出相關(guān)建議,以期為提高科技期刊質(zhì)量和加快學(xué)術(shù)生態(tài)建設(shè)提供有益參考。
在國(guó)際上,利用技術(shù)手段檢測(cè)學(xué)術(shù)不端行為的研發(fā)工作始于20世紀(jì)70年代,20世紀(jì)90年代數(shù)字指紋等檢測(cè)方法開始投入應(yīng)用[5]。利用該技術(shù)研發(fā)的全球最權(quán)威的英文學(xué)術(shù)不端檢測(cè)系統(tǒng)Turnitin可實(shí)現(xiàn)無(wú)人工干預(yù)自動(dòng)檢測(cè),能偵測(cè)論文是否存在偽造、購(gòu)買或剽竊問題[6],其反饋報(bào)告還能指導(dǎo)學(xué)生改進(jìn)寫作技巧并正確引用文獻(xiàn),Elsevier、Springer Nature、牛津大學(xué)出版社、劍橋大學(xué)出版社等出版商旗下的絕大多數(shù)SCI期刊都使用該系統(tǒng)。2004年前后,國(guó)際上采用Glatt、SPlaT等軟件輔助判斷論文是否存在學(xué)術(shù)不端問題。2008年3月4日,Elsevier發(fā)布Publishing Ethics Resource Kit(PERK)以核查論文是否存在學(xué)術(shù)不端問題。PERK與Elsevier發(fā)布的各種與出版道德相關(guān)的政策和程序性文件相關(guān)聯(lián),能為期刊編輯提供及時(shí)與廣泛的在線支持[6]。2008年6月19日CrossCheck正式發(fā)布,能自動(dòng)檢測(cè)論文原創(chuàng)性——當(dāng)論文相似度超過50%時(shí)系統(tǒng)自動(dòng)顯示黃色提醒[6-7],是國(guó)際通用的英文論文學(xué)術(shù)不端檢測(cè)軟件,并支持英文、中文(簡(jiǎn)體、繁體)、日文和韓文等30多個(gè)語(yǔ)種論文的學(xué)術(shù)不端檢測(cè),已被Elsevier、Wiley、Springer Nature、Taylor & Francis等出版集團(tuán)旗下的期刊所使用。SafeAssign檢測(cè)系統(tǒng)可為學(xué)生反饋包含論文匹配度與分析報(bào)告的檢測(cè)結(jié)果,指導(dǎo)老師可參考檢測(cè)結(jié)果對(duì)論文打分[6]。加拿大Sciworth公司開發(fā)的MyDropbox使用微軟搜索技術(shù),提供論文抄襲檢測(cè)服務(wù)[5]。除了上述幾家國(guó)際著名的檢測(cè)系統(tǒng)外,還有Article Checker、PlagiarismSearch、Plagiarism Detector、Plagiarism Checker、The Plagiarism等公司的檢測(cè)平臺(tái)和馬里蘭大學(xué)的The Plagiarism Checke檢測(cè)平臺(tái)等[6]。張旻浩等[6]對(duì)國(guó)外部分學(xué)術(shù)不端檢測(cè)系統(tǒng)的特征進(jìn)行了報(bào)道。
我國(guó)學(xué)術(shù)不端檢測(cè)系統(tǒng)的研發(fā)比國(guó)外稍晚。湯興華等[8]于2005年探討了建立學(xué)術(shù)期刊論文學(xué)術(shù)不端檢測(cè)數(shù)據(jù)庫(kù)的必要性和可行性。2008年12月底,《中國(guó)學(xué)術(shù)期刊(光盤版)》電子雜志社與同方知網(wǎng)(北京)技術(shù)有限公司歷時(shí)2年研發(fā)的“科技期刊學(xué)術(shù)不端文獻(xiàn)檢測(cè)系統(tǒng)”問世,成為國(guó)內(nèi)最具代表性的學(xué)術(shù)不端檢測(cè)系統(tǒng)[4]。2010年3月,國(guó)內(nèi)第二大數(shù)據(jù)集成商萬(wàn)方數(shù)據(jù)推出了萬(wàn)方論文相似性檢測(cè)系統(tǒng)。2010年9月,維普推出通達(dá)論文引用檢測(cè)系統(tǒng)。2008年4月,武漢大學(xué)信息管理學(xué)院出版科學(xué)系沈陽(yáng)教授團(tuán)隊(duì)推出文檔相似性檢測(cè)工具——ROST反剽竊系統(tǒng)[6](早期版本名稱為“網(wǎng)盜克星”)。此外,還有大雅相似性分析系統(tǒng)、PaperPass、Gocheck等[9],這些檢測(cè)系統(tǒng)主要針對(duì)中文論文。研究認(rèn)為,國(guó)內(nèi)學(xué)術(shù)不端檢測(cè)系統(tǒng)目前主要以提供多種形式的查重報(bào)告為主,同一數(shù)據(jù)庫(kù)檢測(cè)不同格式的論文或不同數(shù)據(jù)庫(kù)檢測(cè)同一個(gè)格式的論文,檢測(cè)結(jié)果會(huì)出現(xiàn)不一致現(xiàn)象[3,9],這與其對(duì)比數(shù)據(jù)庫(kù)和應(yīng)用的技術(shù)有關(guān)。目前,國(guó)內(nèi)機(jī)構(gòu)使用較多的AMLC允許機(jī)構(gòu)用戶自建數(shù)據(jù)庫(kù),擴(kuò)展對(duì)比數(shù)據(jù)庫(kù)范圍,2022年6月12日中國(guó)知網(wǎng)宣布向個(gè)人用戶提供學(xué)術(shù)不端檢測(cè)服務(wù)。針對(duì)學(xué)術(shù)不端檢測(cè)的難點(diǎn)與短板,AMLC采用新技術(shù)不斷提升檢測(cè)能力[10]:針對(duì)大面積改寫以降低文字重復(fù)比例的問題,采用神經(jīng)網(wǎng)絡(luò)方法,并對(duì)觀點(diǎn)類內(nèi)容進(jìn)行“意思抄襲檢測(cè)”,而對(duì)其他內(nèi)容仍保留原來(lái)的檢測(cè)方式;針對(duì)將文字內(nèi)容轉(zhuǎn)成圖片以規(guī)避檢測(cè)的問題,用光學(xué)字符識(shí)別(Optical Character Recognition,OCR)技術(shù)對(duì)論文中的圖片進(jìn)行自動(dòng)文字識(shí)別;針對(duì)使用“Google翻譯方法”規(guī)避檢測(cè)的問題,支持中英雙語(yǔ)對(duì)照檢測(cè)和語(yǔ)義檢測(cè),預(yù)防“翻譯抄襲”;針對(duì)論文代寫及買賣的問題,嘗試從詞、句和段落等維度分析同一作者的不同論文,或同一論文不同部分的寫作風(fēng)格,以判斷代寫的可能性。張旻浩等[6]、吳凌等[9]對(duì)國(guó)內(nèi)主要學(xué)術(shù)不端檢測(cè)系統(tǒng)的特征進(jìn)行了總結(jié)。
學(xué)術(shù)不端檢測(cè)系統(tǒng)有著強(qiáng)大的文字查重功能,使用簡(jiǎn)單、便捷,能有效節(jié)約檢測(cè)成本,可有效檢測(cè)一稿多投、重復(fù)發(fā)表和一般抄襲行為[11],但在其使用過程中也引發(fā)了很多爭(zhēng)議。學(xué)術(shù)不端檢測(cè)系統(tǒng)雖然不斷改造升級(jí)自身的檢測(cè)功能,但受技術(shù)條件等限制,難免存在缺陷、局限性和檢測(cè)盲區(qū)。
(1) 文字復(fù)制比高低不能作為判斷學(xué)術(shù)不端的唯一依據(jù)。孔琪穎等[12]認(rèn)為檢測(cè)系統(tǒng)能幫助論文初審,但不能直接決定初審結(jié)果:①文字復(fù)制比低,但不一定沒有抄襲;②文字復(fù)制比高,不一定沒有創(chuàng)新,例如同一作者撰寫的有延續(xù)性的研究成果、與學(xué)位論文相似度高的論文及綜述類論文等會(huì)產(chǎn)生文字復(fù)制比高的情況。趙秋民[13]提出:文字復(fù)制比為0的論文學(xué)術(shù)價(jià)值不一定高,有可能為作者有意拼湊而成;文字復(fù)制比超過40%的論文學(xué)術(shù)價(jià)值不一定低,有可能與相關(guān)的會(huì)議論文、學(xué)位論文、前期已發(fā)表的研究成果或認(rèn)識(shí)等重復(fù),或?qū)儆诟袷叫哉Z(yǔ)言、實(shí)驗(yàn)方法或操作步驟、部分標(biāo)準(zhǔn)或權(quán)威性定義等的重復(fù)。劉暢等[14]認(rèn)為文字復(fù)制比為0的醫(yī)學(xué)論文可能存在隱性學(xué)術(shù)不端行為,且客觀因素與主觀因素可能交織存在,需被謹(jǐn)慎對(duì)待:客觀因素集中在對(duì)比源的局限性和參考文獻(xiàn)著錄的不規(guī)范;主觀因素表現(xiàn)在作者采用增減字?jǐn)?shù)、變換語(yǔ)法句式、更改關(guān)鍵詞、原意復(fù)述、圖片造假及翻譯等多種方式,刻意降低論文的文字復(fù)制比。
(2) 檢測(cè)系統(tǒng)查準(zhǔn)度不高,結(jié)果不一定準(zhǔn)確。丁明剛[15]認(rèn)為文字復(fù)制比檢測(cè)存在隨意設(shè)置文字復(fù)制的時(shí)間節(jié)點(diǎn)、混淆文字重復(fù)性與學(xué)術(shù)繼承性、無(wú)視檢測(cè)制度的先天性缺失、夸大檢測(cè)系統(tǒng)對(duì)比源的萬(wàn)能性、對(duì)檢測(cè)系統(tǒng)工具的盲從5個(gè)誤區(qū),應(yīng)將檢測(cè)中的工具理性與科學(xué)理性緊密結(jié)合,從而對(duì)文字復(fù)制及其實(shí)質(zhì)做出科學(xué)判斷。顏峻等[16]指出學(xué)術(shù)不端情況較為復(fù)雜,不能僅以文字復(fù)制比作為定性抄襲的唯一依據(jù),需要查看文字重合來(lái)源或結(jié)合其他手段綜合認(rèn)定。在利用AMLC檢測(cè)的過程中,不能僅以機(jī)器檢測(cè)結(jié)果作為唯一判定標(biāo)準(zhǔn),應(yīng)輔以人工研判[17]。人工研判的關(guān)鍵是對(duì)檢測(cè)結(jié)果(文字復(fù)制比)進(jìn)行科學(xué)修正。有學(xué)者建議可以綜合參考多個(gè)檢測(cè)系統(tǒng)的檢測(cè)結(jié)果,規(guī)避檢測(cè)精度不高的問題[18-19]。
(3) 過度依賴檢測(cè)系統(tǒng)引起新的學(xué)術(shù)不端行為。朱榮華等[20]研究發(fā)現(xiàn),高校對(duì)學(xué)生的畢業(yè)論文、學(xué)術(shù)期刊對(duì)作者論文的學(xué)術(shù)不端檢測(cè)都存在依賴學(xué)術(shù)不端檢測(cè)系統(tǒng)的現(xiàn)象,依據(jù)文字復(fù)制比直接給出評(píng)閱結(jié)果,其根源在于我國(guó)過度量化科研評(píng)價(jià)體系。除了惡意的抄襲,為使論文符合相關(guān)的文字復(fù)制比要求,科研人員也只能通過改變表述方式等降低文字復(fù)制比,這會(huì)造成變相的學(xué)術(shù)不端行為。為規(guī)避檢測(cè)風(fēng)險(xiǎn),社會(huì)上衍生出相關(guān)副產(chǎn)品,如協(xié)助作者降低論文文字復(fù)制比的公司或個(gè)人、高價(jià)提供論文文字復(fù)制比檢測(cè)服務(wù)的個(gè)人或機(jī)構(gòu),部分論文由此被泄露或被盜。
2.2.1 同一檢測(cè)系統(tǒng)的局限性
綜合前人研究[11,17,21-22],檢測(cè)系統(tǒng)的局限性可梳理為7類:(1)對(duì)比源數(shù)據(jù)滯后性。從投稿到出版存在時(shí)間“盲區(qū)”,對(duì)比源數(shù)據(jù)存在滯后性,論文檢測(cè)時(shí)間不同,檢測(cè)結(jié)果也可能不同。若對(duì)比數(shù)據(jù)庫(kù)尚未收錄相關(guān)論文,則檢測(cè)系統(tǒng)無(wú)法檢測(cè)出論文的學(xué)術(shù)不端問題。(2)檢測(cè)有盲區(qū)和漏洞。只能檢測(cè)“善意”的文字重復(fù)(不變動(dòng)原文字的重復(fù)),無(wú)法檢測(cè)隱性的抄襲剽竊(對(duì)文字等重組排列,改變表述方式;將文字等改為圖表形式;將外文翻譯為中文)、思想性抄襲等。(3)可定量但不能定性。文字復(fù)制比與抄襲度一般呈正相關(guān),但并非絕對(duì),如部分進(jìn)行合理引用、引證的論文文字復(fù)制比偏高。(4)極易將常用名言警句、專有名詞、固定詞組等誤判為抄襲。(5)對(duì)同一論文的不同電子保存格式檢測(cè)結(jié)果不同,如PDF文檔與Word文檔格式的論文在同一檢測(cè)系統(tǒng)中的檢測(cè)結(jié)果有差異。(6)參考文獻(xiàn)的引用格式不規(guī)范,會(huì)使檢測(cè)系統(tǒng)無(wú)法正確比對(duì)相應(yīng)文字而出現(xiàn)漏檢現(xiàn)象,產(chǎn)生不正確的檢測(cè)結(jié)果[23]。(7)檢測(cè)方式機(jī)械,不能智能判斷學(xué)術(shù)水平。文字復(fù)制比為0的論文可能存在刻意規(guī)避檢測(cè)的隱性學(xué)術(shù)不端問題,文字復(fù)制比超過40%的論文也有可能具有較高的學(xué)術(shù)價(jià)值。
2.2.2 不同檢測(cè)系統(tǒng)的局限性
不同檢測(cè)系統(tǒng)產(chǎn)生差異較大的檢測(cè)結(jié)果,往往與對(duì)比數(shù)據(jù)庫(kù)的數(shù)據(jù)完整性有關(guān),對(duì)比源數(shù)據(jù)不同,檢測(cè)結(jié)果也不同。吳凌等[9]從檢測(cè)技術(shù)、服務(wù)項(xiàng)目、所參考的數(shù)據(jù)庫(kù)范圍、檢測(cè)結(jié)果等方面對(duì)比和分析了國(guó)內(nèi)5個(gè)檢測(cè)系統(tǒng)(中國(guó)知網(wǎng)、萬(wàn)方、維普、PaperPass、大雅),并用這5個(gè)檢測(cè)系統(tǒng)檢測(cè)了同一篇論文,檢測(cè)所得文字復(fù)制比分別為:20%(中國(guó)知網(wǎng))、 32.6%(萬(wàn)方)、 38%(PaperPass)、54.4%(大雅)、57.79%(維普)。畢麗萍等[24]對(duì)比了上述5個(gè)檢測(cè)系統(tǒng)的特點(diǎn),發(fā)現(xiàn)不同檢測(cè)系統(tǒng)的對(duì)比數(shù)據(jù)庫(kù)范圍有所不同,檢測(cè)的文字復(fù)制比差異可能較大。不同開發(fā)商使用的檢測(cè)技術(shù)不同、對(duì)比數(shù)據(jù)庫(kù)不同,提供的服務(wù)項(xiàng)目類型也不盡相同。中國(guó)知網(wǎng)檢測(cè)系統(tǒng)提供的學(xué)術(shù)不端檢測(cè)服務(wù)范圍相對(duì)比較廣泛,如針對(duì)學(xué)位論文、科技/社科期刊、大學(xué)生論文與中學(xué)生作業(yè)、職稱論文、圖書專著、科研成果等的學(xué)術(shù)不端檢測(cè)服務(wù)。
論文查重是檢測(cè)論文文字復(fù)制比和相似度的主要方法,也是檢驗(yàn)論文學(xué)術(shù)價(jià)值的重要手段,往往以文字復(fù)制比(也稱“重復(fù)率”)顯示檢測(cè)結(jié)果,但目前尚無(wú)統(tǒng)一的文字復(fù)制比標(biāo)準(zhǔn)。據(jù)文獻(xiàn)[25]的調(diào)研結(jié)果,de Maria等于2003年提到,許多期刊能夠接受的文字復(fù)制比為25%。2004年前后,《英國(guó)醫(yī)學(xué)雜志》(BritishMedicalJournal,BMJ)將文字復(fù)制比標(biāo)準(zhǔn)定為10%,若文字復(fù)制比超過10%,作者需附加說(shuō)明性文件。2001年美國(guó)計(jì)算機(jī)協(xié)會(huì)(Association for Computing Machinery,ACM)要求論文文字復(fù)制比低于75%,美國(guó)電氣與電子工程師協(xié)會(huì)(Institute of Electrical and Electronics Engineers,IEEE)系列期刊之一——IEEETransactionsonMicrowaveTheoryandTechniques(T-MTT)的主編則認(rèn)為這個(gè)比例應(yīng)該是60%[26]。
我國(guó)期刊采用的AMLC論文文字復(fù)制比標(biāo)準(zhǔn)[27]為:輕度句子抄襲(文字復(fù)制比<10%,且各連續(xù)重合文字?jǐn)?shù)量<200字)、句子抄襲(文字復(fù)制比≥10%,且各連續(xù)重合文字?jǐn)?shù)量<200字)、輕度段落抄襲(文字復(fù)制比為10%~30%,且連續(xù)重復(fù)文字?jǐn)?shù)量≥200字)、整體抄襲(文字復(fù)制比≥50%,重復(fù)文字?jǐn)?shù)量占比大于總字符數(shù)的1/2)。王麗[28]指出不能完全按照文字復(fù)制比指標(biāo)來(lái)鑒別剽竊和抄襲,需人工輔助評(píng)判:文字復(fù)制比>30%的論文可作退稿處理;文字復(fù)制比為20%~30%的論文原則上需退修,但要視具體情況而定;文字復(fù)制比<20%的論文可過初審。顏峻等[16]認(rèn)為,文字復(fù)制比<10%時(shí)論文一般較少存在問題,在10%~40%范圍時(shí)或多或少存在問題,文字復(fù)制比>40%時(shí)多存在自我抄襲(包括項(xiàng)目團(tuán)隊(duì)內(nèi)部抄襲)或一稿多投。國(guó)內(nèi)學(xué)者普遍認(rèn)為文字復(fù)制比>30%的論文基本不體現(xiàn)創(chuàng)新性[29]。但對(duì)不同學(xué)科或性質(zhì)的論文需要區(qū)別對(duì)待,如對(duì)綜述性論文文字復(fù)制比的要求可適當(dāng)放寬至40%左右[15]。國(guó)內(nèi)不同的期刊出版單位采用的文字復(fù)制比標(biāo)準(zhǔn)也不一致?!栋不蔗t(yī)學(xué)》2010年啟用AMLC,對(duì)文字復(fù)制比超過30%的稿件直接退稿,2014年底同時(shí)啟用AMLC和萬(wàn)方論文相似性檢測(cè)服務(wù)后將此標(biāo)準(zhǔn)修正為不超過20%[29]?!渡轿鞴麡洹穼?duì)文字復(fù)制比>80%的論文作者標(biāo)紅,對(duì)其以后來(lái)稿重點(diǎn)檢測(cè);對(duì)文字復(fù)制比為50%~80%的論文,依據(jù)創(chuàng)新性大小決定是否發(fā)表;文字復(fù)制比<40%的論文不判為剽竊或抄襲[30]?!陡=ㄞr(nóng)業(yè)學(xué)報(bào)》采用的閾值為20%,對(duì)不同的稿件會(huì)做不同的處理[31]?!秲?nèi)蒙古電力技術(shù)》將文字復(fù)制比低于10%的稿件直接進(jìn)入審稿流程,對(duì)文字復(fù)制比超過10%的稿件給出退改后酌情處理的決定,超過50%的直接退稿[32]。由于AMLC系統(tǒng)每年會(huì)給編輯部用戶寄發(fā)疑似抄襲論文,編輯部為避免學(xué)術(shù)不端問題、管理及社會(huì)壓力,總體采用較為“安全”的10%的文字復(fù)制比閾值。檢測(cè)系統(tǒng)在幫助期刊編輯部甄別一稿多投、重復(fù)發(fā)表等方面起到了重要作用,但過度追求低文字復(fù)制比也影響了期刊的學(xué)術(shù)繼承性、創(chuàng)造性發(fā)展。
近期筆者以石油天然氣類期刊論文為例,對(duì)學(xué)術(shù)不端檢測(cè)系統(tǒng)查準(zhǔn)度進(jìn)行驗(yàn)證。根據(jù)既定檢測(cè)方案,用同一系統(tǒng)采取2次檢測(cè)進(jìn)行對(duì)比分析。第一次檢測(cè)原文的結(jié)果顯示,容易重復(fù)的內(nèi)容主要有:前人研究現(xiàn)狀、區(qū)域地質(zhì)概況、相關(guān)概念與定義、研究方法、固定詞語(yǔ)與說(shuō)法、常識(shí)性說(shuō)法、圖表名稱等。針對(duì)檢測(cè)出的重復(fù)內(nèi)容,主要使用以下方法降重:對(duì)重復(fù)內(nèi)容進(jìn)行審核,查漏補(bǔ)缺;對(duì)重復(fù)內(nèi)容標(biāo)明出處;對(duì)引用的前人定義添加引號(hào);對(duì)重復(fù)句子進(jìn)行精煉、句式改變或重組。隨后,將修改后的內(nèi)容進(jìn)行第二次檢測(cè),顯示重復(fù)的內(nèi)容有:修改后(有引用)的部分句子與其他作者(未引用)的表述重復(fù),即引用A作者的思想觀點(diǎn),但與B作者的表述重復(fù);添加了引號(hào)的部分內(nèi)容依然顯示重復(fù);有引用的內(nèi)容依然顯示重復(fù)。若還要降低文字復(fù)制比,只能將精練的句子復(fù)雜化,即由“簡(jiǎn)”變“繁”;對(duì)前人下的定義換方式表達(dá);無(wú)法再改的內(nèi)容,只能刪除,或標(biāo)注“詳見參考文獻(xiàn)”。修改時(shí)發(fā)現(xiàn),將引用內(nèi)容由“簡(jiǎn)”變“繁”,畫蛇添足;改變?cè)浔磉_(dá)可能歪曲原作者的思想觀點(diǎn),或產(chǎn)生對(duì)同一個(gè)定義的多種表述,造成混亂;對(duì)前人研究結(jié)論點(diǎn)到為止、改頭換面或直接刪除,往往會(huì)曲解原意或影響論文完整性。只為降重而采取“技術(shù)手段”,背離學(xué)術(shù)本真,長(zhǎng)此以往,不利于學(xué)術(shù)繼承性發(fā)展和科技創(chuàng)新。
學(xué)術(shù)不端檢測(cè)系統(tǒng)總體利大于弊,是預(yù)防學(xué)術(shù)不端的有力工具,但期刊要正確、合理應(yīng)用檢測(cè)系統(tǒng),并探索可持續(xù)的能規(guī)避學(xué)術(shù)不端的方法,建立起良性的學(xué)術(shù)研究與科技創(chuàng)新導(dǎo)向。
我國(guó)學(xué)術(shù)不端檢測(cè)系統(tǒng)功能日漸增強(qiáng),但機(jī)械性強(qiáng)、智能化程度低的缺陷仍未得到有效解決,文字復(fù)制比對(duì)論文質(zhì)量的反映也不盡科學(xué)、全面、準(zhǔn)確。若忽略這一問題,設(shè)置過低的文字復(fù)制比閾值,可能會(huì)阻礙學(xué)術(shù)溝通與交流,甚至扼殺學(xué)術(shù)創(chuàng)新的可能性,也可能會(huì)引起“重揉”造句等變相的學(xué)術(shù)不端行為,對(duì)學(xué)術(shù)繼承性、創(chuàng)新性極為不利。近幾年過度依賴文字復(fù)制比評(píng)判、追溯學(xué)術(shù)不端行為的現(xiàn)象,給科研人員、出版單位均造成較大的壓力,期刊編輯部和主管單位應(yīng)根據(jù)論文發(fā)表時(shí)間、學(xué)科方向、論文類型、內(nèi)容側(cè)重點(diǎn)等設(shè)置合理的文字復(fù)制比閾值。鑒于檢測(cè)系統(tǒng)自身缺陷,在認(rèn)定學(xué)術(shù)不端時(shí)應(yīng)引入更多的同行評(píng)議結(jié)果進(jìn)行綜合判定。特別是我國(guó)從2009年才開始推廣使用檢測(cè)系統(tǒng),對(duì)2009年以前發(fā)表的論文,基于文字復(fù)制比的學(xué)術(shù)不端行為界定和追責(zé)應(yīng)慎之又慎,避免挫傷科研人員的積極性。丁明剛[15]認(rèn)為不同時(shí)期的論文應(yīng)區(qū)別對(duì)待,2008年及以前發(fā)表的論文除存在明顯抄襲(一般文字復(fù)制比高于30%)可被判定為學(xué)術(shù)不端外,其余論文的文字復(fù)制比一般可允許在30%以內(nèi);2009年及以后發(fā)表論文的文字復(fù)制比應(yīng)嚴(yán)格控制在20%以下,對(duì)于綜述論文等需要大量引證的論文,可以允許文字復(fù)制比略高于其他類型的論文(40%左右)。同時(shí),在人才引進(jìn)、職稱晉升、項(xiàng)目評(píng)審等過程中,應(yīng)合理設(shè)置相關(guān)量化指標(biāo),避免“唯論文”不良導(dǎo)向誘發(fā)急功近利的行為乃至變相學(xué)術(shù)不端。從學(xué)術(shù)繼承性、創(chuàng)新性出發(fā),應(yīng)正確應(yīng)用學(xué)術(shù)不端檢測(cè)系統(tǒng),不設(shè)置太低的文字復(fù)制比閾值,以營(yíng)造寬松的科研環(huán)境,促進(jìn)學(xué)術(shù)研究良性發(fā)展。
期刊編輯部可聯(lián)合相關(guān)檢測(cè)機(jī)構(gòu)制定統(tǒng)一的引用規(guī)范,準(zhǔn)確界定引證、臨摹、延續(xù)與重復(fù),指導(dǎo)作者合理、規(guī)范引證。參考文獻(xiàn)的繼承性引用、指示性引用和批判性引用均屬于合理引用。美國(guó)《芝加哥手冊(cè)》規(guī)定,“凡使用他人原話在3個(gè)連續(xù)詞以上,都要使用直接引號(hào),否則即使注明出處,仍視為抄襲”。AMLC等學(xué)術(shù)不端檢測(cè)系統(tǒng)會(huì)自動(dòng)識(shí)別直接用引號(hào)標(biāo)出的引文,并以綠色標(biāo)注,將其列入合理引用。但筆者發(fā)現(xiàn),使用引號(hào)并增加參考文獻(xiàn)標(biāo)注的句子,在AMLC檢測(cè)時(shí)也可能被標(biāo)為紅色,故需輔以人工判別抄襲。無(wú)論學(xué)術(shù)不端檢測(cè)系統(tǒng)有多完善,其本質(zhì)都是程序智能,不可能精準(zhǔn)判斷思想的抄襲與重復(fù)。編輯部應(yīng)正確認(rèn)識(shí)程序智能的局限性,制定合理規(guī)范的工作流程以彌補(bǔ)系統(tǒng)誤判、漏檢等缺陷,介入更多專業(yè)學(xué)術(shù)判斷,科學(xué)、準(zhǔn)確評(píng)判論文質(zhì)量與學(xué)術(shù)道德;可適當(dāng)增加檢測(cè)次數(shù),在審稿、編輯加工、校對(duì)[23]或初審、錄用、編輯加工前、發(fā)稿前、發(fā)稿后等階段對(duì)稿件進(jìn)行學(xué)術(shù)不端檢測(cè),依不同階段檢測(cè)結(jié)果綜合分析研判。針對(duì)系統(tǒng)文獻(xiàn)收錄不全、漏檢等問題,可借鑒多個(gè)檢測(cè)系統(tǒng)結(jié)果。界定學(xué)術(shù)不端時(shí),最好“人機(jī)”結(jié)合,既重視AMLC檢測(cè)結(jié)果,又做到系統(tǒng)檢測(cè)與人工甄別相互印證、相互彌補(bǔ),如:對(duì)判別“換湯不換藥”式的隱性抄襲、界定學(xué)術(shù)水平等介入較多人力,力求判斷準(zhǔn)確;對(duì)“文改圖”式的抄襲現(xiàn)象,可借鑒JournalofCellBiology原主編Rossner的經(jīng)驗(yàn),設(shè)置圖片分析師崗位,聘請(qǐng)專業(yè)人員開展圖片完整性分析;應(yīng)用Droplets工具包等檢測(cè)可疑圖片[33]。編輯部還需加強(qiáng)與各行業(yè)的合作交流,不斷豐富對(duì)比數(shù)據(jù)庫(kù),推動(dòng)數(shù)據(jù)、資源和信息互通共享,加強(qiáng)論文創(chuàng)作全過程管理,建立學(xué)術(shù)論文寫作全程監(jiān)控和定期檢查機(jī)制,多方位、多途徑發(fā)現(xiàn)和預(yù)防學(xué)術(shù)不端。平臺(tái)方可開放檢測(cè)系統(tǒng)供個(gè)人使用,引導(dǎo)科研人員正確、合理標(biāo)引,增強(qiáng)學(xué)術(shù)道德自覺。
建立學(xué)術(shù)不端審核機(jī)制,規(guī)范流程,形成編輯為主、多方聯(lián)合的多元防治體系,首先應(yīng)建立合理的審查處理制度,讓編輯在初審時(shí)做到有據(jù)可依,如劉暢[21]提議相關(guān)部門建立的審查處理制度為:對(duì)文字復(fù)制比大于50%的論文直接退回;對(duì)文字復(fù)制比為30%~49%的論文進(jìn)行再檢測(cè),甄別其觀點(diǎn)是否為新觀點(diǎn),并再次檢測(cè)返修后的論文,若符合要求則考慮錄用;對(duì)于文字復(fù)制比為10%~29%的論文,由編輯初審后提出退修意見;文字復(fù)制比小于10%的論文直接進(jìn)入審稿流程。編輯是界定期刊論文是否存在學(xué)術(shù)不端行為的主力,因此要特別注重編輯自身素養(yǎng)、業(yè)務(wù)水平與學(xué)術(shù)鑒別能力的提升,使編輯的專業(yè)水平、知識(shí)結(jié)構(gòu)、對(duì)學(xué)術(shù)前沿的掌握度與審稿需求相適應(yīng),從而在初審時(shí)能準(zhǔn)確判斷論文的學(xué)術(shù)水平與創(chuàng)新程度。其次,可借助專家學(xué)術(shù)力量進(jìn)行審核。對(duì)編輯不能評(píng)判的稿件,在同行評(píng)議時(shí)可附學(xué)術(shù)不端檢測(cè)報(bào)告供專家合理判斷,編輯最終結(jié)合專家意見對(duì)重復(fù)內(nèi)容作出理性的綜合判斷;還可在終審時(shí)建立編委“共享”審查制度[31],讓編委參與定稿并研判學(xué)術(shù)不端。此外,還可以嘗試細(xì)分領(lǐng)域內(nèi)的同行專家評(píng)議制度、同行編輯部間的“防范”聯(lián)結(jié)機(jī)制[31]等。
檢測(cè)系統(tǒng)開發(fā)商應(yīng)不斷探索語(yǔ)義分析、人工智能、大數(shù)據(jù)、區(qū)塊鏈等新技術(shù)的應(yīng)用,開發(fā)針對(duì)不同學(xué)科自動(dòng)調(diào)整檢測(cè)策略的智能化學(xué)術(shù)不端檢測(cè)平臺(tái),提高檢測(cè)系統(tǒng)的檢測(cè)能力:減少對(duì)常用名言警句、專有名詞、固定詞組的誤判,提高查準(zhǔn)率;吸收借鑒iPlagiarism圖片檢測(cè)系統(tǒng)等的先進(jìn)技術(shù)并優(yōu)化改良,提高對(duì)圖表等的智能辨別能力,預(yù)防圖片造假;適當(dāng)擴(kuò)大對(duì)比源數(shù)據(jù),推動(dòng)建立各大數(shù)據(jù)源聯(lián)盟,實(shí)現(xiàn)一站式檢索功能,提高檢測(cè)效率與準(zhǔn)確率;建立各檢測(cè)系統(tǒng)能夠接受的統(tǒng)一規(guī)范,并給作者提供相應(yīng)規(guī)范的培訓(xùn)教育,增強(qiáng)檢測(cè)系統(tǒng)的規(guī)范化程度與權(quán)威性;拓展知識(shí)服務(wù)功能,并將反饋報(bào)告的落腳點(diǎn)放在提升寫作技巧、引導(dǎo)正確引用和提高學(xué)術(shù)道德等方面,最終提升論文學(xué)術(shù)質(zhì)量。另外,中國(guó)科技期刊陸續(xù)推進(jìn)的新型出版模式,如增強(qiáng)出版[34]、數(shù)據(jù)出版[35]、媒體融合[36-38],以及科技期刊論文碎片化、富媒體化、富鏈接化、科普化等也是大勢(shì)所趨,學(xué)術(shù)不端檢測(cè)系統(tǒng)要與時(shí)俱進(jìn),不斷更新系統(tǒng)檢測(cè)功能以及查準(zhǔn)度,以滿足新型出版過程中對(duì)學(xué)術(shù)不端檢測(cè)的多樣化需求。
學(xué)術(shù)不端檢測(cè)系統(tǒng)畢竟只是工具,從根本上治理學(xué)術(shù)不端行為,要依靠相關(guān)法律法規(guī)推進(jìn)我國(guó)學(xué)術(shù)不端防治體系與監(jiān)督體系的建設(shè),最終形成我國(guó)學(xué)術(shù)不端法治體系。美國(guó)作為學(xué)術(shù)不端治理的先行者,以政府監(jiān)管為主導(dǎo)、預(yù)防教育為核心、法律約束為手段,建立了具有完善法律法規(guī)、榮譽(yù)準(zhǔn)則制度支撐的學(xué)術(shù)不端防治體系,形成了完整的“評(píng)估、質(zhì)詢、調(diào)查、裁決和上訴”等工作程序。英國(guó)的國(guó)際出版?zhèn)惱砦瘑T會(huì)(Committee on Publication Ethics,COPE)通過舉辦討論個(gè)別案例的論壇及研討會(huì)、每年資助2項(xiàng)出版?zhèn)惱矸较虻难芯炕稹⑴e辦“世界科研誠(chéng)信大會(huì)”、實(shí)施在線培訓(xùn)項(xiàng)目等,加強(qiáng)編輯出版?zhèn)惱斫逃?,建立學(xué)術(shù)不端案例及解決方案數(shù)據(jù)庫(kù),并制定了一套較為完備的指導(dǎo)研究行為的指南及針對(duì)學(xué)術(shù)不端行為的具有詳細(xì)處理流程的處理規(guī)范,且該流程圖已被國(guó)際上多數(shù)著名出版機(jī)構(gòu)采用。德國(guó)基于《基本法》形成“學(xué)術(shù)團(tuán)體自治”,在國(guó)家層面設(shè)置防治學(xué)術(shù)不端行為的專門機(jī)構(gòu),主要由學(xué)術(shù)機(jī)構(gòu)或基金會(huì)管理[39],并出臺(tái)了應(yīng)對(duì)學(xué)術(shù)不端行為的3個(gè)重要法規(guī),建立了以內(nèi)部治理機(jī)制為基礎(chǔ)的學(xué)術(shù)不端治理體系,具有精細(xì)化的調(diào)查處理程序。目前,我國(guó)的學(xué)術(shù)不端處理流程和調(diào)查程序大多由出版單位內(nèi)部規(guī)定,學(xué)術(shù)不端處理結(jié)果爭(zhēng)議較多,難以令人信服[10],應(yīng)盡快基于我國(guó)法律制定國(guó)家層面的學(xué)術(shù)不端法治體系。
檢測(cè)系統(tǒng)屬于事后控制學(xué)術(shù)不端的工具,學(xué)術(shù)不端的防治還要注重源頭防控。美國(guó)的學(xué)術(shù)誠(chéng)信教育從“娃娃抓起”,各個(gè)階段學(xué)生入校就開始接受學(xué)術(shù)誠(chéng)信教育與指導(dǎo)??的螤柎髮W(xué)在學(xué)生學(xué)術(shù)規(guī)范條例中對(duì)如何使用互聯(lián)網(wǎng)信息作出明文規(guī)定,杜克大學(xué)要求大一新生在注冊(cè)前完成關(guān)于網(wǎng)絡(luò)剽竊和抄襲界定的線上輔導(dǎo)課程,普林斯頓大學(xué)專門設(shè)立網(wǎng)頁(yè)對(duì)此進(jìn)行詳細(xì)舉例說(shuō)明[39]。英國(guó)將學(xué)術(shù)不端納入信用機(jī)制,如:學(xué)術(shù)不端行為可能會(huì)對(duì)購(gòu)房、銀行開戶等一系列行為產(chǎn)生影響。我國(guó)應(yīng)深入推進(jìn)科研誠(chéng)信教育常態(tài)化,讓從事科研工作的人群熟知學(xué)術(shù)不端行為類型、熟悉學(xué)術(shù)出版規(guī)范、了解失信行為需承擔(dān)的責(zé)任和要付出的代價(jià),引導(dǎo)和倒逼科研工作者恪守誠(chéng)信原則。編輯部要發(fā)揮橋梁和紐帶作用,通過各種手段、采用各種形式、面向不同群體開展學(xué)術(shù)誠(chéng)信教育與宣傳,并與相關(guān)機(jī)構(gòu)聯(lián)合建立終身制個(gè)人誠(chéng)信數(shù)據(jù)庫(kù)。對(duì)發(fā)表后的論文可進(jìn)行再檢測(cè),若有學(xué)術(shù)不端嫌疑,可將該作者列入編輯部的誠(chéng)信可疑人員名單或個(gè)人誠(chéng)信數(shù)據(jù)庫(kù),并對(duì)其以后的來(lái)稿進(jìn)行重點(diǎn)檢測(cè);也可與同行編輯部形成“聯(lián)盟”,共享學(xué)術(shù)不端黑名單,共同抵制學(xué)術(shù)不端行為。相關(guān)單位也可將學(xué)術(shù)道德納入人才評(píng)價(jià)體系,促進(jìn)學(xué)術(shù)生態(tài)良性發(fā)展。
本文系統(tǒng)梳理了國(guó)內(nèi)外學(xué)術(shù)不端檢測(cè)系統(tǒng)的局限性及爭(zhēng)議,基于期刊論文檢測(cè)結(jié)果,結(jié)合國(guó)外相關(guān)防治體系,就我國(guó)科技期刊應(yīng)用學(xué)術(shù)不端檢測(cè)系統(tǒng)提出5點(diǎn)建議。限于篇幅,未能對(duì)國(guó)內(nèi)外不同學(xué)術(shù)不端防治體系、檢測(cè)系統(tǒng)展開深入討論,未能對(duì)不同學(xué)科論文、論文不同部分的檢測(cè)結(jié)果進(jìn)行詳細(xì)對(duì)比。檢測(cè)系統(tǒng)也僅能檢測(cè)出具有誠(chéng)信之人的學(xué)術(shù)不端問題,對(duì)惡意的學(xué)術(shù)不端行為只能介入更多人工界定,而啟用多個(gè)檢測(cè)系統(tǒng)又會(huì)增加編輯工作量。治理學(xué)術(shù)不端,要從根本上建立合理的人才評(píng)價(jià)機(jī)制,營(yíng)造寬松的科研環(huán)境;實(shí)行終身學(xué)術(shù)誠(chéng)信教育機(jī)制,建立終身的誠(chéng)信檔案數(shù)據(jù)庫(kù);長(zhǎng)遠(yuǎn)來(lái)講,要建立我國(guó)學(xué)術(shù)不端法治體系。編輯部可以發(fā)揮橋梁和紐帶作用,面向不同群體,廣泛開展學(xué)術(shù)誠(chéng)信教育與宣傳。