• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      數(shù)字圖書館視域下學(xué)術(shù)論文圖像篡改造假檢測研究

      2018-07-26 03:01:48徐彤陽任浩然山西財(cái)經(jīng)大學(xué)信息管理學(xué)院山西太原030006中科院文獻(xiàn)情報(bào)中心北京0090
      現(xiàn)代情報(bào) 2018年7期
      關(guān)鍵詞:不端插值學(xué)術(shù)

      徐彤陽 任浩然(.山西財(cái)經(jīng)大學(xué)信息管理學(xué)院,山西 太原 030006;2.中科院文獻(xiàn)情報(bào)中心,北京 0090)

      2016年1月15日,教育部、財(cái)政部和國家發(fā)展改革委三部委聯(lián)合印發(fā)了《統(tǒng)籌推進(jìn)世界一流大學(xué)和一流學(xué)科建設(shè)實(shí)施辦法(暫行)》,表明我國高校變革發(fā)展正式進(jìn)入實(shí)施階段。在建設(shè)一流大學(xué)和一流學(xué)科的過程中,科研綜合實(shí)力是判斷各大高校是否屬于一流學(xué)校的重要標(biāo)準(zhǔn)之一。然而,在加快雙一流建設(shè)的過程中,由于科研管理制度的不完善導(dǎo)致社會出現(xiàn)急功近利思想,驅(qū)使學(xué)術(shù)不端人員為了“成就”和“聲譽(yù)”抄襲、剽竊他人的學(xué)術(shù)成果,造成學(xué)術(shù)風(fēng)氣的敗壞,破壞了學(xué)術(shù)研究的公平和公正,直接影響我國雙一流建設(shè)的成果。同時,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展以及信息傳播平臺的多樣化,信息傳播更加便捷,在促進(jìn)各個學(xué)科的快速發(fā)展,方便人們便捷的獲取學(xué)術(shù)信息的同時,也為某些學(xué)術(shù)不端者的抄襲提供了捷徑。

      在大數(shù)據(jù)時代,紙質(zhì)型的學(xué)術(shù)資源慢慢淡出人們的視野,學(xué)術(shù)作品的電子化、網(wǎng)絡(luò)化程度越來越高,數(shù)字圖書館積累了大量的電子化數(shù)據(jù)。作為學(xué)術(shù)健康發(fā)展的“守門人”,各高校圖書館對科研成果進(jìn)行甄別和鑒定時承擔(dān)著重要的責(zé)任。因此,研究數(shù)字圖書館的信息鑒別技術(shù),提升其信息服務(wù)質(zhì)量具有重要的意義[1]。

      目前,雖然已經(jīng)有了許多成熟的技術(shù)去鑒別造假的科研文章,但研究仍然集中在對文字抄襲方面,而電子期刊的論文中除了文字以外,還有大量的圖像數(shù)據(jù),這些數(shù)據(jù)往往能夠表達(dá)豐富的內(nèi)涵,在論文中起到至關(guān)重要的作用,也極易引起抄襲和篡改[2]。而且,隨著圖像處理軟件的普及和操作簡便化,人工鑒別的方式很難判斷圖像是否經(jīng)過修改。這就使學(xué)術(shù)不端人員有機(jī)可乘,擅自利用軟件篡改他人論文中的圖像數(shù)據(jù),形成圖像篡改的學(xué)術(shù)造假。因此,數(shù)字圖書館對科研成果中圖像篡改的學(xué)術(shù)造假行為的甄別和檢測已經(jīng)迫在眉睫。

      本文提出了一種能夠檢測高校圖書館數(shù)據(jù)庫中論文存在圖像篡改痕跡的方案,為彌補(bǔ)數(shù)字圖書館檢測系統(tǒng)缺陷提供一種新的參考思路,進(jìn)一步加快大數(shù)據(jù)時代數(shù)字圖書館服務(wù)技術(shù)變革,促進(jìn)信息服務(wù)水平的提升。

      1 論文查重檢測技術(shù)概述

      1.1 論文查重技術(shù)研究現(xiàn)狀

      大數(shù)據(jù)時代下,人們獲取信息的途徑十分便捷,這就為一些研究人員抄襲和篡改他人的研究成果提供了便利。數(shù)字圖書館作為收錄方和檢測方,應(yīng)該不斷革新技術(shù),杜絕抄襲數(shù)據(jù)流入互聯(lián)網(wǎng)絡(luò),為用戶提供優(yōu)質(zhì)的信息服務(wù)。因此,為了防止學(xué)術(shù)造假的現(xiàn)象進(jìn)一步擴(kuò)大化,學(xué)術(shù)造假檢測研究成為信息服務(wù)領(lǐng)域的一個新的研究方向。目前,論文的查重技術(shù)主要檢測的對象以文字為主[3]。

      1976年,Ottenstein等人最先指出數(shù)字圖書館中文檔數(shù)據(jù)容易被復(fù)制造成版權(quán)侵犯,后來又提出了一種源代碼屬性計(jì)數(shù)法[4],通過實(shí)驗(yàn)?zāi)軌蛴行z測被抄襲的代碼,之后,隨著互聯(lián)網(wǎng)技術(shù)的發(fā)展和數(shù)字資源的不斷膨脹,研究人員逐漸加大對文本抄襲現(xiàn)象的研究力度。1991年,相關(guān)學(xué)者研發(fā)出首個可以檢測文本中有抄襲內(nèi)容的檢測工具——WordCheck[5],采用關(guān)鍵詞匹配的方法來計(jì)算相似度。Z Su等人[6]采用了一種混合的檢測算法,該算法結(jié)合了生物序列局部相似性識別和量化原理,并考慮了心理因素,可以有效檢測包括插入、刪除或替換單詞等剽竊行為。Anguita A等人[7]基于自然語言處理技術(shù)和機(jī)器學(xué)習(xí)方法,提出了一種檢測電子文檔中跨語言剽竊的新方法。國內(nèi)關(guān)于復(fù)制檢測方面的研究落后于西方,2002年,宋擒豹等人[8]針對數(shù)字上非法復(fù)制和擴(kuò)散,提出一種數(shù)字正文重疊性度量算法可以準(zhǔn)確地檢測復(fù)制和移位等數(shù)字非法復(fù)制行為,具有較強(qiáng)的擴(kuò)展性。趙俊杰等人[9]提出了一種基于段落詞頻統(tǒng)計(jì)的論文抄襲判定算法,不但可以檢測出抄襲者成段抄襲的情況,而且可以檢測出段落中語句順序改變、段落內(nèi)容壓縮和擴(kuò)充的情況,若疑似抄襲還可以將抄襲論文和被抄襲論文的相似內(nèi)容輸出,方便用戶進(jìn)一步審查。楊超[10]提出了一種綜合文本分析、結(jié)構(gòu)度量和屬性計(jì)數(shù)的混合式程序抄襲檢測方法,可以多種抄襲行為,具有較高的準(zhǔn)確率和查全率。

      隨著對檢測技術(shù)的深入研究,我國對學(xué)術(shù)論文的復(fù)制檢測技術(shù)已經(jīng)達(dá)到商業(yè)應(yīng)用的程度,各大高校、圖書館和機(jī)構(gòu)常用的中文電子期刊全文數(shù)據(jù)庫主要有CNKI、萬方和維普這3種數(shù)據(jù)庫,每種數(shù)據(jù)庫都有各自的檢測系統(tǒng),各檢測系統(tǒng)的特點(diǎn)如表1所示:

      表1 國內(nèi)學(xué)術(shù)不端檢測系統(tǒng)的特點(diǎn)

      其中,中國知網(wǎng)開發(fā)的科技期刊文獻(xiàn)檢測系統(tǒng)AMLC在3個常用檢測系統(tǒng)中對論文數(shù)據(jù)查重監(jiān)測最為全面,數(shù)據(jù)庫中包含的類型有中國學(xué)術(shù)期刊網(wǎng)絡(luò)出版總庫、中國博士/碩士論文全文數(shù)據(jù)庫、中國會議全文數(shù)據(jù)庫、互聯(lián)網(wǎng)資源、英文數(shù)據(jù)庫、圖書資源等。在檢測時,CNKI檢測系統(tǒng)在檢測一篇文章時能夠在約2~5秒的時間內(nèi)就能比對完各個數(shù)據(jù)庫,并顯示比對的結(jié)果,檢索效率高,檢測結(jié)果精確[11]。萬方論文相似性檢測系統(tǒng)是基于萬方數(shù)據(jù)公司所收錄的期刊論文、學(xué)位論文、萬方數(shù)值數(shù)字化期刊全文數(shù)值庫、萬方數(shù)值學(xué)位論文、常識服務(wù)平臺的全文數(shù)值庫等海量數(shù)據(jù),運(yùn)用先進(jìn)的檢測算法研制而成,它具有檢測速度快、檢測準(zhǔn)確等特點(diǎn)[12]。通達(dá)論文檢測系統(tǒng)是由維普公司與通達(dá)恒遠(yuǎn)信息技術(shù)有限公司及北京多所重點(diǎn)高校共同合作開發(fā)的文本檢測系統(tǒng),該系統(tǒng)自主研發(fā)的大規(guī)模文本處理技術(shù),通過對文檔關(guān)鍵語義片斷的識別、檢測,可檢測出文檔中存在的不當(dāng)引用、過度引用,甚至是抄襲等現(xiàn)象。通過計(jì)算出文檔的引用率、復(fù)寫率和自寫率等重要指標(biāo),為各級論文評定、檢測、發(fā)表機(jī)構(gòu)提供論文評定和論文收錄的檢測依據(jù),為個人寫作者提供寫作輔導(dǎo)及論文自查服務(wù)[13]。

      1.2 論文查重技術(shù)目前存在的問題

      隨著對學(xué)術(shù)不端文獻(xiàn)檢測系統(tǒng)的大量運(yùn)用,但系統(tǒng)的局限性也導(dǎo)致一些問題出現(xiàn):

      1.2.1 檢測盲區(qū)影響檢測結(jié)果

      檢測系統(tǒng)無法全面檢測論文,主要體現(xiàn)在以下3個方面:第一,時間上的滯后性。論文發(fā)表一般要經(jīng)歷投遞、審核、排版和收錄等環(huán)節(jié),周期在幾個月甚至一年以上,這些未公開的文章還沒有被數(shù)據(jù)庫收錄,因此在檢測時就會缺少一部分比對數(shù)據(jù)。第二,語言上的限制。近年來,國內(nèi)越來越多研究人員為了完成科研任務(wù),從外文文獻(xiàn)中剽竊他人的觀點(diǎn)甚至直接翻譯抄襲他人的學(xué)術(shù)成果,國內(nèi)的檢測系統(tǒng)中跨語言檢測功能還未完善,導(dǎo)致“跨國抄襲”的現(xiàn)象日益嚴(yán)重。第三,數(shù)據(jù)庫的有限性。目前國內(nèi)的檢測系統(tǒng)還無法做到全面的收錄所有的文獻(xiàn)數(shù)據(jù),例如互聯(lián)網(wǎng)資源,由于互聯(lián)網(wǎng)傳播速度快,發(fā)表內(nèi)容便捷,其中不乏一些質(zhì)量高、具有一定價(jià)值的文章,檢測系統(tǒng)無法及時有效的收錄這些信息就會導(dǎo)致在檢測時存在漏檢的問題。此外,由于知網(wǎng)、萬方等知名數(shù)據(jù)庫之間競爭激烈,為了在行業(yè)中獲取優(yōu)勢,爭相與不同的學(xué)術(shù)期刊簽訂獨(dú)家合作協(xié)議,獲取優(yōu)先出版的版權(quán),這也導(dǎo)致各檢測系統(tǒng)中的學(xué)術(shù)資源并不全面,不可避免地影響到最后的檢測結(jié)果[14]。

      1.2.2 無法甄別合理引用

      學(xué)術(shù)不端檢測系統(tǒng)的智能化程度較低,無法正確區(qū)分論文中的引用部分和抄襲部分。有些引用部分被檢測系統(tǒng)檢測為抄襲的合理性也有待商榷,例如綜述類的文章往往被檢測出的重復(fù)率更高,但這類文章僅僅是對前人的觀點(diǎn)做復(fù)述和引證;又如在引用專業(yè)性的理論和概念時,為了體現(xiàn)論文的嚴(yán)謹(jǐn),會整句引用,也會被檢測系統(tǒng)標(biāo)為抄襲內(nèi)容。此外,學(xué)術(shù)不端檢測系統(tǒng)在識別文章中不加標(biāo)注的合理引用與不當(dāng)引用也缺乏有效性,二者均顯示為高重合率[15]。因此,如何提高學(xué)術(shù)不端檢測系統(tǒng)檢測的合理性,不斷完善和改進(jìn)系統(tǒng)功能從而解決鑒別文章是合理引用還是抄襲的問題,也將是相關(guān)研究人員接下來值得關(guān)注的主要方向。

      1.2.3 文本以外的其他形式的抄襲無法檢測

      在檢測系統(tǒng)中,還存在一個比較明顯的局限性:文章中除文字以外的數(shù)據(jù)檢測功能缺失,從表1中我們不難看出,目前國內(nèi)的三大常用的檢測平臺都沒有針對圖件的識別。圖像往往內(nèi)容豐富,相比文字能夠更加生動表達(dá)作者的觀點(diǎn)、創(chuàng)新等,在文中具有十分重要的意義,然而隨著圖像編輯軟件的普及和應(yīng)用的便捷,越來越多的人對圖像內(nèi)容進(jìn)行人為的篡改。目前對文章中是否有圖件數(shù)據(jù)抄襲,要靠編輯和專家依靠經(jīng)驗(yàn)進(jìn)行查詢,認(rèn)真分析、審核判斷,然而人的精力有限,無法做到對相關(guān)的所有文獻(xiàn)進(jìn)行比對。因此盡快在論文相似性檢測系統(tǒng)中增設(shè)完善的圖表識別功能顯得尤為重要和迫切,這也是本文研究意義之所在。

      2 數(shù)字圖書館圖像篡改檢測模型的設(shè)計(jì)

      通過梳理國內(nèi)外學(xué)者對論文查重的研究和國內(nèi)學(xué)術(shù)不端檢測系統(tǒng)的不足發(fā)現(xiàn),檢測系統(tǒng)大都是針對文本內(nèi)容的甄別檢測,而圖情領(lǐng)域?qū)φ撐闹写嬖趫D像篡改現(xiàn)象的檢測尚處于探索階段,對圖像篡改檢測的研究會是一個新的發(fā)展趨勢。

      論文中圖像數(shù)據(jù)的篡改體現(xiàn)在原圖像的真實(shí)性或者內(nèi)容完整性的改變。真實(shí)性就是原圖像所表達(dá)的概念被扭曲,被篡改后的圖像與原圖像呈現(xiàn)不同的意義,圖像編輯里常用的技術(shù)有圖像增強(qiáng)、變形等。完整性是指圖像中部分內(nèi)容被增加或者刪除。不論論文中原圖像的真實(shí)性被改動還是內(nèi)容的完整性被破壞,都會留下改動的痕跡,通過判斷這些痕跡就能找到圖像中被篡改區(qū)域并且定位,是圖像篡改檢測的理論基礎(chǔ)[16]。

      2.1 數(shù)字圖書館圖像篡改檢測系統(tǒng)模型構(gòu)建

      為了解決目前數(shù)字圖書館或?qū)W術(shù)資源平臺中存在的檢測系統(tǒng)無法識別圖像篡改這一問題,本文提出一種基于圖像篡改的學(xué)術(shù)不端檢測模型,該模型主要由論文圖像提取、圖像預(yù)處理、特征計(jì)算、置換區(qū)檢測4個模塊組成。圖像采集提取模塊主要負(fù)責(zé)圖像數(shù)據(jù)的收集工作。圖像預(yù)處理模塊實(shí)現(xiàn)圖像數(shù)據(jù)歸一化、圖像插值放大等功能。特征計(jì)算是該模型能否實(shí)現(xiàn)的核心,本文采用的是有限差分特征提取算法,可以有效提取被放大后圖像的特征值。置換區(qū)檢測最終實(shí)現(xiàn)圖像篡改檢測功能。具體模型如圖1所示。

      圖1 數(shù)字圖書館圖像篡改檢測系統(tǒng)模型

      2.1.1 圖像采集提取模塊

      數(shù)字圖書館和學(xué)術(shù)資源平臺中存儲的數(shù)據(jù)大多是PDF格式的論文,雖然也有部分少量的圖像數(shù)據(jù),但圖像信息主要集中在PDF論文中。因此,在采集圖像數(shù)據(jù)作為比對數(shù)據(jù)庫時,除了直接收集以圖像格式存儲的數(shù)據(jù),還要提取論文中的圖像信息。提取PDF文件中圖像信息是實(shí)現(xiàn)圖像篡改盲檢測的基礎(chǔ),直接影響檢測效果。本文提取PDF文件中圖像數(shù)據(jù)采用的方法是:首先讀取PDF中的交叉參考表,交叉參考表中存有所有對象的入口地址,利用相關(guān)程序就可以定位圖像對象;然后,根據(jù)PDF文檔結(jié)構(gòu)和頁面樹結(jié)構(gòu),對PDF中包含圖像信息的頁面按順尋進(jìn)行精準(zhǔn)的搜尋,定位圖像具體的位置后依次提取壓縮數(shù)據(jù),將得到的圖像數(shù)據(jù)保存為JPEG格式。最后要將提取的圖像信息正確的組織起來,不同類型的圖像在保存到文件時可以按照中圖分類號放置于圖像數(shù)據(jù)庫當(dāng)中。

      2.1.2 圖像預(yù)處理模塊

      采集完成后,就要進(jìn)行圖像預(yù)處理工作。圖像預(yù)處理是為了改進(jìn)特征提取、提高匹配和識別的可靠性而進(jìn)行的消除圖像中無關(guān)的信息或增強(qiáng)有關(guān)信息的可檢測性等采取的一系列操作。經(jīng)過預(yù)處理操作,可以方便后續(xù)工作的開展,提高工作效率。數(shù)字圖像篡改的種類非常多,學(xué)術(shù)不端人員可以對原圖像進(jìn)行拼合、潤色、增強(qiáng)、變形等操作,不同的篡改行為會導(dǎo)致不同的效果。為了驗(yàn)證本文提出的圖像盲檢測模型的可行性,筆者主要針對論文中一類被放大篡改行為的圖像檢測。因此,實(shí)驗(yàn)過程中,該環(huán)節(jié)首先對被檢測圖像數(shù)據(jù)進(jìn)行放大處理以更好地完成圖像篡改檢測。

      圖像縮放算法中常用有最鄰近插值算法與線性插值方法。最鄰近插值算法就是將目標(biāo)圖像各點(diǎn)的像素值設(shè)為源圖像中與其最近的點(diǎn),該算法計(jì)算量小,運(yùn)算速度塊,但可能造成插值生成的圖像灰度上的不連續(xù),在灰度變化的地方可能出現(xiàn)明顯的鋸齒狀,如果用這個方法進(jìn)行圖像放大,那么在放大比例較大的情況下就會出現(xiàn)非常明顯的“馬賽克”現(xiàn)象。線性插值就是連接兩個已知量的函數(shù)表達(dá)式,確定這兩個已知量之間的某一函數(shù)值的方法。該方法在放大圖像時能使像素的過度較為平滑,有效解決了最近鄰插值算法的缺點(diǎn),在圖像處理領(lǐng)域經(jīng)常使用。因此,圖像預(yù)處理時本文主要采用線性插值方法對圖像放大。

      圖像經(jīng)過不同比例插值放大的效果如圖2所示。

      圖2 不同插值變換后的圖像

      2.1.3 特征計(jì)算模塊

      圖像特征提取是圖像篡改盲檢測的關(guān)鍵環(huán)節(jié),直接影響圖像篡改檢測的檢測效果。目前圖像篡改特征計(jì)算方式主要有兩種方式,一種是針對圖像的復(fù)制粘貼進(jìn)行特征提??;另一種是圖像的拼接篡改進(jìn)行特征提取[17]。復(fù)制粘貼篡改就是將原圖像中的部分內(nèi)容經(jīng)過篡改行為從新復(fù)制粘貼到圖中的其他地方,經(jīng)過粘貼的區(qū)域?yàn)榇鄹膮^(qū)域。針對圖像復(fù)制粘貼篡改盲檢測技術(shù)有基于DCT的塊特征檢測方法,如Y Cao等人[18]提出一種有效檢測區(qū)域復(fù)制圖像的方法,首先將原始圖像分成固定大小的塊,然后對每個塊應(yīng)用離散余弦變換DCT系數(shù)來表示。其次,每個余弦變換塊由一個圓塊表示,并提取四個特征以減少每個塊的維數(shù)。最后,將特征向量按字典序排序,組成一個4維的向量。T song等人[19]提出一種新的特征描述符,對圖像局部結(jié)構(gòu)進(jìn)行量化,然后提取和重排二維DCT特征,所得到的DCT系統(tǒng)的一個子集作為新的特征描述符。常用的檢測方法還有基于紋理的檢測算法和基于傅里葉變換的塊檢測算法等等[20-21]。圖像拼接篡改就是將原圖像中的部分內(nèi)容截取放入另一幅圖像當(dāng)中去。拼接篡改的盲取證方法有基于整體特征分類檢測方法,如Z He等人[22]提出一種基于馬爾科夫的方法,首先利用馬爾可夫等人提出的離散余弦變換概率矩陣生成的原始特征,然后在小波變換域構(gòu)造更多的特征來表征小波系數(shù)在位置、尺度和方向上的3種依賴關(guān)系,最后利用支持向量機(jī)對真實(shí)圖像和拼接圖像進(jìn)行分類。仝威等人[23]提出一種基于熵和多步馬爾可夫特征的圖像拼接檢測算法,該方法先從原圖、3階Haar離散小波變換(DWT)和多尺度分塊離散余弦變換(DCT)中提取圖片的信息熵,再從圖像的分塊DCT系數(shù)中提取多步馬爾可夫轉(zhuǎn)移概率矩陣,由信息熵和多步馬爾可夫轉(zhuǎn)移概率矩陣組成統(tǒng)計(jì)特征,利用支持向量機(jī)分類器進(jìn)行分類得到判決結(jié)果。除此之外還有基于局部特征的拼接算法和基于篡改圖像處理痕跡的拼接檢測算法等。

      圖像篡改方式種類繁多,為驗(yàn)證本文提出的數(shù)字圖書館圖像篡改檢測模型可行性。在實(shí)驗(yàn)時主要針對一類圖像放大的拼接篡改檢測。在篡改他人圖像時,經(jīng)常會發(fā)現(xiàn)學(xué)術(shù)不端人員常常將原圖像中的某一重要內(nèi)容截取,拼接到另一幅圖像中去,并且在拼接的過程中對篡改內(nèi)容的大小進(jìn)行修改,最終被篡改者引用到自己的文章當(dāng)中。經(jīng)過放大后篡改的圖例如圖3所示。

      圖3 圖像插值置換

      針對插值放大圖像檢測方法的研究已經(jīng)受到廣泛的關(guān)注,如B Mahdian等人[24]通過插值分析,提出一種能夠找到重采樣和插值痕跡的周期檢測方法;M Kirchner等人[25]提出一種基于空間域局部線性預(yù)測殘差信號的周期性檢測方法。這些算法雖然能夠檢測出插值放大的痕跡,但存在運(yùn)算復(fù)雜、有損JPEG圖像和檢測正確率較低等問題。因此,在實(shí)驗(yàn)過程中,本文主要采用一種新的有限差分算法對上述篡改現(xiàn)象進(jìn)行特征提取。該方法不需要迭代運(yùn)算,計(jì)算簡便,能夠?qū)D像篡改痕跡進(jìn)行精準(zhǔn)的定位。有限差分公式中yi[n]經(jīng)過R階有限差分后可以表示為:

      ΔRyi[n]=ΔR-1yi[n+1]-ΔR-1yi[n]

      (1)

      其中,n=0,1,2,…,n,ΔR代表R階有限差分。

      2.1.4 圖像檢測模塊

      提取出圖像篡改的特征值后,我們就要進(jìn)行最終的篡改盲檢測階段。通過有限差分置換方法能夠?qū)?jīng)過放大的插值圖像引入周期性,利用這種周期性的特點(diǎn)就能計(jì)算出被篡改圖像的插值數(shù),此外,不同插值數(shù)可以根據(jù)差分序列的時域周期性進(jìn)行判斷和鑒別。在檢測時,就可以根據(jù)圖像是否具有周期特性來檢驗(yàn)圖像插值篡改的行為,如果存在插值操作,就可以通過周期性的異同實(shí)現(xiàn)對局部置換區(qū)域的準(zhǔn)確定位,從而實(shí)現(xiàn)論文中被篡改的圖像盲檢測功能。

      2.2 實(shí)驗(yàn)驗(yàn)證與分析

      為保證本文所設(shè)計(jì)模型的有效性,筆者針對本模型進(jìn)行實(shí)驗(yàn)驗(yàn)證。實(shí)驗(yàn)環(huán)境如下:操作系統(tǒng)為Windows7,雙核2.1GHz,內(nèi)存為4GDDR3,采用Matlab2015B軟件編程。本次在預(yù)處理時首先采用上述3種插值放大方法對圖1(a)所示的像素大小為256×256的圖像,分別進(jìn)行1.5、2.25及4倍于原圖像的3次插值放大。然后采用有限差分方法提取具有周期性的篡改特征,最終完成定位和檢測圖像中被篡改的痕跡。再利用有限差分算法對其周期特征進(jìn)行檢測。其中,最近鄰插值方法在經(jīng)過一階有限差分序列后會出現(xiàn)周期性,而另外兩種方法則需進(jìn)行二階或多次差分。經(jīng)過3種插值方法放大并選取不同的插值因子后,具有周期性的頻譜就能夠清晰地呈現(xiàn)出來,如圖3所示。因此,可通過歸一化的幅頻就能準(zhǔn)確的計(jì)算和定位被篡改的圖像痕跡。仿真實(shí)驗(yàn)的結(jié)果驗(yàn)證了本文采用方法的實(shí)用性和有效性。

      最后,為了展示篡改圖像的實(shí)際檢測效果,筆者選取了3組篡改的圖例進(jìn)行檢測。對經(jīng)過最近鄰插值、線性插值及3次插值3種不同類型的插值放大方法分別對圖像部分內(nèi)容進(jìn)行1.25倍、1.5倍和2倍放大。如圖5所示,其中a和b為原圖像,將a圖像中的部分區(qū)域經(jīng)過插值放大后拼接到b圖像形成篡改圖像c,而圖像d中的白色區(qū)域即為經(jīng)過有限差分置換檢測后顯示的區(qū)域。從仿真實(shí)驗(yàn)的結(jié)果可以清晰地看到,不同插值算法放大的圖像能夠被有效地檢測定位出來,其中針對最近鄰插值檢測的效果最好。因此,本文設(shè)計(jì)的圖像篡改盲檢測模型在針對論文中圖像篡改的檢測具有較高的可行性。

      3 結(jié) 語

      近年來,學(xué)術(shù)不端在期刊中頻頻發(fā)生,伴隨著大數(shù)據(jù)的發(fā)展,數(shù)字圖書館和相關(guān)學(xué)術(shù)資源平臺的抄襲數(shù)據(jù)呈現(xiàn)逐漸蔓延的趨勢。而隨著圖像處理軟件技術(shù)的快速發(fā)展,為圖像篡改這類學(xué)術(shù)不端行為提供了新的土壤。目前人們更多的是對文字抄襲等進(jìn)行鑒別和檢測,而現(xiàn)有圖像取證技術(shù)發(fā)展的速度相比圖像篡改技術(shù)的要遠(yuǎn)遠(yuǎn)落后,尤其在圖情領(lǐng)域中,大部分檢測系統(tǒng)缺乏對論文中圖像的檢測功能,缺乏對篡改圖像痕跡的取證技術(shù),侵害了他人的知識產(chǎn)權(quán),造成學(xué)術(shù)不端行為進(jìn)一步加深。因此,面對這類問題的日益嚴(yán)重,需要引起人們的高度重視,同時迫切需要一種對接觸到的圖像的信息真實(shí)性進(jìn)行有效確認(rèn)的方案和技術(shù),形成一道堅(jiān)實(shí)的抵御學(xué)術(shù)不端行為的“防火墻”。

      圖4 3種插值方式和插值因子對應(yīng)的幅頻圖

      圖5 檢測結(jié)果圖

      在這種背景下,相關(guān)學(xué)者逐漸加大了對圖像篡改盲取證研究的力度,該領(lǐng)域應(yīng)用廣泛,具有良好的研究前景。本文針對數(shù)字圖書館學(xué)術(shù)不端檢測系統(tǒng)中無法有效檢測圖像篡改的缺陷,提出了一種數(shù)字圖書館圖像篡改檢測模型,詳細(xì)介紹了每種模型的功能,并通過實(shí)驗(yàn)證實(shí)了該模型的有效性,為數(shù)字圖書館的圖像篡改盲檢測提供了理論支持。在提取圖像篡改特征值時,主要采用了有限差分方法,通過仿真實(shí)驗(yàn)證明,本文提出的圖像篡改模型對最近鄰插值、線性插值和3次插值這3種不同插值放大后的拼接放大篡改圖像,通過周期性的異同性能夠精確捕捉被修改的痕跡,其平均檢測率可高達(dá)99.67%。同時筆者提出的有限差分置換檢測方法在面對高斯白噪聲和有損JPEG壓縮等因素的干擾時具有一定的魯棒性。論文中圖像篡改除了插值放大置換還有很多其它方式,如何能夠高效的檢測不同類型的篡改圖像,提高檢測的效率是今后筆者繼續(xù)研究和努力的方向。

      猜你喜歡
      不端插值學(xué)術(shù)
      規(guī)范科學(xué)技術(shù)活動 抵制學(xué)術(shù)不端行為
      如何理解“Curator”:一個由翻譯引發(fā)的學(xué)術(shù)思考
      中國博物館(2019年2期)2019-12-07 05:40:44
      論文作者學(xué)術(shù)不端行為類型
      對學(xué)術(shù)造假重拳出擊
      商周刊(2019年2期)2019-02-20 01:14:22
      基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
      一種改進(jìn)FFT多譜線插值諧波分析方法
      基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
      《肝膽胰外科雜志》來稿中常見的學(xué)術(shù)不端問題
      關(guān)于本刊啟用“科技期刊學(xué)術(shù)不端檢則系統(tǒng)”(AMLC)的通知
      Blackman-Harris窗的插值FFT諧波分析與應(yīng)用
      泸溪县| 北京市| 奎屯市| 株洲县| 双牌县| 惠州市| 普格县| 三都| 曲阳县| 南江县| 清徐县| 修文县| 湖南省| 丰都县| 北京市| 神木县| 鞍山市| 革吉县| 鱼台县| 无棣县| 绵阳市| 湘乡市| 鄂托克前旗| 田阳县| 贵州省| 上饶市| 仙居县| 太仆寺旗| 海淀区| 田东县| 新疆| 泰安市| 台安县| 卫辉市| 太仆寺旗| 息烽县| 湾仔区| 蒲江县| 伊金霍洛旗| 广州市| 菏泽市|