周貫旭,姜紅*,胡曉光,陳敏璠,莫修浩
紅外光譜結(jié)合主成分分析對紙質(zhì)快遞文件袋的分類研究
周貫旭1,姜紅1*,胡曉光1,陳敏璠2,莫修浩2
(1.中國人民公安大學(xué) 偵查學(xué)院,北京 100038;2.北京鑒知技術(shù)有限公司,北京 100084)
建立一種快速無損的檢驗紙質(zhì)快遞文件袋的分析方法。利用傅里葉變換紅外光譜對63個紙質(zhì)快遞文件袋樣品進(jìn)行檢驗,分析樣品的紅外光譜吸收峰的峰位,結(jié)合主成分分析對光譜數(shù)據(jù)進(jìn)行了降維處理并分類。利用費歇爾判別對快遞文件袋的分類結(jié)果進(jìn)行分析和驗證。同時建立多層感知器神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)2種分類模型,進(jìn)行分析和驗證。63個紙質(zhì)快遞文件袋樣品可被分成四大類,利用費歇爾分類模型進(jìn)行驗證,準(zhǔn)確率為100%;多層感知器神經(jīng)網(wǎng)絡(luò)分類模型準(zhǔn)確率為95.23%,徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)分類模型準(zhǔn)確率為92.06%。通過比較發(fā)現(xiàn),費歇爾判別可以實現(xiàn)對紙質(zhì)快遞文件袋更加有效地分類。該方法簡單快速,樣品用量少且無損樣品,可為快遞文件袋類的物證鑒定提供科學(xué)依據(jù)。
傅里葉變換紅外光譜法;紙質(zhì)快遞文件袋;主成分分析;費歇爾判別
隨著快遞行業(yè)的迅速發(fā)展,快遞業(yè)務(wù)非常普遍。在各類案件現(xiàn)場,經(jīng)常能提取到紙質(zhì)快遞文件袋物證,通過對該類物證的檢驗分析,并對其進(jìn)行準(zhǔn)確快速分類,有助于判斷該物證來源以及主要運輸途徑??蔀閭刹槠瓢柑峁┚€索,縮小偵查范圍[1]。
目前,用于檢驗紙張物證的方法主要有,紅外光譜法、拉曼光譜法、掃描電鏡/能譜法、X射線熒光光譜法[2]、X射線衍射法、原子發(fā)射光譜法等[3]。利用紅外光譜結(jié)合主成分分析對紙質(zhì)快遞文件袋的相關(guān)研究尚未見報道。本實驗采用便攜式紅外光譜儀對收集到63個不同品牌、不同來源的快遞文件袋樣品進(jìn)行檢驗,依據(jù)快遞文件袋表面的涂漆填料的不同對其進(jìn)行分類,借助spss 26.0軟件中的費歇爾判別式、多層感知器神經(jīng)網(wǎng)絡(luò)和徑向基神經(jīng)網(wǎng)絡(luò)對上述分類結(jié)果進(jìn)行分析驗證,進(jìn)而優(yōu)選一種最適合此類樣品的分類方法。
IT 2000傅里葉變換紅外光譜儀(北京鑒知技術(shù)有限公司);掃描次數(shù)為32次;光譜范圍為4 000~500 cm?1;分辨率為4 cm?1。
來自不同城市的順豐、韻達(dá)、中通、圓通、EMS、京東、申通等7個不同快遞公司的紙質(zhì)快遞文件袋樣品63個(樣品表略)。
分別剪取約1 cm2大小的樣品,利用紅外光譜在上述實驗條件下,對實驗樣品進(jìn)行測試。
重復(fù)性實驗:隨機選取57#樣品,對其同一部位進(jìn)行5次平行實驗;隨機選取13#樣品對其上、下、左、右、中心5個部位進(jìn)行測試。
為驗證儀器的精密度和樣品的均勻性,確保實驗結(jié)果準(zhǔn)確可靠,對樣品進(jìn)行了重復(fù)性實驗。57#樣品同一個部位的5次平行實驗的紅外光譜圖見圖1;13#樣品的5個部位的紅外光譜圖見圖2。當(dāng)把一些微小的干擾峰排除后,樣品在同一位置的紅外光譜圖基本一致,在不同位置的紅外光譜圖也基本一致,說明儀器具有較好的精密度,樣品的均勻性較好。因此,利用該實驗方法對紙質(zhì)快遞文件袋進(jìn)行檢驗的結(jié)果準(zhǔn)確可靠。
圖1 57#樣品的紅外光譜圖
圖2 13#樣品的紅外光譜圖
紙質(zhì)快遞文件袋的原料主要是纖維素和半纖維素,因為快遞文件袋表面一般是白色為主,因此在生產(chǎn)過程中,生產(chǎn)廠家常常會添加一定量的涂漆填料。常見的填料主要有如碳酸鈣、高嶺土、滑石粉、膨潤土等,其中713、876、1 434、1 796 cm?1可作為識別碳酸鈣的紅外光譜吸收峰,542、694、916、1 037、1 117、3 622、3 655、3 696 cm?1可作為識別高嶺土的紅外光譜吸收峰,670、1 019 cm?1可作為識別滑石粉的紅外光譜吸收峰,916、1 037、3 625 cm?1可作為識別膨潤土的紅外光譜吸收峰[4]。
為滿足不同紙張的性能要求,不同的快遞文件袋的填料成分或配比會有所不同。本實驗根據(jù)填料種類的不同,可以將樣品分為四大類(分類結(jié)果見表1)。
第I類樣品的主要填料是碳酸鈣(見圖3),其中864.39 cm?1為碳酸鈣C?O面內(nèi)振動彎曲[5]吸收。碳酸鈣在填料中增強了涂層耐磨損和抗腐蝕的能力,使涂層的烘烤溫度降低,壓縮烘烤時間,在降低成本的同時,可有效提高產(chǎn)品質(zhì)量。
表1 樣品分類結(jié)果
Tab.1 Sample classification results
圖3 第I類中1#樣品的紅外光譜圖
第Ⅱ類樣品的主要填料是碳酸鈣和膨潤土(見圖4),其中3 685.74 cm?1是膨潤土內(nèi)表面—OH的吸收,2 920.87 cm?1是—CH3和—CH2對稱和反對稱伸縮振動吸收峰[6],1 026.75 cm?1是Si—O—Si反對稱伸縮振動吸收,1 005.10 cm?1為Si—O伸縮振動吸收,763.37 m?1為Si—O—Mg吸收[7];871.61 cm?1為碳酸鈣C—O面內(nèi)振動彎曲吸收。膨潤土可以降低生產(chǎn)成本,并且還能使紙張顏料分散更加均勻、提高紙張表面光潔度等。
圖4 第Ⅱ類21#樣品的紅外光譜圖
第Ⅲ類中的主要填料是碳酸鈣和高嶺土(見圖5),其中870.41 cm?1為碳酸鈣C—O面內(nèi)振動彎曲吸收;3 693.98~3 624.41 cm?1內(nèi)的吸收峰均是高嶺土晶體內(nèi)部—OH的吸收,1 005.40 cm?1為Si—O伸縮振動吸收,756.79 cm?1為Si—O—Mg吸收[8]。高嶺土具有可塑性好、黏結(jié)性高和絕緣性能好等特點,易分散懸浮于水中,在提高紙張抗酸溶性、耐火性等方面具有較好的作用。
圖5 第Ⅲ類57#樣品的紅外光譜圖
第Ⅳ類中樣品的主要成分是碳酸鈣加滑石粉(見圖6),其中876.42 cm?1為碳酸鈣C—O面內(nèi)振動彎曲吸收;1 010.49 cm?1為滑石粉Si—O的伸縮振動吸收,672.52 cm?1為—OH彎曲振動吸收[9]?;鄄坏軌蚋纳萍垙埖牟煌该鞫群推交?,而且還能提高紙張的適印刷性,價格低廉,具有較高的經(jīng)濟(jì)效益。
圖6 第Ⅳ類41#樣品的紅外光譜圖
主成分分析法(Principal Component AnalysisPCA)是一種基于統(tǒng)計特征的多維正交線性變換,常用來對信號進(jìn)行特征提取和對數(shù)據(jù)進(jìn)行降維[10]??纱蟠蠼档蜆颖緮?shù)據(jù)的復(fù)雜程度,使樣本數(shù)據(jù)處理更加方便。當(dāng)數(shù)據(jù)累計方差貢獻(xiàn)率大于80%,可以較好地解釋基本原始信息[11],實驗中將原樣品數(shù)據(jù)降維成26個變量,其方差累計貢獻(xiàn)率為99.71%,說明PCA提取效果好。
鑒于人工進(jìn)行分類可能會存在誤差的情況,利用費歇爾判別分析對分類結(jié)果進(jìn)行驗證,以降維后的26個變量為研究對象,建立費歇爾判別函數(shù)[12]。對3個判別函數(shù)的模型摘要進(jìn)行分析,進(jìn)而確定哪個判別函數(shù)在實現(xiàn)樣本分類預(yù)測方面具有更顯著的作用。判別函數(shù)的摘要統(tǒng)計見表2。
表2 判別函數(shù)的摘要統(tǒng)計
Tab.2 Summary statistics of discriminant function
費歇爾判別分別提取了3個特征函數(shù)[13],前2個特征函數(shù)所占方差百分比分別為74.1%和19.6%,累計方差貢獻(xiàn)率為93.6%。其方差的百分比代表著對于該模型對于樣本的分類問題的解釋能力的大小,故函數(shù)1和函數(shù)2這2個函數(shù)所攜帶的信息大于第3個函數(shù),則以函數(shù)1和函數(shù)2作為模型的判別函數(shù)繪制樣品聯(lián)合分布散點圖(見圖7)。
由圖7可知,人工分類四大類的質(zhì)心在散點圖上相對分離,其中第2類和第4類的分類效果尤其顯著。同時用該模型對分類結(jié)果進(jìn)行了預(yù)測,其正確判別率為100%(見表3),說明人工分組的結(jié)果具有一定的準(zhǔn)確性和科學(xué)性。
人工神經(jīng)網(wǎng)絡(luò)(ANN)是一種監(jiān)督學(xué)習(xí)算法的模型,其信息的處理大致分為3個層次,即在輸入層中輸入外部信息,然后通過隱藏層進(jìn)行信息的處理,最后通過輸出層將信息進(jìn)行下一步的傳遞[14]。多層感知器(Multilayer Perceptron,MLP)神經(jīng)網(wǎng)絡(luò)和徑向基函數(shù)(Radical Basis Function,RBF)神經(jīng)網(wǎng)絡(luò)分類模型,都是典型的神經(jīng)網(wǎng)絡(luò)算法。
圖7 樣品聯(lián)合分布散點圖
表3 費歇爾模型分類預(yù)測結(jié)果
Tab.3 Classification prediction results of Fisher model
以63個樣本的紅外光譜數(shù)據(jù)為基礎(chǔ),對原始數(shù)據(jù)構(gòu)建MLP和RBF 2種分類模型,將樣本按照70%和30%的比例劃分為訓(xùn)練集和測試集,即44個樣品作為訓(xùn)練集,19個樣本作為測試集[15]。在MLP模型對該類樣品的測試中,協(xié)變量是每個樣品的波長作為輸入層神經(jīng)元,隱藏層層數(shù)為1層,隱藏層中包含3個神經(jīng)元。選擇雙曲正切函數(shù)為輸入函數(shù),令Softmax函數(shù)作為輸出層激活函數(shù),MLP模型分類結(jié)果見表4,其中訓(xùn)練集的準(zhǔn)確率為95.45%,測試集的準(zhǔn)確率為94.73%,其總體準(zhǔn)確率為95.23%。
在RBF模型的模型參數(shù)中,輸入層神經(jīng)元選擇該類樣品的紅外波長作為RBF模型的協(xié)變量,選擇正態(tài)化徑向基函數(shù)作為隱藏層激活函數(shù)[16]。RBF模型分類結(jié)果見表5,其中對訓(xùn)練集的正確率可以達(dá)到93.18%,反觀對測試集的正確率則只有89.47%,其總體準(zhǔn)確率為92.06%。
表4 MLP模型分類結(jié)果
Tab.4 MLP model classification results
表5 RBF模型分類結(jié)果
Tab.5 RBF model classification results
利用紅外光譜法對快遞文件袋樣品進(jìn)行了檢驗分析,依據(jù)填料的不同,可將63個樣品分為四大類。通過PCA進(jìn)行降維處理后,提取了26個特征值大于1的主成分,其可以解釋原光譜數(shù)據(jù)中99.71%的信息。根據(jù)費歇爾判別分析對人工分類結(jié)果進(jìn)行驗證,建立費歇爾判別函數(shù)和分類預(yù)測模型,該方法的識別準(zhǔn)確率為100%?;跇悠窋?shù)據(jù)建立的MLP和RBF這2種模型,也可驗證分類方法的準(zhǔn)確率,其準(zhǔn)確率分別為95.23%和92.06%。對未知樣品的判別,費歇爾判別分析模型的準(zhǔn)確率更高。將紅外光譜與主成分分析相結(jié)合,可以對紙質(zhì)快遞文件袋樣品進(jìn)行快速無損地檢測,為公安機關(guān)實際辦案提供幫助。
[1] 姜紅. 刑事案件現(xiàn)場中紙張的檢驗及應(yīng)用[J]. 上海造紙, 2005(3): 9-12.
JIANG Hong. On the Examination of Paper at Case Crime Scene and Its Application[J]. Shanghai Paper Making, 2005(3): 9-12.
[2] 廉哲, 梁魯寧, 光曉俐, 等. X射線熒光光譜在文件/紙質(zhì)文物檢驗中的應(yīng)用研究進(jìn)展[J]. 刑事技術(shù), 2022(2): 185-190.
LIAN Zhe, LIANG Lu-ning, GUANG Xiao-li, et al. Research Progress on XRF Applied into Examination of Document/Paper Cultural Relics[J]. Forensic Science and Technology, 2022(2): 185-190.
[3] FISCHER T, MARCHETTI-DESCHMANN M, CRISTINA ASSIS A, et al. Profiling and Imaging of Forensic Evidence – a Pan-European Forensic round Robin Study Part 1: Document Forgery[J]. Science & Justice, 2022, 62(4): 433-447.
[4] 付鈞澤, 姜紅, 陳煜太, 等. 傅里葉變換紅外光譜法檢驗香煙水松紙的研究[J]. 中華紙業(yè), 2017, 38(20): 43-48.
FU Jun-ze, JIANG Hong, CHEN Yu-tai, et al. A Study on Test of Tipping Paper with Fourier Transform Infrared Spectroscopy[J]. China Pulp & Paper Industry, 2017, 38(20): 43-48.
[5] 趙華雄, 侯小紅. 制漿系統(tǒng)中出現(xiàn)的沉積物及其紅外圖譜簡析[J]. 中華紙業(yè), 2022, 43(12): 20-24.
ZHAO Hua-xiong, HOU Xiao-hong. Deposit in Bleached Pulp Production System and Its Infrared Spectrum Identification[J]. China Pulp & Paper Industry, 2022, 43(12): 20-24.
[6] 楊瑩琴, 趙新富, 張永笑. 己內(nèi)酰胺插層膨潤土的研制及其性能[J]. 信陽師范學(xué)院學(xué)報(自然科學(xué)版), 2009, 22(4): 565-567.
YANG Ying-qin, ZHAO Xin-fu, ZHANG Yong-xiao. Production and Performance of Caprolactam Intercalation Bentonite[J]. Journal of Xinyang Normal University (Natural Science Edition), 2009, 22(4): 565-567.
[7] CAGGIANI M C, OCCHIPINTI R, FINOCCHIARO C, et al. Diffuse Reflectance Infrared Fourier Transform Spectroscopy (DRIFTS) as a Potential on Site Tool to Test Geopolymerization Reaction[J]. Talanta, 2022, 250: 123721.
[8] ABDEL M M I A, YOUSSEF M A, GHOBASHY M M, et al. Gamma Radiation-Induced Synthesis of Organoclays Based Polyaniline and Ilmenite Clay Minerals for Cesium Ions Removal from Aqueous Solutions[J]. Separation and Purification Technology, 2023, 305: 122434.
[9] WU Hao-yu, HE Ming-yue, WU Shao-kun, et al. Near-Infrared Spectroscopy Study of OH Stretching Modes in Pyrophyllite and Talc[J]. Crystals, 2022, 12(12): 1759.
[10] PFEZER D, KARST J, HENTSCHEL M, et al. Predicting Concentrations of Mixed Sugar Solutions with a Combination of Resonant Plasmon-Enhanced SEIRA and Principal Component Analysis[J]. Sensors, 2022, 22(15): 5567.
[11] AHSAN M, MASHURI M, KHUSNA H. Comparing the Performance of Kernel PCA Mix Chart with PCA Mix Chart for Monitoring Mixed Quality Characteristics[J]. Scientific Reports, 2022, 12(1): 1-12.
[12] ZHANG Jin, GAO Peng-ya, WU Yuan, et al. Identification of Foodborne Pathogenic Bacteria Using Confocal Raman Microspectroscopy and Chemometrics[J]. Frontiers in Microbiology, 2022, 13: 874658.
[13] ZHANG Jin, JIANG Hong, DUAN Bin, et al. A Rapid and Nondestructive Approach for Forensic Identification of Cigarette Inner Liner Papers Using Shift-Excitation Raman Difference Spectroscopy and Chemometrics[J]. Journal of Forensic Sciences, 2021, 66(6): 2180-2189.
[14] 趙崇文. 人工神經(jīng)網(wǎng)絡(luò)綜述[J]. 山西電子技術(shù), 2020(3): 94-96.
ZHAO Chong-wen. A Survey on Artificial Neural Networks[J]. Shanxi Electronic Technology, 2020(3): 94-96.
[15] 李錦, 姜紅, 楊俊, 等. 差分拉曼光譜結(jié)合人工神經(jīng)網(wǎng)絡(luò)對藥品塑料包裝瓶的分類研究[J]. 塑料工業(yè), 2022, 50(8): 101-107.
LI Jin, JIANG Hong, YANG Jun, et al. Classification of Plastic Pharmaceutical Packaging Bottles Based on Differential Raman Spectroscopy and ANN[J]. China Plastics Industry, 2022, 50(8): 101-107.
[16] 田陸川, 楊俊, 姜紅. 基于RBFNN-FDA模型對塑料拖鞋鞋底的拉曼光譜研究[J]. 上海塑料, 2022, 50(4): 62-67.
TIAN Lu-chuan, YANG Jun, JIANG Hong. Study on Raman Spectra of Plastic Slipper Soles Based on RBFNN-FDA Model[J]. Shanghai Plastics, 2022, 50(4): 62-67.
Classification of Paper Express Document Bags by Infrared Spectroscopy Combined with Chemometrics
ZHOU Guan-xu1, JIANG Hong1*, HU Xiao-guang1, CHEN Min-fan2, MO Xiu-hao2
(1. Investigation Institute, People's Public Security University of China, Beijing 100038, China; 2. Beijing Jianzhi Technology Co., Ltd., Beijing 100084, China)
The work aims to establish a fast and nondestructive analysis method for testing paper express document bags. Sixty-three express document bag samples were tested by Fourier transform infrared spectroscopy. The peak position of the absorption peaks in the infrared spectrum was analyzed, and the spectral data were dimensionally reduced and classified in combination with principal component analysis. Fisher discriminant analysis was used to analyze and verify the classification results of express document bags. At the same time, two classification models of multilayer perceptron neural network and radial basis function neural network were established for analysis and verification. The 63 samples of paper express document bags could be divided into four categories, and the Fisher classification model could achieve 100% accuracy; the classification accuracy of the multi-layer perceptron neural network model was 95.23%, and that of the radial basis function neural network model was 92.06%. Through comparison, it was found that Fischer discriminant could achieve a more effective classification of paper express document bags. This method is simple, rapid, less sample consumption and non-destructive to samples. It can provide a scientific basis for identification of physical evidence of express document bags.
Fourier transform infrared spectroscopy (FTIR); paper express document bag; principal component analysis; Fischer discriminant
TB486;D918.9;O657.33
A
1001-3563(2023)23-0231-06
10.19554/j.cnki.1001-3563.2023.23.028
2023-01-06
中國人民公安大學(xué)2021年度基科費重點項目(2021JKF212)
責(zé)任編輯:曾鈺嬋