王小龍 朱盼盼 梁紫妍
1. 安徽建筑大學 電子與信息工程學院 安徽 合肥 230601;
2. 安徽建筑大學 土木工程學院 安徽 合肥 230601
玻璃文物鑒別主要任務是在已通過技術手段得到大量文物化學成分或者部分化學成分的情況下,通過模糊聚類以及隨機森林算法辨別文物成分的合理性以及對于機器無法分析的化學成分予以補充分析,可應用在文物發(fā)掘,文物鑒別、分析等場景,對回溯中國古代外交往來,市場貿易有重要的價值[1]。
在風化過程中,內部元素與環(huán)境元素進行大量交換,導致其成分比例發(fā)生變化,從而影響對其類別的正確判斷。在已知文物類別的情況下,對于分析其化學成分之間的關聯關系以及不同類別之間的化學成分關聯關系的差異性,實際上就是通過灰色關聯度的綜合評價來為同類別間的化學成分排序,以此來探究文物的實際價值[2-3]?,F通過技術手段,使用儀器獲得一批古代文物的相關數據,如下表1所示。
表1 文物成分數據表
同時,由于技術手段的限制,導致部分文物的本分化學組分不清,需要通過下文的方式得出相關的數據,并加以分析文物屬性。
按照表2中的數據構建模糊矩陣,以高鉀玻璃的風化、未風化,鉛鋇玻璃的風化、未風化作為分類對象,14種化學物質作為分類指標。
表2 文物風化情況表
1.1.1 絕對值減數法。
1.1.2 構建矩陣。
1.1.3 模糊聚類。
按梯度規(guī)定得到分類情況,此處應通過SPSSPRO實現計算,從計算可以得出:第1類劃分,共將文物玻璃分為兩大類,第1批編號為1-6,第2批編號7-10,通過表2得出,該類劃分編號文物的共性為高鉀、鉛鋇的不同,而由于受環(huán)境風化程度影響較大,在數學分析上使得4-5的鉛鋇文物編入高鉀文物中,通過高鉀、鉛鋇不同,聯系實際生活,可以大致判斷文物出土的地域特點;第2類劃分,將第1批編號化為次一級編號為1-4,次二級編號為5-6,將第2批編號化為次一級編號7-9,次二級編號9-10,該類劃分在考慮高鉀、鉛鋇的基礎上劃分為風化與未風化,例如,通過表2可以得出,第1批次一級劃分文物,屬高鉀風化文物。第3類劃分,將文物分為5批,第1批為1-2,第2批為3,第3批為4-6,第4批為7-8,第5批為9-10。針對編號5-10的文物研究人員深度挖掘4-6號文物與7-8號文物化學成分內在之間的聯系,將兩類文物的14種化學物質構建特征矩陣,通過提取兩個自變量之間的特征值,影響兩類文物進入同一組的主要貢獻前5名分別為氧化鉛、氧化鋇、二氧化硅、氧化鉀、氧化鍶)[4]。選擇二氧化硅、氧化鉀、氧化鉛、氧化鋇、氧化鍶作為特征變量,認為它們對分類4-6與7-8為一組做出貢獻。以此為自變量,以高鉀,鉛鋇為因變量,構建線性回歸方程:
對于這個公式,利用SPSSPRO分析其合理性:從F檢驗的結果分析可以得到,顯著性P值為0.000***,水平上呈現顯著性,拒絕回歸系數為0的原假設,因此模型基本滿足要求。對于變量共線性表現,VIF全部小于10,因此模型沒有多重共線性問題,模型構建良好,通過這個公式可以發(fā)現,帶入上述數據,在圖像附近的都可被視作初步高鉀玻璃,不符合即為鉛鋇玻璃,即就能認為符合高鉀玻璃。
通過已得出的相關公式,帶入A1~A8相關數據,得出表3。
表3 線性函數的預測
對于表2的屬性分類,以表2為訓練集對其進行訓練,通過隨機森林的方法,多次迭代,讓計算機來模擬情況,但由于樣本數量較少,為了避免過擬合的情況出現,研究人員模擬采集文物樣本風化點,根據已知的高鉀玻璃風化的化學成分范圍隨機生成1000個待分類數據,再通過隨機森林產生的分類標準對其進行分類,觀察分類結果是否隸屬于高鉀風化類。于此,排除了過擬合的可能,隨機森林結果如表4。
表4 隨機森林預測表
再對比第三問得出的結論發(fā)現與結果一致,故模糊聚類具有穩(wěn)定性,且亞分類標準為5是較為合適的結果。
本文通過對風化玻璃文物的化學成分數據進行大數據分析,提出基于模糊聚類和灰色關聯度的風化玻璃文物分析,通過對風化點與未風化點的化學成分進行特征提取,利用模糊聚類算法得到樣本點譜系圖,直觀地看出玻璃文物的一級分化情況,按照化學成分中心點平均值將與風化結果相關性高的成分提取出來,擬合出玻璃分類與化學成分的線性表達,從而鑒別其種類。