王 陳,孟憲昱,于瀛潔,孔 明,劉 維
(1.上海大學 機電工程與自動化學院,上海200444;2.中國計量大學 計量測試工程學院,浙江 杭州310018)
隨著芯片、MEMS等高精密納米器件小型化和集成化需求的高速增長,器件特征尺寸和與之關聯(lián)的公差不斷減小的同時形狀結(jié)構(gòu)的復雜程度卻不斷增加[1],對具有良好的重復性、準確性和可靠性等特性的微納米臺階高度測量及計量表征方法的需求也日趨迫切[2]。在半導體、微電子和納米制造測量等領域中,臺階高度是精密光學元件、集成電路特征尺寸、石墨烯薄膜厚度、芯片等精密微納米結(jié)構(gòu)的關鍵特征尺寸。但是,由于微納米結(jié)構(gòu)表面三維形貌實測數(shù)據(jù)集較大,且特征突變頻繁,實測數(shù)據(jù)通常含有未測點和離群值等測量缺陷,難以對其進行快速高精度表征處理。
臺階高度的定義為高低平面中距離邊緣特定距離的兩點的垂直距離[3]。作為微納米計量領域中的關鍵幾何量,其表征評定方法層出不窮,現(xiàn)階段主要應用的方法包括點對點的高度提取方法(兩點法)、單邊法、直方圖法、ISO法、最小二乘多項式擬合法等[4]。其中,ISO評定方法應用最為廣泛,在最新的GPS標準ISO 25178-700[5]中,規(guī)定了基于區(qū)域的臺階高度評定方法和基于輪廓的臺階高度評定方法。但針對具有測量壞點的三維臺階形貌,目前仍未有計量表征標準。
近年來,國內(nèi)外研究人員針對微納米臺階高度測量表征難題進行了廣泛研究。日本研究人員Ismail M F等針對臺階高度測量數(shù)據(jù)中出現(xiàn)的離群值提出了一種基于相鄰數(shù)據(jù)中值的方法進行去噪表征的算法,提高了臺階高度表征的魯棒性[6];Le Goic G等提出了一種基于離散模態(tài)分解(discrete modal decomposition)的數(shù)學模型轉(zhuǎn)換原始測量數(shù)據(jù),結(jié)合格拉布斯檢驗過濾表面測量數(shù)據(jù)中離群值的方法[7];Nurunnabi A等針對點云數(shù)據(jù)中的離群值提出了兩種高魯棒性的統(tǒng)計方法,結(jié)合點到平面的正交距離和局部表面點的一致性原則獲得最小距離下的最大一致性點集(Maximum Consistency with Minimum Distance),進而基于局部區(qū)域中最可能的無離群值且最一致的點集估計最佳擬合平面,提高了算法的準確度和魯棒性[8];芬蘭研究人員Heikkinen V等應用自組裝的生物樣品設計了5~40 nm的多級臺階高度樣本,并采用多級直方圖的臺階高度表征方法完成了多級臺階高度樣本的表征[9]。國內(nèi)的微納米臺階高度樣板的研制與測量表征研究起步相對較晚[10],但是近年來也取得了豐碩的成果。在微納米臺階測量表征方面,北京交通大學的謝芳等設計應用了一種結(jié)合低相干干涉和高相干干涉的絕對位移測量系統(tǒng),利用兩種干涉方法所獲得干涉圖的峰值移動范圍內(nèi)的條紋數(shù)量得到測量點的高度值,十次測量1 mm量塊的標準差可達0.5 nm[11];西安交通大學的楊樹明等在制作8 nm、18 nm、26 nm三階高度臺階樣品的基礎上,通過濾波去除低頻噪音的同時利用十階多項式擬合表面輪廓,去除高頻噪聲后進行臺階高度表征,提高了臺階高度擬合的準確度與魯棒性[12];國家計量研究院的李偉等針對臺階高度測量中的弓形誤差問題,利用AFM顯微鏡的實測數(shù)據(jù),將幾條相鄰數(shù)據(jù)進行擬合后,進而基于Sobel算子進行邊緣檢測,并將兩條不在同一曲線上的兩線段進行平移操作獲得臺階高度表征結(jié)果[13]。
隨著現(xiàn)代精密制造及測量技術(shù)的不斷發(fā)展,臺階高度表征已經(jīng)從傳統(tǒng)的二維高度向三維高度轉(zhuǎn)變[14]。同時,三維測量技術(shù)的不斷提高使得實測多維形貌數(shù)據(jù)的數(shù)據(jù)量較傳統(tǒng)測量方法急劇增大,數(shù)據(jù)結(jié)構(gòu)更為復雜。聚類分析在大數(shù)據(jù)的分析與處理領域中具有良好的處理效果,其一方面可以作為分類預處理的處理手段,另一方面也能對數(shù)據(jù)中的異常值進行分離和識別,進而剔除離群值[15]。本文針對微納米臺階實測形貌數(shù)據(jù)量龐大復雜,通常存在測量壞點難以實現(xiàn)高精度表征的難題,提出了一種三維微納米臺階光學顯微測量和量化表征方法,針對臺階結(jié)構(gòu)選取測量系統(tǒng)并設計測量方法,建立基于K-means聚類算法的臺階高度表征模型,提高三維測量儀器實測面形數(shù)據(jù)的臺階高度表征效率,增強臺階高度表征精度和魯棒性,并對兩種不同標準樣塊進行測量實驗,將結(jié)果與標定值進行比對,進一步驗證所提出算法的可靠性。
K-means算法在本質(zhì)上是基于距離相似性的度量,通過不斷地迭代運算,直到其收斂到聚類中心而停止,本研究基于K-means算法提出處理測量數(shù)據(jù)并表征臺階高度的新方法,主要包括臺階高度數(shù)據(jù)維度重構(gòu)、基于K-means算法的質(zhì)心距離計算及數(shù)據(jù)映射、迭代收斂設計及臺階高度參數(shù)表征。
臺階高度實測數(shù)據(jù)為多維面型數(shù)據(jù),數(shù)據(jù)集龐大復雜的同時又具有低的多維特征相關性,其通常存在離群值。相比之下,低維數(shù)據(jù)處理簡單,且噪聲易去除,處理效率較高。因此本研究采用數(shù)據(jù)維度重構(gòu)的方法將多維面型數(shù)據(jù)重構(gòu)為多個二維數(shù)據(jù)集,提高數(shù)據(jù)處理效率,從而能進一步利用K-means算法的高魯棒性表征臺階高度。
首先,將原始實測數(shù)據(jù)矩陣記錄為S:
其中,S是一個M×N的矩陣(假設M為偶數(shù),若為奇數(shù)則取M=M-1,即忽略最后一行的邊緣數(shù)據(jù))。然后將原始數(shù)據(jù)矩陣S分別選取奇數(shù)行和偶數(shù)行數(shù)據(jù),組成奇數(shù)行數(shù)據(jù)矩陣A和偶數(shù)行數(shù)據(jù)矩陣B:
將奇數(shù)行矩陣和偶數(shù)行矩陣的同行數(shù)據(jù)提取重構(gòu)為數(shù)據(jù)點矩陣S j:
其中:A j,B j表示矩陣A和B的第j行數(shù)據(jù)。將各重構(gòu)矩陣S j第一行數(shù)據(jù)作為x軸數(shù)據(jù),第二行數(shù)據(jù)作為y軸數(shù)據(jù),分別繪制到二維笛卡爾坐標系中。即,每個點坐標Pj,k為:
其中:Z1,k和Z2,k表示重構(gòu)數(shù)據(jù)的第一行和第二行的第k列臺階高度測量值。
K-means方法又稱為K均值算法,其中K代表所要聚類的數(shù)目,means表示各個維度數(shù)據(jù)所構(gòu)成的簇類的數(shù)據(jù)均值,已知包含n個d維數(shù)據(jù)樣本的數(shù)據(jù)集Ω={x a|x a=(x a1,x a2,…,x ad),a=1,2,…,n},其 中,x a是 一個d維向量,表示數(shù)據(jù)集Ω第a個數(shù)據(jù)的d個不同的屬性,n是樣本容量,給定一個聚類數(shù)目K,然后隨機選取K個數(shù)據(jù)點分別作為初始劃分的簇類中心。K-means算法通常選取歐式距離作為相似性和距離判斷的準則:
其中,C b=(C b1,C b2,…,C bd),C b表示第b個簇類的聚類中心,每個簇類中心C b都含有d個不同的屬性。
計算每個樣本數(shù)據(jù)到每個聚類中心C b的距離,從而將該樣本數(shù)據(jù)劃分到與之最近的聚類中心所在的簇類中,通過多次迭代運算,直到簇類內(nèi)所有數(shù)據(jù)的平方和最小且沒有變化時為止。
臺階高度僅由高低平面之差決定,所得形貌數(shù)據(jù)具有明顯的特殊性,理論上只有高臺階值和低臺階值兩組數(shù)值。通過數(shù)據(jù)維度重構(gòu)方法將多維面型數(shù)據(jù)降維至有序二維空間后,數(shù)據(jù)分布為明顯的兩個團簇,兩個聚類團簇的聚類中心在高低平面數(shù)據(jù)點P1j(hlow,hlow)和P2j(hhigh,hhigh)兩個點附近,故其聚類中心數(shù)量值K取2。兩聚類中心的距離為:
其中:P1j,x,P1j,y表 示 第j組重構(gòu)數(shù)據(jù) 的 第 一 個 聚類中心在二維笛卡爾坐標系中的x、y軸坐標,P2j,x,P2j,y表示第j組重構(gòu)數(shù)據(jù)的第二個聚類中心在二維笛卡爾坐標系中的x、y軸坐標。
由于原始數(shù)據(jù)通常存在離群值和噪聲,為提高映射數(shù)據(jù)的可靠性,同時提高算法的魯棒性,需要將降維后的聚類數(shù)據(jù)進行降噪處理。首先,計算同一聚類簇中的各數(shù)據(jù)值與其聚類中心的距離L,計算各點到聚類中心的距離均值Laverage和距離的方差s后,利用3σ原則,分離出離群點,并將其用聚類中心替換迭代,完成數(shù)據(jù)去噪處理。其算法流程圖如圖1所示。
圖1 基于K-means算法的質(zhì)心距離計算及數(shù)據(jù)映射流程圖Fig.1 Flow chart of centroid distance calculation and data mapping based on K-means algorithm
通過前述數(shù)據(jù)映射過程,將臺階高度測量所得多維面型數(shù)據(jù)映射到有序二維空間中,并以兩聚類中心位置距離表征二維數(shù)據(jù)中臺階高度值的大小。為進一步保證離群值的去除率,同時提高測量精度,增強算法測量結(jié)果的穩(wěn)定性和魯棒性,在一次臺階表征的基礎上多次應用上述算法進行去噪和臺階高度參數(shù)表征,直到兩次相鄰的測量數(shù)據(jù)的測量結(jié)果之差小于提前設定的閾值(閾值根據(jù)所需測量精度設定),則此時的算法測量結(jié)果為最終的臺階高度表征值。
根據(jù)聚類原則,兩個聚類中心的橫縱坐標之差理論上均為所要測量的臺階高度H j。但是,由于數(shù)據(jù)誤差的存在,其聚類中心與理想值存在誤差,為減少數(shù)據(jù)誤差,同時增強算法的魯棒性,在本算法中,首先計算兩聚類中點間的歐氏距離,再由畢達哥拉斯定理,得單次測量的二維數(shù)據(jù)點的結(jié)果為:
將降維后的二維數(shù)據(jù)點依次處理,分別計算各降維后的二維數(shù)據(jù)組的臺階高度H j,最后將所有單次計算結(jié)果取均值,得本次數(shù)據(jù)處理后的臺階高度值為:
其中,N表示所有重構(gòu)數(shù)據(jù)的總數(shù)。
為進一步增強表征結(jié)果的可靠性,設置收斂閾值Δ作為迭代收斂條件。閾值設計應綜合考慮測量儀器的分辨率與所測對象的精度要求,首先應保證檢測對象的測量精度要求,但是不得小于所用測量儀器的最小分辨率。
假設每次測量結(jié)果為H e,當H e+1-H e<Δ時,H e即為本次臺階高度表征結(jié)果。收斂設計及最終參數(shù)表征的算法流程圖如圖2所示。
圖2 收斂設計及臺階高度參數(shù)表征流程圖Fig.2 Flow chart of convergence design and step height parameter characterization
臺階高度標準物質(zhì)是指足夠均勻和穩(wěn)定的特定特性的物質(zhì),其特性適用于測量或者標稱特性檢測中的預期用途[16-17]。微納米級臺階作為納米測量領域重要的計量標準器具廣泛應用于微納米領域儀器(如干涉測量顯微鏡、輪廓儀、干涉顯微鏡等[18-19])的標定與校準工作中,用以精確確定此類儀器的測量標準性并進行示值修正[20]。為驗證所提出的臺階高度測量表征方法的可靠性,針對兩種臺階標準物質(zhì)分別選取了相應的測量系統(tǒng)并設計了測量方法,應用所創(chuàng)建的表征模型對測量獲得的形貌數(shù)據(jù)進行參數(shù)化表征,將結(jié)果與標定值進行比對,并對實驗結(jié)果進行了分析。
應用三維形貌輪廓儀,在恒溫、恒濕、潔凈的實驗室內(nèi)對一個名義值為5μm的臺階高度標準物質(zhì)進行測量實驗,溫度為(20±0.5)℃,濕度為(50±5)%RH,千級潔凈度。如圖3所示,測量設備選用為泰勒·霍普森(Taylor Hobson)非接觸式表面輪廓測量儀,實驗樣品選取英國萊斯特(Leicester)大學制作的臺階高度標準樣板,其臺階高度標定值為5.072μm,樣品的測試區(qū)域選在所測量臺階高度標準件的中間區(qū)域,采用10倍物鏡鏡頭,測量區(qū)域大小約為1 600 μm×1 600μm。
圖3 泰勒·霍普森非接觸式表面輪廓測量儀及測量過程Fig.3 Taylor Hobson non-contact surface profile measuring instrument and measurement process
如圖4所示為本次臺階高度標準樣板的實測數(shù)據(jù)三維重建結(jié)果,可以觀察到有明顯的離群值數(shù)據(jù)存在,例如圖中紅色圓圈所示。
圖4 標準樣板實測數(shù)據(jù)三維重建Fig.4 3D reconstruction of measured data of standard sample
原始測量區(qū)域部分數(shù)據(jù)存在明顯測量誤差,為進一步減小臺階高度的表征誤差,提高臺階高度表征區(qū)域的精確度,應用ISO 25178-700[5]中規(guī)定的基于區(qū)域的臺階高度評定方法選擇評定區(qū)域,并應用本文提出的算法對所選取的部分區(qū)域進行數(shù)據(jù)重構(gòu),并表征臺階高度,評定區(qū)域選取如圖5(a)所示,評定區(qū)域數(shù)據(jù)重建如圖5(b)所示。
圖5 樣板實測數(shù)據(jù)的表面重建和標準工件評估Fig.5 Surface reconstruction of the measurement data and the evaluation data of the standard artefact
本次測量采用上述測量方法并應用本文所提出的表征算法得到的臺階高度表征值為5.067μm。其中,收斂設計的閾值為Δ=0.001 μm。實驗表征結(jié)果與標準樣板標定值的相對誤差為0.1%。
為進一步驗證算法的可靠性,選用臺階高度標稱值為90.5 nm的臺階高度標準樣板進行測量,臺階高度標準樣板如圖6(a)所示。實驗儀器選用為Sensofar公司生產(chǎn)的第五代S neox 3D光學輪廓儀,如圖6(b)所示,本次臺階高度標準樣板測量采用20倍物鏡鏡頭。實驗在溫度為(20±0.5)℃,濕度為(50±5)%RH的恒溫、恒濕條件下進行。
圖6 Sensofar 3D光學輪廓儀及測量樣板Fig.6 Sensofar 3D optical profilometer and step height standard artefact
通過視頻顯微鏡將被測樣板放大300倍觀測本臺階高度標準樣板的有效區(qū)域,如圖7(上圖)所示,可以明顯看到表面有大量噪點。圖7(下圖)為利用Sensofar光學輪廓儀測量所獲得的三維重構(gòu)圖。
圖7 臺階高度標準樣板測量結(jié)果圖Fig.7 Measurement results of the step height standard artefact
從三維重構(gòu)圖中可以看到,存在明顯的數(shù)據(jù)噪點。為進一步減小臺階高度的表征誤差,提高臺階高度表征精度,依據(jù)ISO 25178-700[5]中基于區(qū)域的臺階高度評定方法選擇評定區(qū)域,并應用本文所提出的算法對所選取的部分區(qū)域進行數(shù)據(jù)重構(gòu)。其中,收斂設計閾值Δ=0.01 nm,并將數(shù)據(jù)重構(gòu)后的數(shù)據(jù)進行可視化,結(jié)果如圖8(a)所示。圖8(b)為本次臺階高度表征的數(shù)據(jù)分布特征。
圖8 測量數(shù)據(jù)處理結(jié)果Fig.8 Processing results of measurement data
從圖中可以看到,離群值基本去除,數(shù)據(jù)分布范圍明顯集中,臺階高度標準樣板數(shù)據(jù)經(jīng)過處理得到的臺階高度表征的結(jié)果為89.15 nm,表征結(jié)果可靠。
本文提出了一種三維微納米臺階高度光學顯微測量量化表征新方法。針對臺階特征選取合適的測量系統(tǒng)并設計測量方法,將測量獲取的多維原始數(shù)據(jù)進行降維重組后,在臺階高度表征方面引入了聚類算法,提高了臺階高度表征效率的同時增強了表征算法對實測數(shù)據(jù)中離群值的魯棒性,提高了測量表征精度。與傳統(tǒng)表征方法相比,由于本算法采用聚類分析處理多維形貌數(shù)據(jù),能夠不受測量壞點的影響,快速準確獲得臺階高度關鍵尺寸。對兩種臺階高度標準物質(zhì)進行了實驗,通過數(shù)據(jù)重建進行可視化后,可以觀察到離群值被明顯去除。采用本算法對兩次實驗的實測數(shù)據(jù)進行處理,表征結(jié)果與標定值的誤差率均在1.5%以下。所提出的方法能夠高精度測量表征具有測量壞點的三維形貌數(shù)據(jù)的臺階高度值,對三維微納米結(jié)構(gòu)的測量表征具有重要的科學意義及應用價值。