王偉 揭泉林
(武漢大學(xué)物理科學(xué)與技術(shù)學(xué)院,武漢 430000)
通過序參量來研究量子相變是比較傳統(tǒng)的做法,而從機(jī)器學(xué)習(xí)的角度研究相變是一塊全新的領(lǐng)域.本文提出了先采用無監(jiān)督學(xué)習(xí)算法中的高斯混合模型對J1-J2反鐵磁海森伯自旋鏈系統(tǒng)的態(tài)矢量進(jìn)行分類,再使用監(jiān)督學(xué)習(xí)算法中的卷積神經(jīng)網(wǎng)絡(luò)鑒別無監(jiān)督學(xué)習(xí)算法給出的分類點(diǎn)是否是相變點(diǎn)的方法,并使用交叉驗(yàn)證的方法對學(xué)習(xí)效果進(jìn)行驗(yàn)證.結(jié)果表明,上述機(jī)器學(xué)習(xí)方法可以從基態(tài)精確找到J1—J2反鐵磁海森伯自旋鏈系統(tǒng)的一階相變點(diǎn)、無法找到無窮階相變點(diǎn),從第一激發(fā)態(tài)不僅能找到一階相變點(diǎn),還能找到無窮階相變點(diǎn).
機(jī)器學(xué)習(xí)算法的改進(jìn)和更快更強(qiáng)的硬件能夠讓研究者從龐大的數(shù)據(jù)中提取出有用的信息,現(xiàn)在已廣泛應(yīng)用于許多研究領(lǐng)域,這些發(fā)展對物理科學(xué)也產(chǎn)生了廣泛的影響,特別是在分類量子相變上[1-10].量子相變是系統(tǒng)在絕對零度下發(fā)生的一種相變,它僅僅由系統(tǒng)的哈密頓量變化帶來的量子擾動引起[11,12].在量子力學(xué)中,系統(tǒng)的物理狀態(tài)可以表示為希爾伯特空間的一個矢量,由于量子態(tài)通常已經(jīng)歸一化,研究者經(jīng)常使用保真度(兩個量子態(tài)的內(nèi)積)來研究量子相變,它能反映兩個態(tài)之間的相似程度,保真率反映的是這種變化的速率,這是一個純粹幾何學(xué)上的概念,分析認(rèn)為機(jī)器學(xué)習(xí)方法應(yīng)該也能從態(tài)矢量中提取信息來反映系統(tǒng)相變,其與保真度不同的是,輸出結(jié)果是該態(tài)矢量與模型訓(xùn)練數(shù)據(jù)中的所有同類態(tài)矢量的相似程度.研究量子相變,除了能進(jìn)一步豐富人們對低溫磁性材料、鐵電材料、超導(dǎo)體的認(rèn)識外,對其他學(xué)科和量子計算技術(shù)早期的實(shí)踐都具有重要意義.在一個很大的晶格中,計算序參量來判斷相變需要很大的計算量,也需要有先驗(yàn)知識來構(gòu)造一個合適的序參量.機(jī)器學(xué)習(xí)為我們提供了一種新的識別相變點(diǎn)的方法.
Walker 等[13]使用無監(jiān)督機(jī)器學(xué)習(xí)有效識別了材料結(jié)構(gòu)變化的轉(zhuǎn)變溫度,Jadrich 等[14]研究表明不需要有任何先驗(yàn)知識來構(gòu)造一個合適的序參量,使用主成分分析法就能自動發(fā)現(xiàn)序參量來分類相,從而簡化了對相的常規(guī)分析.Canabarro 等[15]使用無監(jiān)督機(jī)器學(xué)習(xí)識別了軸向次近鄰伊辛模型的3 個主要相.Carrasquilla 等[16]研究表明神經(jīng)網(wǎng)絡(luò)能夠被用來編碼物質(zhì)相和識別強(qiáng)關(guān)聯(lián)多體系統(tǒng)的相變.Ahmadreza 等[17]使用卷積神經(jīng)網(wǎng)絡(luò)高精度的定位了二維伊辛模型的相變點(diǎn).
大量研究表明機(jī)器學(xué)習(xí)能夠有效識別相變點(diǎn),然而當(dāng)面對一個全新的系統(tǒng)時,使用無監(jiān)督學(xué)習(xí)得到的分類點(diǎn)是否是相變點(diǎn)仍需要計算序參量加以佐證,當(dāng)不知道相變點(diǎn)時,也無法選擇合適的分類點(diǎn),給訓(xùn)練數(shù)據(jù)集貼上標(biāo)簽,訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型.這時就需要將非監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)結(jié)合起來,可以先使用無監(jiān)督學(xué)習(xí)算法找到分類點(diǎn),再使用稍微遠(yuǎn)離分類點(diǎn)的兩側(cè)數(shù)據(jù)集進(jìn)行訓(xùn)練.發(fā)現(xiàn)如果無監(jiān)督學(xué)習(xí)得到的分類點(diǎn)為相變點(diǎn),通過增加分類點(diǎn)一側(cè)的訓(xùn)練數(shù)據(jù)或者調(diào)整訓(xùn)練集的分布區(qū)域,該點(diǎn)位置一般不會發(fā)生變化,若其不是相變點(diǎn),其位置必發(fā)生變化,由此,就可以不需要任何先驗(yàn)知識,不需要計算任何序參量,直接通過機(jī)器學(xué)習(xí)的方法找到相變點(diǎn).本文采用上述機(jī)器學(xué)習(xí)方法可以從基態(tài)精確找到海森伯J1-J2模型的一階相變點(diǎn)、無法找到無窮階相變點(diǎn),從第一激發(fā)態(tài)不僅能找到一階相變點(diǎn),還能找到無窮階相變點(diǎn).
本文研究的系統(tǒng)是一維反鐵磁海森伯自旋鏈.其哈密頓量是:
其中,J1表示最近鄰相互耦合作用,J2表示次近鄰相互耦合作用,〈i,j〉表示取遍所有的最近鄰,〈〈i,j〉〉表示取遍所有的次近鄰,N表示鏈長.選擇周期性邊界條件.此模型最近鄰和次近鄰之間存在競爭,在熱力學(xué)極限下有兩個相變點(diǎn).Qian等[18-21]研究表明在J2/J1=0.5 時,此模型發(fā)生一階相變,該模型變?yōu)镸ajumdar-Ghosh 模型,此相變是由平移對稱性破缺引起的,在J2/J1=0.241時,此模型發(fā)生無窮階相變,當(dāng)J2/J1> 0.241 時,體系是二聚化相,當(dāng)J2/J1< 0.241 時,體系是自旋液體相.由圖1可知,此相變點(diǎn)對應(yīng)于第一激發(fā)態(tài)的能級交叉點(diǎn),此時基態(tài)無能級交叉,無法反映此相變.需要特別說明的是,本文計算的是有限長的系統(tǒng),因此由于系統(tǒng)的局限性,從圖1可以看出,除了在此模型的相變點(diǎn)處有能及交叉外,不同鏈長的系統(tǒng)在不同的地方也出現(xiàn)了能級交叉點(diǎn),這些假的相變點(diǎn)并沒有反映真實(shí)的物理,本文不做討論.下文討論的機(jī)器學(xué)習(xí)方法的輸出結(jié)果也反映了此情況,這雖然在一定程度上對研究造成了干擾,但并沒有妨礙對系統(tǒng)真實(shí)相變點(diǎn)的識別.
圖1 不同鏈長的 J1-J2海森伯自旋鏈系統(tǒng)基態(tài)與第一激發(fā)態(tài)能量隨J2/J1的變化 (a) N=8;(b) N=10;(c) N=12;(d) N=16Fig.1.Ground and first excited energy level diagram in J1-J2Heisenberg spin chain system with chain length:(a) N=8;(b) N=10;(c) N=12;(d) N=16.
采用無監(jiān)督學(xué)習(xí)識別分類點(diǎn)的方法為高斯混合模型(GMM),GMM 是單一高斯概率密度函數(shù)的延伸[22,23],一維高斯分布模型的概率密度函數(shù)為
其中μ為數(shù)據(jù)均值,σ 為數(shù)據(jù)標(biāo)準(zhǔn)差,多維高斯分布模型的概率密度函數(shù)如下:
其中μ為數(shù)據(jù)均值,∑為數(shù)據(jù)協(xié)方差,D為數(shù)據(jù)維度.
GMM 是由K個單高斯模型組合而成的模型,其概率密度函數(shù)為
其中πk為混合系數(shù),滿足
GMM 類似于聚類,每一個高斯模型可以看作一種類別,輸入一個樣本,即可通過高斯概率密度函數(shù)計算其值,然后通過比較其屬于每個高斯模型的概率大小來判斷高斯模型的類別.使用GMM是因?yàn)楦咚狗植季邆浜芎玫奈锢硇再|(zhì)以及良好的計算性能.
先通過GMM 找到分類點(diǎn),然后通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)一步驗(yàn)證該點(diǎn)是否為相變點(diǎn).CNN包括:輸入層、卷積層、池化層、全連接層和輸出層.數(shù)據(jù)集進(jìn)入網(wǎng)絡(luò)與卷積層多個卷積核卷積生成特征圖,池化層對特征圖下采樣,生成新特征圖,全連接層將池化層生成的多個特征圖融合、分類,輸出分類結(jié)果.
本文采用的CNN 共包含5 層[24,25],第1 層為輸入層,輸入數(shù)據(jù)為一維反鐵磁海森伯模型的態(tài)矢量,第2 層為卷積層(卷積核大小為4× 4),卷積后生成16 個大小為2N/2× 2N/2的特征圖(本文采用Relu 激活函數(shù)).第3 層是池化層,采用最大池化操作(采樣窗口大小為2× 2,步長為2),所以輸出特征圖尺寸減半,即此刻特征圖大小為2N/4×2N/4,但特征圖數(shù)量仍為16 個,池化層的輸出數(shù)據(jù)展為一維矢量后輸入第4 層全連接層(神經(jīng)元個數(shù)設(shè)置為128).為了避免系統(tǒng)參數(shù)更新過快導(dǎo)致過擬合,本文在全連接層添加了dropout (dropout率設(shè)為0.5),全連接層輸出數(shù)據(jù)輸入第5 層輸出層,輸出層神經(jīng)元個數(shù)設(shè)置為n(n為類別數(shù),選取的訓(xùn)練數(shù)據(jù)為無監(jiān)督學(xué)習(xí)得到的分類點(diǎn)兩側(cè)的數(shù)據(jù),采用獨(dú)熱編碼(one-hot)將分類點(diǎn)一側(cè)的訓(xùn)練數(shù)據(jù)標(biāo)記為0,另一側(cè)標(biāo)記為1,因此本文n為2),激活函數(shù)采用softmax 函數(shù)[11],表達(dá)式為
為了得到泛化能力較好的模型,采用交叉驗(yàn)證的策略.在交叉驗(yàn)證中,將樣本集隨機(jī)劃分為10等份,使用其中的1 份作為驗(yàn)證集而其余9 份作為訓(xùn)練集,通過正確率和交叉熵?fù)p失函數(shù)來衡量模型對于未知樣本的預(yù)測能力.
采用遠(yuǎn)離相變點(diǎn)的訓(xùn)練集和驗(yàn)證集數(shù)據(jù)來訓(xùn)練和評估模型,使用訓(xùn)練好的模型對測試數(shù)據(jù)進(jìn)行預(yù)測.
使用J2/J1∈[0,1)(鏈長N=16 的取J2/J1∈[0,0.53),因?yàn)槿2/J1∈[0,1)會優(yōu)先識別隨系統(tǒng)尺寸變化而改變的相變點(diǎn)J2/J1=0.534)的海森伯J1-J2模型基態(tài)態(tài)矢量作為訓(xùn)練集,生成n為2 的GMM,再用該模型對海森伯J1-J2模型基態(tài)態(tài)矢量分類,得到如圖2(a)所示的分類結(jié)果,可以看出J2/J1=0.5 是它的一個分類點(diǎn),其不隨系統(tǒng)尺寸變化而改變.
接下來采用稍微遠(yuǎn)離J2/J1=0.5 的數(shù)據(jù)集作為訓(xùn)練集和驗(yàn)證集,對該點(diǎn)是否是相變點(diǎn)進(jìn)一步驗(yàn)證.我們采用標(biāo)記分別為0(采用one-hot 編碼)的J2/J1∈[0.35,0.45)和為1 的J2/J1∈[0.55,0.65)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù)和驗(yàn)證數(shù)據(jù)(鏈長N=16的取J2/J1∈[0.51,0.61),因?yàn)槿2/J1∈[0.55,0.65)會識別隨系統(tǒng)尺寸變化而改變的J2/J1=0.534 相變點(diǎn)),訓(xùn)練CNN 模型.之后使用該模型對海森伯J1-J2模型基態(tài)態(tài)矢量進(jìn)行預(yù)測,預(yù)測結(jié)果如圖2(b)所示,發(fā)現(xiàn)神經(jīng)元輸出在J2/J1=0.5 處發(fā)生跳變,接下來采用標(biāo)記分別為0 的J2/J1∈[0.3,0.4)和為1 的J2/J1∈[0.55,0.65)的基態(tài)態(tài)矢量和標(biāo)記分別為0 的J2/J1∈[0.2,0.3)和為1 的J2/J1∈[0.55,0.65)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),分別訓(xùn)練兩個CNN 模型,再用模型對基態(tài)態(tài)矢量進(jìn)行預(yù)測,預(yù)測結(jié)果如圖2(c)和圖2(d)所示,發(fā)現(xiàn)前后使用不同訓(xùn)練數(shù)據(jù)集訓(xùn)練的CNN 對測試數(shù)據(jù)集的預(yù)測結(jié)果幾乎沒有發(fā)生變化,因此,基本就能確定J2/J1=0.5 為該系統(tǒng)相變點(diǎn).這樣就在沒有任何先驗(yàn)知識,不知道系統(tǒng)哈密頓量,能量的條件下從基態(tài)態(tài)矢量中直接找到了J1-J2海森伯自旋鏈系統(tǒng)的一階相變點(diǎn).
圖2 (a) 訓(xùn)練數(shù)據(jù)為J2/J1∈ [0,1)的海森伯J1-J2模型基態(tài)矢量生成的GMM 對基態(tài)矢量的分類結(jié)果;(b)采用標(biāo)記為0 的J2/J1∈[0.35,0.45)和為1 的J2/J1∈ [0.55,0.65);(c)標(biāo)記為0 的J2/J1∈ [0.3,0.4)和為1 的J2/J1∈ [0.55,0.65);(d)標(biāo)記為0 的J2/J1∈ [0.2,0.3)和為1 的J2/J1∈ [0.55,0.65)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練所得的CNN 模型對基態(tài)態(tài)矢量的預(yù)測結(jié)果Fig.2.(a) Ground state vector classification results of the GMM generated by the Heisenberg J1-J2model ground state vector with the training data of J2/J1∈ [0,1);(b) using the ground state vector of J2/J1∈ [0.35,0.45) marked as 0 and J2/J1∈ [0.55,0.65)marked as 1;(c) J2/J1∈ [0.3,0.4) marked as 0 and J2/J1∈ [0.55,0.65) marked as 1;(d) J2/J1∈ [0.2,0.3) marked as 0 and J2/J1∈[0.55,0.65) marked as 1 as training data,the prediction results of the ground state vector by the trained convolutional neural network model.
同樣使用J2/J1∈[0,0.5)的海森伯J1-J2模型基態(tài)態(tài)矢量作為訓(xùn)練集(GMM 模型給出的不同鏈長的分類點(diǎn)不盡相同,但其結(jié)果基本一樣,所以僅以鏈長N=10 的態(tài)矢量的分類結(jié)果為例進(jìn)行討論),生成n=2 的GMM,再用該模型對海森伯J1-J2模型基態(tài)態(tài)矢量分類,得到如圖3(a)所示的分類結(jié)果,其在J2/J1=0.305 處出現(xiàn)分類點(diǎn).然后,分別采用標(biāo)記分別為0 的J2/J1∈[0.25,0.3)和為1 的J2/J1∈[0.35,0.4)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),采用標(biāo)記分別為0 的J2/J1∈[0.2,0.25)和為1 的J2/J1∈[0.35,0.4)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),和采用標(biāo)記分別為0 的J2/J1∈[0.2,0.25)和為1 的J2/J1∈[0.35,0.4)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù)(標(biāo)記為1 的數(shù)據(jù)是標(biāo)記為0 數(shù)據(jù)的5 倍),分別訓(xùn)練3 個CNN 模型,之后使用模型對系統(tǒng)基態(tài)的態(tài)矢量進(jìn)行預(yù)測,預(yù)測結(jié)果如圖3(b)—(d)所示.可以看出,CNN 給出的分類點(diǎn)隨訓(xùn)練數(shù)據(jù)集數(shù)據(jù)的變化而發(fā)生改變,不能給出確定的相變點(diǎn),因此不能通過該方法從基態(tài)態(tài)矢量中找到無窮階相變點(diǎn),但能夠有效排除無監(jiān)督學(xué)習(xí)給出的假的相變點(diǎn).
圖3 (a) 訓(xùn)練數(shù)據(jù)為J2/J1∈ [0,0.5)的海森伯J1-J2模型基態(tài)態(tài)矢量生成的GMM 對基態(tài)態(tài)矢量的分類結(jié)果;(b) 分別為采用標(biāo)記為0 的J2/J1∈ [0.25,0.3)和為1 的J2/J1∈ [0.35,0.4);(c)標(biāo)記為0 的J2/J1∈ [0.2,0.25)和為1 的J2/J1∈ [0.35,0.4);(d)標(biāo)記為0 的J2/J1∈ [0.2,0.25)和為1 的J2/J1∈ [0.35,0.4)(標(biāo)記為1 的數(shù)據(jù)是標(biāo)記為0 的5 倍)的基態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練所得的CNN 模型對基態(tài)態(tài)矢量的預(yù)測結(jié)果Fig.3.(a) Ground state vector classification results of the GMM generated by the Heisenberg J1-J2model ground state vector with the training data of J2/J1∈ [0,0.5);(b) respectively usingthe ground state vector of J2/J1∈ [0.25,0.3) marked as 0 and J2/J1∈ [0.35,0.4) marked as 1;(c) J2/J1∈ [0.2,0.25) marked as 0 and J2/J1∈ [0.35,0.4) marked as 1;(d) J2/J1∈ [0.2,0.25) marked as 0 and J2/J1∈ [0.35,0.4) marked as 1 (the data marked as 1 is 5 times as much as the data marked as 0)as training data,the prediction results of the ground state vector by the trained convolutional neural network model.
同樣,使用J2/J1∈[0,1)的海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練集,生成n為2 的GMM,再用該模型對海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量分類,得到如圖4(a)所示的分類結(jié)果,可以觀察到J2/J1=0.24和J2/J1=0.5 可能是它的相變點(diǎn).接下來,采用稍微遠(yuǎn)離J2/J1=0.5 數(shù)據(jù)集作為訓(xùn)練集和驗(yàn)證集,對該點(diǎn)是否是相變點(diǎn)進(jìn)一步驗(yàn)證.采用標(biāo)記分別為0 的J2/J1∈[0.35,0.45)和為1 的J2/J1∈[0.55,0.65)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),采用標(biāo)記分別為0 的J2/J1∈[0.3,0.4)和為1 的J2/J1∈[0.55,0.65)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),和采用標(biāo)記分別為0 的J2/J1∈[0.35,0.45)和為1 的J2/J1∈[0.55,0.65)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù)(標(biāo)記為0 的數(shù)據(jù)是標(biāo)記為1 數(shù)據(jù)的5 倍),分別訓(xùn)練CNN 模型,訓(xùn)練得到的3 個CNN 模型預(yù)測結(jié)果如圖4(b)—(d)所示,發(fā)現(xiàn)訓(xùn)練好的CNN 可以從測試數(shù)據(jù)中精確找到一階相變點(diǎn),且其對測試數(shù)據(jù)集的預(yù)測結(jié)果幾乎沒有發(fā)生變化,由此,也可以通過第一激發(fā)態(tài)態(tài)矢量數(shù)據(jù),在沒有任何先驗(yàn)知識,不知道系統(tǒng)哈密頓量,能量的條件下,確定J2/J1=0.5 為J1-J2海森伯自旋鏈系統(tǒng)相變點(diǎn).
圖4 (a) 訓(xùn)練數(shù)據(jù)為J2/J1∈ [0,1)的海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量生成的GMM 對第一激發(fā)態(tài)態(tài)矢量的分類結(jié)果;(b)分別為采用標(biāo)記為0 的J2/J1∈ [0.35,0.45)和為1 的J2/J1∈ [0.55,0.65);(c)標(biāo)記為0 的J2/J1∈ [0.3,0.4)和為1 的J2/J1∈ [0.55,0.65);(d)標(biāo)記為0 的J2/J1∈ [0.35,0.45)和為1 的J2/J1∈ [0.55,0.65) (標(biāo)記為1 的數(shù)據(jù)是標(biāo)記為0 的5 倍)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練所得的CNN 模型對第一激發(fā)態(tài)態(tài)矢量的預(yù)測結(jié)果Fig.4.(a) The first excited state vector classification results of the GMM generated by the Heisenberg J1-J2model first excited state vector with the training data of J2/J1 ∈ [0,1);(b) using the first excited state vector of J2/J1∈ [0.35,0.45) marked as 0 and J2/J1∈ [0.55,0.65) marked as 1;(c) J2/J1∈ [0.3,0.4) marked as 0 and J2/J1∈ [0.55,0.65) marked as 1;(d) J2/J1∈ [0.35,0.45)marked as 0 and J2/J1∈ [0.55,0.65) marked as 1 (the data marked as 1 is 5 times as much as the data marked as 0)as training data,the prediction results of the first excited state vector by the trained convolutional neural network model.
同樣,采用稍微遠(yuǎn)離J2/J1=0.24 數(shù)據(jù)集作為訓(xùn)練集和驗(yàn)證集,對該點(diǎn)是否是相變點(diǎn)進(jìn)一步驗(yàn)證.采用標(biāo)記分別為0 的J2/J1∈[0.1,0.2)和為1的J2/J1∈[0.3,0.4)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練CNN 模型,再用訓(xùn)練好的CNN 模型對海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量的類別進(jìn)行預(yù)測,預(yù)測結(jié)果如圖5(a)所示,我們發(fā)現(xiàn)訓(xùn)練好的CNN 可以從測試數(shù)據(jù)中精確找到無窮階相變點(diǎn),接著我們又采用標(biāo)記分別為0(的J2/J1∈[0,0.1)和為1 的J2/J1∈[0.3,0.4)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練CNN 模型.再用訓(xùn)練好的CNN模型對海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量的類別進(jìn)行預(yù)測,預(yù)測結(jié)果如圖5(b)所示,發(fā)現(xiàn)訓(xùn)練好的CNN 對測試數(shù)據(jù)集的預(yù)測結(jié)果幾乎沒有發(fā)生任何變化.由此基本就能確定J2/J1=0.24 為J1-J2海森伯自旋鏈系統(tǒng)相變點(diǎn).這樣就在沒有任何先驗(yàn)知識,不知道系統(tǒng)哈密頓量,能量的條件下從第一激發(fā)態(tài)態(tài)矢量中找到了該系統(tǒng)無窮階相變點(diǎn).
圖5 (a)采用標(biāo)記為0 的J2/J1∈ [0.1,0.2),標(biāo)記為1 的J2/J1∈ [0.3,0.4);(b)標(biāo)記為0 的J2/J1∈ [0,0.1),標(biāo)記為1 的J2/J1∈ [0.3,0.4)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練所得的CNN 模型對第一激發(fā)態(tài)態(tài)矢量的預(yù)測結(jié)果Fig.5.(a) Using the first excited state vector of J2/J1∈ [0.1,0.2) marked as 0 and J2/J1∈ [0.3,0.4) marked as 1;(b)J2/J1∈ [0,0.1)marked as 0 and J2/J1∈ [0.3,0.4) marked as 1 as training data,the prediction results of the first excited state vector by the trained convolutional neural network model.
使用J2/J1∈[0,0.24)的海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練集(GMM 模型給出的不同鏈長的分類點(diǎn)不盡相同,但其結(jié)果基本一樣,所以僅討論鏈長N=10 的態(tài)矢量的分類結(jié)果),生成n為2 的GMM,再用該模型對海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量分類,得到如圖6(a)所示的分類結(jié)果,可以觀察到J2/J1=0.125 可能是該模型的相變點(diǎn).采用標(biāo)記分別為0 的J2/J1∈[0.05,0.1)和1 的J2/J1∈[0.15,0.2)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),采用標(biāo)記分別為0 的J2/J1∈[0,0.05)和1 的J2/J1∈[0.15,0.2)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),分別訓(xùn)練CNN 模型,訓(xùn)練得到的兩個CNN 模型對測試集的預(yù)測結(jié)果如圖6(b),圖6(c)所示,我們觀察得到CNN 模型的預(yù)測結(jié)果在J2/J1∈[0,0.24)區(qū)域內(nèi)未出現(xiàn)明顯的間斷點(diǎn),且預(yù)測結(jié)果隨訓(xùn)練數(shù)據(jù)集的變化發(fā)生改變,因此J2/J1=0.125不是該模型的相變點(diǎn).說明監(jiān)督學(xué)習(xí)能夠有效排除無監(jiān)督學(xué)習(xí)模型提供的假相變點(diǎn),有效提高僅通過機(jī)器學(xué)習(xí)找系統(tǒng)相變點(diǎn)的準(zhǔn)確率.
使用J2/J1∈[0.25,0.5)的海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練集,生成n為2 的GMM,再用該模型對海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量分類,得到如圖6(d)所示的分類結(jié)果,可以觀察到J2/J1=0.385 可能是該模型的相變點(diǎn).仍采用上述方法,使用不同訓(xùn)練數(shù)據(jù)分別訓(xùn)練CNN 模型,用訓(xùn)練所得的CNN 模型對測試集進(jìn)行預(yù)測,同樣可觀察得到CNN 模型的預(yù)測結(jié)果在J2/J1∈[0.25,0.5)區(qū)域內(nèi)未出現(xiàn)明顯的間斷點(diǎn),且預(yù)測結(jié)果隨訓(xùn)練數(shù)據(jù)集的變化發(fā)生改變,因此J2/J1=0.385 不是該模型的相變點(diǎn).
圖6 (a) 訓(xùn)練數(shù)據(jù)為J2/J1∈ [0,0.24)的海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量生成的GMM 對第一激發(fā)態(tài)態(tài)矢量的分類結(jié)果;(b),(c)分別為采用標(biāo)記為0 的J2/J1∈ [0.05,0.1)和為1 的J2/J1∈ [0.15,0.2);標(biāo)記為0 的J2/J1∈ [0,0.05)和為1 的J2/J1∈ [0.15,0.2)的第一激發(fā)態(tài)態(tài)矢量作為訓(xùn)練數(shù)據(jù),訓(xùn)練所得的CNN 模型對第一激發(fā)態(tài)態(tài)矢量的預(yù)測結(jié)果;(d) 訓(xùn)練數(shù)據(jù)為J2/J1∈ [0.25,0.5)的海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量生成的GMM 對第一激發(fā)態(tài)態(tài)矢量的分類結(jié)果Fig.6.(a) The first excited state vector classification results of the GMM generated by the Heisenberg J1-J2model first excited state vector with the training data of J2/J1 ∈ [0,0.24);(b) (c) respectively using the first excited state vector of J2/J1∈ [0.05,0.1)marked as 0 and J2/J1∈ [0.15,0.2) marked as 1;J2/J1∈ [0,0.05) marked as 0 and J2/J1∈ [0.15,0.2) marked as 1 as training data,the prediction results of the first excited state vector by the trained convolutional neural network model;(d) he first excited state vector classification results of the GMM generated by the Heisenberg J1-J2model first excited state vector with the training data of J2/J1∈ [0.25,0.5).
采用線性函數(shù)歸一化方法將態(tài)矢量里的值都轉(zhuǎn)換到[0,255]的范圍,公式為
將得到的每一個數(shù)據(jù)轉(zhuǎn)換為2N/2× 2N/2(N為鏈長,本文N=10)的灰度圖(全黑為0,全白為255).
J2/J1=0.44,0.49,0.51,0.58 的基態(tài)態(tài)矢量灰度圖如圖7所示,觀察發(fā)現(xiàn)基態(tài)矢量灰度圖在相變點(diǎn)前和相變點(diǎn)后都變化緩慢,但在相變點(diǎn)前后發(fā)生了突變.第一激發(fā)態(tài)態(tài)矢量灰度圖如圖8所示,觀察得到第一激發(fā)態(tài)態(tài)矢量灰度圖在無窮極相變點(diǎn)和一階相變點(diǎn)前后也都發(fā)生了突變.由此能通過態(tài)矢量灰度圖直接觀測到一維次近鄰海森伯J1-J2模型的相變點(diǎn).機(jī)器學(xué)習(xí)方法也正是因?yàn)槟芴崛〕鰬B(tài)矢量這些特征信息的變化,才能夠有效找到相變點(diǎn).
圖7 海森伯 J1-J2模型基態(tài)態(tài)矢量變換而來的灰度圖 (a) J2/J1=0.44;(b) J2/J1=0.49;(c) J2/J1=0.51;(d) J2/J1=0.58Fig.7.Gray scale images transformed from the ground state vector of the Heisenberg J1-J2model:(a) J2/J1=0.44;(b) J2/J1=0.49;(c) J2/J1=0.51;(d) J2/J1=0.58.
圖8 海森伯J1-J2模型第一激發(fā)態(tài)態(tài)矢量變換而來的灰度圖 (a) J2/J1=0.24;(b) J2/J1=0.25;(c) J2/J1=0.49;(d) J2/J1=0.51Fig.8.Gray scale images transformed from the first excited state vector of the Heisenberg J1-J2model:(a) J2/J1=0.24;(b) J2/J1=0.25;(c) J2/J1=0.49;(d) J2/J1=0.51.
本文將無監(jiān)督學(xué)習(xí)與監(jiān)督學(xué)習(xí)結(jié)合起來,從一維次近鄰海森伯J1-J2模型的基態(tài)中找到了該模型的一階相變點(diǎn),從第一激發(fā)態(tài)不僅找到了一階相變點(diǎn),還找到了無窮階相變點(diǎn),間接說明了第一激發(fā)態(tài)可能比基態(tài)蘊(yùn)含更多信息,將態(tài)矢量可視化說明了機(jī)器學(xué)習(xí)算法的可靠性.
研究結(jié)果表明,機(jī)器學(xué)習(xí)能夠在沒有任何先驗(yàn)知識、不知道系統(tǒng)哈密頓量、能量的條件下,直接從龐大的態(tài)矢量樣本集合中找出一些可能存在的相變點(diǎn),這可能為研究未知系統(tǒng)時提供一些幫助;監(jiān)督學(xué)習(xí)能夠?qū)o監(jiān)督學(xué)習(xí)給出的相變點(diǎn)加以驗(yàn)證,去除假的相變點(diǎn).
由于本文僅研究了一維海森伯J1-J2模型,此方法的魯棒性和推廣能力還未知,需要進(jìn)一步研究.