李峻屹
(陜西警官職業(yè)學(xué)院 信息技術(shù)系, 陜西 西安 710021)
偏微分方程在物理化學(xué)、金融、工程等領(lǐng)域都有非常廣泛的應(yīng)用.但是針對(duì)實(shí)際應(yīng)用問(wèn)題,方程往往不存在解析解.因此對(duì)偏微分方程進(jìn)行數(shù)值求解,傳統(tǒng)的數(shù)值計(jì)算方法如有限差分方法[1,2]、有限體積方法[3,4]、有限元方法等[5,6],這類(lèi)方法嚴(yán)格依賴(lài)于網(wǎng)格的屬性.但在許多情況下生成網(wǎng)格非常耗時(shí),特別是對(duì)于復(fù)雜區(qū)域.為了解決這一困難,學(xué)者們提出了各種無(wú)網(wǎng)格方法.如無(wú)網(wǎng)格局部Petrov-Galerkin,光滑粒子流體動(dòng)力學(xué)方法[7]等,但是都伴隨著耗時(shí)間、計(jì)算量大等棘手問(wèn)題.
隨著可用數(shù)據(jù)和計(jì)算資源的爆炸性增長(zhǎng),機(jī)器學(xué)習(xí)和數(shù)據(jù)分析的最新進(jìn)展已經(jīng)在不同的科學(xué)學(xué)科中產(chǎn)生了革命性的結(jié)果,包括圖像識(shí)別、自然語(yǔ)言處理、認(rèn)知科學(xué)和基因組學(xué).然而,在分析復(fù)雜的物理、生物或工程系統(tǒng)的過(guò)程中,數(shù)據(jù)采集的成本往往過(guò)高,不可避免地面臨著在部分信息下得出結(jié)論和做出決策的挑戰(zhàn).在這種小數(shù)據(jù)區(qū)域中,絕大多數(shù)最先進(jìn)的機(jī)器學(xué)習(xí)技術(shù)(例如,深度/卷積/遞歸神經(jīng)網(wǎng)絡(luò))缺乏魯棒性,無(wú)法提供任何收斂保證.訓(xùn)練一個(gè)深度學(xué)習(xí)算法,從幾個(gè)潛在的非常高維的輸入和輸出數(shù)據(jù)對(duì)中準(zhǔn)確地識(shí)別非線(xiàn)性映射的任務(wù)看起來(lái)是不可行的.
為了使這一任務(wù)變得可處理,在許多與物理和生物系統(tǒng)建模有關(guān)的案例中,存在著大量的先驗(yàn)知識(shí),可以將這種結(jié)構(gòu)化的先驗(yàn)信息編碼到學(xué)習(xí)算法中,即能夠放大和充分利用所看到數(shù)據(jù)的信息內(nèi)容,使算法能夠快速地尋找到最優(yōu)的解決方案,并且即使在只有少數(shù)先驗(yàn)信息的情況下,也能夠很好地利用.結(jié)構(gòu)化先驗(yàn)信息構(gòu)建具有物理信息的高效的學(xué)習(xí)算法已經(jīng)在[8-10]中有所體現(xiàn).除此之外,也可使用高斯過(guò)程回歸[11]設(shè)計(jì)適合于給定線(xiàn)性算子的函數(shù)表示,并且能夠精確地推斷解并提供不確定性估計(jì).
在更新的研究中,Raissi等[12,13]在推理和系統(tǒng)辨識(shí)的背景下提出了對(duì)非線(xiàn)性問(wèn)題的擴(kuò)展.盡管高斯過(guò)程在編碼先驗(yàn)信息方面具有靈活性,但非線(xiàn)性問(wèn)題的處理引入了兩個(gè)重要的局限性.
首先,在文獻(xiàn)[12,13]中,必須在時(shí)間上局部線(xiàn)性化任何非線(xiàn)性項(xiàng),從而限制了所提出的方法在離散時(shí)間域的適用性,并在強(qiáng)非線(xiàn)性區(qū)域中損害了其預(yù)測(cè)的準(zhǔn)確性.
其次,高斯過(guò)程回歸的貝葉斯性質(zhì)需要某些先驗(yàn)假設(shè),這些假設(shè)可能會(huì)限制模型的表示能力,并導(dǎo)致魯棒性問(wèn)題,尤其是對(duì)于非線(xiàn)性問(wèn)題[14].而Stokes 問(wèn)題的算法研究作為流體力學(xué)中十分活躍的一個(gè)研究方向。受文獻(xiàn)[15]的啟發(fā),本文主要研究通過(guò)PINN結(jié)合先驗(yàn)物理知識(shí)求解Stokes問(wèn)題,用數(shù)值算例驗(yàn)證本文所采用方法的有效性及高效性.
眾所周知,求解偏微分方程的數(shù)值方法有很多,如有限差分法、有限元法、譜法等,但這些方法都需要在偏微分方程的平面區(qū)域或者立體表面建立網(wǎng)格,這對(duì)于高維問(wèn)題是復(fù)雜甚至不可能的.然而,除了傳統(tǒng)的數(shù)值計(jì)算方法,無(wú)網(wǎng)格數(shù)值方法如徑向基函數(shù)法,已經(jīng)被證明是不穩(wěn)定的[16].
隨著神經(jīng)網(wǎng)絡(luò)的發(fā)展,卷積神經(jīng)網(wǎng)絡(luò)、DGM、生成式對(duì)抗網(wǎng)絡(luò)等深度學(xué)習(xí)方法的應(yīng)用越來(lái)越廣泛,例如,在圖像處理領(lǐng)域、工程仿真領(lǐng)域、衛(wèi)星圖像檢測(cè)領(lǐng)域等.然而,在具體操作中,如文獻(xiàn)[17]所示,正弦函數(shù)始終是最好的激活函數(shù).在這種情況下,PINNs的輸出可以理解為解的廣義Fourier級(jí)數(shù)近似.訓(xùn)練過(guò)程實(shí)際上是求廣義Fourier近似的最小二乘解.因此,最小二乘Fourier近似的穩(wěn)定性和精度理論可以部分地解釋PINNs的穩(wěn)定性和精確性,這一點(diǎn)已經(jīng)在的大量實(shí)驗(yàn)中得到了證明.
本文利用PINNs作為通用函數(shù)逼近器,其基本結(jié)構(gòu)如圖1所示.即可以在不進(jìn)行局部線(xiàn)性化的情況下,直接處理非線(xiàn)性問(wèn)題.根據(jù)神經(jīng)網(wǎng)絡(luò)的輸入坐標(biāo)和模型參數(shù)來(lái)區(qū)分以獲得具有一定物理先驗(yàn)信息的神經(jīng)網(wǎng)絡(luò).約束這類(lèi)神經(jīng)網(wǎng)絡(luò)以遵守任何對(duì)稱(chēng)性、不變性或源自控制觀測(cè)數(shù)據(jù)的物理定律,其一般由非定常非線(xiàn)性偏微分方程所描述.這種簡(jiǎn)單而強(qiáng)大的結(jié)構(gòu)使我們能夠解決計(jì)算科學(xué)中的一系列問(wèn)題,如本文提出使用具有先驗(yàn)信息的PINNs求解非定常Stokes問(wèn)題并在后面給出數(shù)值算例.
圖1 神經(jīng)網(wǎng)絡(luò)示意圖
本文應(yīng)用PINNs對(duì)二維非定常Stokes方程進(jìn)行求解,進(jìn)一步證明深度學(xué)習(xí)求解偏微分方程的可行性和有效性.通過(guò)將方程真解攜帶的先驗(yàn)信息作為神經(jīng)網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練,在一定程度上避免了初始樣本選擇的盲目性.圖2給出了本文所用算法的流程圖.
圖2 算法流程圖
在流體力學(xué)中,由黏性不可壓縮流體的動(dòng)量守恒方程可以得到Navier-Stokes方程.但由于其中包含了非線(xiàn)性項(xiàng),通常情況下很難求解.因此可根據(jù)實(shí)際情況,對(duì)模型進(jìn)行簡(jiǎn)化.對(duì)于液滴在黏性流體中運(yùn)動(dòng)這一類(lèi)問(wèn)題,由于雷諾系數(shù)小,可以用Stokes方程來(lái)描述.設(shè)Ω是屬于Rd(d=2,3,…)的有界子集,?Ω為Dirichlet邊界,ΩT表示[0,T]×Ω;考慮如下二維非定常Stokes問(wèn)題:
ut-v2u+p=f,
(1)
(2)
u|?ΩT=0,
(3)
u|t=0=0.
(4)
在本文中,d=2,u=u(t,x,y)=(u1,u2),p=p(t,x,y)分別表示速度和壓力,f為右端項(xiàng).其中式(2)稱(chēng)為不可壓縮條件,式(3)和(4)分別表示邊界條件和初始條件.T=(0,20],(x,y)=[1,8]×[-2,2].
(5)
式(5)中:N表示樣本個(gè)數(shù),U表示神經(jīng)網(wǎng)絡(luò)解,u表示真解.
本文使用每層具有20個(gè)神經(jīng)元的PINNs網(wǎng)絡(luò)對(duì)非定常Stokes問(wèn)題進(jìn)行求解,通過(guò)計(jì)算真解與逼近解之間的誤差定義收斂函數(shù).通過(guò)設(shè)置固定迭代次數(shù)或者滿(mǎn)足收斂條件來(lái)終止訓(xùn)練.通過(guò)式(5)計(jì)算真解與逼近解之間的L2誤差,本文只計(jì)算速度,壓力類(lèi)似,因此在本文中不多做贅述.
表1列出了不同網(wǎng)絡(luò)層數(shù)及不同時(shí)間刻度下,真解速度u與神經(jīng)網(wǎng)絡(luò)解U的L2誤差。本文將每個(gè)時(shí)間點(diǎn)中最優(yōu)異的結(jié)果標(biāo)黑.可以看出,隨著層數(shù)的增加真解與逼近解之間的誤差逐漸收斂到一個(gè)穩(wěn)定的數(shù)量級(jí)上,并且能夠在不同的時(shí)間上保持收斂.
圖3~8給出了在1個(gè)、3個(gè)和8個(gè)隱層下PINNs對(duì)速度u1和u2的逼近性能,更準(zhǔn)確和生動(dòng)地反映出了表1的信息.進(jìn)一步說(shuō)明了PINNs求解非定常Stokes問(wèn)題的有效性和高效性.
表1 真解速度u與神經(jīng)網(wǎng)絡(luò)解U的L2誤差
(a)u (b)U
(c)ERRL2圖3 u1的L2誤差圖(1個(gè)隱層)
(a)u (b)U
(c)ERRL2圖4 u1的L2誤差圖(3個(gè)隱層)
(a)u (b)U
(c)ERRL2圖5 u1的L2誤差圖(8個(gè)隱層)
(a)u (b)U
(c)ERRL2圖6 u2的L2誤差圖(1個(gè)隱層)
(a)u (b)U
(c)ERRL2圖7 u2的L2誤差圖(3個(gè)隱層)
(a)u (b)U
(c)ERRL2圖8 u2的L2誤差圖(8個(gè)隱層)
本文利用 PINN求解Stokes問(wèn)題,通過(guò)網(wǎng)絡(luò)優(yōu)化逼近真解與數(shù)值解之間的誤差,并通過(guò)數(shù)值模擬證明理論的可行性,為之后高維問(wèn)題的求解奠定了基礎(chǔ).