吳丹瀾 梁展弘 余懿 蔡博 鄭邦宏 王梓超 張紫玲
關(guān)鍵詞:物理神經(jīng)網(wǎng)絡(luò);機器學(xué)習(xí);波動方程;救援;物理學(xué)
0引言
在當(dāng)今社會,由于全球氣候變化、生態(tài)環(huán)境破壞以及地殼運動活躍等因素的影響,自然災(zāi)害[1]的發(fā)生呈現(xiàn)出頻次增加、強度加劇的趨勢,包括地震[2]、洪水、臺風(fēng)、滑坡、森林火災(zāi)等多種災(zāi)害形式。這些災(zāi)害不僅對人民生命財產(chǎn)安全構(gòu)成嚴(yán)重威脅,而且對社會穩(wěn)定和經(jīng)濟發(fā)展也帶來了巨大挑戰(zhàn)。因此,在災(zāi)后救援工作中,如何快速、精準(zhǔn)地定位被困人員,提升傷員搜救效率,最大限度地減少因災(zāi)害造成的人員傷亡和經(jīng)濟損失,成為一個緊迫且重要的課題。
為實現(xiàn)這一目標(biāo),國家救援隊伍積極采用先進的科學(xué)技術(shù)手段,其中聲波類探測儀器在救援現(xiàn)場的應(yīng)用發(fā)揮了關(guān)鍵作用。這類儀器通常利用超聲波、地震波等物理原理,通過發(fā)送聲波并接收其反射信號來判斷廢墟下是否存在生存空間及生命跡象。它們能夠在復(fù)雜的環(huán)境下穿透障礙物,幫助救援人員確定被困者位置,極大地提高了搜救工作的成功率。
為進一步提升此類探測設(shè)備的效能,科研人員正著重于優(yōu)化波動方程求解算法的研究與應(yīng)用。波動方程是描述聲波或地震波傳播的基本數(shù)學(xué)模型,其精確求解有助于更準(zhǔn)確地模擬現(xiàn)實情況中的聲波傳播路徑和衰減特性,從而提高探測結(jié)果的精度。通過深度開發(fā)和應(yīng)用高精度的波動方程[3]數(shù)值計算方法,可以顯著增強聲波類探測儀器的功能性能,使得在面對各類自然災(zāi)害時,救援行動能夠更加迅速、高效,真正體現(xiàn)“時間就是生命”的救災(zāi)原則。
1我國目前的救援能力現(xiàn)狀
隨著全球氣候變化和人類活動的不斷增加,自然災(zāi)害的發(fā)生頻率和規(guī)模也在不斷擴大,而我國也面臨著越來越嚴(yán)峻的救援挑戰(zhàn)。
一般來說,在事故發(fā)生后,救援隊伍會立刻投入救援當(dāng)中,但因被困人員一般被埋在數(shù)米厚的泥土下,導(dǎo)致搜救工作面臨著巨大困難。而此時生命探測儀器則成為不可或缺的救援工具,像遇到滑坡、地震等災(zāi)害時,救援人員通常難以憑肉眼判斷被困人員的具體位置,但活著的人都有生命特征,身體會有溫度、呼吸、心跳,會產(chǎn)生二氧化碳?xì)怏w,而這些就是生命探測儀器判斷幸存者位置的依據(jù)。
針對不同體征,生命探測儀[4]可分為聲波探測儀、雷達探測儀、紅外探測儀、光學(xué)探測儀等不同種類。但這些裝備也有其局限性,如聲波探測儀無法區(qū)分人和其他動物,且會受到噪聲等干擾。
在聲波探測儀[5]中,捕獲聲波的震動通過波動方程去解析出是否為幸存者心跳、呼吸、移動等發(fā)出的微弱聲音,波動方程解的精確程度即可影響到儀器的精準(zhǔn)程度,改進波動方程可以從軟層面提高儀器的精確度。除此之外,改進波動方程也可以增加儀器對干擾聲波的抗干擾能力。生命探測儀的普及應(yīng)用不斷擴大,顯著提升了搜救工作的速度、準(zhǔn)確性以及安全性。與此同時,中國積極推動國家救援體系[6]的完善,加強了緊急救援裝備的建設(shè)。
1.1聲波檢測儀
在災(zāi)害救援中,聲波檢測儀器以其無損、快速、準(zhǔn)確的探測能力,為救援人員提供了重要的生命跡象信息和災(zāi)害現(xiàn)場的詳細(xì)情況。
首先,聲波檢測儀器通過發(fā)出聲波并接收反射回來的聲波,能夠探測到被掩埋或困在廢墟下的人員。
這種儀器能夠穿透混凝土、土壤、水等介質(zhì),為救援人員提供被困人員的準(zhǔn)確位置信息,從而加快救援速度,減少救援人員的盲目挖掘和搜尋時間。
其次,聲波檢測儀器還廣泛應(yīng)用于災(zāi)害現(xiàn)場的結(jié)構(gòu)安全監(jiān)測。在地震、泥石流等災(zāi)害發(fā)生后,建筑物和橋梁等結(jié)構(gòu)可能存在安全隱患。聲波檢測儀器通過檢測結(jié)構(gòu)內(nèi)部的損傷和裂縫,能夠評估結(jié)構(gòu)的穩(wěn)定性和安全性,為救援人員提供重要的決策依據(jù)。
而波動方程作為描述聲波傳播的基礎(chǔ)理論,對于理解和優(yōu)化聲波檢測儀的性能至關(guān)重要。通過深入研究波動方程及其在聲波傳播中的應(yīng)用,可以不斷優(yōu)化聲波檢測儀的性能,為災(zāi)害救援工作提供更準(zhǔn)確、可靠的技術(shù)支持。
2波動方程
2.1波動方程概念
波動方程或稱波方程(WaveEquation)是一種描述自然界中各種波動現(xiàn)象的二階線性偏微分方程,主要描述自然界中的各種波動現(xiàn)象[8],例如機械波,包括聲波、光波、引力波、無線電波、水波、和地震波[9]等。波動方程抽象自聲學(xué)、波動光學(xué)[10]、電磁學(xué)、電動力學(xué)、流體力學(xué)、廣義相對論[11]等領(lǐng)域。波動方程的一般形式為:
式(1)中,u是關(guān)于位置x和時間t的標(biāo)量函數(shù),表示波的位移或振幅;v是波的傳播速度,是一個常數(shù)。
波動方程的物理意義是:任意一點的加速度(即時間的二階導(dǎo)數(shù))與該點周圍的曲率(即位置的二階導(dǎo)數(shù))成正比,比例系數(shù)為波速的平方。這反映了波的傳播規(guī)律,即波是由局部的振動通過相鄰的點的相互作用而向外擴散的。
2.2一般求解波動方程相關(guān)方法
波動方程的求解方法有多種,如分離變量法[12]、特征線法[13]、傅里葉變換法[14]等,它們分別適用于不同的方程形式、初始條件和邊值條件。
1)分離變量法(SeparationofVariablesMethod)。
分離變量法是一種將偏微分方程化為常微分方程的方法。它的基本思想是將波動方程的解表示為兩個或多個變量的函數(shù)的乘積,例如y(x,t)=X(x)T(t),然后將這個形式代入波動方程。通過分離變量,得到兩個或多個常微分方程,分別求解這些常微分方程,再根據(jù)初始條件和邊界條件確定常數(shù),最后將各個分量的解疊加得到波動方程的解。這種方法僅適用于齊次邊界條件的情況,例如熱傳導(dǎo)方程、波動方程。
分離變量法的求解缺點是適用范圍有限,普適性不強。它不能適用于非齊次邊界條件的情況,也難以處理非線性或非均勻的波動方程。
2)特征線法(CharacteristicLineMethod)。特征線法是一種利用波動方程的特征方程來求解的方法。它的基本思想是找出一族曲線,在這族曲線上,波動方程退化為常微分方程。然后在這些曲線上求解波動方程,再將這些曲線上的解拼接起來得到整個區(qū)域上的解。這種方法適用于一階偏微分方程或可以化為一階偏微分方程的情況,例如波動方程的標(biāo)準(zhǔn)形式uξη=0,其中ξ=x+at,η=x-at。特征線法在非線性以及非均勻的波動方程求解中也存在一些問題,特征線可能會相交或斷裂,導(dǎo)致解的不連續(xù)或不唯一。此外,特征線法要求初始條件不是沿著特征線給定,否則會導(dǎo)致解的不確定或不存在。對于多維的波動方程,特征線法可能會涉及復(fù)雜的邊界條件,難以處理。
3)傅里葉變換法(FourierTransformMethod)。傅里葉變換法是一種將偏微分方程轉(zhuǎn)化為代數(shù)方程的方法。它的基本思想是將波動方程的解表示為傅里葉級數(shù)或傅里葉變換的形式,例如y(x,t)=∫Y(k,t)eikxdk,然后將這個形式代入波動方程。通過傅里葉變換,得到一個關(guān)于Y(k,t)的代數(shù)方程,求解這個代數(shù)方程,再通過傅里葉逆變換得到波動方程的解。
這種方法適用于非齊次邊界條件或無窮區(qū)域的情況。其缺點是需要對波動方程的解進行傅里葉變換和傅里葉逆變換,這可能會引入誤差或失真。對于非線性或非均勻的波動方程,傅里葉變換法可能不適用或難以實現(xiàn)。
3基于PINN的波動方程求解方法
3.1PINN基本原理及求解方法
波動方程是現(xiàn)代科學(xué)[15]和工程建設(shè)[16]領(lǐng)域中涉及較廣的自然物理問題。根據(jù)在科學(xué)研究和工程建設(shè)中的各類初始條件和邊界條件,可以將其抽象成以物理信息為特征的偏微分方程[17],并可以通過各類測量檢測手段獲取偏微分方程中相應(yīng)的物理數(shù)據(jù)[18]。這些物理數(shù)據(jù)信息可以用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)[19],從而求解或發(fā)現(xiàn)偏微分方程的解或參數(shù)。
PINN的核心思想是將偏微分方程的形式和參數(shù)作為神經(jīng)網(wǎng)絡(luò)的一部分,然后通過數(shù)據(jù)驅(qū)動的方式來訓(xùn)練神經(jīng)網(wǎng)絡(luò),使其能夠逼近偏微分方程的解,或者發(fā)現(xiàn)偏微分方程的參數(shù)。PINN可以用來處理一些傳統(tǒng)數(shù)值方法難以解決的復(fù)雜的非線性偏微分方程,或者一些缺乏足夠觀測數(shù)據(jù)的反問題。PINN也可以用來探索一些未知的物理規(guī)律[20]或現(xiàn)象,從數(shù)據(jù)中學(xué)習(xí)出微分方程的形式或系數(shù)。該研究基于PINN的求解物理學(xué)問題方法流程圖如圖1所示。
偏微分方程的物理信息可以用來指導(dǎo)神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)。物理信息的一般表現(xiàn)形式是偏微分方程特征的初始條件和邊值條件,以及偏微分方程的某些特殊形式。將偏微分方程的物理信息分為規(guī)律信息和數(shù)值信息,并提出通過調(diào)節(jié)不同的訓(xùn)練采樣平衡度和訓(xùn)練強度平衡度,以建立具有偏微分方程解的神經(jīng)網(wǎng)絡(luò),最終逼近偏微分方程的所有數(shù)值解。
1)PINN深度神經(jīng)網(wǎng)絡(luò)架構(gòu)(DeepNeuralNet?work,DNN)。多層次的神經(jīng)網(wǎng)絡(luò),也稱為深度神經(jīng)網(wǎng)絡(luò)(DNN),是深度學(xué)習(xí)的基礎(chǔ),本質(zhì)上是一種特征學(xué)習(xí)方法,在自然語言[21]和語音[22]、圖像識別[23]、圖像和視頻數(shù)據(jù)處理[24]、科學(xué)計算等領(lǐng)域效果明顯。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練一般使用DNN。DNN通常由多個神經(jīng)網(wǎng)絡(luò)層組成,包括輸入層、多個隱藏層和輸出層。每一層都包含多個神經(jīng)元,這些神經(jīng)元通過權(quán)重連接形成網(wǎng)絡(luò)。
在PINN中常用的神經(jīng)網(wǎng)絡(luò)是DNN,主要是因為DNN具有靈活性,具有強大的表示學(xué)習(xí)能力,可以靈活地學(xué)習(xí)和逼近復(fù)雜的非線性映射關(guān)系[25]。這使得它們適用于各種不同類型的問題,包括涉及物理方程的問題。DNN能夠自動學(xué)習(xí)數(shù)據(jù)的特征和模式,而PINN的目標(biāo)之一就是從數(shù)據(jù)中學(xué)習(xí)物理方程。深度神經(jīng)網(wǎng)絡(luò)的層次結(jié)構(gòu)使得它們能夠逐步提取和組合數(shù)據(jù)中的抽象特征,有助于更好地捕捉物理規(guī)律。在求解一維波動方程的時候證明了DNN的這兩個特點,對物理定律的結(jié)合也很好,使模型更好地適應(yīng)真實世界的復(fù)雜物理過程。
該研究認(rèn)為波動方程的求解過程如圖2所示。架構(gòu)圖的左側(cè)是一個DNN,它由2個輸入節(jié)點、4個隱藏層和1個輸出節(jié)點組成。輸入節(jié)點分別表示波動方程的自變量X和T,分別代表空間和時間。輸出節(jié)點表示波動方程的因變量u,代表波動的幅度。隱藏層是由40個節(jié)點構(gòu)成的全連接層,每層都使用了RectifiedLinearUnit(ReLU)作為激活函數(shù)。ReLU是一種常用的非線性激活函數(shù),使用ReLU的好處是其不存在梯度消失問題,可以提升神經(jīng)網(wǎng)絡(luò)的收斂速度,減少參數(shù)的相互依賴,緩解過擬合問題。
架構(gòu)圖的右側(cè)是3種不同的損失函數(shù),它們分別表示波動方程的物理約束[26]。PartialDifferentialEquationLoss(PEDLoss)表示偏微分方程的損失,它衡量了DNN輸出的U是否滿足波動方程的形式。BoundaryConditionsLoss(BCLoss)表示邊界條件的損失,它衡量了DNN輸出的U是否滿足波動方程的邊界條件。InitialConditionLoss(ICLoss)表示初始條件的損失,它衡量了DNN輸出的U是否滿足波動方程的初始條件。這三種損失函數(shù)都是基于平方誤差的,它們的和構(gòu)成了總的損失函數(shù),用于優(yōu)化DNN的參數(shù)。最后通過數(shù)據(jù)驅(qū)動方式訓(xùn)練神經(jīng)網(wǎng)絡(luò),實現(xiàn)損失函數(shù)輸出值的最小化。
2)波動方程代入PINN。在PINN中,物理方程通常被嵌入神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程中,以提高模型對物理系統(tǒng)行為的理解。根據(jù)以上論述,將波動方程代入PINN進行求解的步驟主要體現(xiàn)如下。
將式(1)波動方程的方程形式、規(guī)律信息和數(shù)值信息,構(gòu)建一個神經(jīng)網(wǎng)絡(luò),將該神經(jīng)網(wǎng)絡(luò)的空間坐標(biāo)定義為x和時間t為輸入,將輸出波函數(shù)的估計值u?(x,t)作為神經(jīng)網(wǎng)絡(luò)的輸出,然后將波動方程作為損失函數(shù)的一部分。該損失函數(shù)包括波動方程的結(jié)構(gòu)損失、邊值條件損失、初值條件損失和真實數(shù)據(jù)條件損失。波動方程對應(yīng)于時間二階導(dǎo)數(shù)和空間二階導(dǎo)數(shù),如式(2)所示:
隨后,需要收集有關(guān)系統(tǒng)行為的數(shù)據(jù),包括邊界條件和初始條件,并將這些數(shù)據(jù)運用到梯度下降或其他優(yōu)化算法以實現(xiàn)最小化損失函數(shù),從而調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù),得到波動方程最逼近的解。在這個過程中,需要用真解去驗證PINN的解集是否正確,由于真解表示波動方程u在空間x和時間t上的變化,在幾個時間戳上進行說明,分別是t在初始狀態(tài)、1s、2s、4s時的狀態(tài),可以看到u的波形如圖3~圖6所示。
將波動方程的一般形式代入PINN求解后的計算解,圖7所示。
其中,?2u為關(guān)于空間?x2和時間?t2的解函數(shù)。
波動方程描述了一維空間中的波動現(xiàn)象,其中u(x,t)是波函數(shù),表示波動在空間x和時間t上的變化。該方程表達了波動的傳播速度v對波動的空間和時間演化的影響。在常規(guī)波動方程的求解過程中,深度神經(jīng)網(wǎng)絡(luò)(DeepNeuralNetwork,DNN)的任務(wù)是學(xué)習(xí)函數(shù)u(x,y),使其滿足上述波動方程,并同時滿足初始條件和邊界條件。通過優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù),使得輸出的解盡可能地逼近真實的波動方程解。在圖7中,可以看出PINN解在t=0,1,2,4時的波形u(x,y)跟真解上對應(yīng)時刻的u的波形形狀是擬合的,說明PINN的訓(xùn)練效果和結(jié)果都是正確的。
3.2波動方程代入PINN實驗調(diào)試分析
波動方程是描述波動現(xiàn)象的一種偏微分方程,在改良聲波應(yīng)用上有很大的作用。根據(jù)上述解波動方程的理論,可以將其中的方程代入為聲波方程,聲波神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程等同于聲波傳播[27]的反問題。在地球物理學(xué)中,通過在地表激發(fā)地震波、記錄相應(yīng)的地震響應(yīng)信號、建立反問題模型并數(shù)值求解該問題來確定地下結(jié)構(gòu)的屬性。在聲波神經(jīng)網(wǎng)絡(luò)中,給定輸入和輸出層條件后,神經(jīng)網(wǎng)絡(luò)反問題的求解可以確定網(wǎng)絡(luò)結(jié)構(gòu)權(quán)重系數(shù)[28],這些系數(shù)的數(shù)量通常非常龐大[21]。根據(jù)聲波方程的特點修改其初始條件和邊界條件,將物理方程修改為聲學(xué)方程,確保正確計算聲學(xué)方程的各個導(dǎo)數(shù),并設(shè)置符合聲學(xué)問題求解需求的損失函數(shù)。
在實驗過程中,本研究添加了0.05的噪聲模擬真實數(shù)據(jù),然后構(gòu)建神經(jīng)網(wǎng)絡(luò),定義損失函數(shù),計算離散點之間的間隔,使用中心差分法計算偏導(dǎo)數(shù)和二階偏導(dǎo)數(shù),將得到的近似導(dǎo)數(shù)與聲波方程進行比較,最后輸出結(jié)果。在圖8中可以看出三個損失函數(shù)的折線圖現(xiàn)象。在相同條件下,初始條件(IC)、邊界條件(BC)、偏微分方程(PDE)三個損失函數(shù)的數(shù)據(jù)集數(shù)越多,則誤差越小,當(dāng)超過10000個例子時,誤差快速下降。
調(diào)整神經(jīng)網(wǎng)絡(luò)的結(jié)果,使其更好地擬合聲波方程,需要根據(jù)實際情況調(diào)整優(yōu)化器和超參數(shù),以及訓(xùn)練時長和迭代次數(shù),從而完成從波動方程到聲波方程的替換。
在實際實驗中,調(diào)試神經(jīng)網(wǎng)絡(luò)時選擇合適的隱藏層和每層的神經(jīng)元個數(shù)非常重要。這個過程需要不斷調(diào)試,并需要大量數(shù)據(jù)進行調(diào)整,以獲得理想的誤差值。在聲波方程替換波動方程中,最困難的部分是修改邊界條件,因為需要針對不同的場景進行不同的邊界修改。這是未來的研究方向,即如何自適應(yīng)地確定邊界條件。另外,由于邊界條件的影響,即使方程解的誤差很小,最終生成的解集也可能與實際解不對應(yīng)。表1顯示了神經(jīng)網(wǎng)絡(luò)調(diào)試數(shù)據(jù)。
ICLoss(初始條件損失)表示神經(jīng)網(wǎng)絡(luò)在模擬系統(tǒng)初始狀態(tài)(t=0時刻)時的誤差,通過比較神經(jīng)網(wǎng)絡(luò)在初始時刻的位移與真實初始條件值之間的均方誤差來計算。
BCLoss(邊界條件損失)表示神經(jīng)網(wǎng)絡(luò)在邊界上滿足約束條件的程度,通過比較神經(jīng)網(wǎng)絡(luò)在給定空間和時間邊界上的位移與真實邊界條件值之間的均方誤差來計算。
PDELoss(偏微分方程損失)表示神經(jīng)網(wǎng)絡(luò)在偏微分方程上的擬合誤差,即在系統(tǒng)內(nèi)部滿足物理方程的程度,通過比較神經(jīng)網(wǎng)絡(luò)在隨機采樣點上滿足偏微分方程的程度,即通過比較波動方程的時間和空間偏導(dǎo)數(shù)之間的均方誤差來計算。
這三個損失項的綜合構(gòu)成了總體的損失函數(shù)(Loss)。通過最小化這些損失,優(yōu)化算法試圖調(diào)整神經(jīng)網(wǎng)絡(luò)的參數(shù),使其能夠較好地逼近真實的波動方程解并滿足初始條件、邊界條件和偏微分方程。表中顯示誤差值都很小,但對于方程解來說,誤差肯定是越小越好。經(jīng)過不斷嘗試,發(fā)現(xiàn)當(dāng)DNN的隱藏層數(shù)量為5,神經(jīng)元數(shù)量為50時,取得的誤差最小。
4結(jié)論
該研究提出了物理信息神經(jīng)網(wǎng)絡(luò)(PINN)應(yīng)用于波動方程求解的方法,降低了波動方程應(yīng)用的難度。在解波動方程的過程中,該研究嘗試將其應(yīng)用于聲波方程,并通過數(shù)值算例表明,波動方程在解決聲波問題上發(fā)揮著重要作用。研究也證明了深度神經(jīng)網(wǎng)絡(luò)(DNN)在物理信息神經(jīng)網(wǎng)絡(luò)中的應(yīng)用具有靈活性和廣泛性。通過調(diào)整隱藏層的層數(shù)和神經(jīng)元個數(shù),可以使方程的解集擬合。然而,訓(xùn)練過程中可能導(dǎo)致過度擬合,使得解無法形成。因此,在調(diào)試過程中,ICLoss、BCLoss和PDELoss之間存在最優(yōu)權(quán)衡。
在波動方程中,PDELoss的影響相對于其他兩個損失更為顯著。因此,在調(diào)試的過程中,著重調(diào)節(jié)了PDELoss,以達到總損失的最小值。實驗中發(fā)現(xiàn),當(dāng)DNN的隱藏層數(shù)量為5,神經(jīng)元數(shù)量為50時,取得的Loss最小,對于提高波動方程求解精度具有重大意義。相比波動方程的傳統(tǒng)解法,這一方法有著顯著的改進。然而,受到邊界條件影響,聲波方程[29]的圖形與真解的對應(yīng)關(guān)系存在一定問題。因此,邊界條件的自適應(yīng)修改仍然是未來研究的重要技術(shù)方向。
未來的深入研究將集中在進一步優(yōu)化物理信息神經(jīng)網(wǎng)絡(luò)在波動方程中的真實數(shù)據(jù)應(yīng)用上,特別是在邊界條件[30]的自適應(yīng)和誤差最小化方面。此外,還將探索這些網(wǎng)絡(luò)在處理更復(fù)雜的偏微分方程中的更具體應(yīng)用,希望通過持續(xù)創(chuàng)新和突破,為社會安全和應(yīng)急救援響應(yīng)能力的提升做出更大的貢獻。