薛文文,苗洪利,苗翔鷹
(中國(guó)海洋大學(xué) 信息科學(xué)與工程學(xué)院,山東 青島 266100)
電離層對(duì)微波的延遲是影響微波遙感對(duì)地面及海洋觀測(cè)的重要因素。特別是對(duì)于衛(wèi)星高度計(jì)對(duì)海表面高度的厘米級(jí)測(cè)量精度,電離層延遲會(huì)帶來(lái)較大的測(cè)高誤差。電離層延遲主要取決于電離層中的電子密度及總電子含量(Total Electron Content,TEC)。國(guó)際參考電離層(International Reference Ionosphere,IRI)構(gòu)建了分層模型,用以預(yù)報(bào)平靜電離層的平均狀態(tài),能夠準(zhǔn)確預(yù)測(cè)80%以上的微波路徑上的電子含量[1-2]。但是,IRI模型構(gòu)造復(fù)雜、參數(shù)較多,不利于模型的推廣使用[3]。近年來(lái),國(guó)外學(xué)者通過(guò)IRI與高度計(jì)實(shí)測(cè)數(shù)據(jù)進(jìn)行分析,認(rèn)為IRI表示在電離層變化情況上具有較高的精確度。但是,用戶一般在其官網(wǎng)上通過(guò)輸入必要的時(shí)間、位置及高度參量而獲取總電子含量[4],為在單頻衛(wèi)星高度計(jì)上應(yīng)用該模型帶來(lái)困難?;诖髷?shù)據(jù)的深度學(xué)習(xí)可以通過(guò)網(wǎng)站獲取大量數(shù)據(jù),建立基于IRI的神經(jīng)網(wǎng)絡(luò)模型[5]。
Keras是基于Tensorflow后端,由Python語(yǔ)言編寫(xiě)的一種高層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。Tensorflow是Google的開(kāi)源框架,是當(dāng)今大數(shù)據(jù)、人工智能、圖像識(shí)別及深度學(xué)習(xí)等領(lǐng)域的強(qiáng)大工具。Keras由于具備高效可擴(kuò)展的序貫?zāi)P秃秃瘮?shù)式模型,其性能優(yōu)于傳統(tǒng)BP算法。
本文基于IRI電離層預(yù)測(cè)值,通過(guò)Keras網(wǎng)絡(luò)框架構(gòu)建一個(gè)神經(jīng)網(wǎng)絡(luò)模型,利用Jason-2衛(wèi)星高度計(jì)雙頻法測(cè)得的總電子含量值對(duì)神經(jīng)網(wǎng)絡(luò)模型進(jìn)行檢驗(yàn),旨在將該模型應(yīng)用于單頻高度計(jì)的電離層延遲校正。
IRI官網(wǎng)(http://irimodel.org/)給出 IRI-2016 在線運(yùn)行界面,可以輸入時(shí)間及位置等信息獲取所需電離層電子含量。但是這種交互式操作,對(duì)于幾十萬(wàn)甚至上千萬(wàn)的數(shù)據(jù)量來(lái)說(shuō)難以操作。本文采用Python編寫(xiě)程序,通過(guò)程序獲取所需數(shù)據(jù)原理示意圖如圖1所示。
圖1 IRI數(shù)據(jù)獲取原理圖
在客戶端將所需要的請(qǐng)求數(shù)據(jù)進(jìn)行POST編碼后發(fā)送請(qǐng)求到服務(wù)器,服務(wù)器會(huì)根據(jù)POST請(qǐng)求發(fā)送response響應(yīng)給客戶端??蛻舳耸盏椒?wù)器發(fā)來(lái)的數(shù)據(jù)后,使用Python解析庫(kù)將需要的信息提取并且保存在本地計(jì)算機(jī)。本文使用的爬蟲(chóng)信息與IRI官網(wǎng)上信息一致,包括時(shí)間信息(year,month,day,time),位置信息(latitude,longitude,height),還有可選信息F10.7 radio flux(10.7 cm的太陽(yáng)輻射通量是太陽(yáng)活動(dòng)的極好指標(biāo)[6]。它通常被稱(chēng)為F10.7指數(shù),是太陽(yáng)活動(dòng)中運(yùn)行時(shí)間最長(zhǎng)的記錄之一)等,這樣得到的總電子含量TEC,記為T(mén)ECIRI[7]。
選 取 Jason-2的 GDR(Geophysical Data Records)中2016年Cycle281數(shù)據(jù),每個(gè)Cycle由近10 d、254個(gè) Pas(s升降軌)、127圈構(gòu)成。
提取其中Ku波段的時(shí)間、經(jīng)度、緯度及對(duì)應(yīng)的用雙頻法測(cè)得的電離層延遲值Δ,Δ與總電子含量TEC的關(guān)系如式(1)[8-9]所示:
根據(jù)式(1)可以算出總電子含量:
f為Ku波段的頻率,其值為13.575 GHz;總電子含量TEC的單位為T(mén)ECU,1 TECU=1016el/m2。
在Jason-2的Cycle281中提取Pass11-Pass30(10圈,接近1 d)的時(shí)間、經(jīng)緯度、高度及Ku波段電離層延遲等信息,利用式(2)將電離層延遲換算為T(mén)EC值,記為T(mén)ECJason-2。
對(duì)比Jason-2與IRI-2016的TEC值,必須首先進(jìn)行時(shí)間和空間信息的匹配。將Jason-2數(shù)據(jù)中的時(shí)間,經(jīng)度、緯度、高度信息依次輸入到網(wǎng)絡(luò)獲取軟件的POST請(qǐng)求當(dāng)中,這樣就可以得到時(shí)間和位置完全匹配的兩列TEC數(shù)據(jù)。按時(shí)間排序的兩列TEC數(shù)值分布見(jiàn)圖2所示。
圖2 電離層總電子含量分布
從圖2可以看出,Jason-2繞地球每一圈,其觀測(cè)到的與地面之間的總電子總量具有周期性,反映了地面固定位置電離層分布的日周期性,而IRI-2016模型值表現(xiàn)出與Jason-2觀測(cè)值較強(qiáng)的分布一致性。
Jason-2利用雙頻觀測(cè)法進(jìn)行每秒一次的實(shí)時(shí)觀測(cè),受實(shí)時(shí)環(huán)境因素影響,會(huì)產(chǎn)生較大波動(dòng),而IRI-2016模型值是由多層公式積分而得,其結(jié)果必為連續(xù)可微函數(shù)值,其分布為平滑曲線。
由于IRI-2016模型值與雙頻法測(cè)量值分布及量值基本一致,因此,基于IRI-2016模型值深度學(xué)習(xí)的Keras神經(jīng)網(wǎng)絡(luò)模型可以用于衛(wèi)星高度計(jì)的電離層延遲校正。
深度學(xué)習(xí)的數(shù)據(jù)集來(lái)自IRI-2016模型中2016年將近300萬(wàn)組數(shù)據(jù),經(jīng)緯度的精度為0.01°,時(shí)間的精度為36 s。70%用于訓(xùn)練模型,30%用于測(cè)試模型。深度學(xué)習(xí)對(duì)計(jì)算機(jī)性能要求極大,本文選取IRI模型適當(dāng)?shù)臅r(shí)間及空間精度,同時(shí)兼顧學(xué)習(xí)時(shí)間和模型結(jié)果準(zhǔn)確率[10]。
Keras神經(jīng)網(wǎng)絡(luò)模型的時(shí)間輸入分為兩個(gè)部分:一部分為年積日,即從每年的1月1日起開(kāi)始累計(jì)的天數(shù),另一部分為日積時(shí),即每天的時(shí)刻數(shù)(以0.01小時(shí)單位)。同時(shí)輸入的參數(shù)還有空間位置信息,包括經(jīng)度(longitude)、緯度(latitude)、高度(height)及 F10.7信息。
圖3為Keras神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)示意圖,將前述輸入?yún)⒘孔鳛檩斎雽?,選擇合適的激活函數(shù)以及模型的優(yōu)化器將各層數(shù)據(jù)輸入訓(xùn)練。模型的層數(shù)以及各層的節(jié)點(diǎn)數(shù)需要不斷地訓(xùn)練調(diào)整,直到損失達(dá)到最小及梯度不再下降,進(jìn)而固定各層參數(shù),完成模型的建立。
圖3 Keras神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
本文全鏈接采用6層網(wǎng)絡(luò),前5層的激活函數(shù)均為“relu”,最后一層采用“l(fā)inear”。在隱含層選用“relu”是因?yàn)樗哂腥缦聝?yōu)點(diǎn):克服梯度消失的問(wèn)題與加快訓(xùn)練速度。最后選用“l(fā)inear”線性激活函數(shù),為了補(bǔ)償網(wǎng)絡(luò)輸出結(jié)果的線性偏置[11]。
對(duì)所建立的Keras網(wǎng)絡(luò)模型,只要將待測(cè)日期和時(shí)間分解為年積日和日積時(shí),連同待測(cè)位置的經(jīng)緯度及高度輸入模型,即可輸出總電子含量TEC值,記為T(mén)ECKeras。當(dāng)然,本文所建模型固定高度為Jason-2的軌道高度(1 336 km),模型只針對(duì)于特定的高度計(jì)[9-10]。
神經(jīng)網(wǎng)絡(luò)模型的建立均需要測(cè)試,一般采用數(shù)據(jù)集的20%用于模型測(cè)試[12]。圖4為模型輸出值TECKeras和數(shù)據(jù)集中的目標(biāo)值TECIRI的擬合散點(diǎn)圖。
圖4 TECKeras和TECIRI擬合散點(diǎn)圖
由圖4可以看出,Keras模型輸出值與IRI-2016的模型值具有很好的一致性。統(tǒng)計(jì)結(jié)果表明,二者的均方根誤差為0.72 TECU,相關(guān)系數(shù)高達(dá)0.99。這說(shuō)明Keras模型具有較高的有效性和可靠性。
將所建模型應(yīng)用到Jason-2的Cycle281-290中的數(shù)據(jù),從結(jié)果中選用兩個(gè)PASS做出細(xì)節(jié)描述。圖5為Pass17和pass18一圈的TEC分布。
圖5 單圈雙頻觀測(cè)值和Keras模型值分布
圖中,灰色線為Jason-2雙頻測(cè)量的TEC值,為了與Keras模型值(黑色線)進(jìn)行有效對(duì)比,將其進(jìn)行多項(xiàng)式擬合,其擬合線見(jiàn)圖5中的藍(lán)色線。從中可以看出,擬合后的TEC值分布整體與Keras模型值分布較為接近。但是也可以看出,在部分地區(qū)Jason-2的測(cè)量值與網(wǎng)絡(luò)模型輸出值存在偏差。圖6為單圈情況下兩者的誤差分布直方圖。
圖6 Jason-2與模型輸出值TEC誤差分布直方圖
如圖6所示,Jason-2與模型值兩者的偏差一般在-15~20 TECU之間,且分布集中區(qū)域?yàn)?5~10之間,這樣的誤差分布表現(xiàn)出兩者的一個(gè)系統(tǒng)性偏差,大約為 4~5 TECU。
圖7 Jason-2與Keras模型值對(duì)比
如圖7所示,選用Cycle281-290的高度計(jì)數(shù)據(jù),TECJason-2為雙頻觀測(cè)數(shù)據(jù),TECmodel為Keras模型輸出數(shù)據(jù),模型輸出值在各Cycle的Jason-2數(shù)據(jù)上表現(xiàn)出良好的一致性,對(duì)于范圍更廣的測(cè)量區(qū)域做出兩者的數(shù)據(jù)分布圖[13]。統(tǒng)計(jì)10個(gè)Cycle的各自均方根差(RMSE)和相關(guān)系數(shù)及平均值,結(jié)果見(jiàn)表1所示。
從表1可以看出,二者在各個(gè)Cycle內(nèi)的均方根誤差比較穩(wěn)定,均值為4.46 TECU,換算為Ku波段的電離層延遲為8.5 mm,對(duì)于測(cè)高精度為厘米的衛(wèi)星高度計(jì)有良好的提升,毫米的電離層延遲誤差可以接受[14-15]。二者的相關(guān)系數(shù)均值為0.75,此結(jié)果為原始雙頻觀測(cè)數(shù)據(jù)與模型對(duì)比得到,而原始雙頻觀測(cè)數(shù)據(jù)相鄰點(diǎn)存在測(cè)量誤差,其值波動(dòng)較大,如圖5所示,如果進(jìn)行平滑處理,會(huì)提升其相關(guān)系數(shù)。盡管兩者的相對(duì)誤差達(dá)到0.25左右,但是TEC值當(dāng)TECU達(dá)到較大值30 TECU時(shí)候,兩者的誤差也就為6 TECU左右,符合之前對(duì)模型的誤差分析。從圖7得到,在模型推廣到其他Cycle的時(shí)候,模型輸出值精度和各Cycle數(shù)據(jù)相同,具有較高的準(zhǔn)確率。
表1 Jason-2雙頻觀測(cè)值與Keras模型值對(duì)比
本文采用python編程在IRI網(wǎng)站獲取了與Jason-2衛(wèi)星高度計(jì)Cycle281-290同軌道信息的IRI-2016模型電離層總電子含量數(shù)據(jù)。通過(guò)將該數(shù)據(jù)與Jason-2利用雙頻法測(cè)得的總電子含量比較,二者均具有明顯一致性。
基于IRI-2016數(shù)據(jù),通過(guò)深度學(xué)習(xí)建立了Keras神經(jīng)網(wǎng)絡(luò)模型。經(jīng)測(cè)試,模型輸出值與測(cè)試數(shù)據(jù)集中的目標(biāo)值之間的相關(guān)系數(shù)高達(dá)0.99,均方根誤差為0.72 TECU,說(shuō)明模型有效。
將所建Keras神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于Jason-2衛(wèi)星高度計(jì),對(duì)比模型值與雙頻觀測(cè)值。結(jié)果表明,二者在10個(gè)cycle的平均電子含量均方根誤差為4.46 TECU,平均相關(guān)系數(shù)為0.75,對(duì)應(yīng)的Ku波段傳輸延遲值為8.5 mm。
本文所建立的Keras神經(jīng)網(wǎng)絡(luò)模型只適用于Jason-2及與其同軌道高度的高度計(jì),這是由于建模時(shí)選用Jason-2的軌道高度。IRI模型是從電離層以不同高度分層的數(shù)據(jù)獲得的經(jīng)驗(yàn)?zāi)P?,只要選取不同軌道高度的IRI數(shù)據(jù)建模,就可將模型應(yīng)用于任意高度單頻高度計(jì)的電離層延遲誤差校正。