譚程明,顏毅華,譚寶林,劉玉英
(1.中國科學(xué)院國家天文臺(tái),北京 100012;2.中國科學(xué)院太陽活動(dòng)重點(diǎn)實(shí)驗(yàn)室 (國家天文臺(tái)),北京 100012)
“工欲善其事,必先利其器”,通用、完善的數(shù)據(jù)分析系統(tǒng)直接決定一個(gè)天文觀測設(shè)備的科學(xué)產(chǎn)出。在計(jì)算機(jī)和互聯(lián)網(wǎng)飛速發(fā)展的今天,數(shù)據(jù)處理在現(xiàn)代天文研究中更有著催化劑和生長素的作用,最有可能在海量或精細(xì)的數(shù)據(jù)分析中觸動(dòng)新的科學(xué)發(fā)現(xiàn)。目前中國太陽物理研究取得了長足的進(jìn)步,各種探測儀器不斷建立。然而由于觀測臺(tái)站在建成初期受限于計(jì)算機(jī)軟件技術(shù)和硬件環(huán)境,不可能一步到位,與之相應(yīng)的數(shù)據(jù)處理軟件相對單一零散,資源無法充分利用、數(shù)據(jù)共享和交流不暢、疏于更新等問題越來越突出。
國家天文臺(tái)懷柔觀測基地的太陽射電頻譜儀(SBRS)[1-3]的相關(guān)技術(shù)指標(biāo)在國際同類設(shè)備中處于領(lǐng)先地位,獲得了北京市科技進(jìn)步一等獎(jiǎng)。在建成初期,由于計(jì)算機(jī)技術(shù)和IDL軟件環(huán)境有限,每個(gè)頻譜儀都開發(fā)了一個(gè)獨(dú)立的數(shù)據(jù)處理軟件,2002年后開始對這些單一的數(shù)據(jù)處理軟件進(jìn)行合成升級(jí)。2001年建立了太陽射電網(wǎng)站和數(shù)據(jù)庫,2009年開始建設(shè)中俄聯(lián)合射電數(shù)據(jù)庫。SBRS觀測數(shù)據(jù)與處理軟件在太陽物理研究和國際合作交流中發(fā)揮了積極的作用,國內(nèi)外直接利用觀測數(shù)據(jù)和軟件進(jìn)行研究的SCI論文達(dá)100余篇,其中2002年4月21日事件被美日陽光衛(wèi)星主持發(fā)布的網(wǎng)上《每周科學(xué)評(píng)論》報(bào)導(dǎo)[4]。然而目前依然存在幾個(gè)迫需解決的問題。(1)SBRS在過去10多年積累了近2 TB的觀測數(shù)據(jù)約2600個(gè)射電爆發(fā)事件,并且以每天0.2~8 GB的數(shù)據(jù)量增長。相關(guān)研究受限于數(shù)據(jù)處理方法的單一,進(jìn)展緩慢,大量的射電爆發(fā)事件被錄入統(tǒng)計(jì)表后就淹沒在日益增長的數(shù)據(jù)堆積中,加之?dāng)?shù)據(jù)處理軟件甄別能力有限,尚有不少爆發(fā)事件未能被發(fā)現(xiàn)而隱藏在海量的數(shù)據(jù)堆積中。若任由現(xiàn)狀發(fā)展則將陷入一個(gè)無人問津的數(shù)據(jù)塵封狀態(tài),多年后隨同觀測設(shè)備一起沉寂、遺忘;(2)數(shù)據(jù)處理軟件未與SSW[5-6]兼容,數(shù)據(jù)庫共享不完備,沒有定期更新,客觀上限制了數(shù)據(jù)的國際交流和利用;(3)數(shù)據(jù)光盤取放麻煩,而且多人使用容易遺漏,頻繁使用也導(dǎo)致部分介質(zhì)損壞,雖然有備份光盤,但更亟需的是一個(gè)容量充足的數(shù)據(jù)庫。正在建造的中國太陽射電頻譜日像儀[7]也面臨著類似問題。因而必須加快對數(shù)據(jù)分析軟件按SSW規(guī)范設(shè)計(jì)開發(fā),并建立一個(gè)有充足容量、安全穩(wěn)定、自動(dòng)化程度高、便于更新管理的數(shù)據(jù)庫。
SSW創(chuàng)始于1998年,是國際太陽物理學(xué)界使用最為廣泛的數(shù)據(jù)分析系統(tǒng),能處理多達(dá)60余個(gè)天基或地基儀器設(shè)備的探測數(shù)據(jù)以及國際虛擬太陽天文臺(tái)的數(shù)據(jù)。國際太陽射電頻譜儀同類設(shè)備中目前只有瑞士蘇黎世的偏振計(jì)頻譜儀的數(shù)據(jù)處理軟件加入了SSW,但數(shù)據(jù)處理軟件無用戶界面,且難以進(jìn)行更深層次的分析研究。本文探討的太陽射電頻譜觀測數(shù)據(jù)分析系統(tǒng)技術(shù)方案在現(xiàn)有的軟件和數(shù)據(jù)庫基礎(chǔ)上突出重點(diǎn)和效率,實(shí)現(xiàn)與SSW兼容并拓展數(shù)據(jù)庫的容量與效能。這將挽救在數(shù)據(jù)堆積中不斷淹沒的科學(xué)信息,提高數(shù)據(jù)的利用率和開放率,進(jìn)一步擴(kuò)大SBRS觀測數(shù)據(jù)在國際上的交流和影響。
SSW[5-6]是一套為太陽物理研究提供公用程序和數(shù)據(jù)處理環(huán)境的軟件綜合庫、數(shù)據(jù)庫和系統(tǒng)應(yīng)用工具,英文名為Solar Soft Ware。SSW建立于Yohkoh、SOHO、SDAC(Solar Data Analysis Center)和IDL天文用戶庫并利用了來自眾多項(xiàng)目團(tuán)隊(duì)的貢獻(xiàn)。它首先是一個(gè)基于IDL的軟件系統(tǒng),當(dāng)然有些分支軟件加入了以其它語言編寫的可執(zhí)行程序。SSW環(huán)境在廣泛分布的協(xié)同研究制度上提供了一個(gè)兼容的環(huán)境以利于數(shù)據(jù)交流和促進(jìn)協(xié)作分析。SSW的基本目標(biāo)是:(1)提供一個(gè)不依賴于硬件和臺(tái)址的數(shù)據(jù)分析系統(tǒng);(2)推動(dòng)使用特定的標(biāo)準(zhǔn)便于合成數(shù)據(jù)分析;(3)促進(jìn)一個(gè)逐漸發(fā)展的環(huán)境;(4)提供支持各種數(shù)據(jù)庫的入口;(5)提供一個(gè)不依賴于文件格式的分析環(huán)境;6)提供其它IDL軟件包的綜合入口。
圖1 SSW標(biāo)準(zhǔn)安裝目錄結(jié)構(gòu)圖[6]Fig.1 “Typical”SSW installation tree[6]
GEN子目錄包括整體有用的程序,這些程序可用于各類分支但不依賴于儀器或項(xiàng)目的公用程序和系統(tǒng)設(shè)置。各個(gè)項(xiàng)目(MISSION)中的GEN目錄包含不依賴于項(xiàng)目但可以用于該項(xiàng)目中所有設(shè)備的程序。SITE子目錄可以用于當(dāng)?shù)靥栜浖鸵援?dāng)?shù)芈窂矫腟SW環(huán)境,也包括SSW的安裝執(zhí)行程序。SSW安裝程序和系統(tǒng)設(shè)計(jì)允許包含目錄樹中有子目錄的本地布局。
主要有以下幾點(diǎn)[5-6]:(1)軟件及程序的名稱爭議和開頭文檔說明。在將一個(gè)新的分支軟件合成到太陽軟件之前,一件必須要做的事情是核對名稱爭議并進(jìn)行規(guī)范更改。比如某儀器數(shù)據(jù)的解壓程序可以命名為xxx_decompress.pro(xxx是儀器的定義,例如SXT、CDS等),而不只是decompress.pro。每個(gè)程序或程序包都應(yīng)該有開頭文檔,包含在IDL程序指南中。特別是名稱、目的、有變量解釋的調(diào)用子程序、程序歷史等均應(yīng)該包含在 “;+”和 “; -”符號(hào)的開頭文檔中。(2)子目錄結(jié)構(gòu):儀器分支或庫的細(xì)節(jié)組織主要取決于研究團(tuán)隊(duì)的決定,可以按如下標(biāo)準(zhǔn)目錄來建立。
[/idl/setup]該子目錄很重要,只能包括用于定標(biāo)和數(shù)據(jù)分析的軟件或程序,不允許其它成分的加入。在/idl下的子目錄和一些不必要的目錄將減慢IDL的運(yùn)行速度。理想的情況是子目錄的數(shù)量控制在最小。當(dāng)研究團(tuán)隊(duì)希望提供的程序應(yīng)該在子目錄中執(zhí)行時(shí),可以定義這個(gè)子目錄。
[/doc]子目錄包含了軟件使用說明、儀器數(shù)據(jù)分析方法、定標(biāo)和一些附屬文件。
[/calibration]目錄包含的文件與儀器定標(biāo)有關(guān)。如果僅僅是簡單的、小的定標(biāo)文件放在太陽軟件目錄中是允許的。其它隨著時(shí)間變化的大文件最好存在SDB目錄中,比如暗場、平場文件等等。用大量的文件存儲(chǔ)這些信息便于用戶只拷貝需要的文件分析所關(guān)注的觀測數(shù)據(jù)。將這些文件從儀器目錄中分列出來將保證安裝分支儀器軟件的壓縮文件 (tar)控制在一個(gè)合適的范圍。
[/response]運(yùn)行軟件或者程序時(shí)產(chǎn)生的一些響應(yīng)文件或日志文件。
[/catalog]對于短期的設(shè)備,可以將列表和觀測日志放在該目錄中。對于長期觀測設(shè)備,列表最好存儲(chǔ)于/sdb目錄中。將列表按星期、月或者幾個(gè)月分開存檔更為合理,只要文件的大小控制在一個(gè)合適的范圍。而且將文件分列便于用戶只拷貝他們所關(guān)心時(shí)間段的文件,而不是全部。對于其它鏡像地址,如果增加了一個(gè)額外的觀測,只要拷貝最近的文件就可以,而不是整個(gè)文件或長列表。
[/data]目錄可以存放一些數(shù)據(jù)分析中有用的小數(shù)據(jù)文件,但又不是分類或定標(biāo)文件。
自1994年建立第1臺(tái)太陽射電頻譜儀以來,截止2009年底,中國先后共建成5個(gè)頻譜儀(見表1)。該設(shè)備具有高時(shí)間分辨率(1~8 ms)、高頻譜分辨率(1.37~20 MHz)、高靈敏度(2% ~5%寧靜太陽射電輻射流量)和寬頻帶(0.7~7.6 GHz)的特點(diǎn),相關(guān)技術(shù)指標(biāo)在國際同類設(shè)備中處于領(lǐng)先地位。并在建成初期開發(fā)出了相應(yīng)的數(shù)據(jù)處理軟件(見表1)。
表1 頻譜儀和相應(yīng)數(shù)據(jù)處理軟件的特點(diǎn)Table 1 Characteristics of radio spectrometers and corresponding data-processing softwares
紫臺(tái)的數(shù)據(jù)處理軟件系統(tǒng)由南京大學(xué)的狄曉華開發(fā),使用方便,功能豐富,但非IDL語言的軟件需要專人維護(hù)升級(jí)。國臺(tái)開發(fā)的各個(gè)頻段的數(shù)據(jù)處理軟件都是以IDL語言為開發(fā)環(huán)境,具有相似的顯示平臺(tái)和數(shù)據(jù)處理功能。該系列軟件的開發(fā)基于勞德幫1996年為1.0~2.0 GHz頻譜儀設(shè)計(jì)編寫的軟件包。更多的頻譜儀建成后,考慮到新增觀測數(shù)據(jù)和處理功能,顏毅華于2000年對該軟件進(jìn)行整合升級(jí),每個(gè)頻譜儀都開發(fā)了一個(gè)獨(dú)立的數(shù)據(jù)處理軟件。一個(gè)頻譜儀一個(gè)數(shù)據(jù)處理軟件的好處是使用簡單,便于升級(jí)維護(hù)。同時(shí)也存在幾點(diǎn)不足:(1)數(shù)據(jù)分析處理時(shí)打開窗口太多,容易混亂,效率低;(2)數(shù)據(jù)處理功能簡單,定標(biāo)功能不完善。隨著計(jì)算機(jī)技術(shù)的提升,對數(shù)據(jù)處理的要求和各種功能需求不斷增加,原有的操作界面也難以滿足更高的要求。自2002年6月開始,譚程明對各個(gè)頻譜儀的數(shù)據(jù)處理軟件再次進(jìn)行合成升級(jí),并增加了定標(biāo)[8]、扣除干擾、小波去噪[9]和特征信息提?。?0]等功能。該合成軟件于2002年10月投入使用并于2003年3月全部完成,之后得到不斷完善和發(fā)展。到目前為止,軟件具備了表2中的主要特點(diǎn)和功能。該軟件的目錄結(jié)構(gòu)相對簡單,主要包括程序目錄、定標(biāo)常數(shù)目錄、數(shù)據(jù)分析結(jié)果存儲(chǔ)目錄,軟件界面如圖2。在數(shù)據(jù)庫建設(shè)方面,2001年建立了太陽射電網(wǎng)站(http://srg.bao.ac.cn/)和頻譜儀觀測數(shù)據(jù)庫并開放,之后網(wǎng)站和數(shù)據(jù)庫得到不斷更新,科研人員可以網(wǎng)上直接下載數(shù)據(jù)或電子郵件聯(lián)系。2009年開始建設(shè)中俄聯(lián)合射電數(shù)據(jù)庫(http://srg.bao.ac.cn/fast/),該數(shù)據(jù)庫能實(shí)現(xiàn)自動(dòng)更新,但受限于數(shù)據(jù)處理軟件的不完善而滯后。
表2 目前數(shù)據(jù)處理軟件的特點(diǎn)和功能Table 2 Characteristics and functions of the current data-processing softwares
圖2 軟件用戶界面Fig.2 User interface of the software currently used in the NAO
SBRS觀測數(shù)據(jù)與數(shù)據(jù)處理軟件在太陽物理研究和國際合作交流中發(fā)揮了積極的作用。但目前的現(xiàn)狀成為進(jìn)一步擴(kuò)大數(shù)據(jù)利用率和開放率的瓶頸。具體表現(xiàn)在以下幾點(diǎn):(1)數(shù)據(jù)處理軟件未與國際兼容,不規(guī)范,國外研究人員難于上手;(2)數(shù)據(jù)處理軟件功能繁多界面復(fù)雜,科研工作者使用不便捷;(3)軟件結(jié)構(gòu)設(shè)計(jì)有不合理之處,有些功能和數(shù)值運(yùn)算方法有待進(jìn)一步優(yōu)化;(4)軟件開發(fā)初期未做多種可能的分析,考慮不夠周全,隨著功能的增加,漏洞也不斷增多;(5)數(shù)據(jù)庫沒有定期更新,無法滿足更多的快速大量的數(shù)據(jù)需求,缺乏一套具有自動(dòng)更新和搜索功能的數(shù)據(jù)庫管理系統(tǒng)和一套容量充足安全穩(wěn)定的硬件設(shè)備;(6)數(shù)據(jù)光盤取放麻煩,而且讀取速度慢,最大的問題是數(shù)據(jù)光盤多人使用容易遺漏,頻繁使用也導(dǎo)致部分介質(zhì)損壞。因而有必要對軟件按SSW規(guī)范重新設(shè)計(jì)編寫,并建立一個(gè)容量充足安全穩(wěn)定的數(shù)據(jù)庫,既能滿足局域網(wǎng)內(nèi)快速大量獲取也能實(shí)現(xiàn)遠(yuǎn)程網(wǎng)絡(luò)下載。
目前已經(jīng)開發(fā)出了成套的SBRS觀測數(shù)據(jù)處理軟件,建立了數(shù)據(jù)庫,在IDL軟件開發(fā)和數(shù)據(jù)庫建設(shè)方面積累了很多經(jīng)驗(yàn),儲(chǔ)備了一定的技術(shù)。另一方面,對SSW的框架規(guī)范有充分了解,有能力開發(fā)一套與之兼容的軟件并建設(shè)相應(yīng)的數(shù)據(jù)庫。以下分軟件和數(shù)據(jù)庫兩方面詳述系統(tǒng)設(shè)計(jì)方案。
IDL是一種數(shù)據(jù)分析和圖像化應(yīng)用程序及編程語言。IDL的使用者可以迅速方便地運(yùn)用此軟件將數(shù)據(jù)轉(zhuǎn)換為圖像,促進(jìn)分析和理解。IDL的開發(fā)環(huán)境IDLDE是用戶快速編寫、測試并調(diào)試代碼的最佳環(huán)境,適用于WINDOWS和LINUX系統(tǒng)。而且SSW是基于IDL的軟件系統(tǒng),因而與SSW兼容的升級(jí)軟件將以IDL為開發(fā)和運(yùn)行環(huán)境。新開發(fā)的數(shù)據(jù)處理軟件既能在SSW下運(yùn)行也能獨(dú)立運(yùn)行。設(shè)計(jì)方案分為3部分:(1)目錄規(guī)劃;(2)界面設(shè)計(jì);(3)功能模塊及流程設(shè)計(jì)。
3.1.1 目錄規(guī)劃
根據(jù)太陽軟件提供規(guī)范和建議,結(jié)合SBRS數(shù)據(jù)處理軟件的特點(diǎn),擬定5個(gè)子目錄。
[/idl]包含了軟件的主程序和子程序,以及安裝和設(shè)置程序。
[/doc]包含了軟件的使用說明和數(shù)據(jù)分析方法,以及軟件中的定標(biāo)方法和一些附屬說明文件。
[/calibration]包含了各種定標(biāo)文件和定標(biāo)常數(shù),定標(biāo)常數(shù)是隨著儀器系統(tǒng)的維護(hù)檢修有變化的。
[/catalog]數(shù)據(jù)按年/年_月_日/頻段_時(shí)間分辨率分為3級(jí)目錄,便于用戶下載存放觀測數(shù)據(jù),也便于同一個(gè)射電頻譜事件的綜合分析。
[/data]用戶在數(shù)據(jù)處理中得到的一些結(jié)果或者圖片可以默認(rèn)自動(dòng)存放在這個(gè)目錄中,擬按儀器頻段建立0.6_1.5GHz、1.0_2.0GHz_old(2002年頻譜儀升級(jí)之前的觀測數(shù)據(jù))、1.0_2.0GHz_new(2002年頻譜儀升級(jí)之后的觀測數(shù)據(jù))、2.6_3.8GHz、4.5_7.6GHz、5.2_7.6GHz這6個(gè)文件夾。用戶也可以建立自己的文件夾。
由于[/catalog]和[/data]兩個(gè)目錄占用資源較大,如將其放到SSW目錄中運(yùn)行SSW時(shí)會(huì)消耗系統(tǒng)資源降低運(yùn)行速度,用戶可以將這兩個(gè)目錄在安裝設(shè)置時(shí)自定義到其它文件夾。如果是獨(dú)立于SSW的安裝就沒有這個(gè)問題。
3.1.2 界面設(shè)計(jì)
原有的數(shù)據(jù)處理軟件是將圖像顯示界面、控制界面、信息顯示界面等全部合為一個(gè)窗口(圖2)。這樣的好處是窗口少,不混亂,處理分析數(shù)據(jù)效率高,缺點(diǎn)是控制按鈕太多,對新用戶顯得繁雜。新軟件的用戶界面還是采用一個(gè)窗口的設(shè)計(jì)方案(圖3),窗口的大小是按一定比例自定義可調(diào)的。圖像顯示界面是觀測數(shù)據(jù)的直接輸出部分,因而應(yīng)將窗口的空間盡量分配給圖像顯示。控制界面的功能按鈕將按使用頻度和難易度分成兩類:(1)經(jīng)常使用的按鈕將直接顯示在控制界面中,包括數(shù)據(jù)讀取存儲(chǔ)、圖像存儲(chǔ)、數(shù)據(jù)定標(biāo)、圖像調(diào)整和界面調(diào)整等基本功能按鈕;(2)不常使用的功能按鈕比較多,包括數(shù)據(jù)合成、數(shù)學(xué)分析、自動(dòng)批處理等高級(jí)圖像處理和綜合功能按鈕。這些按鈕在開始使用時(shí)是隱藏狀態(tài),初學(xué)者無需關(guān)注,在需要時(shí)可以展開,不需要時(shí)再收起隱藏。圖像信息顯示界面大小適中,既要內(nèi)容豐富又便于用戶查看。
圖3 新軟件用戶界面Fig.3 User interface of the new software
3.1.3 功能模塊及流程設(shè)計(jì)
這部分是軟件的核心部分,主要內(nèi)容是主程序和子程序。主程序包括圖像及界面控制、數(shù)據(jù)和圖像調(diào)用、圖像顯示、功能子程序調(diào)用、信息顯示、鼠標(biāo)狀態(tài)等內(nèi)容。子程序包括數(shù)據(jù)和圖像讀取、時(shí)間運(yùn)算、數(shù)據(jù)定標(biāo)、數(shù)據(jù)合成、數(shù)學(xué)分析、數(shù)據(jù)存儲(chǔ)、圖像存儲(chǔ)和自動(dòng)批處理等功能模塊。而數(shù)學(xué)分析是內(nèi)容豐富功能強(qiáng)大的數(shù)值處理模塊,包括扣除干擾、小波去噪、歸一化、特征信息提取、數(shù)值擬合、數(shù)值相關(guān)等。以上主要內(nèi)容及各功能模塊在原軟件已部分實(shí)現(xiàn),但在編寫規(guī)范、結(jié)構(gòu)和流程設(shè)計(jì)、功能完善和漏洞排解等方面還需要做大量的工作。首先是編寫規(guī)范,由于在軟件開發(fā)初期追求短平快,遺留了很多漏洞,程序缺乏詳盡的說明增加了排錯(cuò)時(shí)間。升級(jí)軟件在現(xiàn)有的規(guī)范和經(jīng)驗(yàn)基礎(chǔ)上編寫,將更好地解決這個(gè)問題。其次是結(jié)構(gòu)和流程設(shè)計(jì)規(guī)范,結(jié)合多年的軟件開發(fā)和使用經(jīng)驗(yàn),認(rèn)為下述簡易流程圖 (圖4)可以做為一個(gè)標(biāo)準(zhǔn)設(shè)計(jì)。該流程圖是按Microsoft Office軟件中自選圖形的流程圖規(guī)范制作的,如六角形為‘準(zhǔn)備’、倒梯形為‘人工操作’等。
圖4 簡易流程圖Fig.4 Simplified flowchart of the new software
第三是功能完善,軟件目前的多數(shù)功能是完善的,但在定標(biāo)、小波去噪和扣除干擾等一些數(shù)學(xué)分析方面還有更大的發(fā)展空間。在定標(biāo)方面已經(jīng)取得了一定的進(jìn)展[11]。小波去噪方面,現(xiàn)有的方法是分析某一通道(對應(yīng)射電輻射頻率)觀測數(shù)據(jù)的干擾信號(hào)的頻率特征并對全波段數(shù)據(jù)濾掉這個(gè)干擾頻段的信號(hào)。實(shí)際上每個(gè)通道的干擾頻段和特征是略有不同的,可以設(shè)計(jì)多通道自動(dòng)濾波的方案對所有通道分別濾波。小波去噪的另外一個(gè)問題是運(yùn)算時(shí)間隨數(shù)據(jù)量增加按幾何級(jí)數(shù)增長,根據(jù)SBRS觀測數(shù)據(jù)的干擾特征可以設(shè)計(jì)分段自動(dòng)濾波的方案。自動(dòng)濾波從理論和以往經(jīng)驗(yàn)來說都是可行的,但實(shí)際效果有待進(jìn)一步檢驗(yàn)。最后一個(gè)問題是漏洞排解,規(guī)范的軟件編寫和合理的流程設(shè)計(jì)將提高漏洞排解的效率。
數(shù)據(jù)庫將結(jié)合國內(nèi)外研究人員的需求和SBRS觀測數(shù)據(jù)的特點(diǎn)研究適用的方案。目前國外有俄羅斯,國內(nèi)有南京大學(xué)、紫金山天文臺(tái)和云南天文臺(tái)對觀測數(shù)據(jù)的需求量比較大。國臺(tái)總部使用數(shù)據(jù)更為頻繁,最常見的問題是數(shù)據(jù)光盤多人使用導(dǎo)致遺漏缺失,頻繁使用也導(dǎo)致部分介質(zhì)損壞。因而需要建立一個(gè)容量充足、安全穩(wěn)定的數(shù)據(jù)庫,既能滿足局域網(wǎng)內(nèi)即時(shí)大量獲取也能實(shí)現(xiàn)遠(yuǎn)程下載。
SBRS觀測數(shù)據(jù)量比較大,懷柔射電頻譜儀自1994年到現(xiàn)在的觀測大約積累了3000片數(shù)據(jù)光盤近2 TB的數(shù)據(jù)。將這些數(shù)據(jù)全部拷貝至硬盤不現(xiàn)實(shí)也沒有必要,可以考慮只將那些有爆發(fā)事件的數(shù)據(jù)裝入數(shù)據(jù)庫,沒有爆發(fā)的數(shù)據(jù)通過電子郵件聯(lián)系。目前觀測數(shù)據(jù)存為png格式圖像后,文件大小能降至10%以下,因而估算圖像資料數(shù)據(jù)量小于200 GB。如果在圖像顯示時(shí)減少像點(diǎn)(降低分辨率)至合理范圍,或者采用秒級(jí)綜合頻譜圖加精細(xì)結(jié)構(gòu)頻譜圖,則數(shù)據(jù)量可以大幅度降低至20 GB以下。對于有爆發(fā)事件的觀測原始資料,數(shù)據(jù)大小目前難于統(tǒng)計(jì),但也是可以估算的。懷柔的SBRS共有480個(gè)通道,每個(gè)數(shù)據(jù)需要2字節(jié)存儲(chǔ),每0.2 s一個(gè)數(shù)據(jù)點(diǎn)的數(shù)據(jù)量是5 KB。目前的觀測統(tǒng)計(jì)有2600多個(gè)頻譜事件,如果按射電爆發(fā)事件平均持續(xù)30 min估算0.2秒級(jí)文件數(shù)據(jù)量大概有40 GB。精細(xì)結(jié)構(gòu)的發(fā)生率在1.0~2.0 GHz頻段大概為22%,2.6~3.8 GHz大概為10%,5.2~7.6 GHz大概為7%,毫秒級(jí)文件(只考慮有精細(xì)結(jié)構(gòu)的事件)數(shù)據(jù)量大概有200 GB。綜上分析,一個(gè)太陽活動(dòng)周分配300 GB的存儲(chǔ)量就足夠了,目前市場上1 TB的存儲(chǔ)容量可以滿足2~3個(gè)太陽活動(dòng)周。另外一個(gè)問題是如何在短期內(nèi)生成海量(預(yù)計(jì)105個(gè)以上)的觀測圖像文件,用人工操作軟件來生成難以忍受。解決辦法是前期慢慢積累高質(zhì)量的圖像資料,后期開發(fā)數(shù)據(jù)處理軟件的自動(dòng)處理功能批量生成圖像文件。根據(jù)上述分析,數(shù)據(jù)庫的建設(shè)方案如表3。
表3 數(shù)據(jù)庫建設(shè)方案Table 3 Design of the database
在數(shù)據(jù)庫的開發(fā)環(huán)境方面,國家天文臺(tái)太陽射電網(wǎng)站目前的服務(wù)器環(huán)境是Windows-WEB,服務(wù)器軟件有微軟Internet信息服務(wù)器(IIS)和Apache Http Server。使用Filezilla Server作為FTP服務(wù)器,使用MySQL作為數(shù)據(jù)庫管理系統(tǒng)。MySQL關(guān)系數(shù)據(jù)庫管理系統(tǒng)是一個(gè)速度快、成本低、易于升級(jí)管理的數(shù)據(jù)庫,而且MySQL開放源碼,這些特點(diǎn)非常適合中小型網(wǎng)站。目前建設(shè)的中俄聯(lián)合射電數(shù)據(jù)庫就是以MySQL關(guān)系數(shù)據(jù)庫管理系統(tǒng)為環(huán)境的,能實(shí)現(xiàn)數(shù)據(jù)庫的局域網(wǎng)甚至遠(yuǎn)程管理。為保證網(wǎng)站的安全穩(wěn)定運(yùn)行,局域網(wǎng)內(nèi)快速大量下載應(yīng)使用專用帳號(hào),遠(yuǎn)程下載需要提供合法的電子郵箱地址和驗(yàn)證密碼。
SSW是一個(gè)不依賴于硬件和臺(tái)址的廣泛兼容的數(shù)據(jù)分析系統(tǒng),使用特定的標(biāo)準(zhǔn)便于合成數(shù)據(jù)分析。同時(shí)該軟件系統(tǒng)也為太陽軟件提供者制定了規(guī)范和建議。中國SBRS觀測數(shù)據(jù)處理軟件適合于國內(nèi)所有頻譜儀的觀測數(shù)據(jù)處理且功能豐富,雖然未與SSW兼容但在一些程序設(shè)計(jì)和目錄結(jié)構(gòu)方面有相似之處。通過對SSW和SBRS觀測數(shù)據(jù)軟件的詳細(xì)闡述和比較分析,本文認(rèn)為現(xiàn)有的軟件系統(tǒng)與SSW兼容是切實(shí)可行的,進(jìn)而提出了一個(gè)詳細(xì)的設(shè)計(jì)方案。該設(shè)計(jì)方案在軟件的目錄規(guī)劃方面與SSW類似,其內(nèi)容在SBRS軟件中已部分齊備;在界面設(shè)計(jì)方面保留了SBRS的特點(diǎn)但更加簡潔適用;在功能模塊與流程設(shè)計(jì)方面更加注重設(shè)計(jì)編寫規(guī)范和功能完善,這也是應(yīng)對漏洞問題的前提。數(shù)據(jù)庫建設(shè)方案結(jié)合SBRS觀測數(shù)據(jù)的特點(diǎn)和國內(nèi)外研究人員的需求,根據(jù)現(xiàn)有觀測數(shù)據(jù)量估算升級(jí)后的數(shù)據(jù)庫容量建議為1 TB,利用MySQL關(guān)系數(shù)據(jù)庫管理系統(tǒng)建設(shè)一個(gè)安全穩(wěn)定、易于升級(jí)管理的數(shù)據(jù)庫。
該數(shù)據(jù)分析系統(tǒng)的成功開發(fā)將挽救在數(shù)據(jù)堆積中不斷淹沒的科學(xué)信息,從而提高數(shù)據(jù)分析效能和數(shù)據(jù)利用效率,有望今后在海量的統(tǒng)計(jì)研究和精細(xì)的數(shù)據(jù)分析中發(fā)現(xiàn)新的太陽物理現(xiàn)象和規(guī)律,擴(kuò)大數(shù)據(jù)的國際交流,提高觀測設(shè)備的國際影響力。同時(shí)為中國太陽射電頻譜日像儀項(xiàng)目的數(shù)據(jù)分析系統(tǒng)積累經(jīng)驗(yàn)和儲(chǔ)備技術(shù),并為國內(nèi)其它臺(tái)站提供模式和經(jīng)驗(yàn)。軟件中應(yīng)用到的各種數(shù)值分析方法和計(jì)算技巧也可以推廣到其它研究中。
[1]Fu Qijun,Qin Zihai,Ji Huirong,et al.A Broadband Spectrometer for Decimeter and Microwave Radio Bursts[J].Solar Physics,1995,160(1):97-103.
[2]Fu Qijun,Ji Huirong,Qin Zihai,et al.A New Solar Broadband Radio Spectrometer(SBRS)in China [J].Solar Physics,2004,222(1):167 -173.
[3]Ji Huirong,F(xiàn)u Qijun,Liu Yuying,et al.A Solar Radio Spectrometer at 5.2 ~7.6 GHz [J].Solar Physics,2003,213(2):359-366.
[4]Hugh Hudson,David Mc Kenzie.Comlicated Radio Waves from an X-class Flare [EB/OL]http://www.lmsal.com/YPOP/Nuggets/2002/020510/020510.html.
[5]Bentely R D,F(xiàn)reeland S L.SOLARSOFT-An Analysis Environment for Solar Physics[C]//Puerto de la Cruz,Tenerife,Canary Islands.A Crossroad for European Solar and Heliospheric Physics.Spain:ESA Publication SP,1998:225 -228.
[6]Freeland S L,Handy B N.Data Analysis with the SolarSoft System [J].Solar Physics,1998,182(2):497-500.
[7]Yan Y,Zhang J,Wang W,et al.The Chinese Spectral Radioheliograph—CSRH [J].Earth,Moon,and Planet,2009,104(1 -4):97-100.
[8]Yan Y H,Tan C M,Xu L,et al.Nonlinear Calibration and Data Processing of the Solar Radio Burst[J].Science in China Series A,2002,45(21):89-96.
[9]Sych Robert A,Yan Yihua.Wavelet Cleaning of Solar Dynamic Radio Spectrograms [J].ChJAA,2002,2(2):183-192.
[10]Yan Y,Zhang L,Tan C,et al.Microwave Zebra Pattern Bursts of 21-April-2002 X1.5 Flare[J].IAUS,2004(219):722 -727.
[11]Tan Chengming,Yan Yihua,Tan Baolin,et al.Calibration of the Solar Radio Spectrometer[J].Science in China Series G,2009(52):1760-1764.