王 鈺,黃少平
(江西省氣象信息中心,330096,南昌)
紙質(zhì)氣象記錄檔案是氣象檔案的重要資源,其中壓、溫、濕、風(fēng)、降水自記紙是數(shù)量最多、時(shí)間分辨率較高的氣象記錄檔案,但早期受檔案載體及信息技術(shù)限制利用率較低,特別是自記跡線中包含的分鐘級(jí)數(shù)據(jù)沒(méi)有得到充分應(yīng)用。隨著計(jì)算機(jī)圖像識(shí)別技術(shù)的發(fā)展,降水自記紙、EL型電接風(fēng)自記紙先后開(kāi)始自記跡線數(shù)字化提取[1-3],獲取了分鐘級(jí)降水?dāng)?shù)據(jù)、風(fēng)向風(fēng)速自記數(shù)據(jù),并為各地城市暴雨強(qiáng)度公式計(jì)算、風(fēng)能資源評(píng)價(jià)提供了高時(shí)間分辨率的基礎(chǔ)數(shù)據(jù)支持。
雖然自記紙數(shù)字化提取的每個(gè)步驟都進(jìn)行了數(shù)據(jù)質(zhì)量控制,但數(shù)字化成果完整、系統(tǒng)地質(zhì)量控制一直未開(kāi)展。由此,2018年中國(guó)氣象局“關(guān)于做好2018年氣象業(yè)務(wù)檔案相關(guān)工作的通知”中下達(dá)EL型電接風(fēng)自記紙數(shù)字化成果質(zhì)量控制軟件研發(fā)任務(wù),旨在通過(guò)質(zhì)量控制提升EL型電接風(fēng)自記紙數(shù)字化成果的精確性。本文從軟件的技術(shù)規(guī)則、功能設(shè)計(jì)與應(yīng)用實(shí)效等方面進(jìn)行闡述,以期EL型風(fēng)自記紙數(shù)字化成果得到使用者的廣泛應(yīng)用及更進(jìn)一步的信賴。
風(fēng)自記紙數(shù)字化提取數(shù)據(jù)質(zhì)量控制依據(jù)《地面氣象觀測(cè)規(guī)范》和風(fēng)跡線提取數(shù)據(jù)質(zhì)量控制技術(shù)規(guī)則(表1),采取公司級(jí)、省級(jí)和國(guó)家級(jí)三級(jí)質(zhì)量控制方式。其中公司級(jí)質(zhì)量控制采用逐張自記紙質(zhì)量檢查,核對(duì)跡線提取數(shù)據(jù)是否正確;省級(jí)質(zhì)量控制采用通過(guò)省級(jí)風(fēng)跡線提取數(shù)據(jù)篩選技術(shù)規(guī)則(表2),對(duì)與A6文件中數(shù)據(jù)差異超過(guò)一定界限值、跡線異常處理等自記紙進(jìn)行檢查,判斷公司級(jí)人員處理是否正確;國(guó)家級(jí)質(zhì)量檢查采用通過(guò)國(guó)家級(jí)風(fēng)跡線提取數(shù)據(jù)篩選技術(shù)規(guī)則(表2),對(duì)省級(jí)可能出錯(cuò)的自記紙進(jìn)行檢查,判斷風(fēng)跡線提取數(shù)據(jù)是否正確、數(shù)字化成果是否完整等。
表1 風(fēng)跡線提取數(shù)據(jù)質(zhì)量控制技術(shù)規(guī)則
表2 風(fēng)跡線提取數(shù)據(jù)篩選技術(shù)規(guī)則
軟件結(jié)構(gòu)與數(shù)據(jù)流程如圖1所示。因軟件需要大量重復(fù)操作,重點(diǎn)考慮了軟件的穩(wěn)定性、通用性、實(shí)用性,故軟件采用C/S結(jié)構(gòu),不需要環(huán)境配置、插件安裝,兼容Windows XP、Windows 7、Windows10操作系統(tǒng),并具有“記憶”功能無(wú)需重復(fù)輸入。
圖1 EL型風(fēng)自記紙數(shù)字化成果質(zhì)量控制軟件結(jié)構(gòu)與數(shù)據(jù)流程
公司提取人員完成一個(gè)站全部風(fēng)自記紙跡線提取工作后,將預(yù)處理后圖像文件(jpg文件)、風(fēng)自記跡線文件(gal文件)、提取效果文件(png文件)、數(shù)據(jù)庫(kù)文件(db文件)、風(fēng)自記紙跡線分鐘數(shù)據(jù)文件(Fm文件)、小時(shí)數(shù)據(jù)文件(Fh文件)等6種數(shù)據(jù)文件嚴(yán)格按照《EL型電接風(fēng)自記紙數(shù)據(jù)提取技術(shù)規(guī)定》中“數(shù)據(jù)存儲(chǔ)目錄結(jié)構(gòu)”規(guī)定存儲(chǔ)后,移交公司質(zhì)量控制人員開(kāi)始公司級(jí)質(zhì)量控制工作。
2.1.1 軟件自動(dòng)檢查
1)數(shù)據(jù)文件完整性檢查,檢查風(fēng)自記紙?zhí)崛∵^(guò)程中形成的數(shù)據(jù)文件是否完整、存放路徑是否正確。
2)數(shù)據(jù)質(zhì)量檢查,檢查風(fēng)自記跡線文件、數(shù)據(jù)庫(kù)文件、風(fēng)自記分鐘和小時(shí)數(shù)據(jù)文件格式,檢查提取數(shù)據(jù)的值域、一致性、完整性和邏輯性的質(zhì)量,相關(guān)技術(shù)指標(biāo)詳見(jiàn)氣象行業(yè)標(biāo)準(zhǔn)《風(fēng)自記紙記錄數(shù)字化 EL型》(QXT 156—2021),逐條核實(shí)檢查出來(lái)的疑誤信息并備注說(shuō)明。
2.1.2 人工回放檢查 軟件自動(dòng)檢查后,利用風(fēng)自記跡線提取數(shù)據(jù)定位、圖像疊加技術(shù),對(duì)全部自記跡線提取的數(shù)據(jù)進(jìn)行逐張回放檢查:1)逐時(shí)A6數(shù)據(jù)是否完整;2)網(wǎng)格開(kāi)始時(shí)間、結(jié)束時(shí)間設(shè)置是否正確,即網(wǎng)格提取時(shí)間與自記紙?jiān)季W(wǎng)格起止時(shí)間應(yīng)重合;3)風(fēng)速跡線開(kāi)始、結(jié)束位置是否正確,風(fēng)速跡線開(kāi)始、結(jié)束時(shí)間的錄入值與自記紙上標(biāo)注的時(shí)間是否相符;4)風(fēng)速、風(fēng)向跟蹤線與自記紙跡線是否重合,即風(fēng)速跟蹤跡線保持在紙面跡線中心位置,每張自記紙風(fēng)向漏跟蹤劃數(shù)<15根;5)根據(jù)軟件提示判斷風(fēng)向缺失是否屬實(shí);6)根據(jù)軟件提示,對(duì)提取的逐時(shí)風(fēng)向風(fēng)速與A系列文件中對(duì)應(yīng)時(shí)次記錄差異較大的進(jìn)行檢查確認(rèn),根據(jù)檢查情況予以備注說(shuō)明,如無(wú)備注公司質(zhì)檢人員應(yīng)補(bǔ)充;7)自記紙跡線異常時(shí),應(yīng)檢查提取人員異常處理是否正確,并備注異常自記紙,備注內(nèi)容包括自記紙的年月日,站名,區(qū)站號(hào)。
2.1.3 數(shù)據(jù)提交 公司完成質(zhì)量控制后,將全部數(shù)據(jù)文件向省級(jí)氣象資料業(yè)務(wù)部門(mén)提交。
省級(jí)質(zhì)量控制與公司級(jí)質(zhì)量控制步驟基本一致,在公司級(jí)質(zhì)量控制的基礎(chǔ)上,對(duì)質(zhì)量控制軟件依據(jù)省級(jí)篩選技術(shù)規(guī)則(表2)篩查出的自記紙逐張進(jìn)行回放檢查,檢查要求同2.1.2。
省級(jí)完成質(zhì)量控制后,將全部數(shù)據(jù)文件向國(guó)家級(jí)氣象資料業(yè)務(wù)部門(mén)提交。
國(guó)家級(jí)質(zhì)量控制與省級(jí)質(zhì)量控制步驟基本一致,在省級(jí)質(zhì)量控制的基礎(chǔ)上,對(duì)質(zhì)量控制軟件依據(jù)國(guó)家級(jí)篩選技術(shù)規(guī)則(表2)篩查出的自記紙,需在29吋顯示器上全屏顯示自記紙的狀態(tài)逐張進(jìn)行回放檢查,檢查要求同2.1.2。
國(guó)家級(jí)依據(jù)質(zhì)量控制結(jié)果填寫(xiě)“疑誤信息查詢單”向省級(jí)查詢;省級(jí)反饋后國(guó)家級(jí)最后根據(jù)質(zhì)量控制結(jié)果和反饋信息給出每個(gè)站數(shù)字化成果質(zhì)量檢查結(jié)論,編制數(shù)字化成果質(zhì)量評(píng)估報(bào)告。
江西省應(yīng)用質(zhì)檢軟件完成82個(gè)站風(fēng)自記紙跡線提取數(shù)據(jù)的質(zhì)量控制。各站風(fēng)自記紙總數(shù)量雖有差異,但質(zhì)量控制軟件依據(jù)篩選技術(shù)規(guī)則均按30%的比例自動(dòng)篩選風(fēng)自記紙進(jìn)行質(zhì)量檢查,平均每站抽檢3 173張。剔除人工誤判的8個(gè)站點(diǎn),從74個(gè)站點(diǎn)國(guó)家級(jí)質(zhì)量控制結(jié)果來(lái)分析(圖2),各站存在疑誤的風(fēng)自記紙?jiān)?~243張之間,經(jīng)國(guó)家級(jí)質(zhì)檢后省級(jí)確認(rèn)為錯(cuò)誤的自記紙各站在0~243張之間,確認(rèn)比例各站在53.9%~100.0%之間,其中只有1個(gè)站點(diǎn)的確認(rèn)率0%,54個(gè)站點(diǎn)的確認(rèn)率達(dá)100%,平均確認(rèn)比例達(dá)94.8%,從平均確認(rèn)比例分析,軟件起到了風(fēng)自記紙跡線提取數(shù)據(jù)質(zhì)量控制的作用,有效提高了EL型電接風(fēng)自記紙數(shù)字化成果的質(zhì)量。
圖2 風(fēng)跡線提取數(shù)據(jù)國(guó)家級(jí)質(zhì)量控制結(jié)果
1)該軟件采取公司級(jí)、省級(jí)和國(guó)家級(jí)三級(jí)質(zhì)量控制方式,其中公司級(jí)采用逐張自記紙回放檢查,核對(duì)跡線提取數(shù)據(jù)是否正確;省級(jí)和國(guó)家級(jí)采用篩選技術(shù)規(guī)則,對(duì)超過(guò)一定界限值、跡線異常處理等自記紙進(jìn)行檢查,分別對(duì)公司級(jí)處理是否正確、省級(jí)可能出錯(cuò)進(jìn)行檢查,判斷風(fēng)跡線提取數(shù)據(jù)是否正確、數(shù)字化成果是否完整等。
2)軟件采用自動(dòng)檢查、人工回放檢查相結(jié)合的方式,篩選出不符合技術(shù)規(guī)定的風(fēng)自記紙,再逐張人工回放檢查,不僅減少了重復(fù)檢查時(shí)間,而且提高檢查效率。
3)通過(guò)已完成國(guó)家級(jí)質(zhì)量控制74個(gè)站質(zhì)量情況看,軟件均按30%的比例自動(dòng)篩選風(fēng)自記紙進(jìn)行質(zhì)量檢查;各站存在疑誤的風(fēng)自記紙?jiān)?~243張之間,經(jīng)省級(jí)確認(rèn)為錯(cuò)誤的自記紙各站在0~243張之間,確認(rèn)比例各站在53.9%~100.0%之間,平均確認(rèn)比例為94.8%,疑誤100%確認(rèn)的站點(diǎn)達(dá)54個(gè),確認(rèn)比例高,說(shuō)明質(zhì)控軟件起到了風(fēng)自記紙跡線提取數(shù)據(jù)質(zhì)量控制的作用。