李淼,田宗彪,陳海鵬,楊緒峰
(國家測繪產(chǎn)品質(zhì)量檢驗測試中心,北京 100036)
地理國情是重要的基本國情[1],做好重大國情國力的動態(tài)監(jiān)測,是全面了解國情、把握國勢、制定國策的基礎性工作[2]。隨著自然資源監(jiān)管的融合統(tǒng)一,地理國情監(jiān)測成果的應用領域隨之擴大,應用層級也隨之提升[3],地理國情監(jiān)測成果將持續(xù)發(fā)揮對各類自然資源調(diào)查監(jiān)測的基礎性支撐作用,其成果質(zhì)量水平將直接影響自然資源調(diào)查監(jiān)測各類統(tǒng)計、分析結果的正確性與可靠性[4]。自然資源調(diào)查監(jiān)測業(yè)務對地理國情監(jiān)測成果提出了更高的要求,因此,基礎性地理國情監(jiān)測成果的質(zhì)量提升方法研究是其重要保障。本文分析總結了在自然資源監(jiān)管融合統(tǒng)一的格局下基礎性地理國情監(jiān)測成果的質(zhì)量要求,并結合實際生產(chǎn)中頻發(fā)性、關鍵性的典型問題分析質(zhì)量影響因素,提出了質(zhì)量提升的方法和措施。
地理國情監(jiān)測成果主要是利用多源航空航天遙感影像中蘊含的豐富光譜、紋理及時相特征[5],結合各種參考資料和知識,采用交互解譯、外業(yè)調(diào)查等方法,提取地表覆蓋分布及變化信息,采用數(shù)據(jù)集、元數(shù)據(jù)和統(tǒng)計等進行數(shù)據(jù)表達,具備數(shù)學基礎、數(shù)據(jù)精度和數(shù)據(jù)現(xiàn)勢性等質(zhì)量特征[6]。由于我國地域廣袤,各地自然和人文環(huán)境差異較大,衛(wèi)星遙感影像源往往存在傳感器多源差異大等問題,對地表變化信息采集造成不利影響,再加上生產(chǎn)作業(yè)過程中存在的各種人為和軟件因素[7],導致地理國情監(jiān)測數(shù)據(jù)成果中難免存在各種質(zhì)量問題,其中時間精度、采集精度、分類精度和屬性精度嚴重影響監(jiān)測成果的數(shù)據(jù)質(zhì)量,在面向自然資源大數(shù)據(jù)集成和融合的過程中,存在影響政府部門應用統(tǒng)計分析、影響決策正確性的風險[8]。
地理國情監(jiān)測數(shù)據(jù)成果要求原始資料數(shù)據(jù)源、行業(yè)資料和成果數(shù)據(jù)均滿足時點要求[9]。一般采用資料核查分析方法進行檢驗,核實內(nèi)容包括影像數(shù)據(jù)源的時相信息、各行業(yè)專題資料的現(xiàn)勢性、外業(yè)調(diào)查工作的時效性以及最終成果的時點。
地理國情監(jiān)測成果的數(shù)學精度主要體現(xiàn)在地表覆蓋數(shù)據(jù)采集和國情要素數(shù)據(jù)采集的地物范圍與影像上地物邊界和位置的對應程度。檢查內(nèi)容包括幾何位移和矢量接邊,一般要求在合格正射影像的基礎上,影像上分界明顯的地表覆蓋分類界線和地理國情要素的邊界以及定位點的采集精度控制在5個像素以內(nèi)。
地理國情監(jiān)測成果的分類精度檢查內(nèi)容主要包括分類正確性和覆蓋完整性2個方面。首先,要求數(shù)據(jù)成果應完整覆蓋所承擔監(jiān)測任務區(qū)的范圍;其次,要求在沒有明顯分界線的過渡地帶內(nèi),地表覆蓋分類數(shù)據(jù)中的圖斑應至少保證符合上一級類型的歸類要求,分界線明顯的圖斑須嚴格按照歸類要求正確歸類。
地理國情監(jiān)測成果的屬性精度檢查內(nèi)容主要包括通用屬性項、專有屬性項的完整性和正確性。要求值域范圍符合枚舉值要求,標識發(fā)生變化類型的屬性客觀正確,更新對象與正射影像、外調(diào)成果、行業(yè)專題資料以及其他參考資料的屬性一致等。
本文結合近年來從事的基礎性地理國情監(jiān)測數(shù)據(jù)檢查工作進行分析,梳理歸納常見影響成果質(zhì)量的問題,主要集中表現(xiàn)為以下幾個方面。
將轉基因煙草葉片用100 mol/L 的eBL處理10 h。提取BnBZL2蛋白,將20 mg蛋白加到12%的SDS-PAGE上進行分離,并轉移至硝酸纖維素膜(100 mA,1 h)。將硝酸纖維素膜在含有1% BSA的PEB緩沖液中封閉處理1 h,然后用抗GFP抗體(Santa cruz biotechnology)探測堿性磷酸酶標記的二抗。15 min后加入底物BCIP/NBT(Invitrogen),停止反應后進行觀察。
數(shù)據(jù)源使用不正確導致在時間精度、采集精度、分類精度和屬性精度方面產(chǎn)生質(zhì)量問題。數(shù)據(jù)源主要包括影像和專業(yè)部門的專題資料。在影像保障上,國家層面分批多次下發(fā)影像數(shù)據(jù),除統(tǒng)一開展的影像資料收集工作外,允許各作業(yè)單位發(fā)揮自身優(yōu)勢協(xié)同開展影像收集工作;在專題資料收集上,除了國家基礎數(shù)據(jù)外,還有各省自行收集到的水利、林業(yè)、國土、交通、民政、環(huán)境等相關部門的專題資料。在數(shù)據(jù)源使用過程中,需要綜合考慮影像分辨率和時相的要求,并充分利用權威專業(yè)部門現(xiàn)勢性好、規(guī)范程度高的資料。數(shù)據(jù)源使用常見以下問題:同一重要區(qū)域覆蓋多源影像,未采用高分辨率影像進行數(shù)據(jù)生產(chǎn),導致邊界范圍采集精度超限;同一區(qū)域具有監(jiān)測期內(nèi)不同時相的同類型影像資料,未采用第二季度影像或最新影像進行生產(chǎn),導致影像現(xiàn)勢性不滿足要求,造成圖斑漏更新;其他各類基礎測繪成果和水利、林業(yè)、國土、交通、民政、環(huán)境等相關部門的專題資料成果時相性不滿足要求或?qū)n}資料的分析整理不到位,導致要素更新錯誤。
針對數(shù)據(jù)源使用問題,提出以下2點建議。
①由于影像資料難以一次性收集,且由于客觀原因分批次下發(fā)的影像在分辨率、時相方面存在較多差異,在影像資料使用時,應以選擇使用有效信息量更大、更有利于信息提取的影像為原則。為避免作業(yè)員在生產(chǎn)過程中使用單景影像發(fā)生數(shù)據(jù)源選擇錯誤的情況,建議作業(yè)單位組織專人對影像進行篩選,選擇分辨率和時相更為合適的影像,分批次按不同分辨率進行影像鑲嵌拼接。作業(yè)員使用鑲嵌后影像進行生產(chǎn),保證作業(yè)員在作業(yè)過程中使用的影像唯一,降低作業(yè)員切換影像導致影像源使用錯誤的風險。
②在利用專題資料進行生產(chǎn)時,應對各類資料進行時效性和正確性的篩選、甄別、整理,確保專題資料的可使用性。
1)數(shù)據(jù)采集超限。采集精度超限的問題主要源自影像使用方面,沒有依據(jù)影像進行準確的范圍采集。例如城市地區(qū)前期已采用低分辨率影像進行數(shù)據(jù)更新,但由于影像分辨率低,范圍邊界更新不準確,在補充高分辨率衛(wèi)星影像數(shù)據(jù)源的情況下,未依據(jù)高分辨率影像進行邊界范圍的調(diào)整,導致圖斑邊界和正射影像套和差超限;監(jiān)測期影像上地物類型和范圍均發(fā)生改變,作業(yè)過程中只依據(jù)新時期影像進行地類編碼的修改,未對圖斑邊界范圍進行修改,導致邊界范圍采集超限。圖1反映的問題為監(jiān)測期地物發(fā)生變化,作業(yè)員未根據(jù)監(jiān)測影像更新圖斑編碼和邊界,導致圖斑邊界與正射影像邊界不套和。
圖1 采集精度超限
2)圖斑漏更新。在作業(yè)過程中,由于技術路線驗證不充分和對地物更新尺度把握不統(tǒng)一,導致圖斑存在漏更新錯誤。個別作業(yè)員習慣將變化區(qū)域識別和變化信息采集分為2個獨立的作業(yè)過程,變化區(qū)域識別過程僅疊加2期影像進行變化范圍的確定,變化信息采集過程中只疊加本底矢量數(shù)據(jù)、監(jiān)測期影像和變化范圍圖層,在已識別的變化范圍內(nèi)進行變化信息的采集,忽略了范圍外的變化,導致地物變化漏更新。遙感影像上同種地物可能具有不同的光譜特征,作業(yè)員對某些地物的解譯和更新指標等理解不到位,更新尺度不一致,導致圖斑漏更新。圖斑漏更新直接影響監(jiān)測數(shù)據(jù)在更新數(shù)據(jù)集上的統(tǒng)計分析和使用。圖2反映的問題為種植土地變更為房屋建筑區(qū),未依據(jù)監(jiān)測期影像進行地類更新。
圖2 建筑物漏更新
3)圖層間約束關系錯誤。由于地表覆蓋數(shù)據(jù)與地理國情要素數(shù)據(jù)分屬不同作業(yè)人員生產(chǎn),或后續(xù)修改過程中未注重2類成果間一致性等原因,容易造成同一生產(chǎn)單元的2類成果之間邏輯一致性出現(xiàn)問題,如道路中心線超出地表覆蓋路面范圍,常年河中心線不在地表覆蓋水面內(nèi)等。圖3反映的問題為地表覆蓋中水面和國情要素中高水界范圍線未同步更新。
圖3 水面和高水界約束關系錯誤
針對數(shù)據(jù)更新采集問題,提出以下3點建議。
②加強過程檢查,對影像及元數(shù)據(jù)制作、變化信息采集等關鍵作業(yè)環(huán)節(jié)進行質(zhì)量檢查,避免將錯誤帶入下一個生產(chǎn)環(huán)節(jié)。
③強調(diào)作業(yè)人員間的聯(lián)動更新,同時充分利用已有質(zhì)檢軟件,對數(shù)據(jù)的聯(lián)動更新問題進行排查。
屬性賦值貫穿于數(shù)據(jù)采集和編輯整理過程中。生產(chǎn)中為了提高生產(chǎn)效率,對某些屬性項進行軟件自動賦值,軟件在測試驗證不充分的情況下投入使用,勢必導致一些人為和軟件缺陷造成的屬性賦值錯誤,且一旦出現(xiàn)基本都是普遍性錯漏。
1)枚舉值賦值錯誤。數(shù)據(jù)中存在部分枚舉字段,可以采用人工或自動方式進行填寫。如在地理國情監(jiān)測數(shù)據(jù)成果中“變化類型”字段體現(xiàn)變化,應根據(jù)圖斑伸縮、新生等情況對字段進行賦值。在生產(chǎn)過程中存在因為個人理解不到位導致的“變化類型”賦值錯誤,也存在由于軟件未經(jīng)過測試驗證便投入使用而導致的“變化類型”“要素唯一標識碼”等枚舉值字段賦值錯誤。圖4反映的問題是新生型圖斑“變化類型”錯誤賦值為9。
圖4 變化類型錯誤
2)對象屬性與資料/實地不一致。國情要素更新主要依據(jù)權威部門的專題資料。由于各省收集的專題資料水平不一致,在專題資料完整性和時相性方面均存在差異,導致在生產(chǎn)中存在2方面問題:①沒有充分利用專題資料信息,可填寫的屬性漏填;②充分依賴專題資料,沒有對專題資料進行分析、整理和檢查,機械的賦值、明顯的錯誤沒有剔除,導致要素對象屬性與實地調(diào)查結果不一致。圖5反映的問題為依據(jù)專題資料對道路進行了更新,而通過外業(yè)照片資料進行核查,發(fā)現(xiàn)道路車道數(shù)、路寬屬性均與實地不一致。
圖5 道路屬性與實地不一致
3)圖斑類型錯誤。大面積圖斑更新錯誤會直接導致數(shù)據(jù)成果質(zhì)量不合格,使數(shù)據(jù)可信度降低,嚴重影響統(tǒng)計、分析和決策。圖斑類型錯誤主要由3方面原因造成:①由于圖斑切割或合并時誤操作導致原本未發(fā)生變化的圖斑錯誤更新;② 2期影像對比無明顯變化,僅通過內(nèi)業(yè)無法確定圖斑分類情況下,未輔以外業(yè)調(diào)查,僅通過內(nèi)業(yè)判讀對面積較大數(shù)據(jù)進行了更新;③編輯整理過程中未依據(jù)外業(yè)調(diào)查結果進行圖斑分類編碼的更新。圖6反映的問題為在進行數(shù)據(jù)更新生產(chǎn)時,對原有圖斑進行切割或合并操作,對圖斑賦屬性時產(chǎn)生人為錯誤,從而導致實際未發(fā)生變化的城市道路CC碼賦值錯誤。
圖6 將城市道路錯地表示為草地
針對屬性賦值問題,提出以下3點建議。
①在生產(chǎn)過程中謹慎使用軟件進行賦值,對投入使用的軟件加大前期測試的力度和強度,對重點屬性進行重點測試,并結合質(zhì)檢問題的持續(xù)暴露對軟件進行動態(tài)更新,確保自動化賦值的正確性。
②各級檢查工作中加大對大圖斑的排查力度。
③加強內(nèi)外業(yè)的工序銜接,在無充分依據(jù)的情況下不對存疑圖斑進行地類更新。對專題資料要合理有效利用,同時根據(jù)外業(yè)調(diào)查結果進行內(nèi)業(yè)成果編輯整理,確保內(nèi)外業(yè)結果一致。
基礎性地理國情監(jiān)測數(shù)據(jù)生產(chǎn)是一個人力密集型的生產(chǎn)過程,自動化過程占用生產(chǎn)的小部分,數(shù)據(jù)生產(chǎn)工序復雜,成果類型繁雜。本文圍繞人員、設備、資料、技術、質(zhì)量管控機制等方面,提出以問題為導向、全過程質(zhì)量控制、按要素重要性分級檢查、優(yōu)化質(zhì)檢軟件資源配置、以方法預研為方向的多途徑創(chuàng)新質(zhì)量管控模式,不斷探索提升質(zhì)量把控成效的新思路,應用于基礎性地理國情監(jiān)測項目實施過程的關鍵環(huán)節(jié)。過程關鍵環(huán)節(jié)及其質(zhì)量提升措施如圖7所示。
圖7 過程關鍵環(huán)節(jié)及質(zhì)量提升措施
監(jiān)測數(shù)據(jù)成果的質(zhì)量控制應堅持以問題為導向,將檢查關注點從數(shù)據(jù)成果轉移到人員、設備、資料、技術、質(zhì)量管控機制5個方面,把握關鍵問題,從問題入手,確保各級質(zhì)檢有的放矢。在檢查過程中,緊盯嚴重影響成果質(zhì)量的關鍵環(huán)節(jié)和重要因素,包括以作業(yè)員為主導作用的工序所產(chǎn)生的缺陷、自動化過程所用軟件的不可靠性、數(shù)據(jù)資料收集利用的不充分性、技術路線方法的偏差性以及管理部門質(zhì)量監(jiān)管的不到位等。
地理國情監(jiān)測的質(zhì)量控制在傳統(tǒng)“兩檢一驗”測繪成果質(zhì)量檢驗理念的基礎上,遵循從作業(yè)單位到承擔單位再到國家層面的分級質(zhì)量管理,強化全過程質(zhì)量控制,對影響數(shù)據(jù)質(zhì)量的關鍵環(huán)節(jié)進行過程把控,及時發(fā)現(xiàn)并解決生產(chǎn)中出現(xiàn)的質(zhì)量問題,把質(zhì)量控制的關注點從結果控制前移至過程控制,充分發(fā)揮質(zhì)檢對生產(chǎn)的保障作用。同時加強技術培訓、督促和糾正技術偏差,及時發(fā)現(xiàn)影響監(jiān)測成果的普遍性、傾向性問題,統(tǒng)一技術標準,保障數(shù)據(jù)質(zhì)量符合技術設計要求,為自然資源專項調(diào)查等重大國情國力調(diào)查監(jiān)測奠定基礎。
在質(zhì)量評判環(huán)節(jié),根據(jù)后期監(jiān)測成果數(shù)據(jù)使用的程度不同,將國情要素劃分為極重要要素、重要要素和一般要素,成果出現(xiàn)不合格的較多情況是由極重要要素、重要要素出現(xiàn)錯漏導致。因此,從作業(yè)過程出發(fā),結合各級質(zhì)量控制,突出檢查極重要要素和重要要素,在質(zhì)檢力度不變的情況下,可有效保障成果質(zhì)量,將可能出現(xiàn)的質(zhì)量問題對成果使用造成的影響降至最低。
在現(xiàn)有作業(yè)模式中,質(zhì)檢軟件的使用在質(zhì)量檢查中成效較高,對檢查效率和成果質(zhì)量提升具有重大的促進作用。然而,生產(chǎn)單位質(zhì)檢軟件配置有限,加上各單位質(zhì)檢人員力量有限,導致質(zhì)檢軟件的使用只能短期集中于檢查環(huán)節(jié)。歷年來,國情監(jiān)測時間緊、任務重,通常在后期集中開展問題整改容易導致出現(xiàn)其他意外錯誤。本文結合多年工作經(jīng)驗,認為應將質(zhì)檢軟件使用前置,從生產(chǎn)作業(yè)環(huán)節(jié)就開始投入使用,利用質(zhì)檢軟件對關鍵質(zhì)量要素進行自查,可有效避免成果整改的集中化,通過不斷優(yōu)化質(zhì)檢資源配置,可大程度提高質(zhì)檢效率。
隨著地理國情監(jiān)測和自然資源其他行業(yè)調(diào)查監(jiān)測工作的深入開展,多年來獲取的各種影像源、專題資料以及各類數(shù)據(jù)產(chǎn)品規(guī)模不斷擴大[10],從數(shù)據(jù)量、增長速度、準確度和應用價值來看,標志著監(jiān)測數(shù)據(jù)已進入大數(shù)據(jù)時代[11],這意味著基礎性地理國情監(jiān)測數(shù)據(jù)成果的檢測數(shù)據(jù)將涉及國民經(jīng)濟的每一個角落,是一種重要的質(zhì)檢資源。質(zhì)檢部門要使用好這些共享數(shù)據(jù)資源,進行質(zhì)檢方法的科技創(chuàng)新,在互聯(lián)網(wǎng)、云模式的技術支持下,探索地理國情大數(shù)據(jù)的集成共享,構建可集成眾源數(shù)據(jù)的質(zhì)檢大數(shù)據(jù)支撐數(shù)據(jù)庫,形成可供用戶上傳下載的數(shù)據(jù)池,包括解譯樣本、專家知識,以及利用大數(shù)據(jù)深度學習提取的海量變化信息模型,用以輔助質(zhì)檢,從而提高質(zhì)檢工作效率,實現(xiàn)質(zhì)量管控的科學性、公正性、全面性與客觀性。
基礎性地理國情監(jiān)測是常態(tài)化的活動,歷年來取得的成果已在“多規(guī)合一”、城市規(guī)劃實施監(jiān)管、環(huán)境保護與治理、自然資源管理、空間用途管制等多個方面得到應用。隨著自然資源業(yè)務的融合統(tǒng)一,各項業(yè)務工作對地理國情信息產(chǎn)品將會提出更多、更高的要求。
本文對基礎性地理國情監(jiān)測數(shù)據(jù)質(zhì)量提升方法進行了論述,分析了出現(xiàn)的主要質(zhì)量問題及原因;提出了有針對性的質(zhì)量提升措施,包括以問題為導向的檢查方法、全過程的質(zhì)量管控方法、優(yōu)化質(zhì)檢軟件配置和突出重要檢查項的檢查模式,并對基于大數(shù)據(jù)的質(zhì)檢模式進行了初步探索。
本文提出的方法在實際質(zhì)量控制工作中加以運用,取得了較好的成效,對于基礎性地理國情監(jiān)測質(zhì)量控制工作具有一定的指導意義,對過程抽查、成果驗收、成果復核等環(huán)節(jié)具有一定的參考價值。在接下來的研究中,將圍繞地理國情監(jiān)測生產(chǎn)技術水平、成果形式多樣化,以及互聯(lián)網(wǎng)+大數(shù)據(jù)等多方面技術的發(fā)展,開展基礎性地理國情監(jiān)測數(shù)據(jù)成果質(zhì)量提升方法的深入研究。