馬郡澤
大數(shù)據(jù)技術(shù)為經(jīng)濟普查提供了新的手段,也帶來了數(shù)據(jù)量激增、數(shù)據(jù)安全隱患加劇、數(shù)據(jù)管理與分析難度增加等一系列新挑戰(zhàn)。為有效解決這些難題,需要通過與多個領(lǐng)域的數(shù)據(jù)關(guān)聯(lián)應用,發(fā)掘數(shù)據(jù)更大的價值,服務(wù)于經(jīng)濟管理的多個決策層面。
隨著信息技術(shù)的快速發(fā)展,大數(shù)據(jù)技術(shù)的應用為各行各業(yè)的數(shù)據(jù)發(fā)掘與分析提供了新的思路。然而大數(shù)據(jù)條件下經(jīng)濟普查也面臨一定的難點與挑戰(zhàn)。數(shù)據(jù)量與數(shù)據(jù)類型的多樣性使得數(shù)據(jù)的真實性和有效性難以保證,數(shù)據(jù)的隱私性與安全性也面臨威脅。此外,不同系統(tǒng)異構(gòu)數(shù)據(jù)之間關(guān)聯(lián)度的提高給數(shù)據(jù)分析的廣度與深度帶來挑戰(zhàn)。為此,需要從保證數(shù)據(jù)質(zhì)量、強化數(shù)據(jù)安全以及擴大數(shù)據(jù)應用等多個層面入手,綜合應對大數(shù)據(jù)條件下經(jīng)濟普查中的難點,發(fā)揮大數(shù)據(jù)技術(shù)對經(jīng)濟研究與決策支持的重要作用。
一、大數(shù)據(jù)背景下經(jīng)濟普查的難點
(一)數(shù)據(jù)質(zhì)量問題
在大數(shù)據(jù)時代,數(shù)據(jù)的質(zhì)量是影響數(shù)據(jù)分析的關(guān)鍵因素。然而,經(jīng)濟普查中的數(shù)據(jù)質(zhì)量面臨著嚴峻的挑戰(zhàn)。首先,由于數(shù)據(jù)來源廣泛,真實性難免受到影響。例如,一些數(shù)據(jù)可能來自不可靠的渠道,或者存在人為的篡改、偽造、誤報等現(xiàn)象。這些都會導致數(shù)據(jù)的真實性降低,影響數(shù)據(jù)的可信度和有效性。其次,異構(gòu)數(shù)據(jù)之間存在語義不匹配的問題。例如,不同的數(shù)據(jù)源可能采用不同的數(shù)據(jù)格式、編碼、標準、定義等,導致數(shù)據(jù)之間的一致性和互操作性差。
(二)數(shù)據(jù)安全問題
在大數(shù)據(jù)環(huán)境下,經(jīng)濟普查數(shù)據(jù)規(guī)模巨大,涉及個人、企業(yè)的隱私數(shù)據(jù)。這些敏感數(shù)據(jù)很容易受到外部的攻擊、盜取或篡改,數(shù)據(jù)安全問題凸顯。一旦出現(xiàn)數(shù)據(jù)泄密,后果嚴重。例如,個人的身份信息、收入情況、消費行為等,如果被泄露,可能會導致個人的財產(chǎn)損失、信用受損、隱私侵犯等。企業(yè)的經(jīng)營狀況、市場占有率、核心技術(shù)等,如果泄露,可能導致企業(yè)的競爭力下降、商業(yè)機密泄露、知識產(chǎn)權(quán)被侵權(quán)等。
(三)數(shù)據(jù)處理問題
大數(shù)據(jù)時代數(shù)據(jù)類型復雜、變化快,給數(shù)據(jù)處理帶來困難。如何快速高效地對海量經(jīng)濟普查數(shù)據(jù)進行收集、存儲、清理、轉(zhuǎn)換、加載、運算分析,是數(shù)據(jù)處理面臨的難題。例如,數(shù)據(jù)收集過程中,需要考慮數(shù)據(jù)的來源、時效、完整、準確等因素,并采用合適的數(shù)據(jù)采集方法和工具。數(shù)據(jù)存儲過程中,需要考慮數(shù)據(jù)的規(guī)模、結(jié)構(gòu)、分布、可訪問性等因素,并采用合適的數(shù)據(jù)存儲模式和技術(shù)。數(shù)據(jù)清理過程中,需要考慮數(shù)據(jù)的質(zhì)量、一致性、有效性等因素,并采用合適的數(shù)據(jù)清理方法和工具。這些數(shù)據(jù)處理的各個環(huán)節(jié)都需要大量的時間、資源、技術(shù)和人力,并且存在相互依賴和影響的關(guān)系,難度不小。
(四)數(shù)據(jù)應用問題
如何擴大經(jīng)濟普查大數(shù)據(jù)的應用范圍,讓數(shù)據(jù)發(fā)揮更大的價值,也是目前面臨的難點。比如開發(fā)符合決策需求的應用,實現(xiàn)與其他領(lǐng)域數(shù)據(jù)的有效融合等,仍有不少工作要做。例如,如何將經(jīng)濟普查數(shù)據(jù)與社會、政治、文化、環(huán)境等其他領(lǐng)域的數(shù)據(jù)進行有效整合,形成更全面、更深入的數(shù)據(jù)分析,從而為各級政府和社會各界提供更有價值的數(shù)據(jù)支持和服務(wù)。如何將經(jīng)濟普查數(shù)據(jù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等其他技術(shù)進行有效結(jié)合,形成更智能、更便捷的數(shù)據(jù)應用和服務(wù),從而為個人、企業(yè)和社會提供更有用的數(shù)據(jù)產(chǎn)品和解決方案。這些都是經(jīng)濟普查大數(shù)據(jù)應用的方向和目標,但也存在著技術(shù)、資源、管理、法律等方面的障礙和挑戰(zhàn)。
(五)信息共享問題
在大數(shù)據(jù)背景下,經(jīng)濟普查數(shù)據(jù)的信息共享是提高數(shù)據(jù)利用效率和價值的重要途徑。然而,目前經(jīng)濟普查數(shù)據(jù)的信息共享還存在著一些難點。首先,信息共享的法律法規(guī)不完善,缺乏統(tǒng)一的標準和規(guī)范,導致信息共享的主體、范圍、方式、責任等不明確,存在法律風險。例如,數(shù)據(jù)的所有權(quán)、使用權(quán)、許可權(quán)等不清晰,導致數(shù)據(jù)的共享受到限制或阻礙。其次,信息共享的技術(shù)平臺不健全,缺乏統(tǒng)一的數(shù)據(jù)交換和共享機制,導致信息共享的效率和質(zhì)量低下,存在技術(shù)障礙和困難。例如,數(shù)據(jù)的格式、編碼、標準、定義等不統(tǒng)一,導致數(shù)據(jù)的轉(zhuǎn)換和匹配困難。最后,信息共享的管理制度不健全,缺乏有效的數(shù)據(jù)監(jiān)督和評估機制,導致信息共享的秩序和效果不理想,存在管理漏洞和問題。例如,沒有對數(shù)據(jù)的共享過程和結(jié)果進行有效記錄和反饋,導致數(shù)據(jù)的共享缺乏透明度和可追溯性。
二、對策分析
(一)建立健全數(shù)據(jù)質(zhì)量管理體系
首先,建立全面的數(shù)據(jù)質(zhì)量監(jiān)測機制,加強對數(shù)據(jù)來源的管理,確保入庫數(shù)據(jù)的真實可靠。例如,可以通過數(shù)據(jù)源的認證、數(shù)據(jù)的抽樣檢驗、數(shù)據(jù)的交叉驗證等方法,對數(shù)據(jù)的來源進行篩選和評估,排除不可信的數(shù)據(jù)源,提高數(shù)據(jù)的真實性。同時,要不斷完善數(shù)據(jù)標準,強化數(shù)據(jù)之間的關(guān)聯(lián)與匹配,減少異構(gòu)系統(tǒng)數(shù)據(jù)之間的語義偏差。例如,可以通過制定統(tǒng)一的數(shù)據(jù)格式、編碼、標準、定義等,對數(shù)據(jù)進行規(guī)范化和標準化管理,提高數(shù)據(jù)的一致性。還可以通過建立數(shù)據(jù)字典、數(shù)據(jù)目錄、數(shù)據(jù)地圖等,對數(shù)據(jù)進行描述和注釋,提高數(shù)據(jù)的可理解性。
(二)加強數(shù)據(jù)安全保護措施
首先,建立嚴密的數(shù)據(jù)安全體系,運用加密、脫敏、權(quán)限控制等技術(shù)手段,防范外部攻擊和內(nèi)部泄密,保護數(shù)據(jù)的完整性和隱私性。例如,可以通過對數(shù)據(jù)進行加密處理,使數(shù)據(jù)在傳輸和存儲過程中不被竊取或破解,保護數(shù)據(jù)的完整性。還可以通過對數(shù)據(jù)進行脫敏處理,使數(shù)據(jù)在使用和展示過程中不暴露敏感信息,保護數(shù)據(jù)的隱私性。此外,還要加強安全意識培訓,營造所有員工共治的數(shù)據(jù)安全氛圍。例如,可以通過定期的安全教育、安全演練、安全考核等方式,增強員工的安全意識和技能,規(guī)范員工的數(shù)據(jù)使用行為,防止數(shù)據(jù)的濫用或泄露。
(三)利用大數(shù)據(jù)技術(shù)和工具
面對數(shù)據(jù)類型和數(shù)量的爆炸式增長,需要使用大數(shù)據(jù)處理平臺,選擇高效的分布式存儲系統(tǒng),建立高性能的分析計算框架,使用流式處理、內(nèi)存計算等技術(shù)加速數(shù)據(jù)處理,使之能夠適應數(shù)據(jù)量大、速度快、類型復雜的特點。例如,可以使用Hadoop、Spark等大數(shù)據(jù)處理平臺,對海量經(jīng)濟普查數(shù)據(jù)進行收集、存儲、清理、轉(zhuǎn)換、加載、運算分析等操作,提高數(shù)據(jù)處理的效率和質(zhì)量。還可以使用Kafka、Storm、Flink等流式處理技術(shù),對實時經(jīng)濟普查數(shù)據(jù)進行快速的處理和分析,提高數(shù)據(jù)處理的時效性和實時性。
(四)拓展數(shù)據(jù)的應用領(lǐng)域
主動拓寬經(jīng)濟普查大數(shù)據(jù)應用的范圍,通過和其他領(lǐng)域數(shù)據(jù)的有效融合,服務(wù)于更廣泛的決策需求。比如,支持經(jīng)濟狀況評估與預測、構(gòu)建知識圖譜、進行數(shù)據(jù)可視化展示等,讓數(shù)據(jù)應用惠及更多領(lǐng)域,提升數(shù)據(jù)分析的價值。例如,可以通過將經(jīng)濟普查數(shù)據(jù)與社會、政治、文化、環(huán)境等其他領(lǐng)域的數(shù)據(jù)進行有效整合,形成更全面、更深入的數(shù)據(jù)分析和挖掘,從而為各級政府和社會各界提供更有價值的數(shù)據(jù)支持和服務(wù)。還可以通過將經(jīng)濟普查數(shù)據(jù)與互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、人工智能等其他技術(shù)進行有效結(jié)合,形成更智能、更便捷的數(shù)據(jù)應用和服務(wù),從而為個人、企業(yè)和社會提供更有用的數(shù)據(jù)產(chǎn)品和解決方案。
(五)推進數(shù)據(jù)開放和共享
從法律、技術(shù)、管理等方面推進數(shù)據(jù)的開放和共享。首先,完善數(shù)據(jù)的法律法規(guī),明確數(shù)據(jù)的權(quán)屬和責任,制定數(shù)據(jù)的共享標準和規(guī)范,保障數(shù)據(jù)的合法合規(guī)共享。例如,可以通過制定數(shù)據(jù)的分類和分級制度,確定數(shù)據(jù)的共享主體、范圍、方式、條件等,規(guī)范數(shù)據(jù)的共享行為。還可以通過建立數(shù)據(jù)的保護和懲罰制度,保護數(shù)據(jù)的安全和隱私,防止數(shù)據(jù)的濫用和泄露。其次,建立數(shù)據(jù)庫技術(shù)平臺,實現(xiàn)數(shù)據(jù)的統(tǒng)一交換和共享,提高數(shù)據(jù)的共享效率和質(zhì)量。例如,可以通過建立數(shù)據(jù)的共享中心,提供數(shù)據(jù)的發(fā)布、查詢、申請、下載等服務(wù),方便數(shù)據(jù)的共享使用。還可以通過建立數(shù)據(jù)的共享協(xié)議,實現(xiàn)數(shù)據(jù)的格式、編碼、標準、定義等的統(tǒng)一。最后,健全數(shù)據(jù)的管理制度,加強數(shù)據(jù)的監(jiān)督和評估,優(yōu)化數(shù)據(jù)的共享秩序和效果。例如,可以通過建立數(shù)據(jù)的共享日志,記錄數(shù)據(jù)的共享過程和結(jié)果,提高數(shù)據(jù)的共享透明度和可追溯性。還可以通過建立數(shù)據(jù)的共享指標,評估數(shù)據(jù)的共享質(zhì)量和價值,提高數(shù)據(jù)的共享效益和水平。
三、大數(shù)據(jù)背景下經(jīng)濟普查的優(yōu)化措施
(一)多源異構(gòu)數(shù)據(jù)關(guān)聯(lián)分析,支持經(jīng)濟狀況評估與預測
在大數(shù)據(jù)環(huán)境下,可以收集更多類型的經(jīng)濟運行數(shù)據(jù),并與普查數(shù)據(jù)實現(xiàn)有效關(guān)聯(lián),從更多維度解析經(jīng)濟狀況,進而通過模型運算,得出經(jīng)濟形勢評估分析以及未來趨勢預測。例如,可以收集社會、政治、文化、環(huán)境等其他領(lǐng)域的數(shù)據(jù),并與經(jīng)濟普查數(shù)據(jù)進行關(guān)聯(lián)分析,從宏觀和微觀的角度,揭示經(jīng)濟狀況的影響因素、變化規(guī)律、發(fā)展方向等。還可以通過機器學習、深度學習等模型,對經(jīng)濟普查數(shù)據(jù)進行運算分析,從歷史和現(xiàn)狀的角度,評估經(jīng)濟狀況的優(yōu)劣、問題、風險等。此外,還可以通過時間序列分析、趨勢預測等模型,對經(jīng)濟普查數(shù)據(jù)進行運算分析,從未來的角度,預測經(jīng)濟狀況的變化、趨勢、機遇等。
(二)建立經(jīng)濟普查知識圖譜,支持問答、決策等服務(wù)
基于知識圖譜,可以構(gòu)建智能問答、決策分析等服務(wù),輔助管理決策。例如,可以通過知識圖譜技術(shù),將經(jīng)濟普查數(shù)據(jù)中的經(jīng)濟活動主體、經(jīng)濟狀況、經(jīng)濟指標等,作為實體,將實體之間的從屬、關(guān)聯(lián)、影響等關(guān)系,構(gòu)建經(jīng)濟普查知識圖譜,形成經(jīng)濟普查領(lǐng)域的概念體系。還可以通過知識圖譜技術(shù),將經(jīng)濟普查數(shù)據(jù)中的新的數(shù)據(jù)、信息、知識等,不斷融入知識圖譜,豐富圖譜內(nèi)容。此外,還可以基于知識圖譜,構(gòu)建智能問答、決策分析等服務(wù),輔助管理決策。例如,可以通過智能問答服務(wù),根據(jù)用戶的自然語言問題,從知識圖譜中檢索相關(guān)的實體和關(guān)系,給出精準的答案。還可以通過決策分析服務(wù),根據(jù)用戶的決策目標,從知識圖譜中提取相關(guān)的實體和關(guān)系,進行數(shù)據(jù)分析和模型運算,給出優(yōu)化的方案。
(三)數(shù)據(jù)可視化展示分析成果,直觀反映經(jīng)濟動態(tài)
充分利用可視化的展示手段,將抽象的數(shù)據(jù)轉(zhuǎn)化為直觀的圖表,通過動態(tài)的、交互式的可視化應用,將經(jīng)濟普查數(shù)據(jù)分析的結(jié)果和經(jīng)濟發(fā)展動態(tài)更好地呈現(xiàn)出來,提升分析成果的說服力。例如,可以利用柱狀圖、折線圖、餅圖等常見的圖表,將經(jīng)濟普查數(shù)據(jù)分析的結(jié)果,如經(jīng)濟活動主體的數(shù)量、結(jié)構(gòu)、分布等,以及經(jīng)濟狀況的評估、預測等,以簡潔明了的方式展示出來,突出數(shù)據(jù)的重點和趨勢。還可以利用地圖、儀表盤、故事板等高級的圖表,將經(jīng)濟普查數(shù)據(jù)分析的結(jié)果,如經(jīng)濟活動主體的地理位置、經(jīng)濟狀況的區(qū)域差異等,以及經(jīng)濟發(fā)展動態(tài)的變化、影響等,以生動形象的方式展示出來,增加數(shù)據(jù)的吸引力和感染力。此外,還可以利用動態(tài)的、交互式的可視化應用,讓用戶可以根據(jù)自己的需求,對數(shù)據(jù)進行篩選、排序、比較、聚合等操作,實現(xiàn)數(shù)據(jù)的個性化和定制化展示,提高數(shù)據(jù)的可用性和靈活性。
(四)建立經(jīng)濟活動場景和portrait,支持精準識別與畫像
大數(shù)據(jù)技術(shù)可以為經(jīng)濟普查提供更豐富、更準確、更及時的數(shù)據(jù)來源和分析方法。一方面,可以利用定位服務(wù)、交易數(shù)據(jù)等,實現(xiàn)對不同經(jīng)濟活動的實時監(jiān)測和動態(tài)評估。例如,可以通過分析用戶的位置軌跡、消費行為、社交網(wǎng)絡(luò)等,判斷用戶是否參與了旅游、購物、餐飲等經(jīng)濟活動,并對這些活動進行分類、統(tǒng)計和評價。這樣,就可以對經(jīng)濟活動的規(guī)模、分布、特征、影響等進行全面了解和分析,為經(jīng)濟決策提供有力的支持。另一方面,可以依托portrait技術(shù),從數(shù)據(jù)層面深入繪制經(jīng)濟活動主體的畫像,作為經(jīng)濟普查的重要內(nèi)容。portrait技術(shù)是一種利用數(shù)據(jù)挖掘、機器學習等方法,對經(jīng)濟活動主體的屬性、行為、偏好、需求等進行綜合描述和預測的技術(shù)。通過portrait技術(shù),可以將經(jīng)濟活動主體劃分為不同的群體或個體,并對其進行詳細描述和分析。例如,可以根據(jù)用戶的消費習慣、信用評級、收入水平等,為其提供合適的金融產(chǎn)品、優(yōu)惠政策、營銷策略等。這樣,就可以提高經(jīng)濟普查的精度、質(zhì)量和效率,促進經(jīng)濟的發(fā)展和創(chuàng)新。
結(jié)語:
大數(shù)據(jù)為經(jīng)濟普查提供了新的機遇,也帶來一定的挑戰(zhàn)。要認識到大數(shù)據(jù)條件下的數(shù)據(jù)特性,主動應對數(shù)據(jù)質(zhì)量問題、數(shù)據(jù)安全問題、數(shù)據(jù)處理難題以及數(shù)據(jù)應用局限等方面的難點。同時,要充分利用大數(shù)據(jù)技術(shù),建立數(shù)據(jù)治理體系,優(yōu)化數(shù)據(jù)分析流程,拓展數(shù)據(jù)應用范圍,推動經(jīng)濟普查大數(shù)據(jù)分析向規(guī)范化、系統(tǒng)化、智能化方向發(fā)展,造福社會經(jīng)濟。