□楊貴軍 向琳 彭影
隨著互聯(lián)網(wǎng)、云存儲、5G 和人工智能等信息技術(shù)的蓬勃發(fā)展,數(shù)據(jù)生成呈爆發(fā)式增長,數(shù)據(jù)應(yīng)用已經(jīng)滲透進社會日常工作和生活的各領(lǐng)域,發(fā)揮著越來越大的作用,社會對大數(shù)據(jù)重視程度達到前所未有的高度。積極推動大數(shù)據(jù)與政府治理現(xiàn)代化的深度融合成為官方統(tǒng)計工作的重要內(nèi)容。Ashofteh 和Bravo 提出歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型,是大數(shù)據(jù)與現(xiàn)代統(tǒng)計深度融合的模型,探究數(shù)據(jù)科學(xué)在生成官方統(tǒng)計產(chǎn)品中的影響,以說明數(shù)智時代產(chǎn)生的新興技術(shù)如何更好地應(yīng)用于社會生產(chǎn)和實踐中的統(tǒng)計業(yè)務(wù)流程[1]。本文對歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型進行解讀,闡述在官方統(tǒng)計數(shù)據(jù)服務(wù)和統(tǒng)計數(shù)據(jù)產(chǎn)品中新數(shù)據(jù)源和新技術(shù)的應(yīng)用,以及對統(tǒng)計專業(yè)人才的技能及知識的新需求,探討適應(yīng)數(shù)智時代的統(tǒng)計專業(yè)人才培養(yǎng)。
Ashofteh 和Bravo 提出的歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型是基于歐洲官方統(tǒng)計業(yè)務(wù)流程,從指定需求階段、設(shè)計階段、構(gòu)建階段、收集階段、過程階段、分析階段、傳播階段和評估階段展開的。歐洲統(tǒng)計數(shù)據(jù)科學(xué)模型包括六個部分,分別是官方統(tǒng)計方法論、統(tǒng)計工程、數(shù)據(jù)分析、數(shù)據(jù)科學(xué)、可信智能統(tǒng)計和推廣應(yīng)用,六個部分緊密聯(lián)系,并不完全獨立,如圖1 所示。圖1 借鑒了Afshin 和Jorge 的結(jié)構(gòu),并進行了修訂。其中虛線框表示每個部分的覆蓋范圍。
圖1 歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型
歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型由兩大部分構(gòu)成,分別是可信智能統(tǒng)計和推廣應(yīng)用。其中,可信智能統(tǒng)計包含官方統(tǒng)計方法論和數(shù)據(jù)科學(xué),數(shù)據(jù)科學(xué)包含統(tǒng)計工程和數(shù)據(jù)分析。下文分別介紹這六個組成部分。
1.可信智能統(tǒng)計??尚胖悄芙y(tǒng)計是指國家統(tǒng)計局與私人部門在共享計算設(shè)施、代碼、日志和最終統(tǒng)計數(shù)據(jù)等領(lǐng)域合作的安全體系結(jié)構(gòu),且無需共享原始輸入數(shù)據(jù)??尚胖悄芙y(tǒng)計是官方統(tǒng)計在數(shù)智時代的自然演變。它并不是要替代現(xiàn)有的數(shù)據(jù)源和統(tǒng)計流程,而是要進行擴充,建立一個與原系統(tǒng)兼容的新系統(tǒng)[2]。
可信智能統(tǒng)計由國家統(tǒng)計系統(tǒng)進行確認(rèn),在該部分有兩個途徑,一是通過統(tǒng)計工程進行自動化得到智能系統(tǒng),二是通過統(tǒng)計工程進行工業(yè)化得到智能系統(tǒng)??尚胖悄芙y(tǒng)計需要使用其他的技術(shù)和方法來對其進行呈現(xiàn),如自然語言處理、專家系統(tǒng)、可對話人工智能、機器人學(xué)和工業(yè)4.0。
(1)官方統(tǒng)計方法論。官方統(tǒng)計方法論即為與統(tǒng)計相關(guān)的科學(xué)和與官方統(tǒng)計相關(guān)的標(biāo)準(zhǔn)構(gòu)建而成的方法論。官方統(tǒng)計方法論部分從業(yè)務(wù)流程角度看為模型的起點,在指定需求階段,根據(jù)社會和政府的需求以及國際標(biāo)準(zhǔn),檢查輸出目標(biāo)、范圍和概念是否正確,商業(yè)價值是否合理,當(dāng)前數(shù)據(jù)是否具有可用性,如果上述要求均得到確認(rèn),則準(zhǔn)備產(chǎn)生新的官方統(tǒng)計產(chǎn)品。隨后進入設(shè)計階段,在該階段統(tǒng)計人員運用統(tǒng)計專業(yè)知識進行變量描述、搭建框架和選擇樣本。之后進入構(gòu)建階段,該階段以方法論為基礎(chǔ)來構(gòu)建統(tǒng)計方案及模型,包括統(tǒng)計學(xué)、經(jīng)濟學(xué)和數(shù)據(jù)科學(xué)等,在必要時可發(fā)展新的理論和方法。
(2)數(shù)據(jù)科學(xué)。數(shù)據(jù)科學(xué)是一門跨學(xué)科的科學(xué),其核心是從數(shù)據(jù)中提取信息以對問題作出決策,包含收集、管理、分析、展示大數(shù)據(jù)的理論和技術(shù)。數(shù)據(jù)科學(xué)涵蓋了處理數(shù)據(jù)的新方法,包括應(yīng)用傳統(tǒng)統(tǒng)計技術(shù)和新的數(shù)據(jù)挖掘方法對數(shù)據(jù)進行描述、說明和評估。為了實現(xiàn)數(shù)據(jù)科學(xué)的應(yīng)用價值,需要開發(fā)和維護軟件來編制官方統(tǒng)計數(shù)據(jù),當(dāng)前用于歐洲官方統(tǒng)計的熱門軟件有SAS、R、Python 等,開源編程語言將逐漸在官方統(tǒng)計中普及。
在數(shù)據(jù)科學(xué)部分,應(yīng)用將進行面向?qū)ο蟮某绦蛟O(shè)計。之后進行原型試驗,依據(jù)官方統(tǒng)計框架,統(tǒng)計人員利用編程軟件構(gòu)建基于應(yīng)用程序的智能調(diào)查。智能調(diào)查還可通過程序控制面向?qū)ο蟮某绦蛟O(shè)計。其中,面向?qū)ο蟮某绦蛟O(shè)計和智能調(diào)查被稱為軟件工程。對于軟件工程部分,除了要使用和維護統(tǒng)計軟件外,還要注意代碼可復(fù)制性和可重用性以及數(shù)據(jù)的輸入、存儲、交換和共享。構(gòu)建智能調(diào)查后,進入傳播階段,統(tǒng)計素養(yǎng)和數(shù)據(jù)可視化是影響官方統(tǒng)計產(chǎn)品傳播的最重要因素。利用最新技術(shù)實現(xiàn)數(shù)據(jù)可視化是數(shù)據(jù)傳播的必要途徑,將大量復(fù)雜的數(shù)據(jù)壓縮,通過圖形或動態(tài)的方式展示有助于更好地接受和理解官方統(tǒng)計產(chǎn)品。除此之外,統(tǒng)計素養(yǎng)是在作出決策時提供統(tǒng)計考量的能力,在統(tǒng)計人員編制統(tǒng)計數(shù)據(jù)以及公民理解統(tǒng)計產(chǎn)品方面都不可或缺。
①統(tǒng)計工程。統(tǒng)計工程是為了研究如何充分運用統(tǒng)計理論、統(tǒng)計方法和統(tǒng)計工具,以及如何將它們與其他相關(guān)學(xué)科集成以實現(xiàn)更好的結(jié)果[3]。統(tǒng)計工程將統(tǒng)計學(xué)與工程學(xué)相結(jié)合進行數(shù)據(jù)分析。統(tǒng)計工程基于聯(lián)系上下文和分析問題結(jié)構(gòu)的多步驟策略,使用統(tǒng)計的方法、技術(shù)和工具,為復(fù)雜問題找到新的解決方案。統(tǒng)計工程融入了工程學(xué)的思想,更注重解決問題的策略和能力,并要求解決問題的較好思維邏輯。同時要求統(tǒng)計人員不僅掌握統(tǒng)計專業(yè)知識,還要對其他一些相關(guān)領(lǐng)域的知識有所了解,以便官方統(tǒng)計產(chǎn)品能夠更好地服務(wù)于社會各領(lǐng)域。
在統(tǒng)計工程部分,應(yīng)在各步驟中應(yīng)用統(tǒng)計思維。首先進入收集階段,包括對數(shù)據(jù)的復(fù)雜測量和規(guī)模開發(fā),收集不同來源的有效數(shù)據(jù)。之后進入過程階段,通過數(shù)據(jù)倉庫或湖倉一體進行匿名原始數(shù)據(jù)傳輸,根據(jù)官方統(tǒng)計標(biāo)準(zhǔn)進行檢驗,最終在該階段得到優(yōu)良數(shù)據(jù),以用來提取可持續(xù)算法。這個過程階段也稱數(shù)據(jù)工程,數(shù)據(jù)工程被認(rèn)為是統(tǒng)計工程的一個子集,用來管理微觀數(shù)據(jù)和納米數(shù)據(jù)。在數(shù)據(jù)工程部分,對收集到的數(shù)據(jù)進行提取和融合,生成可用于后續(xù)步驟的數(shù)據(jù)集,例如進行預(yù)處理、數(shù)據(jù)清洗、數(shù)據(jù)去重等工作,在此階段需要統(tǒng)計人員有良好的數(shù)據(jù)基礎(chǔ),能夠處理不同類型的數(shù)據(jù)。最后統(tǒng)計人員通過方法集成和得到的數(shù)據(jù)進行數(shù)據(jù)分析。
②數(shù)據(jù)分析。在數(shù)據(jù)分析部分,即進入到分析階段,利用上個階段得到的優(yōu)良數(shù)據(jù),分析其數(shù)據(jù)結(jié)構(gòu)以提取可持續(xù)算法,使用機器學(xué)習(xí)、自然語言處理、時空模型等方法和分析工具以構(gòu)造合理的應(yīng)用算法。其中機器學(xué)習(xí)算法和分析工具不僅用于生成應(yīng)用,還用于分析數(shù)據(jù)結(jié)構(gòu),以改進數(shù)據(jù)結(jié)構(gòu)和應(yīng)用新的缺失值插補方法。在未來的官方統(tǒng)計中,機器學(xué)習(xí)等方法的使用將會大幅增加以適應(yīng)大數(shù)據(jù)的處理需要,特別是在對不同種類的數(shù)據(jù)進行分析時,機器學(xué)習(xí)等方法可實現(xiàn)對文本的情感分析和圖像的理解,適合對復(fù)雜的數(shù)據(jù)進行深層分析。
2.推廣應(yīng)用。推廣應(yīng)用是整個模型的第二大部分,也是產(chǎn)生官方統(tǒng)計產(chǎn)品的最后步驟。統(tǒng)計產(chǎn)品進入評估階段,用官方統(tǒng)計中的質(zhì)量管理標(biāo)準(zhǔn)進行檢測。同時還要考慮官方統(tǒng)計中的倫理和道德問題,例如關(guān)于數(shù)據(jù)的公平、隱私、安全和包容性。如果通過檢測,則該產(chǎn)品準(zhǔn)備為社會進行服務(wù),形成最終的官方統(tǒng)計產(chǎn)品。官方統(tǒng)計產(chǎn)品用來解決問題和創(chuàng)造價值。如果國內(nèi)和國際終端用戶有了新的需求,則再次檢查其輸出目標(biāo)、范圍、商業(yè)價值、概念和數(shù)據(jù)可用性,進入模型的循環(huán),生成新的官方統(tǒng)計產(chǎn)品。
Ashofteh 和Bravo 給出數(shù)據(jù)科學(xué)模型,也歸納了影響模型中各階段的科學(xué)因素及指標(biāo),本文對原文中的因素及指標(biāo)進行分析。
在專業(yè)知識方面,包括歐洲官方統(tǒng)計碩士課程、統(tǒng)計學(xué)、信息技術(shù)、人工智能、數(shù)據(jù)科學(xué)、經(jīng)濟學(xué)、數(shù)學(xué)、歐洲統(tǒng)計培訓(xùn)課程和社會科學(xué)。當(dāng)前官方統(tǒng)計培訓(xùn)的三大學(xué)科為統(tǒng)計學(xué)、經(jīng)濟學(xué)和數(shù)據(jù)科學(xué)。統(tǒng)計學(xué)是官方統(tǒng)計人員必須掌握的知識,是一切官方統(tǒng)計業(yè)務(wù)的基礎(chǔ)。而官方統(tǒng)計業(yè)務(wù)有很大一部分與經(jīng)濟領(lǐng)域息息相關(guān),經(jīng)濟學(xué)也成為統(tǒng)計人員必備的素養(yǎng),數(shù)據(jù)科學(xué)則是統(tǒng)計人員為適應(yīng)數(shù)智時代統(tǒng)計需求而不可或缺的知識和技術(shù)。統(tǒng)計人員對這些知識的掌握是建立官方統(tǒng)計數(shù)據(jù)科學(xué)模型的基礎(chǔ)。
在數(shù)據(jù)工程方面,體現(xiàn)了統(tǒng)計業(yè)務(wù)中如何收集數(shù)據(jù)。涉及到的數(shù)據(jù)源有數(shù)據(jù)湖、大數(shù)據(jù)(如公民數(shù)據(jù))、流動數(shù)據(jù)(如旅行數(shù)據(jù))、高頻數(shù)據(jù)(如掃描數(shù)據(jù))、空間數(shù)據(jù)(如網(wǎng)格數(shù)據(jù))、開源數(shù)據(jù)(如衛(wèi)星數(shù)據(jù))、電信數(shù)據(jù)(如人口統(tǒng)計)、視覺數(shù)據(jù)(如衛(wèi)星圖像)、微觀數(shù)據(jù)和納米數(shù)據(jù)、數(shù)據(jù)重用與共享。特別是數(shù)據(jù)重用與共享,能夠讓很多有相同需求的人獲取有價值的數(shù)據(jù),同時避免了收集數(shù)據(jù)的復(fù)雜繁瑣工作,使現(xiàn)有的數(shù)據(jù)資源得到充分的利用。
在統(tǒng)計工程方面,需要的知識有領(lǐng)域知識與學(xué)科理論、解決問題的策略、數(shù)據(jù)譜系、順序方法、問題上下文或請求上下文的分析。其中,數(shù)據(jù)譜系也稱數(shù)據(jù)血緣,指數(shù)據(jù)在產(chǎn)生、處理、流轉(zhuǎn)和消亡中形成的關(guān)系。根據(jù)數(shù)據(jù)譜系,可以對來源不同的數(shù)據(jù)進行溯源,數(shù)據(jù)發(fā)生異常時可用來分析其原因;還可以通過數(shù)據(jù)譜系從數(shù)據(jù)的受眾、更新量級和更新頻率來評價該數(shù)據(jù)的價值。
在數(shù)據(jù)分析方面,涉及到機器學(xué)習(xí)、深度學(xué)習(xí)、自然語言處理和時空模型等方法。在統(tǒng)計中對文本的轉(zhuǎn)換需要應(yīng)用自然語言處理技術(shù),在統(tǒng)計方面常用的是基于傳統(tǒng)機器學(xué)習(xí)的自然語言處理,利用支持向量機等方法對自然語言進行處理以提高精度?;谏疃葘W(xué)習(xí)的自然語言處理后來逐漸登上舞臺,深度學(xué)習(xí)為機器學(xué)習(xí)的一個分支,應(yīng)用神經(jīng)網(wǎng)絡(luò)等模型完成語言的分類和理解。
在官方統(tǒng)計的軟件和工具方面,選用的有R軟件、Python 軟件、SAS 軟件、共享統(tǒng)計服務(wù)、統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換、代碼可復(fù)制性和可重用性、遙感和衛(wèi)星圖像軟件、時間序列工具、統(tǒng)計披露工具。R、Python 和SAS 軟件已成為數(shù)智時代統(tǒng)計過程中使用最多的軟件,共享統(tǒng)計服務(wù)、統(tǒng)計數(shù)據(jù)和元數(shù)據(jù)交換、代碼可復(fù)制性和可重用性、遙感和衛(wèi)星圖像軟件可以使統(tǒng)計數(shù)據(jù)的獲取和統(tǒng)計過程的重復(fù)更為便利和快捷。時間序列工具對于分析時間序列數(shù)據(jù)十分重要,而統(tǒng)計披露工具可用于官方統(tǒng)計數(shù)據(jù)發(fā)布與推廣。
在官方統(tǒng)計的傳播方面,利用最新技術(shù)的數(shù)據(jù)可視化和復(fù)雜可視化的虛擬現(xiàn)實技術(shù)尤為重要。數(shù)據(jù)可視化是將統(tǒng)計數(shù)據(jù)呈現(xiàn)給用戶的最常用手段,能夠?qū)⒋罅糠彪s的數(shù)據(jù)及結(jié)果簡化并變得通俗易懂。為了迎合技術(shù)的變化,可視化的手段也在不斷更新,復(fù)雜可視化甚至可與虛擬現(xiàn)實技術(shù)相融合,給用戶帶來沉浸性和交互性的體驗。
在官方統(tǒng)計的素養(yǎng)方面,需要具備數(shù)據(jù)讀寫能力、統(tǒng)計素養(yǎng)、計算機素養(yǎng)、公民科學(xué)和統(tǒng)計思維。計算機素養(yǎng)是數(shù)智時代統(tǒng)計人員必須具備的,新的數(shù)據(jù)來源及新的技術(shù)方法促使統(tǒng)計從業(yè)者要不停更新自己的計算機能力,利用最新的手段更好地進行統(tǒng)計工作。
在官方統(tǒng)計中的道德規(guī)范方面,包含隱私和保密、種族平等、公平性和公平數(shù)據(jù)、安全性、包容性、透明度和問責(zé)制。提高統(tǒng)計透明度是官方統(tǒng)計很重要的一項工作,透露數(shù)據(jù)的來源、覆蓋面和流程等不為大眾所知的方面,能夠減少很多混淆和不必要的質(zhì)疑。
在可信智能官方統(tǒng)計方面,需要應(yīng)用物聯(lián)網(wǎng)、可信智能調(diào)查、手機應(yīng)用與操作系統(tǒng)、官方統(tǒng)計的新數(shù)據(jù)方法、官方統(tǒng)計的新數(shù)據(jù)質(zhì)量、官方統(tǒng)計的網(wǎng)頁抓取應(yīng)用和機器學(xué)習(xí)等技術(shù)和方法來實現(xiàn)。隨著數(shù)智時代需要分析的數(shù)據(jù)種類不斷增加,如文本情感分析、圖像理解和網(wǎng)絡(luò)數(shù)據(jù)分析等,使得機器學(xué)習(xí)技術(shù)成為對大數(shù)據(jù)處理分析的重要動力。
大數(shù)據(jù)技術(shù)極大改變了數(shù)據(jù)的收集、處理和分析的方法和過程,對統(tǒng)計專業(yè)教育提出了挑戰(zhàn)?!秶鴦?wù)院關(guān)于印發(fā)促進大數(shù)據(jù)發(fā)展行動綱要的通知》 提到要創(chuàng)新人才培養(yǎng)模式,建立健全多層次、多類型的大數(shù)據(jù)人才培養(yǎng)體系。明確人才培養(yǎng)的新要求,即培養(yǎng)具有社會經(jīng)濟學(xué)背景知識、掌握數(shù)據(jù)科學(xué)和計算機科學(xué)的方法、能夠熟練地運用計算機處理和分析數(shù)據(jù)的復(fù)合型人才?;跉W洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型的解讀以及數(shù)據(jù)科學(xué)基礎(chǔ)知識結(jié)構(gòu),未來統(tǒng)計專業(yè)教育應(yīng)加強如下三方面能力。
現(xiàn)有統(tǒng)計專業(yè)教育的計算機操作要求在大數(shù)據(jù)技術(shù)應(yīng)用方面存在局限性。常用的統(tǒng)計軟件在數(shù)據(jù)分析方面有所欠缺,需要借助其他工具對大數(shù)據(jù)進行數(shù)據(jù)挖掘,計算機操作的重要性更加突出。在處理一些問題時,除了統(tǒng)計方法之外,還可應(yīng)用算法,如在回歸分析中可引入回歸樹、Boosting 回歸、Bagging回歸、隨機森林回歸、LASSO 回歸等處理大數(shù)據(jù)。在數(shù)據(jù)分析軟件方面,除了Excel、SPSS 和SAS 等,開源編程語言成為應(yīng)用領(lǐng)域的熱點。R 語言軟件功能強大,在國內(nèi)外統(tǒng)計工作上被廣泛使用。Python語言是當(dāng)前最受歡迎的程序設(shè)計語言之一,簡單易讀易維護。Hadoop可用于處理多元異構(gòu)的數(shù)據(jù)。SQL語言是數(shù)據(jù)庫建立、數(shù)據(jù)存儲和數(shù)據(jù)查詢的最廣泛應(yīng)用的數(shù)據(jù)庫語言。數(shù)據(jù)可視化是官方統(tǒng)計傳播的最重要手段,通過計算機算法處理海量數(shù)據(jù)進行圖像化、動態(tài)化后展示給用戶,將大量復(fù)雜數(shù)據(jù)的信息簡單化,數(shù)據(jù)變得通俗直觀。上述數(shù)據(jù)分析方法的應(yīng)用都需要借助計算機軟件的幫助,計算機操作成為數(shù)智時代的統(tǒng)計專業(yè)教育必須強化的技能之一。
統(tǒng)計專業(yè)教育需要覆蓋統(tǒng)計學(xué)、信息技術(shù)、數(shù)據(jù)科學(xué)、經(jīng)濟學(xué)、數(shù)學(xué)和社會科學(xué)等。順應(yīng)官方統(tǒng)計的未來發(fā)展趨勢,數(shù)據(jù)科學(xué)的基礎(chǔ)性作用顯著提高。統(tǒng)計理論和統(tǒng)計知識在官方統(tǒng)計應(yīng)用中仍然發(fā)揮主導(dǎo)作用。統(tǒng)計領(lǐng)域?qū)I(yè)素養(yǎng)是統(tǒng)計專業(yè)教育的核心競爭力,需要堅實的統(tǒng)計理論知識基礎(chǔ)。統(tǒng)計領(lǐng)域人才對數(shù)據(jù)、數(shù)據(jù)內(nèi)容和相關(guān)背景有深入了解,才能選擇最合理的知識和方法,挖掘和分析大數(shù)據(jù)、流動數(shù)據(jù)、空間數(shù)據(jù)、開源數(shù)據(jù)、電信數(shù)據(jù)、視覺數(shù)據(jù)、微觀數(shù)據(jù)和納米數(shù)據(jù)等。同時,還要跟蹤統(tǒng)計前沿發(fā)展趨勢,關(guān)注統(tǒng)計與其他學(xué)科或領(lǐng)域融合形成的新理論和新技術(shù)。數(shù)據(jù)分析方法的合理應(yīng)用依賴于數(shù)據(jù)認(rèn)知,數(shù)據(jù)思維成為數(shù)智時代統(tǒng)計專業(yè)教育必須提升的重要能力。
鑒于統(tǒng)計應(yīng)用的復(fù)雜性,傳統(tǒng)的統(tǒng)計專業(yè)培訓(xùn)主要是課堂講授,案例分析與實踐操作主要是針對課堂中統(tǒng)計理論的演示。在現(xiàn)實應(yīng)用中,統(tǒng)計人才需要分析實際問題,需要經(jīng)過實踐活動的鍛煉,具備解決實際問題的能力。各領(lǐng)域知識是解決實際問題的策略基礎(chǔ)。在實際問題中,領(lǐng)域知識與解決問題的能力和技巧同樣重要。實際應(yīng)用中,數(shù)據(jù)分析能力和數(shù)據(jù)應(yīng)用技巧都離不開對問題的深入理解和領(lǐng)域知識的掌握,更多的數(shù)據(jù)分析技巧的產(chǎn)生也是領(lǐng)域知識和理論發(fā)展的結(jié)果。政府部門和企業(yè)等單位的統(tǒng)計工作是領(lǐng)域知識的實踐場景,是數(shù)據(jù)分析的新技能和數(shù)據(jù)科學(xué)方法的重點應(yīng)用平臺。例如聯(lián)合國全球大數(shù)據(jù)平臺 (UNBigData) 的聯(lián)合國官方統(tǒng)計大數(shù)據(jù)全球工作組 (GWG)活動。統(tǒng)計素養(yǎng)是基于領(lǐng)域知識,運用統(tǒng)計方法,進行數(shù)據(jù)收集、處理和分析,做出決策并解決實際問題的觀點和邏輯。統(tǒng)計實踐能力是在處理統(tǒng)計工作的過程中,提出問題、選擇統(tǒng)計方法、解決問題,并克服其中困難的能力。
綜上所述,本文介紹的歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)模型和歐洲官方統(tǒng)計數(shù)據(jù)科學(xué)基礎(chǔ)提供了統(tǒng)計專業(yè)教育未來發(fā)展的方向。隨著數(shù)據(jù)科學(xué)在社會生活各方面的不斷融合和深入,未來統(tǒng)計專業(yè)教育要加強傳授統(tǒng)計學(xué)知識和其他學(xué)科領(lǐng)域知識的力度;夯實數(shù)學(xué)、英語、計算機基礎(chǔ),以及提升處理和分析數(shù)據(jù)的方法的應(yīng)用能力;培養(yǎng)應(yīng)用數(shù)據(jù)科學(xué)知識的數(shù)據(jù)思維和解決現(xiàn)實問題的實踐能力。