勾璦瀛
山東英才學(xué)院 山東 濟(jì)南 250104
2020年開(kāi)年之際,新冠病毒洶涌而至,此次病毒傳播速度快,致病力強(qiáng),隨著大數(shù)據(jù)時(shí)代的來(lái)臨,給疫情防控、應(yīng)急救援帶來(lái)挑戰(zhàn),也給大數(shù)據(jù)技術(shù)的應(yīng)用帶來(lái)前所未有的機(jī)遇。大數(shù)據(jù)及其技術(shù)的應(yīng)用,也為快速高效解決應(yīng)急救援與應(yīng)急保障提供新的思路和方法。
大數(shù)據(jù)是指數(shù)據(jù)量大、數(shù)據(jù)類別復(fù)雜的數(shù)據(jù)集。在信息技術(shù)的支持和普及性應(yīng)用背景下,大數(shù)據(jù)成為當(dāng)今時(shí)代數(shù)據(jù)信息的主要發(fā)展方向。由于大數(shù)據(jù)時(shí)代數(shù)據(jù)量大、數(shù)據(jù)種類多、數(shù)據(jù)處理速度快、數(shù)據(jù)價(jià)值密度低等特點(diǎn),使其在應(yīng)用過(guò)程中對(duì)社會(huì)各行各業(yè)的發(fā)展產(chǎn)生一定影響[1]。
大數(shù)據(jù)具有四個(gè)方面的特征:一是數(shù)據(jù)體量巨大,從TB級(jí)別躍升到PB級(jí)別;二是數(shù)據(jù)類型繁多,包括網(wǎng)絡(luò)日志、視頻、圖片、地理位置信息等各種類型數(shù)據(jù);三是價(jià)值密度低,商業(yè)價(jià)值高;四是處理速度快,遵循“1s定律”,即可從各種類型的數(shù)據(jù)中快速獲得高價(jià)值的信息,這與傳統(tǒng)的數(shù)據(jù)挖掘技術(shù)有著本質(zhì)的不同?!按髷?shù)據(jù)”的四大特征概括起來(lái)即4個(gè)“V”,即Volume(容量)、Variety(種類)、Value(價(jià)值)、Velocity(速度)。
(1)分析涉疫人員的軌跡信息。通過(guò)聯(lián)動(dòng)大數(shù)據(jù)、電信運(yùn)營(yíng)商、互聯(lián)網(wǎng)公司、交通部門、公安等部門提供的數(shù)據(jù)信息,完成涉疫人員的地理位置確定與軌跡信息,利用大數(shù)據(jù)技術(shù)分析出涉疫人員的流動(dòng)軌跡。如通過(guò)手機(jī)信令等包含地理位置和時(shí)間戳信息的數(shù)據(jù)進(jìn)行分析,繪制出病患的行動(dòng)軌跡,形成涉疫人員的歷史時(shí)段軌跡信息圖,利用大數(shù)據(jù)技術(shù)推斷出病患密切接觸者,疑似病患和相關(guān)接觸者的行動(dòng)軌跡,并可以預(yù)測(cè)出高風(fēng)險(xiǎn)地區(qū)和潛在的高風(fēng)險(xiǎn)地區(qū)。
(2)追溯傳染病源頭。根據(jù)病患的確診時(shí)間先后順序和密切接觸人員等信息定位時(shí)空碰撞點(diǎn),通過(guò)大數(shù)據(jù)技術(shù)綜合分析涉疫人員的歷史時(shí)段軌跡信息圖,推斷出疾病傳播路徑,從而追溯傳染病源頭。
(3)調(diào)配救援物資。利用大數(shù)據(jù)技術(shù)對(duì)所在區(qū)域的物資倉(cāng)儲(chǔ)情況、運(yùn)輸能力、運(yùn)輸路線、人員情況的綜合分析,結(jié)合疫區(qū)的實(shí)際需求情況,將救援物資調(diào)配優(yōu)化。
(4)預(yù)測(cè)疫情的發(fā)展趨勢(shì)。通過(guò)確診病患和病患密切接觸者的活動(dòng)情況,結(jié)合疫情新增確診、疑似、死亡、治愈的病例數(shù),借助傳播動(dòng)力學(xué)模型、動(dòng)態(tài)感染模型、回歸模型等大數(shù)據(jù)模型和技術(shù),分析展示出發(fā)病熱力分布圖和密切接觸者的風(fēng)險(xiǎn)熱力分布圖,預(yù)測(cè)疫情的峰值和拐點(diǎn)等相關(guān)信息。有關(guān)部門可以根據(jù)發(fā)病熱力分布圖,對(duì)重點(diǎn)區(qū)域強(qiáng)化衛(wèi)生防疫措施,依據(jù)風(fēng)險(xiǎn)熱力分布圖,對(duì)可能擴(kuò)散的區(qū)域提前防控,避免二次爆發(fā),同時(shí)對(duì)疫情發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),對(duì)于政府部門確定復(fù)工時(shí)間,出臺(tái)經(jīng)濟(jì)措施等方面都有重要作用。
(1)數(shù)據(jù)采集手段原始,具有明顯的滯后性。本次疫情的防控不僅需要對(duì)出入人員進(jìn)行大規(guī)模的登記錄入,還需要進(jìn)行大規(guī)模的核酸檢測(cè)。有的基層部門在數(shù)據(jù)錄入時(shí),仍然采用手工填表等原始的數(shù)據(jù)采集方式,這種采集方式既給基層人員增加了負(fù)擔(dān),又無(wú)法保證數(shù)據(jù)的正確性,數(shù)據(jù)采集方式具有明顯的滯后性。
(2)數(shù)據(jù)流轉(zhuǎn)存在隱私泄露風(fēng)險(xiǎn)。原始數(shù)據(jù)在搜集上報(bào)過(guò)程中,難免造成數(shù)據(jù)泄露(如身份證信息、電話信息的泄露),給被泄露隱私的人的生活造成了極大的不便。同時(shí),數(shù)據(jù)在跨地區(qū)、跨部門、跨層級(jí)的流轉(zhuǎn)也存在困難。
(3)數(shù)據(jù)呈現(xiàn)孤島狀態(tài)。大數(shù)據(jù)的核心在于互聯(lián)互通,在對(duì)個(gè)人行為進(jìn)行分析時(shí),手機(jī)信令能夠提供粗糙的軌跡信息,對(duì)區(qū)域性分析結(jié)果影響較小,但對(duì)于精確度要求高的場(chǎng)景,還不能滿足大數(shù)據(jù)分析的需要。例如,搜索引擎、社交媒體、交管部門、公安部門等更多維度的跨層次跨領(lǐng)域的信息。從目前來(lái)看,不同部門之間的數(shù)據(jù)不能實(shí)現(xiàn)互聯(lián)互通,呈現(xiàn)“孤島”狀態(tài)。
(1)提升采集手段,改善數(shù)據(jù)采集方式。通過(guò)使用多方數(shù)據(jù)聯(lián)動(dòng)與集成。如:微信、支付寶的LBS數(shù)據(jù),交通出行數(shù)據(jù),手機(jī)信令等方式,加強(qiáng)不同部門間的數(shù)據(jù)聯(lián)動(dòng)與集成,提升采集手段,改善數(shù)據(jù)采集方式,提高數(shù)據(jù)采集效率。
(2)加強(qiáng)數(shù)據(jù)的隱私保護(hù),增強(qiáng)數(shù)據(jù)的安全防范意識(shí)。數(shù)據(jù)發(fā)布實(shí)行脫敏原則,對(duì)敏感信息數(shù)據(jù)通過(guò)脫敏原則進(jìn)行數(shù)據(jù)變形,發(fā)布內(nèi)容經(jīng)過(guò)處理之后無(wú)法識(shí)別到特定個(gè)體,實(shí)現(xiàn)敏感隱私數(shù)據(jù)的保護(hù)。在數(shù)據(jù)的移交與傳輸過(guò)程加強(qiáng)數(shù)據(jù)的安全防范意識(shí),提高保密意識(shí),加強(qiáng)數(shù)據(jù)的隱私保護(hù),并找到非必要不公開(kāi)的原則,發(fā)布內(nèi)容應(yīng)限于與疫情相關(guān)內(nèi)容。
(3)豐富數(shù)據(jù)維度,高效運(yùn)轉(zhuǎn)數(shù)據(jù)。除醫(yī)療數(shù)據(jù)外,疫情傳播還涉及氣候、交通、社會(huì)行為、城市衛(wèi)生等多維度因素影響,大數(shù)據(jù)技術(shù)的發(fā)展使得這些影響因素均可以數(shù)據(jù)形態(tài)展示,同時(shí)使得多維度、大規(guī)模的數(shù)據(jù)處理成為可能,可實(shí)現(xiàn)上萬(wàn)量級(jí)的影響因子建模,這極大地豐富了疫情發(fā)展模型的分析維度。打通各環(huán)節(jié)數(shù)據(jù)孤島,提高數(shù)據(jù)的互通互聯(lián)。這次突發(fā)衛(wèi)生事件,是對(duì)城市智慧化水平的一次大考,在疫情防控的嚴(yán)峻形勢(shì)之下,精確翔實(shí)的數(shù)據(jù)歸集和實(shí)時(shí)準(zhǔn)確的信息發(fā)布顯得尤為重要,設(shè)立城市大數(shù)據(jù)平臺(tái),建立城市數(shù)據(jù)綜合處理的中樞,并提供城市數(shù)據(jù)應(yīng)用服務(wù)?;诖髷?shù)據(jù)集成和大數(shù)據(jù)分析實(shí)現(xiàn)高效的協(xié)同治理,將城市基礎(chǔ)數(shù)據(jù),政府服務(wù)業(yè)務(wù)數(shù)據(jù),以及醫(yī)療交通等實(shí)時(shí)動(dòng)態(tài)數(shù)據(jù)加入到地理實(shí)體中,而地理實(shí)體又加載到城市信息模型中,形成實(shí)體、模型、數(shù)據(jù)一體化,有助于實(shí)現(xiàn)政府決策科學(xué)化、社會(huì)治理準(zhǔn)確化、公共服務(wù)高效化。
大數(shù)據(jù)及其獲取方法的研究應(yīng)用能夠有效解決應(yīng)急救援與應(yīng)急保障中的重難點(diǎn)問(wèn)題,本文對(duì)大數(shù)據(jù)的概述及特點(diǎn)、大數(shù)據(jù)在抗疫防控、應(yīng)急保障中的應(yīng)用,大數(shù)據(jù)在疫情防控應(yīng)用中存在的問(wèn)題進(jìn)行分析,分別從數(shù)據(jù)采集手段、數(shù)據(jù)流轉(zhuǎn)的安全問(wèn)題、數(shù)據(jù)的互聯(lián)互通3個(gè)方面進(jìn)行了分析并提出了相應(yīng)的解決辦法。因此,在未來(lái)的工作學(xué)習(xí)中,還需加強(qiáng)對(duì)大數(shù)據(jù)應(yīng)用的研究,為抗疫救援,應(yīng)急保障等做出更大的貢獻(xiàn)。