摘要:本文探討了大數(shù)據(jù)背景下疾控中心檔案信息化建設與應用的策略。文章指出,隨著大數(shù)據(jù)技術的快速發(fā)展,疾控中心應拓展數(shù)據(jù)采集渠道,全面掌握疾病特征與傳播規(guī)律;通過深度挖掘數(shù)據(jù)價值和實現(xiàn)信息資源共享,提升數(shù)據(jù)的應用效能;并通過規(guī)范化建設管理、數(shù)據(jù)化歸檔及智能化分析預測,拓寬檔案的利用領域。這些措施將有助于疾控中心更高效地應對公共衛(wèi)生挑戰(zhàn),全面提升疾病防控能力。
關鍵詞:大數(shù)據(jù);疾控中心;檔案信息化;規(guī)范化管理;智能化分析
中圖分類號:TP391文獻標識碼:A
文章編號:1009-3044(2024)34-0070-04開放科學(資源服務)標識碼(OSID):
0引言
大數(shù)據(jù)技術引發(fā)了當代社會經濟結構的重大變革,并廣泛應用于各個領域。疾控中心的檔案管理不應僅限于紙質檔案的延伸和備份,而應順應大數(shù)據(jù)發(fā)展的趨勢,加快信息化和數(shù)字化進程。通過獲取海量數(shù)據(jù)、挖掘潛在信息、應用數(shù)據(jù)預測等手段,探索疾控中心檔案管理的新路徑,以更好地支撐疫情防控工作[1]。
1獲取海量數(shù)據(jù),擴充檔案信息容量
目前,疾控中心的紙質檔案信息及信息系統(tǒng)中的數(shù)據(jù)信息,雖然看似種類繁多、數(shù)量龐大,但實際上還只是“海量”數(shù)據(jù)中的“一滴水”。21世紀初,全球數(shù)字存儲的信息僅占全球數(shù)據(jù)量的1/4,其余3/4的信息仍存儲在報紙、膠片、盒式磁帶等模擬媒介中。然而,到2007年,所有數(shù)據(jù)中僅有7%仍存儲于報紙、書籍、圖片等媒介上的模擬數(shù)據(jù),其余全部轉化為數(shù)字數(shù)據(jù)。到2013年,非數(shù)字數(shù)據(jù)的比例進一步下降到不到2%。
特別是,隨著谷歌公司將書籍數(shù)據(jù)化構建數(shù)字圖書館,GPS將地理方位數(shù)據(jù)化發(fā)明全球定位系統(tǒng),微信、QQ將人類溝通交流數(shù)據(jù)化構建新型社交網(wǎng)絡,數(shù)字化的范圍和深度不斷擴展。如今,數(shù)字、文字、圖片,甚至方位、溝通、情感等都已經或即將被數(shù)據(jù)化??梢哉f,每個用戶個體都成為一個“海量信息數(shù)據(jù)庫”。
面對這些海量數(shù)據(jù),疾控中心的檔案管理工作需要引入“大數(shù)據(jù)”理念,積極研究創(chuàng)新管理手段,以適應時代需求(如圖1)。
1.1擴大獲取數(shù)據(jù)范圍
為了全面收集個體疾病的海量數(shù)據(jù)并確保其覆蓋全域全維,疾控中心需要采用系統(tǒng)化的方法擴大數(shù)據(jù)的獲取范圍。這不僅意味著要全面收集各種疾病類型的數(shù)據(jù),還需要詳細記錄每次疾病處置的效果。同時,對于個體信息,如個人體質、感染程度和抗病能力等,也須進行細致地收集[2]。
在疾病數(shù)據(jù)方面,疾控中心應注意鑒別由病毒或細菌變異亞種引起的疾病,如H1N1流感、中東呼吸綜合征(MERS)等,并記錄每次疾病應對方案的實施情況及最終效果,包括評估治療方案、預防措施、隔離政策等的實施效果,并從中總結經驗教訓。這將有助于疾控中心在未來采取更有效的疾病防治措施。
在個體信息方面,疾控中心需整合個人體質、感染狀況和免疫力等數(shù)據(jù)。這些數(shù)據(jù)可通過對接健康碼、行程碼及醫(yī)療健康檔案等獲取。同時,與保健機構和大健康產業(yè)的協(xié)作也將助力收集更多健康和疾病風險信息。
拓寬疾病數(shù)據(jù)采集范圍,疾控中心能夠更深入理解疾病特性和傳播趨勢,進而制定精準的防治策略。同時,詳盡的個體信息有助于識別疾病差異,實現(xiàn)醫(yī)療服務的個性化。這將提高疫情防控的效率和效果,保護公眾健康和安全[3]。
1.2拓寬獲取數(shù)據(jù)途徑
為了豐富疾控中心的數(shù)據(jù)來源并提高數(shù)據(jù)質量,疾控中心應與醫(yī)療機構和疫情防控機構建立合作機制。這種合作不僅能有效收集基礎數(shù)據(jù),還能通過協(xié)同工作提升數(shù)據(jù)的準確性和完整性。通過合作,疾控中心能獲取個體體質、疾病預防、發(fā)病風險和可控性等關鍵信息,對疾病預防和控制至關重要。此策略不僅提升了信息化水平,還增強了對公共衛(wèi)生事件的響應能力和決策支持能力。多元化的數(shù)據(jù)獲取手段使疾控中心能提供精準、個性化的健康服務,支持疫情防控。
疾控中心還應與相關單位建立定期交流和數(shù)據(jù)共享機制,以及緊急事件快速響應機制,以便疫情發(fā)生時迅速交換信息。如利用健康碼、行程碼和醫(yī)療健康檔案等數(shù)據(jù)庫,通過技術手段實現(xiàn)數(shù)據(jù)的有效對接,提升收集效率。同時,與保健機構和大健康產業(yè)緊密合作,共建健康信息平臺,服務公共衛(wèi)生。
最后,疾控中心應廣泛覆蓋醫(yī)療保健機構、大數(shù)據(jù)平臺的健康檢測信息、媒體網(wǎng)絡信息等領域,進行綜合分析和數(shù)據(jù)驗證。這不僅需要技術支持,還需跨部門、跨機構之間的協(xié)同合作[4]。
1.3設定獲取數(shù)據(jù)時限
為確保疾控中心能夠全面并及時地獲取檔案信息,設立數(shù)據(jù)獲取時限至關重要。此舉有助于疾控中心在緊張的工作中保持秩序,同時保證數(shù)據(jù)的時效性與準確性。設立時限的目的是確保檔案信息的連貫性與完整性??紤]到時間和資源的限制,實現(xiàn)數(shù)據(jù)的實時、全時獲取存在一定困難。通過設定上報周期,如每月、每季、每半年或每年,疾控中心能夠有序地收集和更新數(shù)據(jù),實時掌握疫情動態(tài)和防控進展。
具體操作步驟包括:制定數(shù)據(jù)收集時間表,明確不同上報周期;提前通知相關部門準備數(shù)據(jù);在收集和整理數(shù)據(jù)時,確保其準確性與完整性;將數(shù)據(jù)上報至檔案管理部門,由專人負責審核歸檔;利用最新數(shù)據(jù)進行分析,及時更新檔案,指導疫情防控。在疫情處置前后,疾控中心需采取靈活、及時的策略收集和更新數(shù)據(jù),包括通過監(jiān)測預警系統(tǒng)收集疫情前信息;啟動緊急收集程序,實時追蹤疫情;疫情控制后總結評估,優(yōu)化防控策略。
通過時限設置與數(shù)據(jù)策略,疾控中心能夠準確掌握疫情動態(tài),為防控工作提供及時、精準的信息,促進科學決策,提高應對突發(fā)公共衛(wèi)生事件的能力。
2挖掘潛在數(shù)據(jù),萃取檔案信息精華
獲取疾控海量數(shù)據(jù)只是完成了第一步,還需要根據(jù)疾控信息的不同需求,挖掘數(shù)據(jù)的潛在價值并加以利用。例如,沃爾瑪作為世界最大的零售商,擁有超過2000萬員工,年銷售額約4500億美元。2004年,沃爾瑪對其歷史交易記錄這一龐大數(shù)據(jù)庫進行了觀察分析。該數(shù)據(jù)庫不僅記錄了每位顧客的購物清單及消費金額,還包括購物籃中的具體物品、購買時間,甚至購買當日的天氣。他們發(fā)現(xiàn),每當季節(jié)性颶風來臨之前,不僅手電筒的銷售量會增加,POP-Tarts蛋撻的銷量也會顯著上升。因此,在季節(jié)性風暴來臨時,沃爾瑪會將庫存蛋撻放置在靠近颶風用品的位置,以方便顧客購買,從而增加銷量。沃爾瑪?shù)某晒υ谟诎l(fā)現(xiàn)了手電筒、蛋撻與颶風之間的潛在數(shù)據(jù)價值,并分析它們的關聯(lián)性,將其轉化為商業(yè)行為以獲取利益。
同樣,如何準確挖掘并利用疾控信息數(shù)據(jù),為有效預防和處置疫情提供有價值的信息和真實可靠的參考依據(jù),是疾控中心的重點關注事項,同時也是用戶關心的問題。疾控中心需要善于從看似毫不相關的雜亂、無序、重復的信息中找出關聯(lián)性,挖掘出潛在價值(如圖2)。
2.1數(shù)據(jù)深度挖掘
從效率的角度來看,傳統(tǒng)信息獲取方式存在明顯的局限性。這種方法主要依賴于官方通告、內部資源以及開源信息,導致所收集的信息零散且缺乏深度。為了提升信息獲取的效率與質量,拓寬信息特征并豐富搜索關鍵詞至關重要,以捕獲更有價值的信息。
傳統(tǒng)的信息搜集手段過于依賴有限的信息源,例如政府公告、學術期刊和公共數(shù)據(jù)庫。這些來源的信息可能存在更新延遲、涵蓋范圍有限以及缺乏深入分析的問題。此外,信息來源的單一性容易導致信息偏差和局限性。
為克服這些障礙,疾控中心需擴展信息維度并增加搜索關鍵詞。這包括應用網(wǎng)絡爬蟲技術廣泛收集互聯(lián)網(wǎng)數(shù)據(jù),利用自然語言處理技術深入分析文本數(shù)據(jù),以及采用機器學習算法進行智能化分析。通過這些先進技術,疾控中心能夠獲取更廣泛、更深入的信息,從而提高決策的精確性和效率。
此外,采用基于聯(lián)盟鏈技術的檔案系統(tǒng)及疾控電子檔案模塊,對于提升信息獲取效率尤為重要。聯(lián)盟鏈技術確保了數(shù)據(jù)的安全性和可信度,促進了跨部門間的數(shù)據(jù)共享與協(xié)作。而疾控電子檔案模塊則允許專業(yè)人員查閱和更新數(shù)據(jù),同時由業(yè)務部門負責監(jiān)督和確認數(shù)據(jù)內容。通過這種方式,可構建一個動態(tài)更新、全程記錄、客觀可信、全面監(jiān)督的電子檔案管理系統(tǒng),實現(xiàn)數(shù)據(jù)在物理上的分散與邏輯上的統(tǒng)一。
通過深度挖掘數(shù)據(jù)并采納先進的檔案管理系統(tǒng),疾控中心能夠更好地應對信息獲取的挑戰(zhàn),提高數(shù)據(jù)分析的準確性,為疫情防控和公共衛(wèi)生決策提供更有力的支持。這不僅有助于提升疾控中心的工作效率,也能增強其在公共衛(wèi)生領域的專業(yè)性和權威性[5]。
2.2實現(xiàn)信息資源交互共享
在疾病防控工作中,各業(yè)務系統(tǒng)往往局限于特定領域,形成了信息“孤島”與“數(shù)據(jù)壁壘”。這些系統(tǒng)普遍缺乏數(shù)據(jù)共享和智能分析的機制。為破解這一難題,采用聯(lián)盟鏈技術促進信息共享與分析顯得尤為關鍵。
信息“孤島”和“數(shù)據(jù)壁壘”意味著系統(tǒng)間獨立運作,數(shù)據(jù)共享與整合困難重重。系統(tǒng)之間各自為戰(zhàn),缺乏有效的數(shù)據(jù)交換與整合手段,進而引發(fā)數(shù)據(jù)隔離,影響了綜合分析和決策的效率。
針對這一問題,聯(lián)盟鏈技術能夠分布式整合不同業(yè)務系統(tǒng)。作為一種多中心化的區(qū)塊鏈技術,聯(lián)盟鏈支持多個組織共同維護賬本,確保數(shù)據(jù)安全、高效地共享與協(xié)作。通過公私密鑰機制和訪問控制,聯(lián)盟鏈為數(shù)據(jù)安全和隱私保護提供了堅實保障。
在此基礎上,引入大數(shù)據(jù)分析工具,為不同部門設置公私密鑰,以保障數(shù)據(jù)的維護與監(jiān)管。這些工具能夠跨越層級和部門界限,促進數(shù)據(jù)的交互、共建和共享,有效打破信息障礙。借助機器學習、數(shù)據(jù)挖掘和人工智能算法,大數(shù)據(jù)分析工具能夠深入挖掘數(shù)據(jù)間的復雜關聯(lián),提供全面而精確的決策支持,進一步增強疾控中心的專業(yè)能力。
利用聯(lián)盟鏈技術和大數(shù)據(jù)分析工具,疾控中心能夠實現(xiàn)業(yè)務系統(tǒng)間的信息共享與協(xié)同分析。這種集成式數(shù)據(jù)管理模式有助于提高疾控中心的決策能力和疾病防控成效,促進跨部門、跨領域的合作與創(chuàng)新。此外,信息共享還能夠提升公共衛(wèi)生系統(tǒng)的運作效率和應急響應速度,更好地應對突發(fā)公共衛(wèi)生事件。
3運用數(shù)據(jù)預測,拓寬檔案利用領域
2009年,甲型H1N1流感暴發(fā)的幾周前,互聯(lián)網(wǎng)巨頭谷歌在《自然》雜志上發(fā)表了一篇引人矚目的論文,解釋了谷歌為何能夠預測冬季流感傳播,并且可以具體到特定地區(qū)。谷歌公司將5000萬條美國人最頻繁檢索的詞條與美國疾控中心在2003年到2008年間季節(jié)性流感傳播時期的數(shù)據(jù)進行了比較。通過處理4.5億個不同數(shù)學模型,并將結果與2007年、2008年美國疾控中心記錄的實際流感病例比對后,谷歌找到了一組包含45條檢索詞條的組合。將這些詞條用于一個特定的數(shù)學模型后,谷歌的預測與官方數(shù)據(jù)的相關性高達97%,預測結果非常準確且及時。這充分展示了“大數(shù)據(jù)”在流感傳播預測中的強大能力。
要將“大數(shù)據(jù)”理念應用于疾控中心檔案管理,就需要不斷拓展檔案服務和利用領域(如圖3)。
3.1規(guī)范化建設管理
規(guī)范化建設管理對疾控中心檔案信息化建設起著關鍵作用。它涵蓋電子文件歸檔管理以及檔案信息資源的獲取、存儲、查詢和利用等多個環(huán)節(jié)。建立健全科學、嚴密、安全的疾控檔案信息化管理制度,對于防止信息失真、確保檔案安全具有重要意義。
首先,電子文件的歸檔和管理至關重要。隨著數(shù)字化進程的加速,越來越多的檔案以電子文件形式存在。對這些電子文件進行有效歸檔和管理,不僅能夠提高工作效率,還能確保信息的長期保存和可追溯性。因此,疾控中心需建立一套完整的電子文件管理制度,涵蓋文件的分類、命名、存儲、備份、檢索和銷毀等方面。
其次,建立安全的疾控檔案信息化管理制度是保障檔案安全的關鍵。這包括制定嚴格的檔案數(shù)據(jù)集管理統(tǒng)一標準,對檔案材料和其他信息資源的收集積累、歸檔驗收、安全保密等環(huán)節(jié)進行規(guī)范。此外,還需建立信息安全防護措施,如數(shù)據(jù)加密、訪問控制和網(wǎng)絡安全等,以防止檔案數(shù)據(jù)被非法訪問、篡改和泄露。
最后,擴大疾控電子檔案的應用范圍是在確保信息安全的前提下提高檔案利用效率的重要措施??梢酝ㄟ^設置查閱權限,允許相關單位調閱電子檔案,以便核實相關信息。這不僅能夠解決當前與信息化管理不相適應的問題,還能促進信息的共享和利用,從而提高疾控中心的工作效率。
綜上所述,規(guī)范化建設管理是確保疾控中心檔案信息化建設順利進行的重要保障。通過建立完善的電子文件歸檔和管理制度,制定安全的檔案信息化管理制度,以及擴大電子檔案的應用范圍,疾控中心能夠更好地應對公共衛(wèi)生挑戰(zhàn),提高疾病防控能力[6]。
3.2數(shù)據(jù)化歸檔建檔
疾控中心的檔案電子化和數(shù)據(jù)化是實現(xiàn)檔案管理信息化的基礎。這種轉換不僅能夠提高檔案管理效率,還能確保檔案材料的真實性和原始性。通過構建電子檔案與紙質材料的對應關系,疾控中心確保了檔案信息的準確性和完整性[7]。
利用電子掃描技術,將紙質檔案逐件轉換為電子圖片,建立電子檔案與紙質材料的對應關系。這種轉換既保留了檔案的原貌,又便于存儲和檢索。轉換后的電子檔案按照統(tǒng)一的排序和標準格式進行存儲,既保持了檔案的原始性,又提高了檔案管理效率。
信息系統(tǒng)的使用是檔案管理信息化的關鍵。疾控中心通過信息技術從源頭上規(guī)范化管理檔案材料,例如將病癥表現(xiàn)、疫情特點和防控要點等信息納入信息系統(tǒng),使檔案在形成初期就實現(xiàn)數(shù)據(jù)化和信息化,有效避免了檔案材料失實和信息不準確的問題。
通過數(shù)據(jù)化歸檔建檔,疾控中心不僅提升了檔案管理效率,還確保了檔案的真實性和原始性,為檔案的長期保存和高效利用奠定了基礎。同時,數(shù)據(jù)化歸檔建檔也助力疾控中心更好地應對公共衛(wèi)生事件,提高疾病防控能力。
3.3智能化分析預測
疾控中心檔案信息化管理系統(tǒng)的功能設計應全面且智能化。系統(tǒng)應包括組織機構信息、人員信息、檔案目錄、轉遞查詢(借閱)、材料收集、整理記錄、缺失登記和統(tǒng)計查詢等功能。這樣的設計將使疾控檔案材料的管理和使用更加智能化。
通過標準化的管理軟件,疾控中心能夠快速查閱材料、統(tǒng)計數(shù)據(jù)、分析情況、提出處置意見并打印報表。這種功能設計有助于疾控中心充分挖掘檔案信息資源的價值,為疫情防控和預測工作提供決策支持。此外,標準化的管理軟件還能幫助管理人員快速、準確地處理大量數(shù)據(jù),提高工作效率。
在疫情分析和預測方面,利用計算機永久保存疫情特征和病例的電子檔案,為歷史事實和未來情況預測提供重要依據(jù)。在工作調整時,留存電子檔案以備查閱,并復制一份隨紙質材料轉遞。這種方式確保檔案資料的安全性和可靠性,并為決策者提供準確的歷史數(shù)據(jù)和趨勢分析,以便更好地應對未來可能出現(xiàn)的情況。
智能化分析預測是疾控中心檔案信息化管理系統(tǒng)的重要功能之一。通過使用標準化的管理軟件和計算機技術,不僅能夠提升檔案管理的效率和準確性,還能夠為疫情防控和預測工作提供有力的決策支持。這種智能化的管理方式有助于疾控中心更好地應對公共衛(wèi)生挑戰(zhàn),提高疾病防控能力。
4結束語
隨著時代的發(fā)展,利用大數(shù)據(jù)、區(qū)塊鏈、人工智能等現(xiàn)代信息技術推進檔案工作信息化轉型已成為大勢所趨。疾控中心的工作涵蓋海量數(shù)據(jù)處理任務,更應緊跟時代步伐。信息化、數(shù)據(jù)化和智能化密不可分,只有在大數(shù)據(jù)背景下做好疾病防控海量數(shù)據(jù)的收集整理、識別歸檔和智能分析,才能應對復雜多變的疫情形勢,處理突發(fā)情況,預測未知風險,將疫情防控工作做到最前沿、做到根本[8]。
參考文獻:
[1]張斌,楊文.關于做好新冠肺炎疫情防控工作檔案資料管理的思考[J].秘書工作,2020(2):23-24.
[2]王羽佳.基層單位檔案收集精準化管控探析[J].北京檔案,2020(2):23-25.
[3]田明.黑龍江省檔案館全力防控新型冠狀病毒肺炎疫情[DB/OL].(2020-02-12)[2023-02-20].http://www.chinaarchives.cn/home/category/detail/id/7374.html.
[4]葉修斌.江西省部署做好新冠肺炎疫情防控建檔工作[DB/OL].(2020-02-12)[2023-02-20].http://www.chinaarchives.cn/home/category/detail/id/15736.html.
[5]楊靜.內蒙古自治區(qū)檔案館收第一份抗疫檔案資料[DB/OL].(2020-03-20)[2023-02-20].http://www.chinaarchives.cn/home/category/detail/id/6250.html.
[6]樓俐.H7N9禽流感文件材料的前端控制和過程管理[A].王茂法.檔案管理理論與實踐:浙江省基層檔案工作者論文集:2013[C].杭州:浙江工商大學出版社,2013:179-181.
[7]尚建芳.疾控中心檔案管理工作現(xiàn)狀以及改進思想[J].臨床醫(yī)藥文獻電子雜志,2017,4(8):1573.
[8]趙進華.疾控中心檔案管理質量提升對策研究[J].辦公室業(yè)務,2019(1):83.
【通聯(lián)編輯:唐一東】