摘 要 如今,大數(shù)據(jù)的迅猛開展之下,艾滋病成為各界甚至世界各國政府關(guān)注的焦點。其中人們對大數(shù)據(jù)的的發(fā)掘利用,可以針對不同人群密度分布的特點,基于對預(yù)防HIV病毒傳播的分析,對本區(qū)域的預(yù)防HIV病毒進(jìn)行實時監(jiān)控,并基于灰色系統(tǒng)相關(guān)的知識結(jié)構(gòu)去建設(shè)關(guān)于艾滋病預(yù)測的灰色GM(1,1)模型,利用大數(shù)據(jù)進(jìn)行相關(guān)的統(tǒng)計、分析、比較,將HIV病毒的一系列數(shù)據(jù)代入模型中,經(jīng)過嚴(yán)密的推理與計算,最終得出結(jié)論對我國今后在預(yù)防和控制艾滋病的傳播方面帶來一定的參考價值。
關(guān)鍵詞 大數(shù)據(jù);艾滋病預(yù)防;灰色GM(1,1)模型
引言
艾滋病的醫(yī)學(xué)全名為“獲得性免疫缺損綜合征”,英文簡稱AIDS,因人體免疫缺損病毒也就是HIV引起的。自從八十年代初第一病例被確診以來,艾滋?。ˋIDS)正在成為威脅人類的最嚴(yán)重疾病之一。面對艾滋病的威脅,我國政府和人民也正在接受一次前所未有的挑戰(zhàn)。盡管已經(jīng)知道艾滋病是 HIV-I 感染引起的,但這種病毒的一些數(shù)量特征仍然困惑著艾滋病研究人員。人體內(nèi)有一種淋巴白細(xì)胞被稱作 CD4+ T-細(xì)胞,這種細(xì)胞的分泌和分化對人體免疫系統(tǒng)其他細(xì)胞起著不可替代的作用,正常情況下CD4+ T-細(xì)胞計數(shù)在血液中大約為 1000/μl。HIV-I 進(jìn)入人體后主要感染 CD4+ T-細(xì)胞,病毒的gp120蛋白質(zhì)站粘著 CD4+ 受體并進(jìn)入細(xì)胞核,通過反轉(zhuǎn)錄作用、整合和生成衣殼蛋白質(zhì),一個被感染的細(xì)胞會釋放出數(shù)以百計的新病毒,這些新病毒又感染CD4+ T-細(xì)胞,如此反復(fù)。目前,人類還沒有找到能醫(yī)治AIDS的療法,并且當(dāng)今一些AIDS療法不僅對人體有不好的作用,而且花費也很高。盡管如此,我們?nèi)嗽诓粩嗯φ覍じ杏玫姆椒ā?/p>
隨著人們科技水平的不斷提升,信息技術(shù)也變得更為先進(jìn),所以當(dāng)我們踏入了數(shù)字信息時代時,一切信息的來源都使我們對未知領(lǐng)域更迫切的了解。越來越多的數(shù)據(jù)匯聚在一起,隨著時空不斷變化,持續(xù)產(chǎn)生、不斷流動、進(jìn)而形成大數(shù)據(jù)。而大數(shù)據(jù)常常“伴隨我們”左右,與我們生活密不可分。同時越來越多的問題都可以通過大數(shù)據(jù)來了解觀察并解決。
因此在大數(shù)據(jù)背景下,我們可以用數(shù)學(xué)模型預(yù)防HIV病毒,將大量數(shù)據(jù)與數(shù)學(xué)模型相結(jié)合,并與時代接軌,利用大數(shù)據(jù)去探索有價值的事物。所以,在HIV病毒預(yù)防過程中,大數(shù)據(jù)的“輔助”無疑是讓人們增強(qiáng)HIV病毒預(yù)防和精確度。通過不斷的分析、判斷和實驗,將大數(shù)據(jù)代入數(shù)學(xué)模型中得到結(jié)果,從而讓HIV病毒預(yù)防能夠有更新更高的突破。
1 分析
1.1 數(shù)據(jù)的收集與處理
(1)中國艾滋病發(fā)病數(shù)及死亡人數(shù)統(tǒng)計
我們根據(jù)網(wǎng)絡(luò)大數(shù)據(jù),查找到相關(guān)數(shù)據(jù)如下表:
通過相關(guān)數(shù)據(jù)我們可以很直觀地知道在2011年到在2017年的發(fā)病人數(shù)和死亡人數(shù)。 死亡人數(shù)則是專業(yè)人員結(jié)果傳染病忘了直報系統(tǒng)統(tǒng)計報告所得到的數(shù)據(jù),是一個重要的依據(jù)。因此我們可以通過上表數(shù)據(jù)建立一個數(shù)學(xué)模型。
1.2 中國艾滋病發(fā)病數(shù)及死亡人數(shù)進(jìn)一步整理
首先利用Matlab軟件畫出其柱狀圖和折線圖見圖1和圖2。我們通過柱狀圖和折線圖可以發(fā)現(xiàn)的變化趨勢是:HIV發(fā)病人數(shù)隨著時間的增長而增長。
1.3 HIV感染者、AIDS病人人數(shù)、死亡人數(shù)
經(jīng)過繁多的數(shù)據(jù),我們可以調(diào)查了解到全國報告現(xiàn)存活艾滋病病毒(HIV)感染者/AIDS病人789617例,報告死亡245498例?,F(xiàn)存活HIV感染者460551例,AIDS人329066例。
2 GM(1,1)模型的建立與求解
2.1 數(shù)據(jù)預(yù)處理與處理
為確保建??尚行?,需要對中國HIV發(fā)病數(shù)和死亡人數(shù)時間序列進(jìn)行級別檢驗、分析和對大量數(shù)據(jù)進(jìn)行處理,進(jìn)而對比模型檢驗分類,最終獲得較高的精度,我們在此只研究中國HIV發(fā)病數(shù),如表2所示:
Step1:建立中國HIV發(fā)病數(shù)時間序列如下:
Step2:求級比? 有 ,
Step3:級比判斷
由于所有的,,故可以用? 作GM(1,1)建模[1-4]。
2.2 模型建立
Step1:將原始數(shù)據(jù) ,
記為。
Step2:作為一次累加,得到
,
其中 ,
Step3:構(gòu)造數(shù)據(jù)矩陣? 以及數(shù)據(jù)向量 ,有
Step4:計算,
,
于是可以得到 。
Step5:建立GM(1,1)模型
求解可得
Step6:求生成序列預(yù)測值
以及模型還原值
令,由上式的時間響應(yīng)函數(shù)可得,其中?。?/p>
得到:
3 模型的檢驗與分析
3.1 背景
經(jīng)驗證,所用的模型測量出的精度較為準(zhǔn)確,因此能為之后提供有效的預(yù)測等[5-8]。
4 模型的評價與推廣
4.1 模型評價
(1)模型優(yōu)點
①可以借助微分方程來發(fā)現(xiàn)其實質(zhì),并且模型精度較高。②能將無規(guī)律的原始數(shù)據(jù)進(jìn)行生成得到規(guī)律性較強(qiáng)的生成序列,運(yùn)算簡便,易于檢驗,不需要考慮分布狀況,不考慮變更。
(2)模型缺點
運(yùn)用灰色理論的GM(1,1)模型所模擬的數(shù)據(jù)大部分只適用于中短期的預(yù)測,中長期的預(yù)測精度會出現(xiàn)偏差,且只反映一直流行趨勢。
5 結(jié)束語
雖然灰色系統(tǒng)GM(1,1)模型能夠較好的適用于玩過艾滋病傳染趨勢的預(yù)測,但灰色預(yù)測方法也或多或少存在不足。艾滋病的發(fā)展趨勢是一個長期的過程,受到來自各方面的影響,所以要進(jìn)行長期的預(yù)測需要更新數(shù)據(jù)建立的動態(tài)預(yù)測模型,才能達(dá)到更好更精確的預(yù)測效果。
參考文獻(xiàn)
[1] 司守奎,孫兆亮.數(shù)學(xué)建模算法與應(yīng)用[M].北京:國防工業(yè)出版社,2015:55.
[2] 姜啟源,謝金星,葉俊.數(shù)學(xué)模型[M].北京:高等教育出版社,2011:109.
[3] 鄧聚龍.灰色理論基礎(chǔ)[M].武漢:華中科技大學(xué)出版社,2000:36.
[4] 高世同,劉建平.艾滋病高溫人氣規(guī)模國際以及方法[J].中華流行病學(xué)雜志,2003,(24):987-990.
[5] 佚名.艾滋病[ED/OL].https://www.baikemy.com/disease/detail/850/1.
[6] 佚名.近年中國艾滋病疫情情況數(shù)據(jù)及傳播途徑分析[ED/OL].http://www.sohu.com/a/272197682_1079932018-10-30.
[7] 李學(xué)志,王海霞.具有感染年齡結(jié)構(gòu)的CD4+T-細(xì)胞感染HIV病毒模型分析[J].應(yīng)用數(shù)學(xué)學(xué)報,2009,32(2):207.
[8] 王元卓,靳小龍,程學(xué)旗.網(wǎng)絡(luò)大數(shù)據(jù):現(xiàn)狀與展望[J].計算機(jī)學(xué)報,2013,36(6):1125-1138.
作者簡介
劉思丹(1997-),女,四川馬爾康人,內(nèi)江師范學(xué)院學(xué)生。