張珣 何東陽
摘要:隨著大眾對健康認知的提升,體質(zhì)檢測所采集的基本健康信息以及生理參數(shù)指標數(shù)據(jù)呈指數(shù)級增長?;卺t(yī)療大數(shù)據(jù)技術(shù),提出對收集的生理健康數(shù)據(jù)進行前期預(yù)處理和特征提取,通過運用反向傳播網(wǎng)絡(luò)和受限玻爾茲曼機,提出一種基于深度信念網(wǎng)絡(luò)的個人健康評估模型。該模型能通過訓(xùn)練大量人體健康參數(shù)信息,將個人健康評估結(jié)果分為3類9級:Healthy(A、B、C),Sub-Healthy(D+、D、D-),Unhealthy(F+、F、F-),評估出個人健康危險因素與健康狀態(tài)之間的量化關(guān)系。
關(guān)鍵詞:個人健康評估;反向傳播網(wǎng)絡(luò);深度信念網(wǎng)絡(luò)
DOIDOI:10.11907/rjdk.181244
中圖分類號:TP301
文獻標識碼:A 文章編號:1672-7800(2018)010-0044-04
英文摘要Abstract:In recent years, the public has improved their knowledge of health, and the basic health information and physiological parameter data collected by physical fitness tests have been increased exponentially. The pre-processing and feature extraction of the collected physiological health data are proposed, and then through the use of back-propagation network and restricted Boltzmann machine, a personal health assessment model based on deep belief network is proposed. The model can evaluate the quantitative relationship between individual health risk factors and the results of individual health assessments are classified into three categories: Healthy(A、B、C),Sub-Healthy(D+、D、D-),Unhealthy(F+、F、F-)and health status by training a large amount of human health parameter information are also evaluated.
英文關(guān)鍵詞Key Words:personal health assessment;back propagation network;deep belief network
0 引言
世界衛(wèi)生組織將“健康”定義為“不但是身體沒有疾病或虛弱,還要有完整的生理、心理狀態(tài)和社會適應(yīng)能力[1]”。“亞健康”指“通常沒有器官、組織、功能上的病癥和缺陷,但是自我感覺不適,疲勞乏力,經(jīng)常處在焦慮、煩躁狀態(tài)”[2]。調(diào)查顯示,符合“健康”定義的中國人群只有15%,還有15%的疾病人群,其余70%的人群處在“亞健康”狀態(tài)中。醫(yī)學(xué)資料表明,慢性非傳染性疾病的發(fā)生往往是由亞健康發(fā)展而來的。如果亞健康狀態(tài)沒有及時預(yù)防并采取有效治愈措施,可能導(dǎo)致真正的慢性疾病。顯然,研究發(fā)展針對于個人的健康評估[3]預(yù)測極具現(xiàn)實價值和意義。
了解自身健康,預(yù)測健康危險因素[3-4],規(guī)范自身健康行為,已成為當前大眾重要的健康需求。普通人在醫(yī)院作完健康體檢[5]后,往往看著體檢報告單上的數(shù)據(jù)一頭霧水,不知所措。個人健康評估模型的建立有助于解決這類問題,它通過對個人健康危險因素進行全面篩查、分析、處理、預(yù)測,起到健康預(yù)警作用,讓個人清晰地認識自身健康狀況,積極規(guī)范自身健康行為,提升健康生活質(zhì)量。
1 個人健康評估
體檢生理參數(shù)指標的性質(zhì)和變化趨勢蘊含著豐富的人體生理病理信息。更詳細的解釋是,人體生理參數(shù)[6]指標的細微變化都反映著機體健康的趨勢。通過對話機體生理參數(shù)的多項指標,基于深度信念網(wǎng)絡(luò)對個人健康狀況進行綜合評估。個人健康評估通過取得多方面的個人健康體檢參數(shù)信息,分析出健康危險因素與健康狀態(tài)之間的量化關(guān)系,預(yù)測個人在當前時間下的健康狀況以及潛在危險疾病發(fā)生的可能性,對這一可能性進行量化評估。該模型能積極幫助體質(zhì)檢測個體全面綜合認識自身健康狀況,提前預(yù)測潛在疾病的發(fā)生幾率,幫助改善個人健康狀況。
個人健康評估有健康生理參數(shù)信息采集、數(shù)據(jù)預(yù)處理[7]、個人健康評估幾個階段。
(1)健康生理參數(shù)信息采集:這是進行個人健康評估的基礎(chǔ),包括問卷檢查、常規(guī)體格檢查、實驗室檢查。問卷檢查,就是以表和問卷形式對被檢測人進行相關(guān)健康問答,該方法主觀性強,相比較而言,缺乏客觀、準確的評價指標和標準。常規(guī)體格檢查指對人體形態(tài)結(jié)構(gòu)和技能發(fā)展水平進行檢測和計量,例如身高、體重、體溫、脈搏等。實驗室檢查通常指在實驗室進行物理或化學(xué)檢查,確定檢測物質(zhì)的內(nèi)容、性質(zhì)、濃度、數(shù)量等特性,常見的實驗室檢查有血常規(guī)、尿常規(guī)、血脂、血糖等。本研究中,個人健康評估預(yù)測模型獲取個人最新的體檢特征參數(shù),共輸入182個生理特征。其中包括10大類,分別為一般檢查12項(例如血壓、脈搏、體重、BMI[8]、體脂率等),血常規(guī)10項,尿常規(guī)13項,便常規(guī)10項,肝膽、腎、血脂、血糖等共24項,乙肝、丙肝、梅毒、AIDS[9]、腫瘤甲狀腺、風濕等51項,男性性激素、女性性激素6項,體適能、肺功能、微量元素等18項,眼科、耳鼻喉科、口腔、婦科31項,心臟類7項。
(2)數(shù)據(jù)預(yù)處理:數(shù)據(jù)預(yù)處理在機器學(xué)習、深度學(xué)習等不同算法中起著非常重要的作用,實際運用中,將數(shù)據(jù)作歸一化和標準化處理后,模型能夠發(fā)揮最佳預(yù)測效果。
(3)個人健康評估:主要包括健康狀態(tài)評估和疾病風險評估兩種評估方式。一般健康風險評估(HRA[10])指對具有一定健康特征個體的危險因素和可能發(fā)生疾病的評估。疾病風險評估(DSHA[11])是健康風險評估擴展為以疾病為基礎(chǔ)的健康危險性評價。所謂疾病風險評估,是指對特定疾病患者健康風險的評估。
2 算法原理
3 個人健康評估模型
3.1 模型結(jié)構(gòu)
深度信念網(wǎng)絡(luò)結(jié)構(gòu)[17](Deep Belief Networks , DBNs)是由若干層受限玻爾茲曼機和一層反向傳播網(wǎng)絡(luò)組成的一種深層神經(jīng)網(wǎng)絡(luò),見圖2。在深度信念網(wǎng)絡(luò)中,上一層RBM網(wǎng)絡(luò)可以通過學(xué)習得到的特征輸出作為下一層的輸入,使每層能更好地提取上一層特征。而頂層的反向傳播網(wǎng)絡(luò)則以RBM網(wǎng)絡(luò)提取特征作為輸入,然后對輸入特征進行分類或預(yù)測。
第一層RBM可視層節(jié)點數(shù)量由輸入樣本特征數(shù)量決定。實踐研究表明,隨著RBM 層數(shù)的增加,深度信念網(wǎng)絡(luò)的建模能力也隨之增強,特征提取的抽象能力增加,結(jié)果預(yù)測能力更強,但是由于過多的RBM層數(shù)導(dǎo)致DBNs的泛化能力降低,容易出現(xiàn)過擬合現(xiàn)象。所以,DBNs網(wǎng)絡(luò)深度對模型預(yù)測能力有一定的影響。需要考慮深度信念網(wǎng)絡(luò)模型的每個隱層節(jié)點數(shù)對模型預(yù)測性能的影響。大量實踐數(shù)據(jù)顯示,隱層節(jié)點數(shù)過少可能會導(dǎo)致模型預(yù)測效果偏低;隱層節(jié)點數(shù)過多,同樣也可能導(dǎo)致過擬合現(xiàn)象。
3.2 模型訓(xùn)練過程
4 評估結(jié)果
根據(jù)生命健康密切相關(guān)的生理體征信息,總結(jié)前人健康評估模型的不足,利用深度學(xué)習理論的強大特征抽象提取能力,建立一種新的健康評估方法。該評估模型通過對生理參數(shù)信息做前期預(yù)處理,利用反向傳播網(wǎng)絡(luò)、受限玻爾茲曼機生成深度信念網(wǎng)絡(luò),預(yù)處理完成后的生理特征作為訓(xùn)練數(shù)據(jù),經(jīng)過大量數(shù)據(jù)訓(xùn)練出科學(xué)、準確的健康評估模型。把健康評估結(jié)果分為3類9級:Healthy(A、B、C),Sub-Healthy[23](D+、D、D-),Unhealthy(F+、F、F-),如表1所示。在判斷個體健康狀態(tài)基礎(chǔ)上,增加對每一狀態(tài)的健康等級劃分,目的是方便用戶更加簡潔直觀地看到自己的健康情況。
5 結(jié)語
本文針對個人體檢參數(shù)結(jié)果,給出了健康生理特征參數(shù)信息的處理與分析方法,提出了一種基于深度信念網(wǎng)絡(luò)的個人健康評估模型。該模型基于深度信念網(wǎng)絡(luò),建立一種個人體質(zhì)檢測生理特征參數(shù)(例如一般檢查、血常規(guī)、尿常規(guī)、生化檢查、免疫檢查等)作為輸入特征,以健康狀況作為輸出結(jié)果的模型。利用大量個人體檢健康數(shù)據(jù)對模型進行訓(xùn)練,充分挖掘個人健康參數(shù)中的語義特征,實現(xiàn)基于體檢健康大數(shù)據(jù)的個人健康評估模型。通過利用受限玻爾茲曼機和深度信念網(wǎng)絡(luò),對個人健康情況進行分類。研究表明,基于深度信念網(wǎng)絡(luò)的健康評估方法,能較好地提取人體重要特征,更好地挖掘健康大數(shù)據(jù)的潛在價值,為大眾提供健康指導(dǎo),提高生活質(zhì)量。
參考文獻:
[1] 祝木蘭.大學(xué)生心理健康狀況及其影響因素研究[J].衛(wèi)生職業(yè)教育,2007,25(23):123-125.
[2] 石愛橋,張匯敏.傳統(tǒng)體育養(yǎng)生的困境與未來發(fā)展方向研究[C].中國體育博士高層論壇,2014.
[3] 朱明賢.人體健康評估及信息管理平臺的設(shè)計與實現(xiàn)[D].濟南:山東大學(xué),2015.
[4] 宇傳華,季潔,張干深,等.中國人壽命、死因與健康危險因素——全球疾病負擔研究最新結(jié)果[J].中國衛(wèi)生統(tǒng)計,2015,32(1):181-182.
[5] 姚宇彤.健康體檢護理在健康和亞健康人群中的應(yīng)用分析[J].中外醫(yī)學(xué)研究,2015(14):94-96.
[6] 張騰宇,李立峰,王喜太.人體生理參數(shù)預(yù)警及定位系統(tǒng)[P].CN201692066U2011.
[7] 王培培.健康體檢數(shù)據(jù)預(yù)處理方法研究與應(yīng)用[D].鄭州:鄭州大學(xué),2016.
[8] CONSULTATION W E. Appropriate body-mass index for Asian populations and its implications for policy and intervention strategies.[J]. Lancet, 2004, 363(9403):157-163.
[9] FENTON L. Preventing HIV/AIDS through poverty reduction: the only sustainable solution[J]. Lancet, 2017, 364(9440):1186-1187.
[10] SMITH D C. Tread carefully on new HRA law allowing individual coverage reimbursements[EB/OL]. https://Ebn.benefitsnews.com, 2016.
[11] STEINBUECHEL N V, COVIC A, POLINDER S, et al. Assessment of health-related quality of life after TBI: comparison of a disease-specific (QOLIBRI) with a generic (SF-36) instrument[J]. Behavioural Neurology, 2016(6):792-801.
[12] IONESCU C, VANTZOS O, SMINCHISESCU C. Matrix backpropagation for deep networks with structured layers[C]. IEEE International Conference on Computer Vision. IEEE, 2016:2965-2973.
[13] FISCHER A. Training restricted boltzmann machines[J]. KI - Künstliche Intelligenz, 2015, 29(4):441-444.
[14] 張宏毅,王立威,陳瑜希.概率圖模型研究進展綜述[J].軟件學(xué)報,2013(11):2476-2497.
[15] 張艷霞.基于受限玻爾茲曼機的深度學(xué)習模型及其應(yīng)用[D].成都:電子科技大學(xué),2016.
[16] RAMACHANDRAN P, ZOPH B, LE Q V. Searching for activation functions[EB/OL]. https:∥yq.aliyun.com/articles/363672.
[17] LOPES N, RIBEIRO B. Deep belief networks (DBNs)[C]. Machine Learning for Adaptive Many-Core Machines - A Practical Approach. Springer International Publishing, 2015:155-186.
[18] 何鵬程.改進的卷積神經(jīng)網(wǎng)絡(luò)模型及其應(yīng)用研究[D].大連:大連理工大學(xué),2015.
[19] BENGIO Y, DELALLEAU O. Justifying and generalizing contrastive divergence[J]. Neural Computation, 2014,21(6):1601-1621.
[20] SEGAL M, WEINSTEIN E. A new method for evaluating the log-likelihood gradient, the Hessian, and the Fisher information matrix for linear dynamic systems[J]. IEEE Transactions on Information Theory, 1989,35(3):682-687.
[21] CASELLA G, GEORGE E I. Explaining the gibbs sampler[J]. American Statistician, 1992,46(3):167-174.
[22] 魏英姿,張?zhí)旌?,KOMLAN.基于深度置信網(wǎng)絡(luò)的人臉識別方法研究[J].電子世界,2017(19):89-90.
[23] WU S, LIN S, ZHANG Q, et al. A study of sub-healthy status of community residents and its relevant factors in Fuzhou City[J]. Journal of hygiene research, 2015,44(5):738-741.
(責任編輯:杜能鋼)