彭巧娟,周毅,劉娟
(1.南華大學計算機學院,衡陽421000;2.南華大學資源環(huán)境與安全工程學院,衡陽421000;3.南華大學化學化工學院,衡陽421000)
(1)問題背景
阿片類藥物[1]就是指從罌粟中提取的樹脂滲出物,加上人工半合成的麻醉、鎮(zhèn)痛性藥物,具有一定的成癮性。它是癌癥患者和其他重癥患者遭受極度痛苦時為緩解疼痛采用的手段,本應(yīng)當被嚴格限制使用,如今在美國卻唾手可得,由此引發(fā)出一場關(guān)于使用阿片類藥物的全國性危機??紤]到藥物的傳播具有速度快、范圍廣等特點,同時阿片類藥物的濫用存在多個方面的原因,如何正確估算和預(yù)測阿片類藥物隨時間的傳播和特點以及分析阿片類藥物的使用如何達到目前的水平,將為藥物管理部門監(jiān)控和管理阿片類藥物和緝毒署推進禁毒情報工作等提供理論依據(jù)。
(2)已有的研究
2011 年4 月,白宮提出國家處方藥濫用預(yù)防計劃[2],通過宣傳教育和大數(shù)據(jù)追蹤監(jiān)控試圖改善阿片類藥物濫用的現(xiàn)況。2016 年3 月,美國醫(yī)學會雜志(JAMA)發(fā)布了CDC[3]最新版阿片類藥物治療慢性疼痛使用指南,對藥物利弊等作了詳細說明,一定程度上能提高病人的用藥風險意識[4]。但阿片類藥物濫用問題的控制并非一朝一夕,在各方利益博弈中,阿片類藥物濫用問題的解決之路依舊困難重重。
(3)研究目標
①目標一
建立一個數(shù)學模型,描述五個州(俄亥俄州、肯塔基州、西弗吉尼亞州、弗吉尼亞州、賓夕法尼亞州)及其縣之間報告的合成阿片和海洛因事件(案例)隨時間的傳播和特點。使用該模型,確定五個州中每一個州可能已經(jīng)開始使用特定阿片類藥物的任何可能位置。
②目標二
關(guān)于阿片類藥物的使用如何達到目前的水平,是誰在使用/濫用它,以及為什么阿片類藥物的使用盡管存在已知的危險,但仍然持續(xù)存在,使用或趨勢是否與美國人口普查提供的任何社會經(jīng)濟數(shù)據(jù)有某種關(guān)聯(lián)?
③目標三
找出一個應(yīng)對阿片危機的可能策略。
表1
(1)各州合成類阿片隨時間變化的趨勢
①變化趨勢
為了研究五個州中每一個州合成類阿片類使用量的變化,我們將2010-2017 年各州合成類藥物的使用量篩選出來,進行散點分析,得到它們的變化趨勢圖,如圖1 所示:(數(shù)據(jù)來源于https://www.cdc.gov/features/confrontingopioids/index.html)。
圖1 2010-2017年各州合成阿片類藥物的綜合計數(shù)
②圖像分析
我們可以發(fā)現(xiàn)俄亥俄州的阿片藥物總使用量隨時間呈上升趨勢,賓夕法尼亞州的阿片藥物總使用量隨時間呈穩(wěn)步下降趨勢,肯塔基州和西弗吉尼亞州的藥物使用量趨勢相對穩(wěn)定,弗吉尼亞州的藥物使用量隨時間呈上下波動趨勢,我們對各州藥物總量隨時間的變化進行GM(1,1)模型預(yù)測,得到各州的藥物總量的變化規(guī)律。
以俄亥俄州為例。
對原始數(shù)據(jù)x(0)作一次累加,得:
x(1)=(70999,142881,227696,321443,422866,532016,647292,766641)
構(gòu)造數(shù)據(jù)矩陣B 及數(shù)據(jù)向量Y,有:
計算:
于是得到a?=0,b?=1.0e+0.4*6.9626
建立模型:
求解,得:
③變化趨勢方程
最終得到各州的合成類阿片總量隨時間的變化規(guī)律(其中,為了保證預(yù)測模型的準確,我們舍棄了弗吉尼亞州2013 年的突增點):
俄亥俄州(OH):xt=723614.0e0.0831486t-661916.0
肯塔基州(KY):xt=1532144-1503188e-0.0169621t
西弗吉尼亞州(WV):xt=67156.8-59390.8e-0.164836t
弗吉尼亞州(VA):xt=5114977-5075811e-0.00625324t
賓夕法尼亞州(PA):
xt=1512155-1434277e-0.0499548t
(2)形成變化趨勢的分析
我們研究這五個州的地理位置發(fā)現(xiàn),這五個州以靠近水源的俄亥俄州為起點,向四周發(fā)散。其中,俄亥俄州是兩大交通動脈70 號和75 號公路交匯樞紐,是墨西哥毒梟分銷毒品和禁藥最理想的地點,同時也是阿片類藥物流通的極佳地點。賓夕法尼亞州同樣作為一個靠近水源的州,它擁有十分發(fā)達的交通運輸系統(tǒng),該州阿片類藥物的使用量相對較高。肯塔基州、西弗吉尼亞州和弗吉尼亞州由于地處山區(qū),交通相對來說不太便利,因此,這三個州阿片類藥物的使用量相對較低。
圖2 五個州的地理分布
(3)各州及其縣之間海洛因隨時間的傳播和特點。
①模型的建立與求解
以肯塔基州海洛因的使用量為例。我們先對肯塔基州每個縣的海洛因總數(shù)和對應(yīng)縣的阿片類藥物總量進行標準化處理:
我們對標準化后的數(shù)據(jù)與縣代碼進行處理,以縣代碼為x 軸,以標準化數(shù)據(jù)為y 軸,得到海洛因在每個縣內(nèi)的波動情況如圖3。
圖3 某縣(用縣代碼表示)海洛因的比例
通過圖像我們可以發(fā)現(xiàn)肯塔基州的前125 個縣內(nèi)海洛因所占比重波動特別明顯,后面100 多個縣雖然也存在這種情況,但波動很小,我們可以猜測海洛因主要存在于編號為75-125 的縣內(nèi),并以此為中心,向四周擴散。
我們將年份、縣代碼、縣海洛因物質(zhì)總量建立出一個數(shù)據(jù)集,對肯塔基州各縣的數(shù)據(jù)用一個矩陣進行存儲,當我們需要進行預(yù)測時,只需輸入該縣的縣代碼,即可得到該縣近幾年海洛因數(shù)據(jù)的預(yù)測值。
記 原 始 時 間 序 列 為 aFt(t=2010,2011,…,2017),對于時間序列樣本aF2010,aF2011,…,aF2017,記aFi的秩為Ri=R(aFi),考慮變量對(t,Rt),t=1,2,…,8 的Spearman 相關(guān)系數(shù)qs,有:
為了構(gòu)造平穩(wěn)序列,對序列aFt(t=2010,2011,…,2017)作一階差分運算bFt=aF(t+1)-aFt,得到序列bFt(t=2010,2011,…,2017)。從時間序列bFt的散點圖,我們可以對每個縣建立其預(yù)測模型:
F:表示縣編號,t:表示時間,cF1,cF2:各縣的待定參數(shù),εFt:各縣的隨機擾動項。
我們隨機選取兩個縣進行預(yù)測,可以得到的預(yù)測值如表2(以肯塔基州047 號縣為例)。
表2 肯塔基州047 號縣的時間序列預(yù)測值
②結(jié)論和分析
預(yù)測可知,肯塔基州中Laurel 等縣可能已經(jīng)開始使用特定阿片類藥物,美國政府應(yīng)該對這幾個縣加大監(jiān)察力度。同理,我們也將俄亥俄州、西弗吉尼亞州、弗吉尼亞州和賓夕法尼亞州的相關(guān)數(shù)據(jù)全部存入一個矩陣中,當我們需要預(yù)測任何地點、任何時間的海洛因總量,只需要輸入該縣的縣代碼和預(yù)測年份,即可得到該縣所需年份對應(yīng)的數(shù)據(jù)預(yù)測值。
圖4 肯塔基州各縣的位置圖
圖中紅色圓圈里的這些縣都是肯塔基州阿片類藥物使用量偏高的位置,這些縣都有一個共同的特點,就是交通十分便利,有的是交通樞紐,有的是靠近水源。阿片類藥物有以這些縣為中心,向其他縣擴散的趨勢。因此,對于各大交通樞紐及臨河城市,美國相關(guān)部門應(yīng)該加大監(jiān)察力度,從源頭控制非法阿片類藥物的擴散。
③模型的進一步驗證
為了增加預(yù)測的準確性,我們對篩選出的數(shù)據(jù)采用灰色預(yù)測,對各州各縣的海洛因總量進行預(yù)測,我們得到已知年份對應(yīng)數(shù)據(jù)的預(yù)測值,通過與原始數(shù)據(jù)進行比對,我們可以得到表3。
表3 肯塔基州047 號縣的灰色預(yù)測值
上面的結(jié)果是對前面結(jié)果的預(yù)測,同時也是一個升華,使得預(yù)測的數(shù)據(jù)更加精確。
(4)藥物識別閾值水平
①問題分析
通過對背景分析,我們可以得知每個州的犯罪實驗室提供的合成類阿片和海洛因的藥物識別計數(shù)的數(shù)據(jù)并不一定是該州的真實記錄,當樣本中沒有提供確定的位置數(shù)據(jù)時,該位置數(shù)據(jù)由市/縣/州調(diào)查執(zhí)法機構(gòu)的位置數(shù)據(jù)代替。
為了降低由各州藥物識別計數(shù)數(shù)據(jù)水平差異引起的誤差,我們根據(jù)給定的每個縣的合成類阿片和海洛因的藥物識別計數(shù)的數(shù)據(jù),對縣阿片類藥物總量和州阿片類藥物總量進行標準化處理,得到二者之間的比值,通過下列流程圖的方法,對其進行處理,得到一個比例閾值,低于該閾值時,則認為該縣的阿片是由于沒有提供位置數(shù)據(jù)導致的,高于該閾值時,則認為該縣的阿片類藥物是由于已經(jīng)開始使用導致的。
圖5 確定閾值的流程圖
②閾值的確定
我們將初始閾值定為0.001,每次以0.001 的幅度遞增,用各縣標準化處理后的值與試探閾值進行比較,當該縣所有年份的值都大于試探閾值、都小于試探閾值、其中某一年份的值大于且該年份之后的值也大于試探閾值這三種情況發(fā)生時,則認為可以判斷該閾值正確的頻數(shù)增加一個,當頻數(shù)與縣的總數(shù)之比大于0.98 時,我們最終得到符合要求的閾值為0.08。
(1)模型的建立與求解
為了測得每個縣的阿片類藥物的總使用量和這23種因素的相關(guān)性強度,我們擬采用灰色關(guān)聯(lián)分析法[5]來進行求解,將每個縣的阿片類藥物總使用量存入數(shù)組,將我們分類完的23 種人口因素存入數(shù)組,我們采用下面的公式分別對每一種因素與阿片類藥物總使用量進行Pearson 相關(guān)性分析。
通過計算,得到每年縣阿片類藥物鑒定總數(shù)和美國人口普查提供的社會經(jīng)濟數(shù)據(jù)之間的相關(guān)性表格,分析結(jié)果如柱狀圖所示。
圖6 2016年阿片類藥物與美國人口普查的社會經(jīng)濟數(shù)據(jù)的相關(guān)性
(2)評價結(jié)論
由數(shù)據(jù)分析結(jié)果以及表4 可知,阿片類藥物的使用和趨勢與多種社會經(jīng)濟數(shù)據(jù)都有極強的相關(guān)性,如教育程度、生育力等,其中,與教育程度的關(guān)聯(lián)度最大。
表4 不同值范圍變量的相關(guān)性強度
(3)阿片類藥物的使用對象
分析可知,和祖父母一同生活的未成年人是使用或濫用阿片類藥物的主要群體,當然,青年和中年人群濫用阿片類藥物的現(xiàn)況同樣也讓人擔憂。
(4)阿片類藥物的使用和成癮增長的原因
阿片類藥物的濫用和成癮問題已經(jīng)成為社會討論的焦點,執(zhí)法機構(gòu)和戒毒團體經(jīng)常將濫用和成癮的原因歸結(jié)為藥企盲目擴張市場以及藥品監(jiān)管部門的不作為,但深入分析不同濫用行為和濫用程度的人群,其濫用原因也不盡相同。
以和祖父母一同生活的未成年人為例,他們的判斷力明顯弱于成年人,同時在成長的過程中,往往得不到正確的引導,因此,缺乏基本常識的非治療性娛樂用藥,是他們對阿片類藥物成癮的重要原因。
而對于大多數(shù)成年人來說,他們往往十分清楚服用這類藥物的潛大在危害,卻依舊選擇使用這些藥物,原因來自兩個方面。一方面,本著“免除疼痛是全人類的權(quán)力”的原則,他們選擇服用醫(yī)生開出的大劑量阿片類藥物來緩解身體上的疼痛。另一方面,現(xiàn)代人面臨的工作壓力十分大,為了逃避生活的不如意,他們只要謊稱身體上有疼痛,就能輕而易舉的得到這些藥物。
(5)對第一部分模型的修改
我們篩選出相關(guān)性最強的三個因素,與縣阿片類藥物總量進行BP 神經(jīng)網(wǎng)絡(luò)預(yù)測,采用下式分別對樣本的輸入、輸出數(shù)據(jù)進行規(guī)格化處理:
K 為規(guī)格化前的變量;kmax和kmin分別為k 的最大和最小值;k?為規(guī)格化后的變量。
通過MATLAB 執(zhí)行算法:
通過上式,我們對2016 的數(shù)據(jù)進行預(yù)測處理,得到部分縣相對誤差值如表5 所示。
表5 神經(jīng)網(wǎng)絡(luò)預(yù)測值表
翻閱以往的文獻,我們發(fā)現(xiàn),遏制阿片類藥物濫用的干預(yù)措施多集中用于患者,但缺少對不同濫用行為和濫用程度的人群的濫用原因的深入分析以及對不同程度濫用者藥物來源的差異性研究。結(jié)合我們前面建立的模型和得出的結(jié)論,我們提出了一個方案:
第一步,根據(jù)每個州每年提交的合成類阿片和海洛因的藥物識別計數(shù)數(shù)據(jù),利用我們第1 問的模型確定每個州及其縣可能已經(jīng)開始使用特定阿片類藥物的時間和位置。
第二步,根據(jù)美國人口普查局提供的社會經(jīng)濟數(shù)據(jù),劃分出不同年齡階段、不同職業(yè)的人群,用第2 問的Pearson 分析確定最有可能濫用阿片類藥物的人群類別,結(jié)合PDMPs 記錄的每個患者開具處方和配藥信息的數(shù)據(jù),對涉嫌濫用或轉(zhuǎn)移處方的人群類別的相關(guān)信息進行監(jiān)控。
最后,結(jié)合調(diào)取數(shù)據(jù)的程序反饋出來的信息,篩選出各州各縣涉嫌濫用阿片類藥物的人群類別,對這些人群的特點進行分析,找到他們?yōu)E用阿片類藥物的原因,對癥下藥,加大對這些人群的教育宣傳力度,控制和酌情減少他們阿片類藥物的使用量。
(1)優(yōu)點
①能夠很好地通過縣代碼把該縣的有關(guān)數(shù)據(jù)提取出來,從而能夠?qū)υ摽h的數(shù)據(jù)單獨進行分析預(yù)測,使之不受州的阿片類藥物使用水平限制;
②剔除了突變過大或者過小的量,在一定程度上減少了由于未提供位置數(shù)據(jù)造成的影響;
③通過對程序多次循環(huán)試探得出了一個合適的閾值,可信度達98%;
④利用多種預(yù)測模型進行對比分析,增大了分析結(jié)果的準確度;
⑤通過對數(shù)據(jù)的標準化處理,不同州的所有的數(shù)據(jù)都可以在同一水平進行討論。
(2)缺點
①處理的方法有些采用人工合作處理,數(shù)值的精確性有待加強;
②由于存在未提供位置數(shù)據(jù)的情況以及部分數(shù)據(jù)缺失嚴重,從而導致部分縣內(nèi)的數(shù)據(jù)變化并不是特別規(guī)律,以致結(jié)果存在一定的誤差。
(1)應(yīng)用
可用于預(yù)測每個縣的阿片藥物總量和各州的藥物總量,并判斷其是否已經(jīng)開始使用特定阿片類藥物,為各州/市/縣針對阿片危機政策起指示作用,能夠針對性地采取措施,減少了不必要的花費。
(2)推廣
該模型同理可以應(yīng)用于預(yù)測人口的增長趨勢和其他的受地區(qū)影響程度較大的數(shù)據(jù)模型,如各國內(nèi)的經(jīng)濟增長、商品的進出口等方面問題。