梅學(xué)聃,周梅華
根據(jù)中國社會科學(xué)院發(fā)布的《2007社會藍皮書》的調(diào)研結(jié)果,“看病難、看病貴”已成為最為困擾國人的社會問題之一。為了應(yīng)對這種情況,中國政府在醫(yī)藥領(lǐng)域?qū)嵤┝艘幌盗泄苤苾r格上限的措施,但是,居民在醫(yī)藥方面的經(jīng)濟負擔(dān)越來越重的現(xiàn)象不僅沒有得到顯著緩和,反倒出現(xiàn)了“以藥養(yǎng)醫(yī)”的現(xiàn)象。醫(yī)療市場的信息不對稱以及“以藥養(yǎng)醫(yī)”現(xiàn)象為醫(yī)藥分離改革的合理性與必要性提供了理論與現(xiàn)實基礎(chǔ)(劉小魯,2011)。中國醫(yī)藥商業(yè)協(xié)會副會長王錦霞認為,醫(yī)藥分開的本質(zhì)目標是實現(xiàn)醫(yī)生開處方、藥店銷售藥品的合理專業(yè)分工。2002年,中國政府開始逐步推進醫(yī)藥分離的試點改革,但因政策不配套,試點沒能繼續(xù)。2009年,《中共中央國務(wù)院關(guān)于深化醫(yī)藥衛(wèi)生體制改革的意見》提出通過實行藥品購銷差別加價、設(shè)立藥事服務(wù)費等多種方式逐步改革或取消藥品加成政策。2017年,《北京市醫(yī)藥分開綜合改革實施方案》正式發(fā)布,2017年4月8日起,北京所有公立醫(yī)療機構(gòu)都需取消掛號費、診療費,取消藥品加成,設(shè)立醫(yī)事服務(wù)費。伴隨醫(yī)藥系統(tǒng)改革的進展,零售藥店逐漸發(fā)揮了更大的作用。
藥品銷量預(yù)測有助于藥品零售企業(yè)有效安排庫存,一方面防止藥品積壓,減少藥品過期帶來的損失,另一方面可以減少缺貨,減弱因無法為顧客提供所需藥品而給他們帶來的不良體驗,藥品銷量預(yù)測是藥品零售企業(yè)管理的一項重要任務(wù)?,F(xiàn)有研究提出了許多預(yù)測方法,但也存在一定的局限性。對于開業(yè)不久的零售藥店或者上市不久的新藥來說,通過需要長時間數(shù)據(jù)的ARIMA等時間序列分析進行銷量預(yù)測非常困難,很可能出現(xiàn)時間序列呈現(xiàn)為白噪聲序列的情況,無法進行相應(yīng)分析?,F(xiàn)存的因果預(yù)測模型,如神經(jīng)網(wǎng)絡(luò)預(yù)測模型、支持向量機預(yù)測模型以及隨機森林預(yù)測模型都需要對影響因素進行比較全面的分析才會有比較良好的預(yù)測效果,但窮盡所有影響因素是極其困難的?;诖?,本文在綜合考慮目前已有的預(yù)測方法優(yōu)缺點基礎(chǔ)上,將時間序列分析和神經(jīng)網(wǎng)絡(luò)結(jié)合起來對銷量進行預(yù)測,力求克服開業(yè)不久的零售藥店和剛上市的新藥沒有長時間銷售數(shù)據(jù)進行ARIMA等時間序列分析的困難,同時減弱因果分析時難以窮盡所有影響因素的預(yù)測困境。在正式進行預(yù)測之前,本文模型利用指數(shù)平滑獲取銷量趨勢信息,以將未能窮盡的某些影響因素納入考慮;之后,利用主成分分析(PCA)對規(guī)模變量和價格變量分別消除冗余;最后,利用后向傳播前饋神經(jīng)網(wǎng)絡(luò)進行預(yù)測。
根據(jù)營銷組合理論,產(chǎn)品、價格、促銷、渠道皆會影響產(chǎn)品需求,下面對可觀測影響因素以及季節(jié)趨勢因素分別進行討論。
1.藥店藥品種類數(shù)(產(chǎn)品)
產(chǎn)品是任何能夠提供給市場供關(guān)注、獲得、使用或消費,并可以滿足需要或欲望的東西。營銷人員在3個層次上做出產(chǎn)品和服務(wù)決策:單個產(chǎn)品決策、產(chǎn)品線決策和產(chǎn)品組合決策。對零售藥店來說,一般需要做出產(chǎn)品組合決策。產(chǎn)品組合由銷售者提供或出售的所有產(chǎn)品組成。產(chǎn)品種類數(shù)能綜合反映零售藥店的產(chǎn)品組合。Campo和Gijsbrechts的研究表明,商店貨架上的產(chǎn)品種類通過反映店內(nèi)環(huán)境對銷量產(chǎn)生影響(2004)。一方面,不同的消費者有不同的購物需求,有的人喜歡治本的中藥,有的人喜歡藥效快的西藥,對同一個藥,消費者也會有不同的品牌偏好,一個日益重要的零售策略旨在滿足不同消費者的需求;另一方面,藥品種類齊全的藥店總是會顯得更專業(yè),更容易獲得消費者的信任,如果消費者總是在一家藥店無法購買到自己想要的藥品,藥店在消費者心中的形象會大打折扣,消費者很可能放棄再到這家藥店買藥。藥店藥品種類數(shù)影響藥品銷量。
2.藥品價格(價格)
價格就是為了獲得某種產(chǎn)品或服務(wù)所付出的金額。企業(yè)所制定的每種價格都可能導(dǎo)致不同的需求水平,Hoch等發(fā)現(xiàn),商店內(nèi)的價格影響商店的銷量。成功的定價策略的基礎(chǔ)是理解消費者的感知價值如何影響他們愿意支付的價格。正常情況下,價格與需求是負相關(guān)的,也就是說價格水平越高,需求水平越低。另外,需求對價格有不同的需求價格彈性。對于零售藥店來說,首先,雖然藥品更偏向是一種必需品,但在同一種藥品有如此眾多不同品牌替代品的今天,藥品的價格會影響消費者的決策,過高的價格可能會使消費者望而卻步,轉(zhuǎn)而購買其它品牌的同類藥品,而且,相對于競爭對手過高的價格也會將消費者“送”給競爭對手,對于同品牌同種類的藥品,理性的消費者為何不選擇更為實惠的銷售者呢?另外,藥品作為一種特殊的商品,承載了治病救人的重任,過低的價格可能使消費者不信任藥品的質(zhì)量,阻礙藥品的銷售。藥品價格影響藥品銷量。
3.藥品價格變動(價格)
根據(jù)期望不一致模型,消費者對產(chǎn)品性能的信念建立在以前的產(chǎn)品經(jīng)驗的基礎(chǔ)上,這個模型同樣可以推廣到消費者對產(chǎn)品價格的期望上。藥品過去的價格使消費者形成對價格的期望值,當(dāng)藥品的價格表現(xiàn)和消費者的預(yù)期一致時,消費者可能不會對它做過多的思考;反之,如果它表現(xiàn)為超過消費者的預(yù)期則會帶來消極影響;而如果它表現(xiàn)為低于消費者的預(yù)期,消費者就會非常滿意。價格變動影響藥品銷量。
4.藥店工作人員數(shù)量(促銷)
藥店工作人員是藥店同其顧客之間的重要聯(lián)結(jié)。藥品是一種特殊的商品,顧客往往需要就藥效、服用方法等問題咨詢藥店工作人員。一方面,藥店工作人員不足可能會讓購買者感覺自己受到忽視,或者因為關(guān)于藥品的疑問沒有得到很好的解答而放棄在該藥店買藥;另一方面,藥店工作人員過多可能會造成一種緊張的氛圍,特別是顧客比較少的時候,過多的工作人員在場可能會讓選購者感覺不適。合適的工作人員數(shù)量對藥店來說是重要的,藥店必須按照自身規(guī)模合理安排工作人員數(shù)量,并且配置適當(dāng)?shù)膶I(yè)人員。藥店工作人員數(shù)量影響藥品銷量。
5.藥店能否使用醫(yī)保(促銷)
定點零售藥店是產(chǎn)生于醫(yī)療保險制度,通過勞動保障行政部門資格審定,并經(jīng)醫(yī)療保險經(jīng)辦機構(gòu)確定,為參保人員提供處方外配和非處方藥零售服務(wù)的藥店。一方面,定點零售藥店的開設(shè)需滿足一系列條件,因此,定點零售藥店本身具有一定的專業(yè)性并反映一定的資質(zhì),更容易獲得消費者的信任。另一方面,醫(yī)保的使用使得購藥的付費負擔(dān)得以減輕,從營銷的角度去理解,可以被看作一種銷售促進手段,對于同樣的藥品來說,消費者更可能在可以使用醫(yī)保的藥店購買。藥店能否使用醫(yī)保影響藥品銷量。
6.藥店面積(渠道)
零售商是分銷渠道中的一個成員,Campo和Gijsbrechts的研究表明,商店的規(guī)模通過反映店內(nèi)環(huán)境影響銷量(2004)。本文用藥店面積來代表藥店的規(guī)模。一方面,藥店的面積會影響購買者選購藥品時的情緒,在寬敞的藥店選購藥品時,對于寬敞的環(huán)境本身,顧客的體驗往往更積極;另一方面,藥店的面積是藥店陳列藥品種類數(shù)的基礎(chǔ),面積大的藥店自然能陳列更多的藥品,間接通過豐富藥品種類促進了藥品的銷售。藥店面積影響藥品銷量。
7.月份(季節(jié))
很多疾病的發(fā)作與季節(jié)息息相關(guān),導(dǎo)致藥品的銷售與季節(jié)息息相關(guān)。夏季的氣溫比較高,人們?nèi)菀谆忌夏c道疾病,止瀉類藥物的銷量相應(yīng)升高;秋冬季節(jié)的氣溫比較低,人們?nèi)菀赘腥竞粑兰膊?,感冒退燒藥銷量相應(yīng)上升;另外,溫暖季節(jié)里,一些傳染病的病原微生物和媒介昆蟲比較容易繁殖,在該季節(jié),相應(yīng)的傳染病易于發(fā)生和流行。在本論文中,用月份代表不同季節(jié)的影響。
8.趨勢
本月的銷量往往和前幾個月展現(xiàn)的銷售趨勢關(guān)聯(lián)頗大,本文用指數(shù)平滑法獲得銷量趨勢信息,趨勢信息中包含了前文未能提到的某些影響因素的信息,如門店形象、門店位置等因素對銷量的影響,對于同一藥房來說,這些因素往往在比較長的時間內(nèi)保持恒定。指數(shù)平滑法是用以前觀測值的加權(quán)和作為某一期趨勢的估計值,并且各期權(quán)重隨時間間隔的增大而呈指數(shù)衰減,本文的趨勢信息由預(yù)測月之前六個月銷量數(shù)據(jù)指數(shù)平滑而得。將銷量趨勢納入考慮應(yīng)該對提高銷量預(yù)測的效果有所助益。
針對藥品銷售特點,在問卷調(diào)研基礎(chǔ)上,并考慮到現(xiàn)實數(shù)據(jù)來源的限制,本文以藥店藥品種類數(shù)、藥品價格、藥品價格變動、藥店工作人員數(shù)量、藥店能否使用醫(yī)保、藥店面積、月份、趨勢為影響因素,對有限時間數(shù)據(jù)下藥品銷量預(yù)測進行了研究,變量定義如表1所示。
表1 變量定義
市場之所以可以被預(yù)測,是基于馬克思主義哲學(xué)的一個基本觀點:世界是由物質(zhì)組成的,物質(zhì)是在不斷運動的,通過不斷的觀察和實踐,物質(zhì)世界是可以被認識的。雖然有各種復(fù)雜的因素影響市場,時而也會有偶然因素作用于市場,但人們可以根據(jù)長時間的認識和實踐,利用逐漸累積的豐富經(jīng)驗和知識,逐漸探索市場運作規(guī)律,借助各種先進的科學(xué)技術(shù)手段,根據(jù)市場發(fā)展的歷史和現(xiàn)狀,推演市場的未來走勢。市場預(yù)測中的兩條重要原理為相關(guān)原理和連續(xù)性原理。
相關(guān)原理是指市場中許多現(xiàn)象是相互關(guān)聯(lián)的,市場預(yù)測的開展可以利用這種關(guān)聯(lián)性。例如汽油的需求量和行駛的里程數(shù)有很強的關(guān)聯(lián)性,若知道了未來將要行駛的里程數(shù),就可以預(yù)測需要多少汽油,這就是市場預(yù)測的相關(guān)性原則。相關(guān)性原則體現(xiàn)了唯物辯證法因果聯(lián)系的觀點,唯物辯證法認為,客觀世界的事物總是相互聯(lián)系的,不存在孤立的事物,一個事物的變化總會引起另一事物的變化,它們構(gòu)成了因果關(guān)系,利用事物的因果關(guān)系,就可以進行市場預(yù)測。本文選用的神經(jīng)網(wǎng)絡(luò)法便是遵循這個原理。
連續(xù)性原理是指事物的發(fā)展和市場的現(xiàn)象的具有一定的延續(xù)性,未來的需求是與過去的發(fā)展以及當(dāng)下的現(xiàn)狀息息相關(guān)的,可以根據(jù)市場的過去和現(xiàn)在預(yù)測市場的未來。市場預(yù)測中之所以貫穿了連續(xù)性原則,是因為一切社會經(jīng)濟現(xiàn)象都有它的過去、現(xiàn)在和未來,任何事物的發(fā)展都與過去有所聯(lián)系,過去的行為不僅影響到現(xiàn)在,還會影響到未來。換言之,一切社會經(jīng)濟現(xiàn)象的存在和發(fā)展具有連續(xù)性。本文選用的指數(shù)平滑法便是遵循這個原理。
本文的研究目的是實現(xiàn)利用有限時間銷量數(shù)據(jù)進行銷量預(yù)測,在探究性實驗中發(fā)現(xiàn),用于預(yù)測的30個月的藥品銷量時間序列多呈現(xiàn)白噪聲特征,故傳統(tǒng)的ARIMA等時間序列分析模型作用不大;藥品銷量受到眾多因素的影響,既有類型變量,又有數(shù)值型變量,且輸出變量為數(shù)值型,典型的線性回歸方法在處理較多的輸入特征時不夠健壯,故本文選擇神經(jīng)網(wǎng)絡(luò)進行預(yù)測,它是一種能解決回歸問題的方法,在處理更高維的輸入特征空間時明顯更為健壯。神經(jīng)網(wǎng)絡(luò)預(yù)測需要對影響因素進行比較全面的分析才會有一個比較良好的預(yù)測效果,但由于理論和現(xiàn)實的限制,窮盡所有影響因素是極其困難的,本文將趨勢信息作為影響變量放入神經(jīng)網(wǎng)絡(luò),以將部分未能窮盡的影響因素納入考慮。在神經(jīng)網(wǎng)絡(luò)預(yù)測中高度相關(guān)的特征會導(dǎo)致預(yù)測損失精確度,故在正式預(yù)測之前,本文先利用主成分分析對規(guī)模變量和價格變量分別消除冗余。
本文模型由指數(shù)平滑、主成分分析和后向傳播前饋神經(jīng)網(wǎng)絡(luò)三個部分組成。模型首先采用指數(shù)平滑獲得銷量的趨勢信息,再采用主成分分析提取富含規(guī)模信息和價格信息的主分量,最后輸入后向傳播前饋神經(jīng)網(wǎng)絡(luò)進行預(yù)測。所有程序在RStudio中實現(xiàn)。下面將依次介紹模型的各個組成部分。
1.指數(shù)平滑獲取趨勢信息
本文首先利用指數(shù)平滑獲取銷量趨勢信息,以此將未能窮盡的某些影響因素納入考慮,如門店形象、門店位置等的影響,對于同一藥房來說,這些因素往往在比較長的時間內(nèi)保持恒定。趨勢信息由預(yù)測月之前六個月銷量數(shù)據(jù)指數(shù)平滑而得。
指數(shù)平滑是一種用過往觀測值的加權(quán)和計算當(dāng)期趨勢的方法,因為對于一個時間序列{Xt},可以認為在一個比較短的時間間隔里序列值是相對穩(wěn)定的,是隨機波動造成了序列值之間的差異。根據(jù)我們的生活經(jīng)驗,對現(xiàn)在影響比較大的是近期的事件,那些遠期的事件對目前的情況影響比較小,由于不同時間間隔對事件發(fā)展影響的不同,指數(shù)平滑法的各期權(quán)重是隨時間間隔的增大而呈指數(shù)衰減的。指數(shù)平滑法如公式(1)所示。
xt(1)=αxt+α(1-α)xt-1+α(1-α)2xt-2+…
(1)
其中xt(1)是向前預(yù)測1期的預(yù)測值。平滑系數(shù)的α值一般根據(jù)經(jīng)驗給出,經(jīng)驗表明,α的值介于0.05~0.3之間效果比較好。為了取得趨勢信息,在本文中,平滑系數(shù)取為0.3。
2.主成分分析消除冗余
主成分分析是一種常用的減少冗余信息,對數(shù)據(jù)進行降維的方法。在神經(jīng)網(wǎng)絡(luò)預(yù)測中高度相關(guān)的特征會導(dǎo)致預(yù)測損失精確度,故在正式預(yù)測之前,本文先利用主成分分析消除冗余。但是,若對所有變量一起進行主成分分析,相當(dāng)于人為地以是否線性相關(guān)為依據(jù)縮減數(shù)據(jù),可能會讓信息受到過多損失,故本文對影響因素分類進行主成分分析,一方面消除冗余,另一方面盡量減少原有影響因素信息的損失。
主成分分析是通過線性變換把給定的一組變量X1,X2,…,Xk轉(zhuǎn)換為一組兩兩相關(guān)系數(shù)為0的變量Y1,Y2,…,Yk。在這種變換中,保持X1,X2,…,Xk的方差之和相等,同時,使Y1具有最大方差,Y2具有次大方差,分別稱為第一主成分和第二主成分。依次類推,原來有k個變量,就可以轉(zhuǎn)換出k個主成分。
但在實際應(yīng)用中,只需要找出小于k的q個主成分即可,找出的q個主成分需要反映出之前k個變量的絕大部分方差。本文參考Cattell碎石檢驗圖選擇q值。Cattell碎石檢驗繪制主成分數(shù)與特征值之間關(guān)系的圖形,圖形可以清晰地展示圖形彎曲狀況,在圖形變化最大處之上的主成分都可保留。
本文對規(guī)模變量Goods、Staff、Area和價格變量Price、PriceChange分別進行主成分分析,以消除線性相關(guān)帶來的冗余。
3.后向傳播前饋神經(jīng)網(wǎng)絡(luò)綜合預(yù)測
人工神經(jīng)網(wǎng)絡(luò)是一組連接的輸入和輸出單元,其中每個連接都與一個權(quán)重相關(guān)聯(lián),它因形態(tài)和作用原理類似于生物神經(jīng)元而得名。雖然有很多種不同的神經(jīng)網(wǎng)絡(luò),但是每種都可以由以下三個特征來定義:網(wǎng)絡(luò)拓撲(或結(jié)構(gòu)),描述了模型中神經(jīng)元的數(shù)量以及層數(shù)和它們連接的方式;激活函數(shù),將神經(jīng)元的組合輸入信號變換成單一的輸出信號,以便進一步在網(wǎng)絡(luò)中傳播;訓(xùn)練算法,指定如何設(shè)置連接權(quán)重,以便減小或者增加神經(jīng)元在輸人信號中的比例。
本文選擇后向傳播前饋神經(jīng)網(wǎng)絡(luò)進行綜合預(yù)測,神經(jīng)網(wǎng)絡(luò)的使用分為訓(xùn)練和預(yù)測兩個階段,相應(yīng)的,實驗中的樣本被分為訓(xùn)練樣本和預(yù)測樣本。在訓(xùn)練階段,調(diào)整人工神經(jīng)元的連接權(quán)重 權(quán)重,使得它能夠預(yù)測輸入元組的正確輸出,獲得訓(xùn)練好的神經(jīng)網(wǎng)絡(luò),在預(yù)測階段,使用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)進行預(yù)測,并評估預(yù)測效果。
多層前饋神經(jīng)網(wǎng)絡(luò)由一個輸入層、一個或多個隱藏層和一個輸出層組成,多層前饋神經(jīng)網(wǎng)絡(luò)拓撲如圖1所示。每個訓(xùn)練元組的觀測屬性同時進入到構(gòu)成輸入層的單元,這些輸入通過輸入層,經(jīng)過加權(quán)同時進入到隱藏層,許多“類神經(jīng)元”組成了隱藏層,一個隱藏層單元的輸出可以輸入到下一個隱藏層,諸如此類。最后一個隱藏層的輸出加權(quán)后輸入到構(gòu)成輸出層的單元。輸出層輸出給定元組的預(yù)測值。
圖1 多層前饋神網(wǎng)絡(luò)拓撲
一個單一的“類神經(jīng)元”如圖2所示,它由一個有向網(wǎng)絡(luò)圖表示,每一個接收的輸入信號(變量x)都根據(jù)其重要性被加權(quán)(w值),所有輸入信號由“類神經(jīng)元”求和,然后該信號被用f表示的激活函數(shù)作用并傳遞,最后得到輸出信號(變量y)。
圖2 單一的“類神經(jīng)元”
本研究中使用S形激活函數(shù)(logistic激活函數(shù)),用公式(2)表示,公式中的e是自然對數(shù)的底(約為2.72)。S形激活函數(shù)的輸出值可以落在0~1的任何地方。
(2)
本文使用的神經(jīng)網(wǎng)絡(luò)通過后向傳播算法進行訓(xùn)練。后向傳播算法通過“前向階段”和“后向階段”的多次循環(huán)實現(xiàn)。一開始,網(wǎng)絡(luò)不包含任何信息,因此網(wǎng)絡(luò)中的初始權(quán)重通常是隨機設(shè)定,在RStudio中,這一過程由設(shè)置隨機種子點實現(xiàn),然后算法開始不斷循環(huán)迭代,直至滿足某一停止準則。后向傳播算法的兩個階段具體為:(1) 在前向階段,輸入信號激活從輸入層到輸出層的“類神經(jīng)元”,沿途應(yīng)用每一個“類神經(jīng)元”的連接權(quán)重和激活函數(shù),一旦到達最后一層,就產(chǎn)生一個輸出信號。(2) 在后向階段,比較訓(xùn)練數(shù)據(jù)中的真實目標值和由前向階段產(chǎn)生的輸出信號的值,得到它們之間的差異即在網(wǎng)絡(luò)中后向傳播產(chǎn)生的誤差,從而修正“類神經(jīng)元”之間的連接權(quán)重,并減小將來產(chǎn)生的誤差。后向傳播算法采用梯度下降法確定權(quán)重需要改變多少。
由于神經(jīng)網(wǎng)絡(luò)要求所有輸入是數(shù)值型的,對于分類變量,本文創(chuàng)建了一系列指示特征Ii作為輸入變量,它的形式如公式(3)所示。變量值在0附近時神經(jīng)網(wǎng)絡(luò)的使用效果最佳,故預(yù)測前將所有變量標準化到了0~1的范圍。
(3)
將價格變量主成分(由Price和PriceChange主成分分析而得)、規(guī)模變量主成分(由Goods,Staff和Area主成分分析而得)、Medicare、Month、Trend作為神經(jīng)網(wǎng)絡(luò)的輸入變量進行預(yù)測。在實驗過程中,先嘗試不同的隱藏層配置,對每一種隱藏層配置種子點為1~50,以嘗試不同的初始權(quán)重,然后選擇各種初始權(quán)重下誤差平方和(SSE)值最小的模型作為該隱藏層配置下的預(yù)測模型,最后,對比不同隱藏層配置的預(yù)測模型的預(yù)測效果,選擇預(yù)測效果最好的隱藏層配置作為預(yù)測所用神經(jīng)網(wǎng)絡(luò)的配置。
本文選用相關(guān)系數(shù)(R)和標準化均方誤差(NMSE)來測度模型的預(yù)測效能,它們的定義如公式(4)(5)所示。其中P代表預(yù)測值,T代表真實值,Cov為協(xié)方差,Var為方差,mean為平均值。
(4)
(5)
相關(guān)系數(shù)是研究變量之間線性相關(guān)程度的量,相關(guān)系數(shù)越大,預(yù)測效果越好。標準化均方誤差代表與真實值的平均值相比,預(yù)測值的預(yù)測效果,標準化均方誤差越小,預(yù)測效果越好。
綜上所述,整體預(yù)測模型如圖3所示。
圖3 整體預(yù)測模型
綜合來說,在預(yù)測中,首先,我們利用每月之前六個月(除去前六個月)的銷量數(shù)據(jù)通過指數(shù)平滑獲取銷量趨勢信息;之后,我們分別對價格變量(Price、PriceChange)和規(guī)模變量(Goods、Staff、Area)進行主成分分析獲得價格變量主成分和規(guī)模變量主成分;然后,我們以Trend、價格變量主成分、規(guī)模變量主成分、Medicare、Month為自變量,藥品銷量為因變量,利用訓(xùn)練樣本對神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,之后,利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)對測試樣本進行預(yù)測并評估效果,對于不同的隱藏層配置和不同的初始權(quán)重,對神經(jīng)網(wǎng)絡(luò)這一步驟進行重復(fù)并選定最好的方案;最后,評估選定的神經(jīng)網(wǎng)絡(luò)方案及整體預(yù)測方案的預(yù)測效能。
按照前述研究設(shè)計,本文分別利用AB藥房連鎖有限公司的三九感冒靈、江中健胃消食片和苯磺酸左旋氨氯地平片2016年1月至2018年6月兩年半的銷量數(shù)據(jù)對2018年7月至2018年12月的銷量以月為單位進行了預(yù)測。
在預(yù)測前,剔除含缺失值的數(shù)據(jù),本文認為過大異常值產(chǎn)生于藥房與集體的大單合作,根據(jù)箱線圖剔除含異常值的數(shù)據(jù),對于一個月內(nèi)藥價有調(diào)整的數(shù)據(jù),以銷量為權(quán)重合并數(shù)據(jù),剔除數(shù)據(jù)缺失太多的藥房,共獲得24個藥房的三九感冒靈、51個藥房的江中健胃消食片和49個藥房的苯磺酸左旋氨氯地平片36個月的銷量數(shù)據(jù)。剔除了比較多的三九感冒靈的數(shù)據(jù)可能是因為集體購買這種藥的情況比較多。全部數(shù)據(jù)均來源于AB公司內(nèi)部數(shù)據(jù)庫。
在預(yù)測中,對于每個月的數(shù)據(jù)(除去前六個月),均以本月之前6個月的銷量數(shù)據(jù)的指數(shù)平滑值作為每個月的趨勢值,用第7個月到第30個月總共24個月的影響因素數(shù)據(jù)和銷量數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)訓(xùn)練神經(jīng)網(wǎng)絡(luò),利用訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)根據(jù)影響因素數(shù)據(jù)對第31個月到第36個月的銷量進行預(yù)測并評估預(yù)測效果。
在預(yù)測過程中,指數(shù)平滑通過R中的HoltWinters函數(shù)實現(xiàn),以獲得趨勢信息;主成分分析通過R中的principal函數(shù)實現(xiàn),根據(jù)主成分分析的結(jié)果,Goods、Staff、Area被合成為一個規(guī)模變量主成分Scale,Price和PriceChange被合成為一個價格變量主成分PricePlus;本文利用R中的neuralnet函數(shù)實現(xiàn)神經(jīng)網(wǎng)絡(luò),經(jīng)過多次嘗試,隱藏層為單層一個節(jié)點的神經(jīng)網(wǎng)絡(luò)效果最好,這可能是由于將本身就具有預(yù)測效果的趨勢值放入神經(jīng)網(wǎng)絡(luò)導(dǎo)致的,但是,加入其他影響因素的神經(jīng)網(wǎng)絡(luò)的預(yù)測效果比純粹的趨勢值的預(yù)測效果好很多,也比不使用趨勢作為變量的神經(jīng)網(wǎng)絡(luò)預(yù)測效果好很多。各種藥品的預(yù)測效果見表2。
表2 預(yù)測效果
根據(jù)實證結(jié)果,雖然只有兩年半的數(shù)據(jù)用于預(yù)測,模型仍然取得了比較好的預(yù)測效果。三九感冒靈的預(yù)測值和真實值的相關(guān)系數(shù)達到了0.77,標準化均方誤差為0.48,江中健胃消食片的預(yù)測值和真實值的相關(guān)系數(shù)達到了0.84,標準化均方誤差為0.33,苯磺酸左旋氨氯地平片的預(yù)測值和真實值相關(guān)系數(shù)達到了0.85,標準化均方誤差僅為0.30。并且由結(jié)果可知,訓(xùn)練樣本數(shù)更多時,預(yù)測效果會更好。
本文提出了一種集成指數(shù)平滑、主成分分析、神經(jīng)網(wǎng)絡(luò)的銷量預(yù)測模型。從整體結(jié)構(gòu)上看,該模型具有指數(shù)平滑的趨勢提取過程和分類別主成分分析的特征提取過程,是具有創(chuàng)新性的。而模型中的神經(jīng)網(wǎng)絡(luò)將影響因素和時間序列趨勢同時納入考慮,既克服了開業(yè)不久的零售藥店和剛上市的藥沒有長時間銷售數(shù)據(jù)進行ARIMA等時間序列分析的困難,又減弱了因果分析時難以窮盡所有影響因素的預(yù)測困境。為了驗證模型的有效性,根據(jù)AB藥房連鎖有限公司24個藥店的三九感冒靈、51個藥店的江中健胃消食片和49個藥店的苯磺酸左旋氨氯地平片2016年1月至2018年6月兩年半的銷量數(shù)據(jù)對2018年7月至2018年12月半年的銷量以月為單位分別進行了預(yù)測,實證結(jié)果顯示,三九感冒靈的預(yù)測值與真實值相關(guān)系數(shù)達到0.77,標準化均方誤差為0.48,江中健胃消食片的預(yù)測值與真實值相關(guān)系數(shù)達到0.84,標準化均方誤差為0.37,苯磺酸左旋氨氯地平片的預(yù)測值與真實值相關(guān)系數(shù)達到0.85,標準化均方誤差為0.30,對于兩年半的預(yù)測數(shù)據(jù)來說,取得了良好的預(yù)測效果。
綜合來說,整體的預(yù)測模型如下:首先,利用指數(shù)平滑獲得銷量的趨勢信息;然后,進行主成分分析提取富含規(guī)模信息和價格信息的主分量;最后,將趨勢、價格變量主成分、規(guī)模變量主成分、醫(yī)保、月份作為自變量,藥品銷量作為因變量進行神經(jīng)網(wǎng)絡(luò)的訓(xùn)練和預(yù)測。
文中模型的提出對于醫(yī)藥生產(chǎn)和經(jīng)營企業(yè)具有現(xiàn)實意義。一方面,該預(yù)測模型有助于醫(yī)藥零售企業(yè),特別是開業(yè)不久或銷售新藥的企業(yè)制定合適的庫存量,減少庫存積壓和庫存不足等問題的發(fā)生;另一方面,隨著經(jīng)濟的不斷發(fā)展以及供應(yīng)鏈體系的不斷完善,終端藥品銷量預(yù)測的實現(xiàn)也有助于供應(yīng)鏈上每個節(jié)點企業(yè)相應(yīng)優(yōu)化自身的決策。
本文的局限性在于:(1) 所提出的預(yù)測模型更適用于連鎖藥店,藥房數(shù)量越多,預(yù)測效果越好。(2) 由于AB公司數(shù)據(jù)庫已有數(shù)據(jù)的限制,一些影響因素未納入模型,例如競爭者價格、營銷費用等,相關(guān)影響因素考慮得越全面,預(yù)測效果越好。在后續(xù)的研究中,可以改進神經(jīng)網(wǎng)絡(luò)算法,實現(xiàn)只將趨勢值輸入最后一層隱藏層的神經(jīng)網(wǎng)絡(luò),以消除趨勢值與其他影響因素線性相關(guān)的影響,這是改進預(yù)測效果的一種可能嘗試。