郭鵬
(貴陽學(xué)院經(jīng)濟管理學(xué)院,貴陽550005)
在近40年的收益管理(RM)理論和實踐發(fā)展使需求無約束估計得到了廣泛重視[1],其計算結(jié)果是預(yù)測模型的重要輸入,能幫助收益管理系統(tǒng)(RMSs)制定更準確的優(yōu)化控制策略??紤]到現(xiàn)代服務(wù)業(yè)的網(wǎng)絡(luò)化特征從根本上使產(chǎn)品預(yù)售時間窗和乘客預(yù)訂用時大幅縮減,公司中央預(yù)售系統(tǒng)(CRSs)中的短期需求數(shù)據(jù)具有高度不確定性,不同“預(yù)售提前期間隔”中的乘客需求能被擬合為不同的分布形式,比如正態(tài)、對數(shù)正態(tài)、威布爾、伽瑪和泊松分布等[2]。
郭鵬等[3]僅考慮了乘客需求在同一航班不同艙位間的“再現(xiàn)”效應(yīng),未對短視型和策略型乘客在整個航空客運網(wǎng)絡(luò)O-D航程產(chǎn)品間的當期和跨期轉(zhuǎn)移購買行為進行描述。已有仿真研究結(jié)果表明,無約束估計方法分布形式假設(shè)的選擇不當會對公司收入造成1.5%的相對影響,對于一般大型航空公司而言,其絕對經(jīng)濟損失可達上億元[4]。
因此,為提高網(wǎng)絡(luò)環(huán)境下多分布需求無約束估計的準確性,提出一種基于威布爾和對數(shù)正態(tài)分布的改進參數(shù)回歸模型。由于Liu等[2]的研究僅考慮需求“溢出”效應(yīng),在模型構(gòu)建和參數(shù)估計等方面均無法滿足網(wǎng)絡(luò)環(huán)境下需求無約束估計的應(yīng)用要求,本文所提模型不僅考慮了航空網(wǎng)絡(luò)乘客需求分布形式、“隨機獨立截尾”機理以及數(shù)據(jù)收集條件等信息,還同時針對網(wǎng)絡(luò)需求的“溢出”和“再現(xiàn)”效應(yīng)、以及乘客取消預(yù)訂和no-shows行為,分別提出了基于截尾樣本數(shù)據(jù)的模型參數(shù)估計和需求無約束估計值計算方法,在提高計算準確性的同時,有效避免了現(xiàn)有方法對歷史乘客真實“初始需求”的高估問題。
本文的研究重點不包括模型擬合優(yōu)度檢驗和參數(shù)假設(shè)檢驗,相應(yīng)內(nèi)容可參見Lawless[5]的研究。本文的研究對象主要針對完全競爭網(wǎng)絡(luò)市場環(huán)境下的航空客運公司,由于“受截尾數(shù)據(jù)分析”不局限于RM實踐行業(yè),本文所提方法同樣能為酒店、汽車租賃、庫存管理、零售生產(chǎn)規(guī)劃、現(xiàn)代旅游服務(wù)供應(yīng)鏈管理、生命可靠性測試和疾病預(yù)測等領(lǐng)域提供參考。根據(jù)文獻[6]提出的RM研究分類,本文的研究對象如表1所示。
表1 本文的研究對象
由于能夠考慮與乘客“初始需求”相關(guān)的所有信息,相較于數(shù)據(jù)驅(qū)動類的非參數(shù)模型,參數(shù)回歸模型通常更具魯棒性,在計算過程中顯得更為實際[2]。
本文所提方法的符號及變量定義如下:
(1)Ο:出發(fā)地集合;
(2)nod:出發(fā)地數(shù)量;
(3)Rm:以出發(fā)地m為起點的O-D航程集合,R={R1,R2,???,Rm},m=(1,2,???,nod);
(4)rm:Rm中的O-D航程數(shù)量,j=(1,2,???,rm);
(5)C:所有航班票價家庭所構(gòu)成的艙位集合,C={C1,C2,???,Cm},Cm={C1,m,C2,m,???,Cjm};
(6)cjm:Cjm中的票價等級數(shù)量,i=(1,2,???,cjm);
(7)t:預(yù)售提前期中觀察點t=(0,1,2,???,T),當t=0時,艙位預(yù)售開放,當t=T時,航班起飛;
(8)Δt:時刻t和t-1之間的“預(yù)售提前期間隔”;
(9)n:從一個給定的出發(fā)日期集合中相同“預(yù)售提前期間隔”中抽樣到的、代表相同歷史票價艙位的乘客需求量樣本觀察值數(shù)量,即樣本容量:k=(1,2,???,n);
(23)X:以艙位i為初次購買首選的乘客“初始需求”量隨機變量;
(24)x:乘客成功預(yù)訂可觀察樣本需求量,x=(x1,x2,…,xn);其中,可將第k個樣本需求量定義為xk=B
(25)z:參數(shù)回歸模型中解釋變量的行向量,z=(z1,z2,???,zp);zk表示與第k個樣本需求相關(guān)的1×p維解釋變量行向量,zk=(zk,1,zk,2,???,zk,p);
(26)θ:參數(shù)回歸模型中與解釋變量z相對應(yīng)的需要被估計的p×1維參數(shù)列向量,θ=(θ1,θ2,???,θp)′;
(27)f(x|z;θ):X的概率密度函數(shù);
(28)F(x|z;θ):X的分布函數(shù),F(xiàn)(x|z;θ)=P{X≤x|z;θ};
(29)S(x|z;θ):X的生存函數(shù),S(x|z;θ)=P{X≥x|z;
(30)h(x|z;θ):X的危險函數(shù),h(x|z;θ)=X<x+Δx|X≥x)Δx=f(x|z;θ)S(x|z;θ);
(31)Uxk:考慮“溢出”效應(yīng)下B的無約束估計量,可用uk表示;其中,當k∈Q時,Ux=B=xk;當k∈時,Uxk=B+CXYD+CFWX;
本文所提方法的計算過程有如下四個步驟:
(1)O-D航程艙位預(yù)售開放狀態(tài)檢查
基于從CRSs中所獲得的某一“聚合水平”下的樣本數(shù)據(jù),可得到O-D航程中的各
(2)基于某種參數(shù)回歸模型形式建立f(x|z;θ)
為正確建立f(x|z;θ),需要在對X的分布形式、z對f(x)的作用、以及建立模型和參數(shù)估計的難易程度進行綜合考慮的基礎(chǔ)上,選擇一種合適的參數(shù)回歸模型形式。其中比較常用的主要有兩類:比例風(fēng)險模型(PHM)和位置尺度模型(LSM)。
建立f(x|z;θ)后,可采用極大似然估計法對回歸模型中的未知參數(shù)θ進行估計,然后通過計算獲得U。考慮到從CRSs中所獲得的B是D在“溢出”和“再現(xiàn)”綜合效應(yīng)作用下的結(jié)果,因此,本文分別定義引起上述兩種效應(yīng)、以及取消預(yù)訂和no-shows行為的解釋變量zk,并采用如下兩個步驟分別對θ、Uxk和U進行估計和計算。
①考慮乘客需求“溢出”效應(yīng)下的估計和計算
②考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為下的估計和計算:
(4)模型的擬合優(yōu)度檢驗和參數(shù)的假設(shè)檢驗
一些一般化的擬合優(yōu)度檢驗方法可被用來檢驗?zāi)P偷臄M合程度。比如,針對連續(xù)型需求分布的改進后的Kolmogorov-Smirnov檢驗。諸如概率密度圖、危險函數(shù)圖或殘差圖等圖形方法也經(jīng)常被用到。對于模型參數(shù)θ的假設(shè)檢驗及其置信區(qū)間的獲取,可通過Fisher信息矩陣和對數(shù)似然比統(tǒng)計檢驗法來進行。如未通過上述兩類檢驗,則需返回相應(yīng)步驟重新建立模型。有關(guān)該問題更加深入的討論參見Lawless[5]。
2.3.1威布爾分布
(1)f(x|z;θ)的建立
本文考慮基于雙參數(shù)威布爾分布建立參數(shù)回歸模型,若允許其尺度參數(shù)α依賴于回歸解釋變量z,而位置參數(shù)δ則與z無關(guān),在給定z后,有:
其中,x≥0,α(z)是z的函數(shù),并含有一些未知參數(shù)β??紤]到δ與z無關(guān)不僅保證了上述模型屬于PHM模型,還使乘客“初始需求”對數(shù)的方差相等,因此,在給定z的情況下通過研究=lnX的分布也能對式(1)進行考察,便得到基于極值分布的參數(shù)回歸模型:
其中,Y服從標準極值分布:f(y)=exp[y-exp(y)],-∞<y<∞。式(3)為LSM模型,其誤差項為Y。式(1)中δ的不變性對應(yīng)于式(2)中σ的不變性,故lnX具有共同方差。因此,式(2)可寫為:
①考慮乘客需求“溢出”效應(yīng)
由極值分布與威布爾分布的關(guān)系可知:
②考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為
在將上述步驟得到的Uxk替換樣本中的B后,便可得到新樣本中的獨立觀測值,zk)。其中,=lnuk=lnUxk。則對數(shù)似然函數(shù)為同理,似然方程?lnL?βl=0(l=1,???,p)和?lnL?σ=0用Newton-Raphson方法或其他迭代方法求解也是沒有困難的。令={,}和z=zR。則:
2.3.2對數(shù)正態(tài)分布
(1)f(x|z;θ)的建立
①考慮乘客需求“溢出”效應(yīng)
V(y)是標準正態(tài)分布的危險函數(shù),λ(y)則是它的導(dǎo)數(shù)。由式(11)和式(12)可得:
如Lawless[5]所述,對式(13)和式(14)采用首先由Sampford和Toylor[7]提出的迭代法,后經(jīng)Wolynetz[8,9]修改和推廣,該迭代方法相較于Newton-Raphson迭代算法能夠更好和更加方便地獲取和。假設(shè)→N(zSβ,σ),那么:
求解可得:
(c)利用式(19)和式(20)計算β(q)和σ(q)。
本質(zhì)上,該方法是一種EM算法[5]。令={,}和z=zS,利用式(15)計算k,可獲得:
②考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為
則:
此時,對式(24)和式(25)采用Newton-Raphson迭代以獲得
可得到:
假定國內(nèi)某航空公司有如圖1所示的航空網(wǎng)絡(luò),以北京、西安、青島和貴陽為出發(fā)地m={1,2,3,4}的O-D航程集合中,nod=4,r1=6,r2=4,r3=5,r4=7。該公司從西安到青島于2015年6月7日起飛的所有航班具有相同艙位設(shè)置,i={1,2,3,4}。其預(yù)售提前期劃分為8個階段?,F(xiàn)使用本文所提方法對上述航空網(wǎng)絡(luò)中西安→北京→青島中轉(zhuǎn)聯(lián)程航線(m=2,j=3)商務(wù)艙(i=2)在第4個“預(yù)售提前期間隔”Δt(t=4)中行無約束估計,z如表2所示(n=6)。
圖1航空網(wǎng)絡(luò)示意圖
表2 的訂購情況以及參數(shù)回歸模型解釋變量示例
表2 的訂購情況以及參數(shù)回歸模型解釋變量示例
zS k zRk k 123456 B3,2 2,4,k zS I3,2 2,4,k k,1 zS k,2 k,1 zR k,2(xk)BL3,22,4,k P3,2 2,4,k100 14.40 8.50 10.20 9.70 6.80 9.50 P2,2 2,4,k100 9.50 11.70 10.20 15.20 9.30 11.70 DL3,2 zR 537546 111011 777577 k 010011
表3 考慮乘客需求“溢出”效應(yīng)的參數(shù)估計和無約束估計結(jié)果
表4 考慮乘客需求“再現(xiàn)”效應(yīng)、取消預(yù)訂和no-shows行為的參數(shù)估計和無約束估計結(jié)果
本文所提方法能更加全面地對網(wǎng)絡(luò)環(huán)境中歷史無約束需求與歷史乘客“初始需求”之間的正相關(guān)關(guān)系進行估計,可將其作為大數(shù)據(jù)時代下RMSs中無約束需求預(yù)測子系統(tǒng)的關(guān)鍵核心,在分析網(wǎng)絡(luò)環(huán)境下的需求聚合水平與具體分布形式之間相關(guān)關(guān)系的基礎(chǔ)上,將大數(shù)據(jù)倉庫中的結(jié)構(gòu)化和非結(jié)構(gòu)化需求信息用解釋變量進行描述,能為優(yōu)化模型提供更加準確和魯棒的無約束需求預(yù)測結(jié)果,RMSs的整體可靠性和實施成功率可顯著提高[1,10]。
參考文獻:
[1]郭鵬.網(wǎng)絡(luò)環(huán)境下收益管理系統(tǒng)需求無約束估計綜述[J].計算機工程與應(yīng)用,2017,53(19).
[2]Liu P H,Smith S,Orkin E B,et al.Estimating Unconstrained Hotel Demand Based on Censored Booking Data[J].Journal of Revenue and Pricing Management,2002,1(2).
[3]郭鵬,蕭柏春,李軍.基于多需求分布的收益管理多艙位無約束估計模型[J].系統(tǒng)科學(xué)與數(shù)學(xué),2013,33(10).
[4]郭鵬,蕭柏春,李軍.收益管理中多分布無約束估計方法的仿真比較[J].計算機仿真,2014,31(2).
[5]Lawless J F.Statistical Models and Methods for Lifetime Data[M].New York:John Wiley&Sons,2003.
[6]Weatherford L R,Bodily S E.A Taxonomy and Research Overview of Perishable-Asset Revenue Management:Yield Management,Overbooking,and Pricing[J].Operations Research,1992,40(5).
[7]Sampford M R,Taylor J.Censored Observations in Randomized Block Experiments[J].Journal of the Royal Statistical Society,1959,21(1).
[8]Wolynetz M S.Algorithm AS 138:Maximum Likelihood Estimation From Confined and Censored Normal Data[J].Journal of the Royal Statistical Society,1979,28(2).
[9]Wolynetz M S.Algorithm AS 139:Maximum Likelihood Estimation in a Linear Model From Confined and Censored Normal Data[J].Journal of the Royal Statistical Society,1979,28(2).
[10]郭鵬.收益管理中基于大數(shù)據(jù)倉庫的需求無約束估計——框架與挑戰(zhàn)[J].大數(shù)據(jù),2017,3(3).