徐 穎,江 熾,陳登翔,劉許文言
(1.武漢理工大學(xué) 自動(dòng)化學(xué)院,湖北 武漢441000;2.武漢理工大學(xué) 土木工程與建筑學(xué)院,湖北 武漢441000)
無車承運(yùn)人作為國家探索發(fā)展“互聯(lián)網(wǎng)+物流”的新模式,對(duì)整個(gè)物流行業(yè)的發(fā)展具有重要的意義。該模式下主要由三個(gè)主要的參與角色,分別為貨主、無車承運(yùn)人平臺(tái)以及承運(yùn)人[1]。但作為一種新業(yè)態(tài)與模式,其在發(fā)展過程中仍面臨諸多問題及困境。當(dāng)前階段無車承運(yùn)人平臺(tái)較為關(guān)注的目標(biāo)是快速促進(jìn)成交以及較低的承運(yùn)成本。為實(shí)現(xiàn)無車承運(yùn)人平臺(tái)和承運(yùn)司機(jī)利益雙贏,如何對(duì)承運(yùn)線路進(jìn)行科學(xué)定價(jià)是目前無車承運(yùn)人平臺(tái)亟待解決的問題[2]。
本文以mathorcup2020年數(shù)學(xué)建模A題的源數(shù)據(jù)為例展開分析,以無車承運(yùn)人視角對(duì)貨運(yùn)線路定價(jià)的主要因素展開研究。該無車承運(yùn)人平臺(tái)面向承運(yùn)端司機(jī),將需要承運(yùn)的線路任務(wù)以一定價(jià)格提前發(fā)布到網(wǎng)絡(luò)平臺(tái)上供承運(yùn)端的司機(jī)瀏覽并決定是否承運(yùn)該運(yùn)輸任務(wù)。承運(yùn)端的司機(jī)將根據(jù)平臺(tái)所發(fā)布的線路任務(wù)及價(jià)格決定是否接單,一旦接單(即交易成功)則任務(wù)下架。若無司機(jī)接單,平臺(tái)可調(diào)價(jià)(價(jià)格發(fā)布限3次),若任務(wù)未被承運(yùn)將給平臺(tái)帶來損失。
回歸分析[3]的作用大體分為三種,分別如下:①識(shí)別以及判斷真正影響平臺(tái)貨運(yùn)線路定價(jià)(稱之為因變量Y)的指標(biāo)(稱之為自變量X),即實(shí)現(xiàn)所謂的變量篩選;②判斷自變量X與因變量Y的相關(guān)關(guān)系的正負(fù)性;③求解不同的回歸系數(shù)以反映各變量之間的相對(duì)重要性,可用于權(quán)重的估計(jì)。
由mathorcup2020年數(shù)學(xué)建模A題的源數(shù)據(jù)可知,各類指標(biāo)既存在定量指標(biāo),如總里程、線路總成本等,同時(shí)也存在定性指標(biāo),如業(yè)務(wù)類型、成交對(duì)象、緊急程度、打包類型、車輛類型、地區(qū)等。其中,以定性指標(biāo)居多。針對(duì)因變量Y以及自變量X中存在的定量變量,利用Stata軟件中的summarize指令進(jìn)行描述性統(tǒng)計(jì),結(jié)果如表1所示。
表1定量變量統(tǒng)計(jì)分析結(jié)果
針對(duì)自變量X中存在的定性變量,可引入虛擬變量。利用Stata軟件中的tabulate指令返回對(duì)應(yīng)變量的頻率分布表并生成虛擬變量。
最小二乘法[4]主要通過將誤差平方最小化以及匹配最適合數(shù)據(jù)的函數(shù)進(jìn)行擬合,常用于多元線性回歸分析。利用Stata中的regress指令運(yùn)用最小二乘法進(jìn)行回歸分析,觀察到變量存在多重共線性,即其之間存在很強(qiáng)的相關(guān)性,此時(shí),利用常規(guī)最小二乘法進(jìn)行回歸分析將使參數(shù)估計(jì)值的方差增大,變量的顯著性檢驗(yàn)將失去意義,可能將重要的解釋變量排除在模型之外。
為解決這一問題,考慮采用主成分分析[5-7]盡可能消除多重共線性。
首先,對(duì)所有研究樣本進(jìn)行總體描述性統(tǒng)計(jì)分析。描述性統(tǒng)計(jì)分析結(jié)果如表2所示,可發(fā)現(xiàn)成交對(duì)象主要為B(即承運(yùn)商),調(diào)價(jià)比例較低且續(xù)簽率高。
將16 008個(gè)樣本以及10個(gè)指標(biāo)構(gòu)成大小為n×p的樣本矩陣(n為樣本數(shù),p為指標(biāo)數(shù)),首先對(duì)10個(gè)特征變量做標(biāo)準(zhǔn)化處理,步驟為按列(各變量)計(jì)算均值以及標(biāo)準(zhǔn)差Sj,計(jì)算得到標(biāo)準(zhǔn)化數(shù)據(jù)xij,即:
進(jìn)一步對(duì)標(biāo)準(zhǔn)化后的數(shù)據(jù)進(jìn)行相關(guān)性分析,計(jì)算樣本矩陣的相關(guān)系數(shù)矩陣R,即:
表2總體描述性統(tǒng)計(jì)分析結(jié)果
繪制出相關(guān)系數(shù)矩陣R圖如圖1所示。
圖中,顏色越深代表相關(guān)性越顯著。由圖1可發(fā)現(xiàn),總里程與線路總成本相關(guān)性強(qiáng),X7相對(duì)X1的相關(guān)系數(shù)為0.997;業(yè)務(wù)類型與調(diào)價(jià)比例相關(guān)性強(qiáng),X9相對(duì)X2的相關(guān)系數(shù)為0.501;車輛類型與線路總成本相關(guān)性強(qiáng),X7相對(duì)X4的相關(guān)系數(shù)為0.557。
圖1相關(guān)系數(shù)矩陣R圖
再計(jì)算相關(guān)系數(shù)矩陣R的特征值λp和特征向量ap,根據(jù)特征值計(jì)算結(jié)果算出主成分貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率,即:
上述所計(jì)算的特征向量、特征值、貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率匯總?cè)绫?所示,由表3可知,前四種主成分的累計(jì)貢獻(xiàn)率達(dá)74.3%,由此可以考慮選前四個(gè)主成分,它們能夠很好地概括原始變量。
由表3對(duì)四個(gè)主成分進(jìn)行分析可得出如下結(jié)論:①第一主成分F1在X1、X4、X7上有中等程度的負(fù)載荷,而在其余變量上的載荷都較小,可稱第一主成分為貨運(yùn)線路成分;②第二主成分F2在X10上有中等程度的正載荷,而在X2、X9上有中等程度的負(fù)載荷,而在其余變量上的載荷都較小,可稱第二主成分為司機(jī)對(duì)價(jià)格的評(píng)價(jià)成分;③第三主成分F3在X6上有中等程度的正載荷,在X3上有中等程度的負(fù)載荷,而在其余變量上的載荷都較小,可稱第三主成分為運(yùn)輸端與地區(qū)成分;④第四主成分F4在X5上有中等程度的正載荷,在X8上有中等程度的負(fù)載荷,而在其余變量上的載荷都較小,可稱第四主成分為訂單要求成分。
表3主成分分析計(jì)算結(jié)果
為進(jìn)一步直觀地展示各樣本的分布情況以及聚類過程,利用SPSS軟件繪制出聚類分析樹狀圖,如圖2所示。
由圖2可知,當(dāng)分類數(shù)取4時(shí),即此時(shí)總里程以及線路總成本為第一類,可描述為貨運(yùn)線路里程及成本;成交對(duì)象和打包類型為第二類,可描述為平臺(tái)指派對(duì)象;車輛類型、需求緊急程度、業(yè)務(wù)類型以及調(diào)價(jià)比例為第三類,可描述為訂單要求;地區(qū)以及是否續(xù)簽為第四類,可描述為司機(jī)評(píng)價(jià)。
圖2聚類分析樹狀圖
由于多元線性回歸分析時(shí),變量存在多重共線性,因此采用主成分分析。經(jīng)過標(biāo)準(zhǔn)化處理后,通過對(duì)各變量進(jìn)行相關(guān)性分析,可發(fā)現(xiàn)變量間的相關(guān)程度,并對(duì)特征向量、特征值、貢獻(xiàn)率以及累計(jì)貢獻(xiàn)率進(jìn)行計(jì)算,便于后續(xù)主成分分析。同時(shí),繪制出聚類分析樹狀圖可視化表示聚類過程。由于聚類時(shí)采用的參數(shù)以及方法不同,因此聚類結(jié)果與主成分分析結(jié)論略有差異,但通過分析可發(fā)現(xiàn)分析出來的影響因素大體相同,因此權(quán)衡后本文采用主成分分析結(jié)果描述平臺(tái)貨運(yùn)線路定價(jià)的主要影響因素。
綜上所述,影響無車承運(yùn)人平臺(tái)進(jìn)行貨運(yùn)線路定價(jià)的主要因素為貨運(yùn)線路里程及成本、司機(jī)對(duì)價(jià)格的評(píng)價(jià)、運(yùn)輸端與地區(qū)、訂單要求,共計(jì)四種,其中,貨運(yùn)線路里程及成本這一因素占最重要地位。