吳海平,李士森,李曉濤,任金政
(1.河北經(jīng)貿大學 財政稅務學院,河北 石家莊050061;2.石家莊鐵路職業(yè)技術學院,河北 石家莊050061;3.中國農(nóng)業(yè)大學,北京100083)
農(nóng)業(yè)保險是國家農(nóng)業(yè)發(fā)展政策的重要組成部分,在保障糧食安全的同時也在糧食價格形成、農(nóng)村金融制度創(chuàng)新、農(nóng)業(yè)供給側結構性改革等農(nóng)業(yè)發(fā)展改革中扮演重要角色,已成為國家進行宏觀調控的配套措施和重要抓手。自2007 年中央財政農(nóng)業(yè)保險保費補貼政策實施以來,我國農(nóng)業(yè)保險得到快速發(fā)展,截至2019 年,農(nóng)業(yè)保險保費收入達到680 億元,為全國1.8 億戶次農(nóng)戶提供了3.6 萬億元的風險保障,三大糧食作物覆蓋率超過70%,為轉移和分散我國農(nóng)業(yè)風險發(fā)揮了重要作用。
費率如何厘定是農(nóng)業(yè)保險可持續(xù)和高質量發(fā)展的關鍵問題,費率偏高會造成農(nóng)戶的有效需求不足,費率偏低又會增加保險機構的經(jīng)營風險,無法提供長期的有效供給,并且精準的費率厘定也是國家進行風險區(qū)劃、制定保費補貼政策、提高補貼資金使用效率的前提。精準的費率厘定需要以大量的經(jīng)驗數(shù)據(jù)為基礎,由于農(nóng)作物一般需要一年的生產(chǎn)周期,且生產(chǎn)過程和結果具有不可重現(xiàn)的特征,因此與其他財產(chǎn)保險相比,農(nóng)業(yè)保險存在較為明顯的經(jīng)驗數(shù)據(jù)不足的問題(張譯元和孟生旺,2020)[1],并且相對于美國、印度等國家,我國在區(qū)域產(chǎn)量數(shù)據(jù)的收集方面存在劣勢(黃正軍,2016)[2],可公開獲取的農(nóng)作物生產(chǎn)和災害數(shù)據(jù)時序較短,越小區(qū)域的數(shù)據(jù)獲取越困難,給農(nóng)作物災害性損失的統(tǒng)計建模帶來很大挑戰(zhàn),造成估計結果存在較大偏差和不穩(wěn)定性,致使研究人員常常對結果的選擇感到困惑,缺乏足夠的可信度(肖宇谷等,2014)[3]。
為了更好地解決經(jīng)驗數(shù)據(jù)不足問題,本文建立了農(nóng)業(yè)保險費率估計的信度優(yōu)化模型,通過“借力”其他地區(qū)同分布數(shù)據(jù)橫向擴大樣本量,在此基礎上提高我國農(nóng)作物保險費率厘定的信度,以期為我國農(nóng)業(yè)保險的精準化和專業(yè)化發(fā)展提供方法借鑒。
現(xiàn)有文獻厘定農(nóng)作物保險費率的方法主要包括兩類:經(jīng)驗費率法和統(tǒng)計模型法(李艷和陳盛偉,2018)[4]。從國外發(fā)達國家的實踐來看,在歷史損失數(shù)據(jù)樣本連續(xù)、完整并充足的情況下,采用經(jīng)驗費率法,通過計算歷史損失率的平均值能夠得到具有較高精度和穩(wěn)健性的費率(Goodwin and Piggott,2009)[5]。在歷史保險損失數(shù)據(jù)不理想的情況下,學者一般通過統(tǒng)計建模對農(nóng)作物單產(chǎn)損失的數(shù)據(jù)特征進行擬合,從而厘定農(nóng)作物保險的費率(葉濤等,2012)[6]。統(tǒng)計模型法根據(jù)估計方法的不同可以分為參數(shù)法和非參數(shù)法(或半?yún)?shù)法),兩種方法在國內文獻中有大量應用,成為目前我國農(nóng)作物保險費率厘定的主流方法,已形成較為成熟的研究模式。王 克(2008)[7]、葉 濤 等(2012)[6]、李 艷 和 陳 盛 偉(2018)[4]以及李政(2018)[8]等文獻對費率厘定的統(tǒng)計模型方法做了較詳細的綜述。
但是,統(tǒng)計模型方法在厘定我國農(nóng)作物保險費率時仍存在一定的不足,費率對產(chǎn)量分布的擬合方法非常敏感,無論是選擇參數(shù)方法還是非參數(shù)方法,估計的費率都存在較大差異(肖宇谷等,2014)[3]。例如,參數(shù)法一般要預先假定樣本數(shù)據(jù)服從一種或幾種經(jīng)典理論分布,然后利用分布擬合檢驗法(K-S檢驗、AD 檢驗或卡方檢驗)選擇擬合程度最好的分布,預先設定分布本身就存在一定的不合理性,當樣本量較小時,還經(jīng)常出現(xiàn)擬合程度不高或接受多種不同分布類型的情況。再例如,非參數(shù)方法中較為常用的核密度函數(shù)法,雖然不必預先假設分布模型,但不同核函數(shù),尤其是不同窗寬的選擇會對估計結果造成較大影響(王克,2008)[7],并且非參數(shù)分布的估計方法需要較大的樣本(Ker 和Goodwin,2000)[9]。吳垠豪(2014)[10]將新疆阿克蘇市62 年的棉花產(chǎn)量數(shù)據(jù)作為“總體”,從中隨機抽取14 年的數(shù)據(jù)作為“小樣本”,利用參數(shù)法與非參數(shù)法估計費率,結果發(fā)現(xiàn)非參數(shù)法的估計結果與“總體”的差異更大,即在“小樣本”情況下不宜采用非參數(shù)法估計農(nóng)作物保險的費率。
綜上而言,經(jīng)驗費率法、參數(shù)和非參數(shù)統(tǒng)計模型法的估計效果都受樣本量的影響。相對于大樣本而言,由于小樣本數(shù)據(jù)遍歷的觀測較少,所蘊含的能夠反映其總體分布特征的信息量低,因此在分布擬合時存在更多不確定性,基于此而得到的統(tǒng)計推斷結果的可信度必然較低(郭建平等,2018)[11]。因此,當樣本量較小時,各種方法估計得到的農(nóng)作物保險費率的精準度和穩(wěn)定性都較差。為增加農(nóng)作物單產(chǎn)數(shù)據(jù)的樣本量,部分學者提出了一些改進方法。例如肖宇谷等(2014)[3]利用Bootstrap 法對黑龍江省14 個區(qū)縣的玉米保險費率厘定進行了分析,李文芳等(2009)[12]通過建立分層貝葉斯模型,利用Gibbs抽樣對湖北荊州市縣級水稻保險費率的厘定進行了研究。這些方法主要利用隨機抽樣技術增加可利用的樣本量,但是抽樣統(tǒng)計結果的好壞主要取決于初始樣本量,樣本量越大,抽樣結果越接近真值。因此增加可利用的初始樣本量是提高農(nóng)作物保險費率厘定信度水平的根本。我國地域遼闊,當兩個區(qū)域農(nóng)作物的風險損失情況相近時,可將兩個區(qū)域的數(shù)據(jù)混合到一起進行費率厘定,這樣就增加了初始樣本量。
本文基于保險費率厘定的信度理論,以提高費率估計的條件信度水平為出發(fā)點,通過構建和求解農(nóng)業(yè)保險費率估計的信度優(yōu)化模型,擇優(yōu)選擇數(shù)據(jù)服從相同分布的區(qū)域,利用數(shù)據(jù)混合的方法擴大樣本量,以增加我國農(nóng)作物保險費率厘定的精確性和穩(wěn)定性,并以河北省縣域玉米保險費率的厘定為例驗證了該方法的可行性和優(yōu)勢。
不考慮保險機構經(jīng)營成本和利潤的情況下,公平的純保險費用應等于期望損失,純費率為期望損失與保障額度之比,即純費率其中為期望達到的單產(chǎn)(保障水平),E(L(X))為期望損失。在保障水平一定的情況下,農(nóng)作物保險費率厘定的核心步驟即為估計農(nóng)作物災害損失的期望。
假設某區(qū)域S0的災害損失額X1,X2,…,Xn獨立同分布,其期望值記為μ,該值即為風險保費,因此農(nóng)業(yè)保險保費厘定的關鍵就是如何確定更為精確的μ 值。由于災害損失的總體分布未知,一般利用平均損失額-X 作為μ 的近似估計值,其中=(X1+X2+…+Xn)/n。在保險理論中,若直接將平均損失額-X作為保費,則稱作經(jīng)驗數(shù)據(jù)的完全信度,即保費厘定完全依靠現(xiàn)有的災害損失數(shù)據(jù)。在完全信度下真實保費μ與之間的關系可以用式(1)表示。
式(1)表示-X 與μ 之間的相對偏差不超過γ 的概率等于θ,即置信水平為θ。不等式兩邊同時乘以并除以標準差σ,式(1)變形為式(2),其中λ=
其中θh表示混合樣本數(shù)據(jù)估計的信度水平,P(B)為區(qū)域S1,S2,…,SJ與區(qū)域S0同分布的概率,P(A|B)為同分布條件下混合數(shù)據(jù)估計的信度水平。事件B可以表示為B=B1?B2?…?BJ,Bj表示區(qū)域Sj與S0的樣本數(shù)據(jù)具有相同的分布,由于Bi與Bj在i≠j時相互獨立(區(qū)域Si和S0是否同分布與Sj和S0是否同分布為獨立事件),根據(jù)獨立事件概率公式有P(B)=P(B1)P因此式(4)可以轉化為式(5)。
在同分布檢驗中,原假設(H0:區(qū)域Sj與S0的樣本數(shù)據(jù)具有相同的分布)成立的概率為假設檢驗的p 值,由于原假設H0=Bj,因此P(Bj)=pj。由于K-S 檢驗對兩樣本經(jīng)驗分布函數(shù)的位置和形狀參數(shù)的差異都比較敏感,是判斷兩樣本(尤其是小樣本情況)是否同分布的常用方法,因此可以利用K-S 檢驗計算同分布檢驗的p 值(K-S 檢驗的基本原理在此不再贅述)。
式(5)中θh由兩部分構成,其中P(A|B1,B2,…,BJ)是混合區(qū)域個數(shù)和樣本量的增函數(shù),由于兩個區(qū)域樣本數(shù)據(jù)同分布的概率是混合區(qū)域個數(shù)的減函數(shù)。在樣本量較小時,僅利用區(qū)域S0的數(shù)據(jù)估計的費率信度水平較低,而一般情況下能在置信水平較大的情況下找到同分布的其他區(qū)域進行數(shù)據(jù)混合,即P(Bj)較大,因此混合數(shù)據(jù)估計的信度水平θh會呈現(xiàn)倒U 形的變化特征,存在最優(yōu)的混合區(qū)域,使得信度水平達到最大值θ*h,如圖1 所示。
圖1 混合數(shù)據(jù)信度水平與混合區(qū)域個數(shù)關系示意圖
綜上,通過如下方法和步驟可以利用混合數(shù)據(jù)方法增加樣本量,提高農(nóng)作物保險厘定費率的信度水平。一是將各區(qū)域的單產(chǎn)數(shù)據(jù)進行去趨勢等相關處理;二是將各區(qū)域的樣本數(shù)據(jù)進行兩兩K-S 同分布檢驗,獲得假設檢驗的p 值;三是通過規(guī)劃模型[式(6)]計算得到最優(yōu)的區(qū)域進行數(shù)據(jù)混合和最大的信度水平θ*h;四是利用混合數(shù)據(jù)估計考察區(qū)域的保險費率。
玉米是重要的糧食作物和飼料作物,同時又是工業(yè)加工的重要原料,對國民經(jīng)濟發(fā)展具有重要影響。河北省是我國13 個玉米主產(chǎn)省之一,玉米生產(chǎn)在全國占有舉足輕重的地位。本文以河北省玉米保險為例,基于1994—2017 年河北省縣級玉米產(chǎn)量數(shù)據(jù),利用上述方法厘定保險費率,驗證上述方法的可行性,并為河北省玉米保險的開展提供參考。數(shù)據(jù)來源于1995—2018年的《河北省農(nóng)村統(tǒng)計年鑒》。
2017 年年底河北省共有168 個縣級行政區(qū)劃(包含47 個市轄區(qū)、20 個縣級市、95 個縣、6 個自治縣),其中27 個市轄區(qū)以及張家口市張北縣、康保縣、沽源縣的數(shù)據(jù)缺失嚴重,在實證研究中剔除這30 個區(qū)域,因此本文最終基于138個縣級區(qū)域1994—2017年的玉米單產(chǎn)數(shù)據(jù)進行研究。
2017 年河北省玉米總播種面積3544.06 千公頃(占全國玉米總種植面積的8.36%),總產(chǎn)量2035.48萬噸(占全國玉米總產(chǎn)量的7.86%),平均畝產(chǎn)382.89公斤(是全國平均畝產(chǎn)的93.99%)。受玉米生產(chǎn)技術進步等因素的影響,玉米單產(chǎn)存在一定的增長趨勢,因此需要通過趨勢擬合計算得到單產(chǎn)的RSV 序列。農(nóng)作物單產(chǎn)趨勢擬合有多種方法,主要包括直線移動平均法(張峭等,2015)[13]、HP 濾波法(鄢姣和趙軍,2014)[14]、回歸分析法(肖宇谷等,2014)[3]以及時間序列預測方法,如灰色模型(Chen et al.,2015)[15]、ARMA 模型(Goodwin and Ker,1998)[16]等,各種方法具有不同的優(yōu)勢和缺點。本文采用非參數(shù)局部線性加權法估計河北省縣級玉米單產(chǎn)趨勢,該方法能夠較好地克服其他模型中存在的模型設定或參數(shù)選擇問題,能夠更好估計農(nóng)作物災害性損失風險(任金政和李士森,2017)[17]。
本文以河北省省級玉米單產(chǎn)為例進行趨勢擬合,趨勢擬合結果如圖2 所示。按照該方法利用MATLAB 軟件估計河北省138 個縣級區(qū)域的玉米單產(chǎn)趨勢。
圖2 河北省省級玉米單產(chǎn)及趨勢擬合
根據(jù)趨勢估計結果,可以將單產(chǎn)分解為Xt=X?t+et,其中為玉米單產(chǎn)的趨勢,et為估計殘差。由于存在增長趨勢,殘差不具有可比性,因此需將估計殘差轉化為波動率xt=et/。利用MATLAB 軟件計算得到河北省138 個縣級區(qū)域玉米單產(chǎn)的波動率(RSV)序列,其均值變化情況如圖3所示。
圖3 河北省138個縣級區(qū)域玉米單產(chǎn)波動率的均值變化情況
基于信度優(yōu)化的數(shù)據(jù)混合法,首先對河北省138 個縣級區(qū)域兩兩之間的RSV 序列進行K-S 檢驗,為每個區(qū)域確定混合數(shù)據(jù)的樣本來源。由于涉及區(qū)域個數(shù)較多,此處僅以2017 年河北省玉米種植面積最大的寧晉縣(位于河北省邢臺市)為例,分析該縣與河北省其他區(qū)域的數(shù)據(jù)同分布情況。利用MATLAB 編程,計算得到寧晉縣與河北省其余137個縣級區(qū)域K-S檢驗的p值,p取值范圍與對應的縣級區(qū)域個數(shù)如表1所示。
表1 寧晉縣與河北省其他縣級區(qū)域K-S檢驗的p取值范圍與對應的區(qū)域個數(shù)
可以看出,在0.1 的顯著性水平下,與寧晉縣玉米單產(chǎn)RSV 序列具有同分布的區(qū)域個數(shù)有133 個,但大部分區(qū)域的p值較低,低于0.5的區(qū)域個數(shù)有69個,低于0.7 的區(qū)域個數(shù)有109 個,p 值高于0.9 的區(qū)域僅有12 個,占區(qū)域總個數(shù)的8.76%。基于上述數(shù)據(jù)求解信度優(yōu)化模型[式(6)]可得到與寧晉縣進行數(shù)據(jù)混合的區(qū)域,包括靈壽縣、贊皇縣、遷安市、盧龍縣、成安縣、磁縣、魏縣、廣宗縣、南宮市、蠡縣、獻縣、安平縣等12 個區(qū)域。按照條件信度水平從高到低排序,寧晉縣玉米單產(chǎn)期望損失估計的條件信度水平隨區(qū)域個數(shù)增加的變化情況如圖4所示。
圖4 條件信度水平的變化情況
從圖4 中可以看出,利用本文設計的區(qū)域數(shù)據(jù)混合方法,隨著合并的區(qū)域數(shù)的增加,條件信度水平呈現(xiàn)先增加后降低的變化趨勢,這與圖1 的分析結論一致。更進一步分析可知,若只基于寧晉縣的樣本數(shù)據(jù),利用經(jīng)驗費率法,其玉米保險費率估計值為2.49%,估計值的信度水平為15.64%,數(shù)據(jù)混合上述12 個區(qū)域后,寧晉縣玉米保險費率估計值變?yōu)?.77%,條件信度水平達到最大值46.40%,大幅度提高了寧晉縣玉米保險費率的信度水平,費率具有更大的穩(wěn)定性和可靠程度,僅利用寧晉縣樣本數(shù)據(jù)估計得到的2.49%很可能低估了玉米保險費率。利用MATLAB 編程計算得到138 個區(qū)域玉米保險費率及信度水平,限于篇幅本文僅列出保定市(2017 年河北省玉米產(chǎn)量最高的地級市)各縣級區(qū)域的計算結果,如表2所示。
從表2的估計結果可以得出如下主要結論。
(1)利用混合數(shù)據(jù)方法橫向擴大樣本量,可提高費率估計的信度水平。除個別縣級區(qū)域(博野縣)外,保定市各區(qū)域費率厘定的平均條件信度水平從0.1852 提高至0.4113,提高了122%,不同區(qū)域信度水平的提高程度存在較大差異,標準差為0.0996,變異系數(shù)達到44%,其中信度水平提高最大的是阜平縣(提高了279%),最小的是望都縣(提高了15%)。
(2)在費率厘定過程中,按照條件信度水平最高原則,不同區(qū)域能夠橫向擴大的樣本量具有較大差異。阜平縣能夠將23 個區(qū)域的數(shù)據(jù)混合利用(樣本量增加了22倍),高陽縣和曲陽縣僅能夠將2個區(qū)域的數(shù)據(jù)混合利用(樣本量僅增加了1 倍)。其主要原因是部分區(qū)域與其他區(qū)域同分布的概率較低,例如博野縣與其他縣級區(qū)域同分布檢驗最大的p 值僅為0.38,因此該縣與任何區(qū)域混合都會降低費率估計的條件信度水平,因此僅能使用本身的樣本數(shù)據(jù)進行費率估計。
表2 保定市各縣級區(qū)域玉米保費測算結果
(3)利用單區(qū)域樣本數(shù)據(jù)厘定費率可能存在一定的估計偏差。從保定市21 個縣級區(qū)域(博野縣暫不具有可比較性)玉米保險費率的厘定結果來看,若基于單個縣級區(qū)域樣本估計費率,則徐水、阜平、高陽、容城和雄縣等5 個區(qū)域可能高估了玉米災害損失風險,造成保費定價偏高,費率偏高最多的區(qū)域為徐水區(qū)(差額為0.0335);其余15 個區(qū)域則可能低估了玉米災害損失風險,造成保費定價偏低,費率偏低最多的區(qū)域為曲陽縣(差額為0.0201);只有安國市的費率估計結果未發(fā)生變化,但在混合數(shù)據(jù)方法下,安國市費率估計的信度水平從0.1696 提高至0.3900,提高了0.2204。
(4)玉米保險費率存在較大區(qū)域差異?;诨旌蠑?shù)據(jù)方法估計各區(qū)域的費率均值為0.0255,標準差為0.0137,變異系數(shù)達到53.73%,曲陽縣的費率最高為0.0725,望都縣費率最低為0.0125,最高費率為最低費率的5.8 倍。費率的差異性說明在玉米保險運作過程中,需要針對不同區(qū)域制定政策和承保方案,而不能實行“一刀切”。
(5)盡管費率厘定的信度水平有所提高,但整體水平仍然較低,保定市所有縣級區(qū)域費率厘定的平均信度水平僅為0.4113。主要原因是本文僅利用了河北省的縣級區(qū)域數(shù)據(jù),能夠選擇的數(shù)據(jù)同分布區(qū)域較少,若基于全國縣域數(shù)據(jù)進行費率厘定,則理論上可得到信度水平更高的估計結果。
為更好地解決我國農(nóng)作物保險費率厘定中經(jīng)驗數(shù)據(jù)不足造成的問題,本文通過“借力”其他地區(qū)同分布數(shù)據(jù)橫向擴大樣本量,在擴大樣本量的過程中對農(nóng)作物災害損失期望估計的信度水平和不同區(qū)域數(shù)據(jù)同分布的概率進行了綜合考慮,提出了條件信度水平的概念,建立了農(nóng)業(yè)保險費率估計的條件信度優(yōu)化模型,分析了目標函數(shù)的變化規(guī)律,并以河北省為例,對其縣級區(qū)域玉米保險費率進行了測定。
從河北省縣級區(qū)域玉米保險費率厘定的結果來看,通過“借力”其他地區(qū)同分布數(shù)據(jù)橫向擴大樣本量,能夠提高費率厘定的條件信度水平。以保定市為例,其縣級區(qū)域保險費率信度水平的平均值從0.1852 增加至0.4113,提高了1.22 倍,基于單區(qū)域樣本估計的費率既可能偏高也可能偏低,影響到保險市場的均衡狀況,并且玉米保險費率存在較大區(qū)域差異,需要針對不同區(qū)域制定政策和承保方案。
1.加快完善農(nóng)作物生產(chǎn)條件和單產(chǎn)數(shù)據(jù)庫
高信度水平農(nóng)作物保險費率的估計是農(nóng)業(yè)保險可持續(xù)發(fā)展的基礎和前提,本文提出的數(shù)據(jù)混合方法在一定程度上能提高費率估計的精準度,但數(shù)據(jù)混合后費率厘定的信度水平仍然較低。從本文的實證結果可以看出,當農(nóng)作物生產(chǎn)條件相似和單產(chǎn)數(shù)據(jù)分布相同時,樣本數(shù)據(jù)越多,費率估計的信度水平越高。我國有2800 多個縣級區(qū)劃,改進本文的混合數(shù)據(jù)方法,將具有相似生產(chǎn)條件(包括氣象環(huán)境、生產(chǎn)資料、農(nóng)戶特征等)的縣域進行數(shù)據(jù)分布匹配和混合,利用更多的區(qū)域數(shù)據(jù)樣本,可更大程度地提高費率厘定的信度水平。
2. 制定基于疫情的支持政策,確保農(nóng)業(yè)保險市場的穩(wěn)定
突如其來的新冠肺炎疫情對國民經(jīng)濟的各行各業(yè)的發(fā)展都造成了影響,給農(nóng)業(yè)保險的宣傳、承保、查勘定損、保險服務以及災害賠付等實際運作環(huán)節(jié)造成困難,降低了農(nóng)戶參保的積極性,提高了農(nóng)業(yè)保險機構的運行成本。為更好發(fā)揮農(nóng)業(yè)保險穩(wěn)定農(nóng)業(yè)生產(chǎn)、分散風險和保障農(nóng)戶收入水平的重要作用,需要定量分析疫情對農(nóng)業(yè)保險的影響,適當調整保費補貼、稅收優(yōu)惠等政策,以減小疫情的沖擊,維持農(nóng)業(yè)保險市場的穩(wěn)定。
3. 以高質量發(fā)展為目標,創(chuàng)新農(nóng)作物保險費率厘定方法
近年來我國農(nóng)業(yè)保險越來越受到黨中央和國務院的重視,連續(xù)17 年的中央“一號文件”中都對農(nóng)業(yè)保險工作進行了部署。2019 年中央全面深化改革委員會第八次會議審議通過了《關于加快農(nóng)業(yè)保險高質量發(fā)展的指導意見》,其中專門強調要“完善保險費率擬訂機制”,實現(xiàn)保險費率動態(tài)調整和“實現(xiàn)地區(qū)風險的差異化定價,真實反映農(nóng)業(yè)生產(chǎn)風險”。因此亟須出臺鼓勵政策和措施,激勵保險機構和科研人員創(chuàng)新多種方法提高風險估計和費率厘定的信度水平,為農(nóng)業(yè)保險高質量發(fā)展提供實踐和理論基礎。