• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于隨機(jī)森林的中小微企業(yè)信貸問題研究

      2022-05-30 10:53:34張子越
      中國集體經(jīng)濟(jì) 2022年24期
      關(guān)鍵詞:隨機(jī)森林中小微企業(yè)

      張子越

      摘要:文章針對(duì)中小微企業(yè)信貸問題進(jìn)行建模求解分析,構(gòu)建了基于優(yōu)化的隨機(jī)森林算法構(gòu)建的信貸策略模型,將發(fā)票的進(jìn)銷賬目、供求關(guān)系和企業(yè)信譽(yù)作為自變量,將企業(yè)實(shí)力評(píng)估和判斷是否提供貸款作為因變量。結(jié)合模型并綜合考慮銀行的收益,結(jié)合額度和年利率數(shù)據(jù),確定各企業(yè)所能擁有的最大額度的放款,列出對(duì)企業(yè)放款的優(yōu)先級(jí)排序。根據(jù)模型求解得出信貸策略為根據(jù)信譽(yù)等級(jí)ABC以及是否違約得出年利率和信貸額度分別為6.82%,95萬元,8.95%,85萬元,10.53%,70萬元。文章主要的創(chuàng)新點(diǎn)在于針對(duì)數(shù)據(jù)維數(shù)過高,無關(guān)特征對(duì)檢測結(jié)果產(chǎn)生干擾的問題,提出了一種基于隨機(jī)森林的特征重要度特征選擇方法,能夠給中小微企業(yè)信貸問題提供方法參考。

      關(guān)鍵詞:中小微企業(yè);信貸策略;隨機(jī)森林;信貸額度

      中小微企業(yè)融資一直是世界性難題,信息不透明、主體分散且缺乏標(biāo)準(zhǔn)化,這些特點(diǎn)意味著小微企業(yè)的經(jīng)營風(fēng)險(xiǎn)很高,更是造成銀行不敢貸、不愿貸的主要原因。由于中小微企業(yè)規(guī)模小和資產(chǎn)較少,也缺少抵押資產(chǎn),因此銀行通常是依據(jù)信貸政策、企業(yè)的交易票據(jù)信息和上下游企業(yè)的影響力,向?qū)嵙?qiáng)、供求關(guān)系穩(wěn)定的企業(yè)提供貸款,并可以對(duì)信譽(yù)高、信貸風(fēng)險(xiǎn)小的企業(yè)給予利率優(yōu)惠,是政府重點(diǎn)扶持的對(duì)象。政府通過銀行對(duì)信譽(yù)高、風(fēng)險(xiǎn)小的企業(yè)給予貸款政策優(yōu)惠,為評(píng)定不同企業(yè)的貸款方式,需建立中小微企業(yè)的信貸決策模型。

      一、基于隨機(jī)森林的模型構(gòu)建

      (一)數(shù)據(jù)預(yù)處理

      在訓(xùn)練模型之前,首先要進(jìn)行特征提取從而最大限度地從原始數(shù)據(jù)中提取特征以供算法和模型使用,并使用python中的sklearn提供了較為完整的特征處理方法,包括數(shù)據(jù)預(yù)處理、特征選擇、降維等。本文中使用特征提取的原因是各表格中數(shù)據(jù)零散,無法進(jìn)行直觀分析,需要通過提取特征值,對(duì)數(shù)據(jù)進(jìn)行子集的劃分,進(jìn)而得到指標(biāo),在構(gòu)造的特征中篩選出最能刻畫研究問題的特性,也就是特征選擇,便于模型的訓(xùn)練和預(yù)測。

      首先對(duì)數(shù)據(jù)進(jìn)行刪除無用數(shù)據(jù)處理(見表1)。

      對(duì)各企業(yè)的進(jìn)項(xiàng)發(fā)票和銷項(xiàng)發(fā)票數(shù)據(jù)進(jìn)行合計(jì),錄入為“進(jìn)貨價(jià)稅合計(jì)”和“銷售價(jià)稅合計(jì)”兩類新數(shù)據(jù)用于判斷企業(yè)的資金流動(dòng)量,數(shù)據(jù)處理的代碼和結(jié)果如表2所示。

      (二)隨機(jī)森林算法原理

      隨機(jī)森林是在bagging算法的基礎(chǔ)之上進(jìn)行了一些小的改動(dòng),首先隨機(jī)從原始數(shù)據(jù)集中隨機(jī)抽取m個(gè)子樣本,而且在訓(xùn)練每個(gè)基學(xué)習(xí)器的時(shí)候,不是從所有特征中選擇最優(yōu)特征來進(jìn)行節(jié)點(diǎn)的切分,而是隨機(jī)選取k個(gè)特征,從這k個(gè)特征中選擇最優(yōu)特征來切分節(jié)點(diǎn),從而更進(jìn)一步降低了模型的方差。而后隨機(jī)森林使用的基學(xué)習(xí)器是CART決策樹。隨機(jī)森林隨機(jī)選擇的樣本子集大小m越小模型的方差就會(huì)越小,但是偏差會(huì)越大,在實(shí)際應(yīng)用中,一般會(huì)通過交叉驗(yàn)證的方式來調(diào)參,從而獲取一個(gè)合適的樣本子集的大小。故隨機(jī)森林除了其學(xué)習(xí)器使用CART決策樹和特征的隨機(jī)選擇以外,其他方面與bagging方法相似(見圖1)。

      最終的分類結(jié)果如式(1)所示:

      本文將“是否違約”作為第一屬性值,對(duì)根節(jié)點(diǎn)“企業(yè)代號(hào)”進(jìn)行劃分成“非葉子結(jié)點(diǎn)123……”,并對(duì)違約的企業(yè)進(jìn)行“NO”處理;再對(duì)劃分出的“非葉子結(jié)點(diǎn)”依據(jù)“企業(yè)的信譽(yù)等級(jí)ABCD”繼續(xù)向下劃分,直到不能再依據(jù)屬性值判定,成為葉子結(jié)點(diǎn)。

      (三)指標(biāo)計(jì)算

      根據(jù)公式對(duì)其他指標(biāo)進(jìn)行計(jì)算處理,將用到的公式如下所示:

      結(jié)合python中panda和numphy算法對(duì)數(shù)據(jù)進(jìn)行特征提取,得到處理后結(jié)果(見表3)。

      二、模型求解過程

      信貸策略提供首先需要對(duì)信貸風(fēng)險(xiǎn)進(jìn)行量化分析。對(duì)于貸款額度和利率,僅從企業(yè)的信譽(yù)評(píng)級(jí)和信譽(yù)層面考慮分配是不合理的,還需要考慮銀行的總收益。本文需要從發(fā)票的總金額、開票的頻率是否異常、發(fā)票的作廢比例、發(fā)票的金額波動(dòng)是否正常多個(gè)指標(biāo)對(duì)企業(yè)實(shí)力進(jìn)行觀察,從發(fā)票周期、進(jìn)項(xiàng)發(fā)票信息和銷項(xiàng)發(fā)票信息對(duì)銀行的總收益進(jìn)行觀察。在完成提取指標(biāo)后,利用“隨機(jī)森林”算法對(duì)指標(biāo)進(jìn)行處理。最后,將處理結(jié)果的數(shù)據(jù)按照放款順序自上而下的優(yōu)先級(jí)進(jìn)行排序,然后在固定總額的前提下,按照優(yōu)先級(jí)分配。

      選取數(shù)據(jù)中的特征值作為訓(xùn)練數(shù)據(jù),企業(yè)風(fēng)險(xiǎn)ABCD作為訓(xùn)練標(biāo)簽,構(gòu)建出隨機(jī)森林對(duì)應(yīng)模型。分析統(tǒng)計(jì)銀行等級(jí)數(shù)據(jù),綜合分析計(jì)算得出企業(yè)信譽(yù)分別為ABC時(shí)的年利率及額度(見表4)。

      根據(jù)前面處理的數(shù)據(jù)得到企業(yè)的風(fēng)險(xiǎn)評(píng)級(jí)結(jié)果,進(jìn)行模型求解,并給出企業(yè)信譽(yù)等級(jí)與年利率之間的關(guān)系如圖2所示。

      三、隨機(jī)森林模型的分析

      在對(duì)特征值進(jìn)行隨機(jī)森林算法處理之后,數(shù)據(jù)的回歸性如表5所示:其中,Accuracy表示回歸結(jié)果的準(zhǔn)確性,Macro avg表示算數(shù)平均值,Weighted avg表示加權(quán)平均值,Pricision表示精確度,Recall表示召回率,即是否符合該模型0或1條件下的線形數(shù)據(jù)處理,Support表示在該模型下的可滿足條件的企業(yè)數(shù),數(shù)據(jù)處理的代碼和結(jié)果如表5所示。

      對(duì)該結(jié)果進(jìn)行雙重檢驗(yàn):1.與實(shí)際中銀行貸款額度相比,結(jié)果中的貸款額度處在正常范圍;2.對(duì)算法進(jìn)行檢驗(yàn),沒有問題且運(yùn)行正確,數(shù)據(jù)正確可信。綜上可知,該模型具有結(jié)果可靠性,可以為銀行解決信道分配策略問題。

      四、結(jié)語

      本文通過構(gòu)建基于優(yōu)化的隨機(jī)森林算法構(gòu)建的信貸策略模型,選取進(jìn)銷賬目、供求關(guān)系和企業(yè)信譽(yù)作為自變量和企業(yè)實(shí)力評(píng)估和判斷是否提供貸款作為因變量。確定各企業(yè)所能擁有的最大額度的放款,列出對(duì)企業(yè)放款的優(yōu)先級(jí)排序。模型得出的結(jié)果中,99.9%不相關(guān)的樹得出的預(yù)測結(jié)果涵蓋所有的情況,這些預(yù)測結(jié)果將會(huì)彼此抵消。少數(shù)優(yōu)秀的預(yù)測結(jié)果會(huì)顯現(xiàn)出主要決定作用,從而得出優(yōu)良的預(yù)測結(jié)果。根據(jù)模型求解得出信貸策略為根據(jù)信譽(yù)等級(jí)ABC以及是否違約得出年利率和信貸額度分別為6.82%,95萬元,8.95%,85萬元,10.53%,70萬元。

      參考文獻(xiàn):

      [1]汪政元.基于優(yōu)化的隨機(jī)森林方法的企業(yè)信用風(fēng)險(xiǎn)評(píng)價(jià)研究[D].廣州:暨南大學(xué),2017.

      [2]單光年.大數(shù)據(jù)背景下商業(yè)銀行信貸風(fēng)險(xiǎn)管理策略研究[J].商業(yè)經(jīng)濟(jì),2020(08):164-165.

      [3]于立勇,詹捷輝.基于Logistic回歸分析的違約概率預(yù)測研究[J].財(cái)經(jīng)研究,2004(09):15-23.

      [4]朱沁.F市農(nóng)商銀行信用風(fēng)險(xiǎn)管理研究[D].南昌:江西財(cái)經(jīng)大學(xué),2020.

      [5]馬琬清.新冠疫情對(duì)中國宏觀經(jīng)濟(jì)的影響分析[J].湖北經(jīng)濟(jì)學(xué)院學(xué)報(bào)(人文社會(huì)科學(xué)版),2020,17(09):34-37.

      [6]鄧偉.基于KMV模型的信用風(fēng)險(xiǎn)評(píng)估研究——以制造業(yè)上市公司為例[J].現(xiàn)代營銷(信息版),2020(07):18-19.

      [7]胡寧,方蘭婷,秦中元.基于隨機(jī)森林和深度的自編碼高斯混合模型的無監(jiān)督入侵檢測方法[J].網(wǎng)絡(luò)空間安全,2020,11(08):40-44+50.

      [8]劉玲,鄭建國.一種基于隨機(jī)森林的組合分類算法設(shè)計(jì)與應(yīng)用[J].電子設(shè)計(jì)工程,2020,28(16):54-57.

      (作者單位:淮北師范大學(xué)數(shù)學(xué)科學(xué)學(xué)院)

      猜你喜歡
      隨機(jī)森林中小微企業(yè)
      隨機(jī)森林在棉蚜蟲害等級(jí)預(yù)測中的應(yīng)用
      基于二次隨機(jī)森林的不平衡數(shù)據(jù)分類算法
      軟件(2016年7期)2017-02-07 15:54:01
      拱壩變形監(jiān)測預(yù)報(bào)的隨機(jī)森林模型及應(yīng)用
      金融支持新疆中小微企業(yè)發(fā)展問題研究
      論中小微企業(yè)融資困境的應(yīng)對(duì)路徑選擇
      淺析中小企業(yè)財(cái)務(wù)壓力及策略
      試論中小微企業(yè)知識(shí)產(chǎn)權(quán)保護(hù)
      我國民營銀行發(fā)展的風(fēng)險(xiǎn)及防范研究
      中小微企業(yè)在四板市場的融資方式分析
      基于隨機(jī)森林算法的飛機(jī)發(fā)動(dòng)機(jī)故障診斷方法的研究
      双柏县| 镇沅| 赞皇县| 崇义县| 秦皇岛市| 舞钢市| 磐石市| 濉溪县| 株洲市| 呼图壁县| 盱眙县| 建始县| 田东县| 彭泽县| 茌平县| 九江县| 胶南市| 怀宁县| 宁都县| 富蕴县| 江城| 大渡口区| 曲周县| 东至县| 云阳县| 德钦县| 碌曲县| 铁岭县| 涟源市| 贺州市| 自贡市| 鄂托克前旗| 宝山区| 襄垣县| 平顺县| 巩留县| 梨树县| 双辽市| 安塞县| 西畴县| 西乌珠穆沁旗|