錢珺 金君仰 季新國
摘? 要:“校園貸”作為信息化和消費金融行業(yè)快速發(fā)展的產(chǎn)物,是消費金融行業(yè)市場的重要組成部分。近年來,不良因素的介入使得“校園貸”淪為某些惡意利用者違法犯罪的工具和平臺,高校亟需一份合適的“校園貸”自身視角方案。研究以構(gòu)建金融管理服務(wù)中心和XGBoost風險評估模型為核心,從疏導(dǎo)、防范等多角度入手,滿足大學生合理借貸需求同時,降低和防范高校“校園貸”風險,讓高校“校園貸”處于有效的監(jiān)管和風險控制之下。
關(guān)鍵詞:校園貸;XGBoost建模;多維融合;防范策略;風險評估
中圖分類號:TP391? ? 文獻標識碼:A? 文章編號:2096-4706(2023)04-0174-03
Research on Risk Control of“Campus Loan”Based on Multi-Dimensional Data Fusion
QIAN Jun1, JIN Junyang2, JI Xinguo3
(1.School of Information Technology, Nanjing Forest Police College, NanJing? 210023, China; 2.Shaoxing Public Security Bureau Yuecheng branch, Shaoxing? 312099, China; 3.Information Management Center, Nanjing Forest Police College, NanJing? 210023, China)
Abstract: The “campus loan” is an important part of the consumer finance industry market as a result of the rapid development of information technology and the consumer finance industry. In recent years, the inclusion of unfavorable factors has transformed “campus loan” into a tool and platform for some criminals to commit crimes, and universities need suitable schemes of “campus loan” urgently from their own perspectives. The research takes the construction of financial management service center and the XGBoost risk assessment model as cores, from the guidance, prevention and other perspectives, meets college students' reasonable lending needs while reducing and preventing the risks of college “campus loan”. Then the college “campus loan” is under effective supervision and risk control.
Keywords: campus loan; XGboost modeling; multi-dimensional integration; prevention strategy; risk assessment
0? 引? 言
“校園貸”以其超前的消費理念和針對大學生群體的突出特征,在高校中得到快速傳播和發(fā)展。以“校園貸”之名偽裝的高利貸、圍繞非法平臺“校園貸”的電信詐騙、侵害公民合法權(quán)益的“裸貸”等違法犯罪事件以及負債、暴力催收等借貸衍生問題,導(dǎo)致大學生身心健康受到消極影響。本文結(jié)合不良“校園貸”的界定和運作機制分析,使用風險控制理論,對“校園貸”風控模型進行了構(gòu)建與研究,采用了知名P2P網(wǎng)貸公司Leading Club的公開借貸信息,以該數(shù)據(jù)作為研究樣本,分析風險要素作為根據(jù),為“校園貸”風控模型方案提供核心評估環(huán)節(jié)的科學支撐。
1? 高?!靶@貸”發(fā)展現(xiàn)狀
隨著社會消費的爆炸式增長和信息技術(shù)的迅速發(fā)展,網(wǎng)絡(luò)貸款及其衍生產(chǎn)物“校園貸”隨著互聯(lián)網(wǎng)金融繁榮發(fā)展而興起。國內(nèi)高校針對“校園貸”管理總體普遍呈重處置、輕疏導(dǎo)和防范的特點。在處置方面,開展排查和整治行動,如對校內(nèi)各類型“校園貸”活動情況開展摸排、清除并抵制校內(nèi)不良“校園貸”活動宣傳、學校有關(guān)部門統(tǒng)計學生校園貸數(shù)據(jù)等。在疏導(dǎo)方面,開展學生教育引導(dǎo)工作,如大學生法律意識培訓(xùn)講座、輔導(dǎo)員加強師生交流溝通、開放心理健康咨詢;開展學生受教育資助工作,如落實國家獎助學金教育資助政策、貧困家庭學生補助幫扶;開展建立大學生創(chuàng)新創(chuàng)業(yè)就業(yè)基金,如高校向應(yīng)屆畢業(yè)生提供創(chuàng)新創(chuàng)業(yè)活動政策保障和科研技術(shù)支持、提供小額免息貸款。多數(shù)高校在為學生建立正確的消費等觀念上,做了大量的教育引導(dǎo)工作,并致力于突發(fā)案件的應(yīng)急處置,但不可否認,非法不良“校園貸”在誘導(dǎo)非理性超前消費、套路借貸上仍然對在校學生造成巨大危害[1]。
2? 高?!靶@貸”風險控制模型的構(gòu)建
2.1? 高校金融管理服務(wù)中心
高校大學生是主流消費群體,為他們提供安全、適宜的信用消費信用貸款,有助于在高校學生中逐步培養(yǎng)起成熟、理性的消費意識和信用觀念[2]。本文引入“高校金融管理服務(wù)中心”的概念,以消除或減少風險要素來實現(xiàn)風險的規(guī)避或降低。高校金融管理服務(wù)中心一方面對內(nèi)承接學生的借貸需求,另一方面對外與社會金融機構(gòu)(如銀行、合法網(wǎng)貸平臺等)簽訂校企合作協(xié)議,建立合作項目。
高校金融服務(wù)管理中心接受網(wǎng)貸平臺的合作申請,對風控能力、經(jīng)營模式、不良記錄等申請信息進行審核后,準許平臺服務(wù)入駐;從網(wǎng)貸平臺中接收學生借貸信息,監(jiān)測管理學生借貸風險,并完善學生借貸信息數(shù)據(jù)和提高風控預(yù)測能力;學生借貸申請需提交至高校金融管理服務(wù)中心,經(jīng)中心審核通過方可從網(wǎng)貸平臺申請借款。通過中心對外及對內(nèi)的雙向業(yè)務(wù),將不良“校園貸”滲入校園的風險排除,從而形成對學生利益的保護,將大學生普遍缺乏金融防范意識、不成熟消費觀的風險要素影響降到最低。
2.2? 基于XGBoost算法的評估模型實證分析
借貸評估工作,一般分為傳統(tǒng)風險評估和現(xiàn)代風險度量方法。在現(xiàn)階段的金融借貸市場中,基于專家的人工審核評估主觀性強、科學性較弱、經(jīng)驗的高度依賴性,已很難適應(yīng)當前信息化、大數(shù)據(jù)的金融行業(yè)發(fā)展模式。在多數(shù)的現(xiàn)代金融行業(yè)中,利用機器學習等技術(shù)的算法模型評估風險已廣泛應(yīng)用[3]。本文引入風控管理評估模型,利用算法模型的構(gòu)建,對“校園貸”借貸中的風險進行科學評估,為該風控模型提供可靠支撐。作為評估核心,“校園貸”風控管理模型接受學生提交的申請,并輸入模型,根據(jù)已經(jīng)訓(xùn)練構(gòu)建完善的模型輸出評估意見,評估意見將給出申請人本次申請的違約預(yù)測,將可能違約的預(yù)測結(jié)果定為“不準許申請”,將沒有違約可能的預(yù)測結(jié)果定為“準許申請”;并對于評估結(jié)果為“準許申請”的樣本提交反饋給高校金融服務(wù)中心;同時對于評估結(jié)果為“不準許申請”的樣本,將進一步提交給學工部門。同時,模型接收高校金融管理服務(wù)中心在業(yè)務(wù)運行過程中產(chǎn)生的真實借貸數(shù)據(jù),這些數(shù)據(jù)也將被列入訓(xùn)練樣本中,對模型進一步優(yōu)化,使其獲得更好的預(yù)測評估效果。
2.2.1? 數(shù)據(jù)來源與指標選取
基于某借貸平臺的37 946條數(shù)據(jù)信息,首先對影響借貸違約的因素進行分析,并從中選取評估指標,隨后通過XGBoost算法建立模型,利用訓(xùn)練后的模型對實時提交的學生借貸申請進行風險評估預(yù)測,為高校金融管理服務(wù)中心的數(shù)據(jù)研判工作提供有效依據(jù)。
本文將大學生個人信息中的家庭年收入(annual_inc)、未結(jié)算的貸款數(shù)量(open_acc)、地址區(qū)位(addr_state)等作為引入構(gòu)建該風控模型的變量指標;將大學生個人在校信息中的學制(emp_length)、學位(emp_title)等作為引入構(gòu)建該風控模型的變量指標;同時將其他一般貸款信息引入該風控模型。根據(jù)風險評估模型實驗需求,選取其中相關(guān)人群數(shù)據(jù)部分,并篩選部分數(shù)據(jù)信息變量,主要包含loan_amnt、term、emp_title、annual_inc、loan_status等,這些變量及其數(shù)據(jù)將參與“校園貸”風險評估模型構(gòu)建中的訓(xùn)練和驗證分析。
2.2.2? 數(shù)據(jù)清洗處理與采樣
數(shù)據(jù)預(yù)處理,首先利用拉格朗日插值法(lagrange)對缺失值進行近似值的估算填補[4];再通過繪制箱線圖對這些數(shù)據(jù)進行異常值的判斷,標準的箱線圖上下邊緣則代表了該組數(shù)據(jù)的最大值和最小值,即在箱體外部的數(shù)據(jù)則稱為異常數(shù)據(jù),將箱線圖中處于上、下邊緣線外的數(shù)據(jù)進行篩除。
2.2.3? 數(shù)據(jù)標準化及特征選取
數(shù)據(jù)標準化和特征值選取,通過標準化處理,可以使得不同的特征變量具有相同的尺度,即將特征的值控制在一定的范圍內(nèi),這樣目標變量就可以由多個相同尺寸的特征變量進行控制,不同的信息變量對模型參數(shù)的影響程度保持一致。本文采用Z-score標準化(標準分數(shù)),其公式為:(X為原始數(shù)據(jù), 為數(shù)據(jù)平均數(shù),s為數(shù)據(jù)標準差)。本文采用單變量統(tǒng)計檢驗的方法對本數(shù)據(jù)表格中的信息變量即特征進行選擇處理。引入python函數(shù)庫sklearn.feature_selection中函數(shù)SelectKBest、f_classif,進行特征的選取,構(gòu)造處理的關(guān)鍵代碼為[5]:
x_new = SelectKBest(f_classif,k=10).fit(X,y).get_support(indices=True)
經(jīng)過特征選取,根據(jù)計算得分排序,得到10個最具價值的特征,結(jié)果如表1所示。后續(xù)的模型構(gòu)造訓(xùn)練學習及檢驗,將使用該10個特征進行運算。
2.2.4? 訓(xùn)練樣本與檢驗樣本的選取
參照熱力值對照表,得知變量間相關(guān)性系數(shù)整體處于0.0~0.4的區(qū)間內(nèi),且多數(shù)處于0.0~0.2的區(qū)間內(nèi),呈弱或極弱相關(guān),變量間的互相影響程度小,符合模型要求。將所有樣本數(shù)據(jù)分為訓(xùn)練組數(shù)據(jù)和檢驗組數(shù)據(jù),其中訓(xùn)練組數(shù)據(jù)用于構(gòu)建模型,檢驗組數(shù)據(jù)用于檢驗?zāi)P偷臏蚀_性和預(yù)測評估。構(gòu)建模型的訓(xùn)練樣本和檢驗樣本如表2所示。
XGBoost由樹模型的迭代來直接影響學習的效果,理論上迭代次數(shù)越多,則模型的訓(xùn)練效果越好,但通常情況下,模型會因樹模型的迭代次數(shù)過多而產(chǎn)生過擬合的風險,使預(yù)測值在訓(xùn)練集數(shù)據(jù)下表現(xiàn)良好,而在測試集數(shù)據(jù)下表現(xiàn)不佳。
依次對num_boost_round、max_depth/min_child_weight、gamma、subsample、colsample_bytree和eta學習率參數(shù)進行調(diào)整,使模型在平均絕對誤差上盡可能小并處于適度擬合的狀態(tài)。最終得到該數(shù)據(jù)集下各參數(shù)最佳參數(shù)值如表3所示,模型擬合狀態(tài)如圖1所示處于適度擬合,同時模型的評價指標mae(Loss-1)由模型最初狀態(tài)得分-0.612 9上升為調(diào)參結(jié)束后的得分-0.249 6。
在模型建立、訓(xùn)練、參數(shù)調(diào)優(yōu)后,針對模型的最優(yōu)狀態(tài)進行預(yù)測能力檢驗。利用驗證數(shù)據(jù)集輸入模型,并得到數(shù)據(jù)集中各組數(shù)據(jù)所對應(yīng)的預(yù)測值,預(yù)測能力結(jié)果如表4所示,該模型能夠在對大學生群體“校園貸”的風控運行機制中,發(fā)揮較好的學生借貸風險預(yù)警和校園金融風險分析輔助作用。
3? 結(jié)? 論
“校園貸”仍是金融領(lǐng)域中的一個重要組成部分,并在當今信息技術(shù)和消費金融快速發(fā)展中扮演合理存在的重要角色。面對風險,僅僅依賴處置無益于高?!靶@貸”的有效整治。創(chuàng)新高?!靶@貸”金融服務(wù)體系,把風險控制與聯(lián)合整治融入整體構(gòu)建中,滿足學生合理借貸需求同時,降低和防范高?!靶@貸”風險,讓“校園貸”在有效監(jiān)管和風險控制下成為真正服務(wù)于學生群體的“安心貸”。
參考文獻:
[1] 貢怡丁.高?!靶@貸”治理現(xiàn)狀及對策研究 [D].合肥:安徽大學,2020.
[2] 張春蓮,徐麗麗,馮云珠.“互聯(lián)網(wǎng)+”背景下的高校網(wǎng)絡(luò)詐騙及風險防范 [J].現(xiàn)代交際,2020(6):187+186.
[3] 王元彬,張堯,李計廣.數(shù)字金融與碳排放:基于微觀數(shù)據(jù)和機器學習模型的研究 [J].中國人口·資源與環(huán)境,2022,32(6):1-11.
[4] 趙莉,孫娜,李麗萍,等.拉格朗日插值法在數(shù)據(jù)清洗中的應(yīng)用 [J].遼寧工業(yè)大學學報:自然科學版,2022,42(2):102-105+117.
[5] 馮凱媛,羅慶斌,鄭明輝,等.基于多特征融合的惡意網(wǎng)頁檢測方法研究 [J].湖北民族大學學報:自然科學版,2021,39(1):80-85.
作者簡介:錢珺(1990—),女,回族,安徽安慶人,講師,碩士,研究方向:電子數(shù)據(jù)檢驗和網(wǎng)絡(luò)犯罪偵查。
收稿日期:2022-09-27
基金項目:江蘇高校哲學社會科學研究項目(2020SJA0567);江蘇高校哲學社會科學研究項目(2022SJYB0089)