駱文輝
摘要:為了解決管理人員對(duì)城市信用數(shù)據(jù)查詢效率和質(zhì)量問(wèn)題,實(shí)現(xiàn)信用畫(huà)像快速、準(zhǔn)確圈定數(shù)據(jù)的要求,提出了一種基于自動(dòng)標(biāo)簽的城市信用畫(huà)像系統(tǒng)。通過(guò)自動(dòng)化標(biāo)簽技術(shù)來(lái)構(gòu)建市場(chǎng)主體的信用畫(huà)像,并基于標(biāo)簽結(jié)合集成學(xué)習(xí)算法實(shí)現(xiàn)了信用風(fēng)險(xiǎn)的自動(dòng)預(yù)警,有效提升了信用監(jiān)管工作的效率。
關(guān)鍵詞:自動(dòng)標(biāo)簽;信用畫(huà)像;集成學(xué)習(xí);風(fēng)險(xiǎn)預(yù)警;系統(tǒng)
中圖分類(lèi)號(hào):TP391? ? ? 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2022)06-0001-03
開(kāi)放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 概述
近年來(lái),多地以信用信息平臺(tái)為支撐,以推進(jìn)誠(chéng)信文化建設(shè)、建立守信激勵(lì)和失信懲戒機(jī)制為重點(diǎn),以聯(lián)合獎(jiǎng)懲、信用服務(wù)為主要手段,全面推進(jìn)社會(huì)信用體系建設(shè)工作[1]。在大數(shù)據(jù)時(shí)代,匯聚企業(yè)基本信息、經(jīng)營(yíng)狀況、經(jīng)營(yíng)風(fēng)險(xiǎn)、知識(shí)產(chǎn)權(quán)、發(fā)展?fàn)顩r等數(shù)據(jù),可以勾勒出企業(yè)整體特征與輪廓,建立起立體的企業(yè)全息畫(huà)像[2]。信用畫(huà)像是指將企業(yè)所有的信用標(biāo)簽綜合起來(lái),對(duì)其信用等級(jí)做出全面精確的評(píng)價(jià)。
傳統(tǒng)的數(shù)據(jù)查詢與統(tǒng)計(jì)模式無(wú)法洞悉數(shù)據(jù)全貌,也無(wú)法滿足同類(lèi)信用群體識(shí)別及多維度的分析比較,更無(wú)法完成在對(duì)信用主體智能識(shí)別的基礎(chǔ)上實(shí)現(xiàn)信用風(fēng)險(xiǎn)自動(dòng)化預(yù)警[3]。本文面向社會(huì)信用領(lǐng)域研發(fā)一款集標(biāo)簽開(kāi)發(fā)、管理與服務(wù)業(yè)務(wù)于一身的信用畫(huà)像系統(tǒng),支持從海量數(shù)據(jù)中挖掘和計(jì)算標(biāo)簽,并通過(guò)良性的標(biāo)簽運(yùn)營(yíng)機(jī)制,促進(jìn)標(biāo)簽在信用業(yè)務(wù)中應(yīng)用。以信用業(yè)務(wù)需求為導(dǎo)向,讓業(yè)務(wù)與標(biāo)簽深度結(jié)合,通過(guò)標(biāo)簽增強(qiáng)業(yè)務(wù),信用業(yè)務(wù)需求拉動(dòng)標(biāo)簽開(kāi)發(fā),從而進(jìn)入一種良性循環(huán),讓標(biāo)簽體系在信用管理業(yè)務(wù)中持續(xù)迭代。
2 系統(tǒng)架構(gòu)與功能
2.1 系統(tǒng)總體架構(gòu)
城市信用畫(huà)像系統(tǒng)采用了層次化的設(shè)計(jì)思想,結(jié)合了國(guó)家有關(guān)標(biāo)準(zhǔn)和實(shí)際業(yè)務(wù)需求,構(gòu)建了信用風(fēng)險(xiǎn)預(yù)警模型預(yù)置在系統(tǒng)中,并基于機(jī)器學(xué)習(xí)等算法技術(shù)實(shí)現(xiàn)了企業(yè)標(biāo)簽的自動(dòng)化提取。城市信用畫(huà)像系統(tǒng)由數(shù)據(jù)源、數(shù)據(jù)層、計(jì)算層和應(yīng)用層四部分組成。數(shù)據(jù)源主要包括各類(lèi)政務(wù)數(shù)據(jù)和公開(kāi)社會(huì)數(shù)據(jù),經(jīng)規(guī)整匯集到指定數(shù)據(jù)庫(kù)。計(jì)算層針對(duì)用戶自定義的標(biāo)簽、指標(biāo)、信用分等進(jìn)行計(jì)算,此外還針對(duì)用戶指定的標(biāo)簽進(jìn)行聚類(lèi)計(jì)算以查找相似群體。數(shù)據(jù)層包括兩類(lèi)數(shù)據(jù):第一類(lèi)是用戶創(chuàng)建的存儲(chǔ)在系統(tǒng)相應(yīng)目錄下的實(shí)時(shí)數(shù)據(jù);第二類(lèi)為基于標(biāo)簽規(guī)則集和預(yù)警規(guī)則集產(chǎn)生的數(shù)據(jù),包括信用標(biāo)簽數(shù)據(jù)、信用風(fēng)險(xiǎn)預(yù)警數(shù)據(jù);第三類(lèi)是基于第一類(lèi)、第二類(lèi)的基礎(chǔ)之上產(chǎn)生的畫(huà)像數(shù)據(jù),包括企業(yè)單體畫(huà)像、群體畫(huà)像。應(yīng)用層在計(jì)算層之上是向用戶提供服務(wù),包括畫(huà)像可視化、風(fēng)險(xiǎn)預(yù)警監(jiān)控等。系統(tǒng)架構(gòu)如圖1所示。
城市信用畫(huà)像系統(tǒng)前端采用VUE和Layui,通過(guò)nginx負(fù)載,依托JWT和Spring Security實(shí)現(xiàn)權(quán)限認(rèn)證體系,服務(wù)層分為系統(tǒng)后臺(tái)服務(wù)和計(jì)算服務(wù),系統(tǒng)后臺(tái)服務(wù)主要使用SpringBoot、Mybatis Plus和Jasypt加密等技術(shù);計(jì)算服務(wù)依托HDFS、Hive、Azkaban、Sqoop等大數(shù)據(jù)框架實(shí)現(xiàn)分布式計(jì)算和數(shù)據(jù)查詢。調(diào)度工具有xxl-job系統(tǒng)調(diào)度平臺(tái)和Azkaban大數(shù)據(jù)調(diào)度平臺(tái)。數(shù)據(jù)存儲(chǔ)層使用Redis緩存數(shù)據(jù)庫(kù)、Mysql數(shù)據(jù)庫(kù)、Hive數(shù)據(jù)庫(kù)。文件存儲(chǔ)采用FastDFS。系統(tǒng)技術(shù)架構(gòu)圖如圖2所示。
用戶請(qǐng)求通過(guò)前端Nginx負(fù)載分發(fā)到后端服務(wù),后端服務(wù)部署至少兩個(gè)節(jié)點(diǎn),保證服務(wù)的高可用;部署Druid監(jiān)控?cái)?shù)據(jù)庫(kù)、Springboot admin監(jiān)控應(yīng)用、Prometheus和Grafana監(jiān)控系統(tǒng);xxl-job任務(wù)調(diào)度平臺(tái)調(diào)用后端服務(wù)實(shí)現(xiàn)定時(shí)任務(wù),后端服務(wù)通過(guò)Azkaban對(duì)大數(shù)據(jù)集群進(jìn)行調(diào)用;大數(shù)據(jù)集群5個(gè)節(jié)點(diǎn),主節(jié)點(diǎn)上部署hive、azkaban、sqoop、hadoop,四個(gè)數(shù)據(jù)節(jié)點(diǎn)部署hadoop;數(shù)據(jù)庫(kù)層面使用關(guān)系型數(shù)據(jù)庫(kù)Mysql存儲(chǔ)系統(tǒng)數(shù)據(jù)、NoSql數(shù)據(jù)庫(kù)redis和Hive數(shù)據(jù)庫(kù)。運(yùn)行環(huán)境為linux、Docker容器或者云服務(wù)器上,Git負(fù)責(zé)項(xiàng)目版本控制,jekins持續(xù)集成部署。城市信用畫(huà)像系統(tǒng)部署架構(gòu)圖3所示。
2.2 數(shù)據(jù)庫(kù)設(shè)計(jì)
政務(wù)數(shù)據(jù)、公開(kāi)社會(huì)數(shù)據(jù)經(jīng)過(guò)匯集后,進(jìn)入系統(tǒng)目錄,以企業(yè)的統(tǒng)一社會(huì)信用代碼作為唯一標(biāo)識(shí)碼,目錄按照配置的更新周期定時(shí)更新數(shù)據(jù)。由目錄數(shù)據(jù)通過(guò)系統(tǒng)配置生成的標(biāo)簽、預(yù)警規(guī)則集,被系統(tǒng)自動(dòng)轉(zhuǎn)化為SQL語(yǔ)句文本或python代碼文本,并以指定的表結(jié)構(gòu)存儲(chǔ)。同時(shí),判斷標(biāo)簽、預(yù)警數(shù)據(jù)是否初次版本,初次版本數(shù)據(jù)全量保留;若已存在初次版本數(shù)據(jù),則異步分析差異數(shù)據(jù),存儲(chǔ)每個(gè)版本差異數(shù)據(jù)。當(dāng)系統(tǒng)需要查詢具體某一版本的數(shù)據(jù)時(shí),根據(jù)初次版本數(shù)據(jù)和歷次版本的差異數(shù)據(jù),匯集計(jì)算得到想要版本的全量數(shù)據(jù)提供給具體的查詢業(yè)務(wù)場(chǎng)景。
2.3 功能設(shè)計(jì)
城市信用畫(huà)像系統(tǒng)具體由目錄管理、行為事件管理、標(biāo)簽管理、風(fēng)險(xiǎn)預(yù)警管理等功能模塊構(gòu)成。用戶可通過(guò)目錄管理功能模塊將清洗數(shù)據(jù)上傳為數(shù)據(jù)目錄,在行為事件管理、標(biāo)簽管理、風(fēng)險(xiǎn)預(yù)警管理功能模塊實(shí)現(xiàn)將目錄構(gòu)建為行為事件、標(biāo)簽、預(yù)警等,并在以上功能模塊基礎(chǔ)上構(gòu)建企業(yè)信用畫(huà)像,支持實(shí)時(shí)查詢查看,同時(shí)通過(guò)大數(shù)據(jù)可視化技術(shù)將企業(yè)畫(huà)像各個(gè)維度信息做出可視化處理供用戶查看。
3 自動(dòng)化標(biāo)簽
3.1 企業(yè)競(jìng)爭(zhēng)力標(biāo)簽
企業(yè)競(jìng)爭(zhēng)力是在競(jìng)爭(zhēng)的市場(chǎng)上,通過(guò)發(fā)展企業(yè)資源和能力,實(shí)現(xiàn)自身價(jià)值的綜合性能力,企業(yè)競(jìng)爭(zhēng)力與企業(yè)創(chuàng)新能力、企業(yè)產(chǎn)品生產(chǎn)及質(zhì)量?jī)?yōu)劣、企業(yè)文化、企業(yè)招投標(biāo)數(shù)量、企業(yè)知識(shí)產(chǎn)權(quán)數(shù)量等息息相關(guān),這些因素越高,企業(yè)發(fā)展動(dòng)力越足,企業(yè)的競(jìng)爭(zhēng)力就越強(qiáng)。通常企業(yè)競(jìng)爭(zhēng)力影響著企業(yè)風(fēng)險(xiǎn)狀況,企業(yè)競(jìng)爭(zhēng)力越強(qiáng),相應(yīng)的企業(yè)風(fēng)險(xiǎn)狀況就越低。自動(dòng)標(biāo)簽構(gòu)建步驟如下。
1) 數(shù)據(jù)預(yù)處理
企業(yè)競(jìng)爭(zhēng)力標(biāo)簽的數(shù)據(jù)處理主要包括臟數(shù)據(jù)的清洗、空數(shù)據(jù)的填充、數(shù)據(jù)類(lèi)型轉(zhuǎn)換等。數(shù)據(jù)分為字符型和數(shù)值型,判斷數(shù)據(jù)類(lèi)型,數(shù)值型進(jìn)行歸一化處理,非數(shù)值型LabelEncoder()并歸一化處理。
2) 特征工程
從數(shù)據(jù)集中挑選出包括企業(yè)從業(yè)人員人數(shù)、股東信息、變更信息、裁判文書(shū)信息、專(zhuān)利信息、軟著信息、招投標(biāo)信息、經(jīng)營(yíng)狀況信息、知識(shí)產(chǎn)權(quán)信息等特征,經(jīng)過(guò)特征多項(xiàng)式、特征組合等方式得到212個(gè)特征字段。
統(tǒng)計(jì)計(jì)算各個(gè)字段特征的max、min、mean等,對(duì)相關(guān)字段特征進(jìn)行標(biāo)準(zhǔn)化操作。然后,基于多項(xiàng)式的、基于指數(shù)函數(shù)的、基于對(duì)數(shù)函數(shù)的進(jìn)行特征變換,同時(shí)日期型數(shù)據(jù)處理成年、月、日等多個(gè)字段。
3) 數(shù)據(jù)集和模型選擇
整理和收集蕪湖市工業(yè)100強(qiáng)企業(yè)、商業(yè)100強(qiáng)企業(yè)、制造業(yè)100強(qiáng)企業(yè)等其他百?gòu)?qiáng)企業(yè)名單作為競(jìng)爭(zhēng)力強(qiáng)的企業(yè),數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,總數(shù)據(jù)量為3萬(wàn)條,訓(xùn)練集和測(cè)試集以5:1的比例劃分。
采用決策樹(shù)作為模型訓(xùn)練的算法,對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行模型訓(xùn)練,其中不純度計(jì)算方法criterion使用基尼系數(shù),樹(shù)深max_depth設(shè)為6,特征切分點(diǎn)splitter設(shè)為“best”。
4) 模型調(diào)參
采用網(wǎng)格搜索GridSearchCV()方法進(jìn)行調(diào)參,設(shè)置參數(shù)取值區(qū)間,循環(huán)調(diào)用參數(shù)訓(xùn)練模型,尋找最優(yōu)參數(shù),調(diào)整決策樹(shù)算法的各個(gè)參數(shù)為最優(yōu)。
3.2 企業(yè)發(fā)展?jié)摿?biāo)簽
企業(yè)的發(fā)展?jié)摿Π髽I(yè)的對(duì)外投資信息和分支機(jī)構(gòu)信息,企業(yè)的軟件著作權(quán)、專(zhuān)利、對(duì)外網(wǎng)站和商標(biāo)信息說(shuō)明企業(yè)具有一定的創(chuàng)新能力,企業(yè)的資質(zhì)證書(shū)和行政許可可以看出企業(yè)的發(fā)展動(dòng)力。自動(dòng)標(biāo)簽構(gòu)建步驟如下:
1) 數(shù)據(jù)預(yù)處理
整理出數(shù)據(jù)集3萬(wàn)條,主要包含企業(yè)類(lèi)型、企業(yè)所屬行業(yè)、企業(yè)營(yíng)收等字段數(shù)據(jù)。數(shù)據(jù)的預(yù)處理包括數(shù)據(jù)填充、文本分割、數(shù)據(jù)清洗、類(lèi)型轉(zhuǎn)換等操作,經(jīng)過(guò)數(shù)據(jù)的預(yù)處理,整理出145個(gè)字段特征。
2) 特征工程
特征工程包含對(duì)時(shí)間特征的轉(zhuǎn)換和編碼處理、交叉特征的處理、占比特征的處理。經(jīng)過(guò)特征工程和初步的特征選擇后形成94個(gè)特征。將94個(gè)特征經(jīng)過(guò)多項(xiàng)式變換之后,形成4185個(gè)特征。
3) 特征選擇
方差選擇:給定方差閾值,計(jì)算特征方差,刪除低于方差閾值的特征;卡方、F檢驗(yàn)選擇:根據(jù)卡方檢驗(yàn)、F檢驗(yàn)進(jìn)行特征與分類(lèi)結(jié)果的相關(guān)性檢驗(yàn)篩選特征。
4) 模型訓(xùn)練和調(diào)參
標(biāo)簽采用決策樹(shù)算法作為分類(lèi)器,進(jìn)行模型的訓(xùn)練,調(diào)整特征選擇函數(shù)的參數(shù)步驟如下:
①方差選擇中的方差閾值(VarianceThreshold),最優(yōu)值為0;
②卡方檢驗(yàn)/F分布中的比例值,最優(yōu)0.85;
③互信息(mutual_info_classif),最優(yōu)閾值為0;
④正則化選取L1正則化,最優(yōu)C=0.01。
4 信用風(fēng)險(xiǎn)預(yù)警
4.1 信用風(fēng)險(xiǎn)標(biāo)簽
系統(tǒng)產(chǎn)生的風(fēng)險(xiǎn)類(lèi)標(biāo)簽包含自身風(fēng)險(xiǎn)類(lèi)標(biāo)簽、周邊風(fēng)險(xiǎn)類(lèi)標(biāo)簽、預(yù)警提醒類(lèi)標(biāo)簽、經(jīng)營(yíng)風(fēng)險(xiǎn)類(lèi)標(biāo)簽,構(gòu)建成圍繞企業(yè)風(fēng)險(xiǎn)信息的標(biāo)簽體系,具體的標(biāo)簽說(shuō)明如表1所示。本文通過(guò)這些標(biāo)簽來(lái)進(jìn)行企業(yè)風(fēng)險(xiǎn)預(yù)警。
4.2 信用風(fēng)險(xiǎn)預(yù)警
集成學(xué)習(xí)(Ensemble learning)通過(guò)構(gòu)建并結(jié)合多個(gè)學(xué)習(xí)器來(lái)完成學(xué)習(xí)任務(wù),有時(shí)也被稱(chēng)為多分類(lèi)器系統(tǒng)(multi-classifier system)、基于委員會(huì)的學(xué)習(xí)(committee-based learning)等。根據(jù)個(gè)體學(xué)習(xí)器的生成方式,目前的機(jī)器學(xué)習(xí)集成方法主要分為兩大類(lèi)。
1) 個(gè)體學(xué)習(xí)器間存在強(qiáng)依賴關(guān)系、必須串行生成的序列化方法,代表為Boosting。
2) 個(gè)體學(xué)習(xí)器間不存在強(qiáng)依賴關(guān)系、可同時(shí)生成的并行化方法,代表為Bagging和隨機(jī)森林。
①隨機(jī)森林
隨機(jī)森林(Random Forest,RF)算法是基于bagging算法與決策樹(shù)結(jié)合的集成算法,在分類(lèi)、預(yù)測(cè)和缺失值檢測(cè)等方面的多個(gè)場(chǎng)景下均得到了廣泛的應(yīng)用。其核心思想是利用每棵決策樹(shù)對(duì)袋外數(shù)據(jù)的輸入矩陣進(jìn)行預(yù)測(cè),將各決策樹(shù)預(yù)測(cè)結(jié)果均值作為最終預(yù)測(cè)輸出結(jié)果。相比于傳統(tǒng)的決策樹(shù)算法,該算法能夠平衡分布不均勻樣本的誤差,分類(lèi)精度高,對(duì)異常值和噪聲有很好的容忍度。
在RF算法中,對(duì)基決策樹(shù)中的每個(gè)企業(yè)節(jié)點(diǎn),先從該節(jié)點(diǎn)的候選屬性集合中隨機(jī)選擇一個(gè)包含k個(gè)屬性的子集S,然后再?gòu)倪@個(gè)子集中選擇一個(gè)最優(yōu)屬性用于數(shù)據(jù)集的劃分。k的選擇對(duì)模型的效果起著比較重要的影響,一般選擇[k=log2d]作為子集大小。
②XGBoost
XGBoost(eXtreme Gradient Boosting)是一種基于梯度提升樹(shù)的集成算法[4],通過(guò)在模型構(gòu)建過(guò)程中引入正則化損失函數(shù)來(lái)構(gòu)建若干弱評(píng)估器,整合弱分類(lèi)器的分類(lèi)結(jié)果,得到一個(gè)準(zhǔn)確率較高的強(qiáng)分類(lèi)器,利用多模型整合的優(yōu)勢(shì)降低了模型過(guò)擬合的風(fēng)險(xiǎn)。由于 XGBoost 使用了預(yù)排序、加權(quán)分位數(shù)、稀疏矩陣識(shí)別以及緩存識(shí)別等技術(shù),故其擁有可以并行運(yùn)算、算法的復(fù)雜度可控、泛化能力強(qiáng)的優(yōu)點(diǎn),其目標(biāo)函數(shù)如下所示。
[L=i=1nl(yi,yi)+k=1kΩ(fk)]
其中,l是損失函數(shù),yi是第i個(gè)樣本xi的真實(shí)值,[yi]是第i個(gè)樣本xi的預(yù)測(cè)值,fk表示第k棵樹(shù)的預(yù)測(cè)函數(shù)。
③LightGBM
LightGBM(Light Gradient Boosting Machine,LGBM)是基于決策樹(shù)算法的梯度提升框架,相比于 XGBoost算法,速度更快,內(nèi)存占用率更低[5]。其原理是利用最速下降法,把損失函數(shù)的負(fù)梯度在當(dāng)前模型的值當(dāng)作殘差的近似值,進(jìn)而擬合出一棵回歸樹(shù)。經(jīng)過(guò)多輪迭代,最后將所有回歸樹(shù)的結(jié)果累加得到最終結(jié)果。與XGBoost的節(jié)點(diǎn)分裂方式不同的是,LightGBM先將企業(yè)特征進(jìn)行分桶,構(gòu)建多個(gè)直方圖,再進(jìn)行節(jié)點(diǎn)分裂計(jì)算。對(duì)于當(dāng)前模型的每個(gè)葉子節(jié)點(diǎn),需要遍歷所有的特征,來(lái)找到增益最大的特征及其劃分值,以此來(lái)分裂該葉子節(jié)點(diǎn)。
4.3 結(jié)合策略
本文使用投票法(voting)的結(jié)合策略來(lái)融合RandomForest、XGBoost和lightGBM模型結(jié)果,其具體過(guò)程如下。
1) 將輸入數(shù)據(jù)分割成Train Set和Test Set,使用Train Set分別訓(xùn)練RandomForest、XGBoost和lightGBM模型。
2) 分別使用RandomForest、XGBoost和lightGBM模型對(duì)Test Set進(jìn)行預(yù)測(cè)得到對(duì)應(yīng)predrf、predxgb和predlgb。
3) 使用加權(quán)投票法(weighted voting)對(duì)三個(gè)模型的預(yù)測(cè)結(jié)果進(jìn)行處理得到最終的預(yù)測(cè)結(jié)果:
[pred=λ1*predrf+λ2*predxgb+λ3*predlgb]
其中,[λ1,λ2,λ3]分別為對(duì)應(yīng)模型的投票權(quán)重且滿足[λ1+λ2+λ3=1]。
4.4 預(yù)警大屏
基于集成學(xué)習(xí)的信用風(fēng)險(xiǎn)預(yù)警模算法,通過(guò)區(qū)域信用風(fēng)險(xiǎn)地圖對(duì)各類(lèi)風(fēng)險(xiǎn)事件進(jìn)行多維呈現(xiàn),分析各類(lèi)主體的歷史數(shù)據(jù),遍歷主體信用變化的痕跡,對(duì)市場(chǎng)主體信用異常波動(dòng)情況進(jìn)行及時(shí)預(yù)警,如圖5所示。
5 結(jié)束語(yǔ)
本文提出了基于大數(shù)據(jù)研究信用標(biāo)簽和畫(huà)像體系,能夠?qū)π庞弥黧w進(jìn)行全方位、多維度地刻畫(huà)、洞察,通過(guò)不斷拓展數(shù)據(jù)維度:基于自動(dòng)化智能標(biāo)簽實(shí)現(xiàn)對(duì)信用主體或目標(biāo)群體的快速圈定;基于集成學(xué)習(xí)的信用風(fēng)險(xiǎn)預(yù)警算法,智能識(shí)別同類(lèi)群體實(shí)現(xiàn)對(duì)信用主體的深度挖掘,實(shí)現(xiàn)信用風(fēng)險(xiǎn)的實(shí)時(shí)預(yù)警;基于對(duì)信用主體全維度的解析、綜合評(píng)估,輔助智能化信用監(jiān)管。
參考文獻(xiàn):
[1] 張遠(yuǎn).社會(huì)治理視角下的社會(huì)信用體系建設(shè)問(wèn)題探討[J].征信,2021,39(11):46-50.
[2] 陳鋼,佘祥榮,秦加奇,等.面向精準(zhǔn)政務(wù)服務(wù)的自然人全息畫(huà)像[J].電子技術(shù)與軟件工,2021(15):209-210.
[3] 李珂琦.大數(shù)據(jù)技術(shù)助力社會(huì)信用體系建設(shè)[J].網(wǎng)絡(luò)安全技術(shù)與應(yīng)用,2020(08):81-82.
[4] T. Chen and C. Guestrin, “XGBoost: A Scalable Tree Boosting System,” in Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery and Data Mining - KDD 16, San Francisco, California, USA, 2016, pp. 785-794, doi: 10.1145/2939672.2939785.
[5] Ke G,Meng Q,F(xiàn)inley T,et al.Light GBM:a highly efficient gradient boosting decision tree[C]. Proceedings of the 31st International Conference on Neural Information Processing Systems,2017:3149-3157.
【通聯(lián)編輯:謝媛媛】