• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于大數(shù)據(jù)技術(shù)的P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)預(yù)警模型

    2015-03-17 03:32:54林春雨李崇綱許方圓許會(huì)泉盧祥虎
    大數(shù)據(jù) 2015年4期
    關(guān)鍵詞:網(wǎng)貸模型

    林春雨,李崇綱,許方圓,許會(huì)泉,石 磊,盧祥虎

    1. 北京金信網(wǎng)銀金融信息服務(wù)有限公司 北京 100101;2. 國(guó)網(wǎng)能源研究院 北京 100101

    基于大數(shù)據(jù)技術(shù)的P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)預(yù)警模型

    林春雨1,李崇綱1,許方圓2,許會(huì)泉1,石 磊1,盧祥虎1

    1. 北京金信網(wǎng)銀金融信息服務(wù)有限公司 北京 100101;2. 國(guó)網(wǎng)能源研究院 北京 100101

    近幾年,我國(guó)P2P網(wǎng)貸行業(yè)在高速發(fā)展的過(guò)程中出現(xiàn)了大量的“失聯(lián)跑路”事件。為此,基于P2P網(wǎng)貸及大數(shù)據(jù)相關(guān)概念的深入剖析,創(chuàng)新性地將平臺(tái)的風(fēng)險(xiǎn)預(yù)警與大數(shù)據(jù)技術(shù)結(jié)合,通過(guò)對(duì)海量數(shù)據(jù)采集、Spark分布式平臺(tái)計(jì)算、機(jī)器學(xué)習(xí)建模等大數(shù)據(jù)技術(shù)的整合,構(gòu)建一個(gè)有效的P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)預(yù)警模型。該模型在多維度風(fēng)險(xiǎn)評(píng)價(jià)指標(biāo)的基礎(chǔ)之上,可以實(shí)現(xiàn)對(duì)網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)的實(shí)時(shí)、精準(zhǔn)、全面監(jiān)測(cè),從而有效降低平臺(tái)集資詐騙、惡意跑路等惡意事件的發(fā)生頻率,維護(hù)廣大投資人的資金安全及社會(huì)穩(wěn)定。

    互聯(lián)網(wǎng)金融;P2P網(wǎng)貸;大數(shù)據(jù);風(fēng)險(xiǎn)預(yù)警;機(jī)器學(xué)習(xí)

    1 引言

    近幾年,我國(guó)互聯(lián)網(wǎng)金融發(fā)展十分迅速。一方面,互聯(lián)網(wǎng)金融的發(fā)展可以很好地滿足中小微企業(yè)、創(chuàng)新型企業(yè)及中低收入階層個(gè)人的投融資需求,為“大眾創(chuàng)新,萬(wàn)眾創(chuàng)業(yè)”營(yíng)造良好的資本環(huán)境;但另一方面,互聯(lián)網(wǎng)金融在創(chuàng)新發(fā)展過(guò)程中也暴露出大量的問(wèn)題及隱患。本文通過(guò)對(duì)其中的P2P網(wǎng)絡(luò)借貸平臺(tái)運(yùn)營(yíng)狀況進(jìn)行相關(guān)調(diào)查發(fā)現(xiàn),截至2015年6月底,P2P網(wǎng)絡(luò)借貸平臺(tái)累計(jì)達(dá)到2 814家,其中問(wèn)題平臺(tái)為786家,比例高達(dá)27.93%,其不僅嚴(yán)重危害了人民的財(cái)產(chǎn)安全,也有礙互聯(lián)網(wǎng)金融的健康發(fā)展。如何有效地監(jiān)測(cè)到潛在的具有高風(fēng)險(xiǎn)的平臺(tái)就成為一項(xiàng)非常有意義的研究。

    P2P網(wǎng)絡(luò)借貸平臺(tái)發(fā)端于英國(guó),成熟于美國(guó)。從資金流向來(lái)看,國(guó)外的P2P網(wǎng)絡(luò)借貸資金主要流向小額信貸領(lǐng)域,借款主體主要為個(gè)人,其用途也是為了滿足個(gè)人消費(fèi)需求和補(bǔ)充個(gè)體戶經(jīng)營(yíng)的流動(dòng)資金需要。對(duì)于這些借款人,P2P平臺(tái)僅需要通過(guò)個(gè)人征信報(bào)告確定其信貸違約風(fēng)險(xiǎn),并將可公開(kāi)的信息提供給投資人,最終由借貸雙方直接達(dá)成借貸協(xié)議。因此,在完善的征信體系與政府監(jiān)管環(huán)境下,可以通過(guò)行業(yè)自律等方式有效預(yù)防問(wèn)題平臺(tái)的出現(xiàn)。而在我國(guó),P2P網(wǎng)絡(luò)借貸不僅為個(gè)人服務(wù),而且很大程度上也服務(wù)于中小微企業(yè),在風(fēng)控手段上必須依靠強(qiáng)化抵押與質(zhì)押品的要求以及引進(jìn)有實(shí)力的融資性擔(dān)保機(jī)構(gòu)對(duì)項(xiàng)目進(jìn)行擔(dān)保。這樣,投資人的信貸風(fēng)險(xiǎn)不再主要取決于個(gè)體項(xiàng)目的違約風(fēng)險(xiǎn),而主要取決于平臺(tái)合作方的擔(dān)保實(shí)力與抵押品的實(shí)際抵押能力[1]。這其中還存在平臺(tái)與合作方相互勾結(jié)的風(fēng)險(xiǎn),因此,由第三方對(duì)P2P網(wǎng)絡(luò)借貸平臺(tái)的風(fēng)險(xiǎn)進(jìn)行監(jiān)測(cè)預(yù)警勢(shì)在必行。

    目前國(guó)內(nèi)關(guān)于網(wǎng)絡(luò)借貸平臺(tái)風(fēng)險(xiǎn)及預(yù)警的研究還處于初級(jí)階段,研究的內(nèi)容也都是從金融業(yè)務(wù)層面進(jìn)行展開(kāi),比如黃葉苨、齊曉雯認(rèn)為P2P面臨的風(fēng)險(xiǎn)主要包括由于法律缺失導(dǎo)致的監(jiān)管風(fēng)險(xiǎn)、用戶導(dǎo)致的風(fēng)險(xiǎn)及借貸平臺(tái)自身運(yùn)營(yíng)與網(wǎng)絡(luò)技術(shù)帶來(lái)的風(fēng)險(xiǎn)[2];而胡旻昱、孟慶軍基于系統(tǒng)科學(xué)理論辯證地分析了P2P平臺(tái)所面臨的風(fēng)險(xiǎn),他們認(rèn)為環(huán)境對(duì)系統(tǒng)有“壓力”,即平臺(tái)會(huì)受到金融危機(jī)、行業(yè)法律缺失、機(jī)構(gòu)主管單位不明確等外界風(fēng)險(xiǎn)的影響,反過(guò)來(lái)系統(tǒng)自身會(huì)對(duì)環(huán)境有“污染”,網(wǎng)貸平臺(tái)自身監(jiān)管不到位、系統(tǒng)安全漏洞、擔(dān)保機(jī)構(gòu)與征信機(jī)制不完善等都是平臺(tái)自身引發(fā)的風(fēng)險(xiǎn)[3];余及堯等基于2013-2014年P(guān)2P網(wǎng)貸平臺(tái)樣本數(shù)據(jù),運(yùn)用logistic回歸模型從企業(yè)性質(zhì)、收益率及風(fēng)控保證模式3個(gè)方面對(duì)平臺(tái)發(fā)生財(cái)務(wù)困境的影響進(jìn)行研究,結(jié)果表明其與短期收益率呈顯著正相關(guān)[4];隨后馬玉娟通過(guò)分析P2P的主要風(fēng)險(xiǎn)類型,同時(shí)綜合相關(guān)專家的評(píng)審構(gòu)建了包含信用評(píng)級(jí)、流動(dòng)性、信息透明度、技術(shù)服務(wù)、品牌、杠桿率6個(gè)方面內(nèi)容的指標(biāo)體系,然后結(jié)合運(yùn)用主成分分析和改進(jìn)的KLR信號(hào)分析法建立了風(fēng)險(xiǎn)預(yù)警模型,最后對(duì)20家網(wǎng)貸平臺(tái)進(jìn)行了綜合打分和排名,驗(yàn)證了模型的可行性和準(zhǔn)確性[5]。但是由于數(shù)據(jù)量少,對(duì)于模型的準(zhǔn)確性結(jié)論就有一定的局限性。王楚珺、劉會(huì)芳等人認(rèn)為P2P網(wǎng)貸主要存在信用評(píng)估、業(yè)務(wù)監(jiān)管及系統(tǒng)安全三大風(fēng)險(xiǎn),并且提出可以將大數(shù)據(jù)引入P2P的風(fēng)險(xiǎn)控制工作[3],但是他們并沒(méi)有深入分析與研究,更沒(méi)有提出一個(gè)具體的風(fēng)險(xiǎn)控制模型。

    綜上所述,已有的相關(guān)研究主要還是集中于理論上的探索,但是P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)評(píng)估是一個(gè)跨領(lǐng)域和多數(shù)據(jù)來(lái)源的復(fù)雜問(wèn)題,多方面的數(shù)據(jù)采集和多角度的特征分析是最終模型能夠完成準(zhǔn)確預(yù)警的重要保障?;诖髷?shù)據(jù)體量大、類型多、速度快、時(shí)效高的特點(diǎn),可以大大擴(kuò)寬用于最終模型訓(xùn)練的歷史數(shù)據(jù)特征字段,因此本文將基于大數(shù)據(jù)及相關(guān)技術(shù)完成對(duì)P2P平臺(tái)監(jiān)測(cè)預(yù)警模型的構(gòu)建。

    2 基本理論與關(guān)鍵技術(shù)

    2.1 P2P網(wǎng)絡(luò)借貸

    P2P網(wǎng)絡(luò)借貸又稱為點(diǎn)對(duì)點(diǎn)借貸,指非金融機(jī)構(gòu)利用互聯(lián)網(wǎng)或移動(dòng)平臺(tái)為民間借貸雙方提供的借貸信息中介服務(wù),包括信息發(fā)布、交易撮合以及為實(shí)現(xiàn)交易撮合而提供的風(fēng)險(xiǎn)評(píng)估、信用評(píng)價(jià)、投資咨詢、交易管理及資金流轉(zhuǎn)等服務(wù)[6]。2005年3月,全球第一家P2P網(wǎng)貸公司Zopa在英國(guó)倫敦成立,接著美國(guó)兩大巨頭網(wǎng)貸公司Prosper和Lending Club先后成立,而我國(guó)第一家網(wǎng)絡(luò)貸款平臺(tái)拍拍貸在2008年上線,直到2011年,我國(guó)的網(wǎng)貸平臺(tái)迎來(lái)了高速增長(zhǎng)時(shí)期。截至2015年6月底,全國(guó)累計(jì)平臺(tái)數(shù)量達(dá)到2 814家。P2P網(wǎng)貸在我國(guó)經(jīng)過(guò)探索創(chuàng)新,其主要運(yùn)營(yíng)模式主要包括3類:一是“純線上中介”模式,此模式借貸雙方通過(guò)相應(yīng)網(wǎng)絡(luò)平臺(tái)發(fā)布信息,自行配對(duì)、自主成交,而P2P企業(yè)此時(shí)只充當(dāng)交易撮合平臺(tái)和資金劃轉(zhuǎn)平臺(tái),但不參與或較少參與借貸交易,沒(méi)有線下審貸環(huán)節(jié),也不對(duì)借款提供擔(dān)保;二是“擔(dān)保賠付”模式,即P2P網(wǎng)絡(luò)借貸平臺(tái)事先承諾,當(dāng)借款人延遲付款時(shí),在一定條件下由平臺(tái)從風(fēng)險(xiǎn)撥備中先期墊付本金和利息,或由平臺(tái)合作的擔(dān)保機(jī)構(gòu)墊付本金和利息,此舉可以有效降低違約風(fēng)險(xiǎn),吸引更多投資人;三是“線上+線下復(fù)合”模式,此模式將不止依附于自身網(wǎng)絡(luò)平臺(tái),相關(guān)業(yè)務(wù)人員會(huì)直接到線下尋找投資者及借款人,并對(duì)借款人開(kāi)展實(shí)地信用調(diào)查。由于激烈的行業(yè)競(jìng)爭(zhēng),目前國(guó)內(nèi)平臺(tái)大多將后兩種模式相結(jié)合來(lái)最大限度地爭(zhēng)取投資人、減少信用風(fēng)險(xiǎn)等。

    2.2 大數(shù)據(jù)內(nèi)涵

    移動(dòng)互聯(lián)網(wǎng)、物聯(lián)網(wǎng)和云計(jì)算技術(shù)的迅速發(fā)展,開(kāi)啟了移動(dòng)云時(shí)代的序幕,大數(shù)據(jù)也越來(lái)越多地被人們所了解和利用。目前,對(duì)于大數(shù)據(jù)來(lái)說(shuō)并沒(méi)有一個(gè)明確的定義,李國(guó)杰等人認(rèn)為大數(shù)據(jù)是指無(wú)法在一定時(shí)間內(nèi)用常規(guī)機(jī)器和軟硬件工具對(duì)其進(jìn)行感知、獲取、管理、處理和服務(wù)的數(shù)據(jù)集合[7];胡雄偉等人認(rèn)為大數(shù)據(jù)是指數(shù)據(jù)量的大小超出了傳統(tǒng)意義上的數(shù)據(jù)尺度,一般的軟件工具難以捕捉、存儲(chǔ)、管理和分析的數(shù)據(jù)[8];而維基百科中將大數(shù)據(jù)定義為:所涉及的資料量規(guī)模巨大到無(wú)法透過(guò)目前主流軟件工具,在合理時(shí)間內(nèi)達(dá)到擷取、管理、處理,并整理成為幫助企業(yè)經(jīng)營(yíng)決策更積極目的的資訊。對(duì)以上相關(guān)定義進(jìn)行總結(jié)歸納,筆者認(rèn)為大數(shù)據(jù)是指由于結(jié)構(gòu)復(fù)雜、種類繁多、數(shù)量龐大而無(wú)法在一定時(shí)間內(nèi)運(yùn)用常規(guī)工具對(duì)其進(jìn)行獲取、存儲(chǔ)、分析及感知的數(shù)據(jù)集合。對(duì)于大數(shù)據(jù)的特性,比較有代表性的是4V定義,即認(rèn)為大數(shù)據(jù)需滿足4個(gè)特點(diǎn):規(guī)模性、價(jià)值密度低、多樣性和高速性。目前,大數(shù)據(jù)在電信、智慧城市、電子商務(wù)及社交娛樂(lè)等行業(yè)已經(jīng)出現(xiàn)規(guī)模化應(yīng)用,隨著網(wǎng)速的進(jìn)一步提升,數(shù)據(jù)將迎來(lái)新一輪爆發(fā)式增長(zhǎng),今后能夠快速獲取、處理、分析海量、多樣化的數(shù)據(jù)對(duì)政府及企業(yè)來(lái)說(shuō)都是至關(guān)重要的。

    2.3 基于Spark的分布式計(jì)算

    分布式計(jì)算研究如何把一個(gè)需要巨大的計(jì)算能力才能解決的問(wèn)題分解成許多小的部分,然后把各個(gè)小的部分分給若干計(jì)算機(jī)同時(shí)進(jìn)行處理,最后把這些計(jì)算結(jié)果綜合起來(lái)得到最終結(jié)果[9]。之前運(yùn)用較多的是傳統(tǒng)的MapReduce框架,它將一個(gè)任務(wù)的執(zhí)行過(guò)程劃分為兩個(gè)階段,即map階段和reduce階段。在map階段,每個(gè)map任務(wù)讀取一個(gè)block,并調(diào)用map函數(shù)進(jìn)行處理,然后將結(jié)果寫到本地磁盤上;而在reduce階段,每個(gè)reduce任務(wù)遠(yuǎn)程地從map任務(wù)所在節(jié)點(diǎn)上獲取相關(guān)數(shù)據(jù),并調(diào)用reduce函數(shù)進(jìn)行數(shù)據(jù)處理,最后將結(jié)果寫入HDFS(Hadoop distributed file system,Hadoop分布式文件系統(tǒng))。但是這種方法在兩個(gè)階段計(jì)算的結(jié)果均要寫入磁盤,因此系統(tǒng)性能降低,很難滿足迭代編程的要求。為了解決迭代問(wèn)題,Spark應(yīng)運(yùn)而生,它是基于MapReduce的新一代大數(shù)據(jù)分析框架,吸收了前者的所有優(yōu)點(diǎn),但Spark將計(jì)算的中間結(jié)果數(shù)據(jù)存儲(chǔ)在內(nèi)存中,通過(guò)減少磁盤I/O,使后續(xù)的數(shù)據(jù)運(yùn)算效率更高。Spark的這種架構(gòu)設(shè)計(jì)對(duì)于需要重復(fù)利用計(jì)算中間數(shù)據(jù)的機(jī)器學(xué)習(xí)、交互式數(shù)據(jù)分析等工作十分適用。

    2.4 文本挖掘技術(shù)

    由于本文是基于大數(shù)據(jù)的建模,原始數(shù)據(jù)中包含了大量的新聞報(bào)道、社交文本等非結(jié)構(gòu)化數(shù)據(jù),必須運(yùn)用相應(yīng)的文本挖掘技術(shù)對(duì)其進(jìn)行排重、分詞、分類等一系列的結(jié)構(gòu)化處理。

    2.4.1 文檔分布式排重

    排重技術(shù)是指根據(jù)詞語(yǔ)的抗篡改能力及語(yǔ)義信息等特征生成詞語(yǔ)指紋,然后根據(jù)詞語(yǔ)指紋對(duì)不同文本進(jìn)行檢測(cè)以排除相似性文檔。具體過(guò)程分為兩個(gè)層次,即粗排重和細(xì)排重,粗排重是對(duì)一篇文檔只生成一個(gè)指紋來(lái)進(jìn)行初步的排重,而細(xì)排重則是在前者的基礎(chǔ)上,針對(duì)更細(xì)分的主題對(duì)文檔生成一組指紋來(lái)進(jìn)行更加精準(zhǔn)的排重。由于網(wǎng)絡(luò)信息發(fā)布主體的去中心化,相同信息(尤其是較為敏感的負(fù)面信息)會(huì)被多個(gè)主體進(jìn)行報(bào)道,同時(shí)這些報(bào)道還會(huì)在論壇、微博等社交網(wǎng)絡(luò)中進(jìn)行轉(zhuǎn)載和評(píng)論,致使網(wǎng)絡(luò)中出現(xiàn)大量的重復(fù)信息。因此,對(duì)其進(jìn)行自動(dòng)排重將會(huì)大大提高后面工作的效率及準(zhǔn)確性。

    2.4.2 自動(dòng)分詞技術(shù)

    自動(dòng)分詞是計(jì)算機(jī)針對(duì)一段文本,按照詞性、語(yǔ)義等將其自動(dòng)切分成單個(gè)詞匯的過(guò)程。人們通過(guò)大腦識(shí)別文本中的詞匯是依賴于對(duì)語(yǔ)言的理解和積累而形成的思維,但對(duì)于機(jī)器來(lái)說(shuō)顯然是不具備此種思維的,因此利用機(jī)器進(jìn)行準(zhǔn)確分詞是比較困難的,其涉及的主要問(wèn)題包括分詞規(guī)范、歧義詞切分及新詞識(shí)別。經(jīng)過(guò)相關(guān)學(xué)者的探索,目前主要的自動(dòng)分詞方法包括機(jī)械分詞算法、基于統(tǒng)計(jì)的分詞算法及基于知識(shí)的分詞算法。其中基于知識(shí)的分詞算法是通過(guò)計(jì)算機(jī)模擬人類對(duì)句子的認(rèn)知過(guò)程來(lái)達(dá)到分詞的目的,但是這種方法目前還處于研究階段。另外兩種方法相對(duì)已經(jīng)比較成熟,但各有優(yōu)缺點(diǎn),基于統(tǒng)計(jì)的分詞方法通過(guò)判斷相鄰字同時(shí)出現(xiàn)的頻率將共現(xiàn)頻率高的字當(dāng)成一個(gè)詞匯分離出來(lái),但在實(shí)踐中發(fā)現(xiàn)這種方法準(zhǔn)確率較低。本文采用的分詞技術(shù)是機(jī)械分詞算法,它利用一定策略將待分詞文本與預(yù)先準(zhǔn)備的語(yǔ)料庫(kù)進(jìn)行匹配來(lái)達(dá)到分詞的目的,雖然這種方法使用簡(jiǎn)單、實(shí)用性強(qiáng),但是其語(yǔ)料庫(kù)詞匯往往會(huì)少于實(shí)際應(yīng)用中遇到的詞匯量。為了解決這一問(wèn)題,筆者研究團(tuán)隊(duì)制作了近10萬(wàn)個(gè)詞的基礎(chǔ)分詞詞典,同時(shí)通過(guò)定期與客戶交流建立客戶詞典來(lái)進(jìn)行有效補(bǔ)充。本文將利用自動(dòng)分詞技術(shù)來(lái)抽取新聞、社交等文本信息中各類主題的關(guān)鍵詞,以達(dá)到文本分類的目的。

    2.5 機(jī)器學(xué)習(xí)

    1997年Mitchell T M給出了一個(gè)機(jī)器學(xué)習(xí)的經(jīng)典定義,即計(jì)算機(jī)利用經(jīng)驗(yàn)改善系統(tǒng)自身性能的行為[10]。人類具有學(xué)習(xí)能力,其學(xué)習(xí)行為背后具有非常復(fù)雜的邏輯判斷過(guò)程,機(jī)器學(xué)習(xí)正是以此過(guò)程中人腦對(duì)信息的處理機(jī)制為理論依據(jù),利用計(jì)算機(jī)來(lái)模擬實(shí)現(xiàn)人類獲取知識(shí)的過(guò)程,再通過(guò)不斷地創(chuàng)新、重構(gòu)已有知識(shí),最終提升計(jì)算機(jī)處理問(wèn)題的能力[11]。在大數(shù)據(jù)環(huán)境下,只有運(yùn)用機(jī)器學(xué)習(xí)的方式才能幫助人們從各式各樣的海量數(shù)據(jù)中挖掘出其中所蘊(yùn)藏的價(jià)值。因此,本文試圖利用機(jī)器學(xué)習(xí)法對(duì)預(yù)處理后的大量特征字段進(jìn)行反復(fù)的訓(xùn)練,以找出真正與平臺(tái)高風(fēng)險(xiǎn)相關(guān)的指標(biāo)及精準(zhǔn)的預(yù)警模型。

    3 研究假設(shè)

    通過(guò)全面分析當(dāng)前P2P網(wǎng)貸平臺(tái)出現(xiàn)風(fēng)險(xiǎn)的原因,本文總結(jié)提出以下4條假設(shè)。

    3.1 H1:運(yùn)營(yíng)數(shù)據(jù)異常程度與平臺(tái)風(fēng)險(xiǎn)呈正相關(guān)

    P2P平臺(tái)的運(yùn)營(yíng)數(shù)據(jù)主要包括借貸人數(shù)、借貸金額、預(yù)期收益率及平臺(tái)標(biāo)的信息等。上述運(yùn)營(yíng)數(shù)據(jù)在行業(yè)內(nèi)通常會(huì)有一個(gè)合理的取值區(qū)間,當(dāng)某些數(shù)據(jù)脫離此區(qū)間太遠(yuǎn)時(shí),平臺(tái)可能會(huì)產(chǎn)生相關(guān)問(wèn)題。例如平臺(tái)預(yù)期收益率遠(yuǎn)遠(yuǎn)高于行業(yè)平均水平,而平臺(tái)中顯示的標(biāo)的數(shù)量卻很少,則此時(shí)該平臺(tái)很有可能出現(xiàn)“資金池”現(xiàn)象。平臺(tái)運(yùn)營(yíng)數(shù)據(jù)是與其風(fēng)險(xiǎn)關(guān)聯(lián)最為直接的指標(biāo),數(shù)據(jù)越偏離合理區(qū)間,其面臨的風(fēng)險(xiǎn)就越大。

    3.2 H2:網(wǎng)絡(luò)負(fù)面輿情數(shù)量與平臺(tái)風(fēng)險(xiǎn)呈正相關(guān)

    網(wǎng)絡(luò)輿情是指由于各種事件刺激而產(chǎn)生的,并通過(guò)互聯(lián)網(wǎng)傳播和形成的人們對(duì)于該事件的所有認(rèn)知、態(tài)度、情感和行為傾向的集合[12]。網(wǎng)絡(luò)輿情來(lái)自于現(xiàn)實(shí)世界,同時(shí)又會(huì)從正面或負(fù)面反作用于現(xiàn)實(shí)世界,尤其是一些涉及民生、政風(fēng)等負(fù)面敏感事件,網(wǎng)絡(luò)會(huì)迅速將其變?yōu)槿駸嶙h的公共話題。因此,基于網(wǎng)絡(luò)輿情傳播的及時(shí)性與廣泛性等特點(diǎn),將有關(guān)P2P平臺(tái)的負(fù)面輿情比例作為其風(fēng)險(xiǎn)預(yù)警指標(biāo)是十分有效的。

    本文是通過(guò)各大新聞及行業(yè)協(xié)會(huì)網(wǎng)站、論壇、微博等搜集P2P平臺(tái)的相關(guān)文本信息,然后通過(guò)文本分類整理出其中所包含的負(fù)面信息(非法、虛假宣傳、投訴等),這些負(fù)面信息可以及時(shí)、全面地揭示平臺(tái)當(dāng)前存在的問(wèn)題,問(wèn)題越多,面臨的風(fēng)險(xiǎn)也就越大。

    3.3 H3:平臺(tái)及相關(guān)法人信用狀況與平臺(tái)風(fēng)險(xiǎn)呈負(fù)相關(guān)

    P2P平臺(tái)發(fā)生風(fēng)險(xiǎn)形成跑路的原因有兩種:一種是自身運(yùn)營(yíng)不當(dāng),一種是惡意集資詐騙。現(xiàn)實(shí)過(guò)程中,很多平臺(tái)以無(wú)風(fēng)險(xiǎn)、高收益等虛假宣傳來(lái)吸引客戶進(jìn)行投資理財(cái),實(shí)則是建立資金池以便自用。以上便涉及了平臺(tái)及法人的信用問(wèn)題,通過(guò)查詢平臺(tái)關(guān)聯(lián)企業(yè)及相關(guān)法人的信用信息和涉訴信息來(lái)對(duì)其信用度進(jìn)行判斷,其信用度越高、涉訴牽連越少,平臺(tái)風(fēng)險(xiǎn)就越低。

    3.4 H4:平臺(tái)背景實(shí)力與平臺(tái)風(fēng)險(xiǎn)呈負(fù)相關(guān)

    P2P平臺(tái)的背景實(shí)力主要包括其注冊(cè)與實(shí)繳資本金數(shù)量、合作擔(dān)保及資金托管機(jī)構(gòu)、關(guān)聯(lián)企業(yè)背景等。一些擁有國(guó)資上市公司背景的平臺(tái)一般不存在跑路、非法集資等惡性事件,另外其在資金和管理團(tuán)隊(duì)方面具有一定的優(yōu)勢(shì),能夠較好地應(yīng)對(duì)平臺(tái)中產(chǎn)生的逾期與壞賬。所以,平臺(tái)背景實(shí)力越強(qiáng),其擁有的風(fēng)險(xiǎn)將越低。

    在接下來(lái)的建模過(guò)程中,將會(huì)針對(duì)每一條假設(shè)建立相應(yīng)指標(biāo)字段,從而對(duì)其進(jìn)行驗(yàn)證。

    4 風(fēng)險(xiǎn)預(yù)警模型的建立

    整個(gè)模型構(gòu)建過(guò)程:首先是運(yùn)用不同的方法對(duì)大量原始數(shù)據(jù)進(jìn)行采集;然后需要對(duì)其進(jìn)行缺失值修補(bǔ)、異常值檢測(cè)等一系列的數(shù)據(jù)預(yù)處理,使原始數(shù)據(jù)格式規(guī)范統(tǒng)一,以滿足訓(xùn)練模型的要求;接著將處理后的數(shù)據(jù)分成訓(xùn)練樣本和測(cè)試樣本兩部分,將訓(xùn)練樣本帶入多種模型進(jìn)行機(jī)器學(xué)習(xí),同時(shí)利用測(cè)試樣本來(lái)驗(yàn)證不同模型的準(zhǔn)確性,并通過(guò)增減原始字段及進(jìn)一步的預(yù)處理來(lái)不斷優(yōu)化改進(jìn)模型的準(zhǔn)確性;最后則是平臺(tái)功能實(shí)現(xiàn)的展示。具體流程如圖1所示。

    4.1 數(shù)據(jù)采集

    平臺(tái)自身的運(yùn)營(yíng)不善及相關(guān)人員的惡意欺詐是P2P網(wǎng)貸平臺(tái)重要的風(fēng)險(xiǎn)構(gòu)成因素,這兩個(gè)因素在平臺(tái)的日常運(yùn)營(yíng)、誠(chéng)信記錄、涉訴情況及相關(guān)網(wǎng)絡(luò)輿情等方面均會(huì)有所表現(xiàn),因此這些信息可以作為風(fēng)險(xiǎn)預(yù)警的判斷依據(jù),信息集合如圖2所示。

    本文經(jīng)過(guò)深入研究,最終確立了與P2P平臺(tái)風(fēng)險(xiǎn)大小緊密相關(guān)的六大特征集合(如圖2內(nèi)環(huán)所示),即企業(yè)基本特征、運(yùn)營(yíng)狀況特征、模式與制度特征、平臺(tái)誠(chéng)信記錄、運(yùn)營(yíng)者信用信息及平臺(tái)宣傳信息,這六大特征集合完整地描述了相關(guān)平臺(tái)的背景實(shí)力、風(fēng)險(xiǎn)保障、標(biāo)的及利率、企業(yè)與個(gè)人信用、網(wǎng)絡(luò)新聞、社交輿情、涉訴等內(nèi)容。這些信息的來(lái)源(如圖2中環(huán)所示)主要包括工商注冊(cè)信息、平臺(tái)網(wǎng)站信息數(shù)據(jù)、宣傳信息數(shù)據(jù)、征信數(shù)據(jù)、銀行數(shù)據(jù)及其他數(shù)據(jù)。針對(duì)不同的數(shù)據(jù)來(lái)源還需要運(yùn)用不同的方法(如圖2外環(huán)所示)進(jìn)行采集,對(duì)于網(wǎng)絡(luò)中的結(jié)構(gòu)化數(shù)據(jù)及公開(kāi)的文本數(shù)據(jù),可利用相關(guān)軟件對(duì)其進(jìn)行自動(dòng)采集,如P2P平臺(tái)的運(yùn)營(yíng)數(shù)據(jù)、新聞報(bào)道及微博、論壇等社交信息;而針對(duì)網(wǎng)絡(luò)中一些特殊的非結(jié)構(gòu)化數(shù)據(jù)或者非互聯(lián)網(wǎng)的數(shù)據(jù),則選用人工調(diào)研搜集的方式,如平臺(tái)規(guī)模及背景實(shí)力等;最后對(duì)于其他機(jī)構(gòu)已經(jīng)搜集整理好的數(shù)據(jù),則采用數(shù)據(jù)庫(kù)導(dǎo)入或?qū)拥姆绞絹?lái)直接獲取。

    圖1 模型建立流程

    圖2 P2P網(wǎng)貸平臺(tái)的特征選取和數(shù)據(jù)采集

    本文實(shí)際采集了100家正常平臺(tái)和100家問(wèn)題平臺(tái)的上述所有特征集合數(shù)據(jù),并結(jié)合經(jīng)過(guò)專家評(píng)分后的專家?guī)鞌?shù)據(jù)共同作為模型訓(xùn)練時(shí)的數(shù)據(jù)源。

    4.2 數(shù)據(jù)預(yù)處理

    最初采集到的數(shù)據(jù)結(jié)構(gòu)類型各異,同時(shí)存在大量的缺失、異常等問(wèn)題,因此需要對(duì)其進(jìn)行一系列的預(yù)處理才能用于之后的數(shù)據(jù)挖掘與建模工作之中。本文主要的預(yù)處理過(guò)程包括以下幾步。

    4.2.1 文本信息處理

    對(duì)于原始數(shù)據(jù)中大量的新聞報(bào)道等非結(jié)構(gòu)化數(shù)據(jù),需要進(jìn)行語(yǔ)義分析及文本分類,將其轉(zhuǎn)換為相應(yīng)數(shù)值指標(biāo)。轉(zhuǎn)換過(guò)程為:通過(guò)關(guān)鍵詞自動(dòng)提取及人工判斷,選出可以區(qū)分不同主題(平臺(tái)非法性、平臺(tái)投訴類、平臺(tái)虛假宣傳類)的關(guān)鍵詞,然后運(yùn)用這些關(guān)鍵詞制定相應(yīng)的檢索表達(dá)式,以實(shí)現(xiàn)對(duì)相關(guān)信息的自動(dòng)分類檢索,最后將有關(guān)某家平臺(tái)的各個(gè)主題內(nèi)信息數(shù)量除以所有相關(guān)信息量,得出輿情投訴率等數(shù)值型指標(biāo)。

    4.2.2 缺失值處理

    在對(duì)平臺(tái)運(yùn)營(yíng)數(shù)據(jù)采集的過(guò)程中出現(xiàn)了一些數(shù)據(jù)缺失現(xiàn)象,針對(duì)此問(wèn)題,主要采用字段均值及擬合函數(shù)的方法來(lái)解決,而針對(duì)個(gè)別存在大量數(shù)據(jù)缺失的字段,則選擇直接棄用。

    4.2.3 異常值檢測(cè)

    在運(yùn)營(yíng)數(shù)據(jù)采集過(guò)程中還會(huì)出現(xiàn)少量的異常值,如果不對(duì)其進(jìn)行有效處理,則會(huì)嚴(yán)重影響模型分析效果。本文對(duì)于異常值的處理綜合采用了以下幾種方法:通過(guò)距離方法來(lái)檢測(cè),即設(shè)立一個(gè)閾值,將數(shù)據(jù)中與平均值之間的距離(歐式距離)大于這個(gè)閾值的點(diǎn)設(shè)為異常點(diǎn);通過(guò)聚類分析,相似或相鄰近的數(shù)據(jù)聚合在一起形成了各個(gè)聚類集合,而位于這些聚類集合之外的數(shù)據(jù)對(duì)象則被認(rèn)為是異常數(shù)據(jù);利用擬合函數(shù)法對(duì)數(shù)據(jù)進(jìn)行平滑處理以發(fā)現(xiàn)異常點(diǎn)。

    4.2.4 數(shù)據(jù)一致性處理

    在原始數(shù)據(jù)中,經(jīng)常會(huì)出現(xiàn)數(shù)據(jù)單位及類型不一致的現(xiàn)象,例如:有些平臺(tái)綜合利率采用月利率計(jì)算,有些則用年利率計(jì)算,此時(shí)就需要對(duì)其單位進(jìn)行統(tǒng)一,解決方法是在程序里使用正則匹配等方法來(lái)統(tǒng)一數(shù)據(jù)單位和數(shù)據(jù)類型。

    4.2.5 數(shù)據(jù)轉(zhuǎn)換

    最后,由于采集到的數(shù)據(jù)包含多種結(jié)構(gòu)類型,因此需要各個(gè)特征字段計(jì)算口徑統(tǒng)一才能用于模型的建立。針對(duì)不同的字段特征將選用以下幾種方法進(jìn)行處理。

    (1)歸一化

    歸一化是一種簡(jiǎn)化計(jì)算的方式,即將有量綱的表達(dá)式變換為無(wú)量綱的表達(dá)式,使數(shù)值的絕對(duì)值變?yōu)槟撤N相對(duì)值關(guān)系。由于建立的指標(biāo)取值區(qū)間相差較大,因此利用此方法對(duì)其進(jìn)行歸一化處理。歸一化轉(zhuǎn)換的方式包括線性函數(shù)轉(zhuǎn)換、對(duì)數(shù)函數(shù)轉(zhuǎn)換和反正切函數(shù)轉(zhuǎn)換3種,本文針對(duì)不同字段特征選擇不同的函數(shù)形式進(jìn)行轉(zhuǎn)換。

    (2)數(shù)據(jù)泛化

    數(shù)據(jù)泛化是一個(gè)從相對(duì)低層概念到更高層概念且對(duì)數(shù)據(jù)庫(kù)中與任務(wù)相關(guān)的大量數(shù)據(jù)進(jìn)行抽象概述的一個(gè)分析過(guò)程。本文主要是運(yùn)用主成分分析法對(duì)大量的原始特征字段進(jìn)行降維處理,排除一些相關(guān)性較強(qiáng)的無(wú)用字段,以提高建模過(guò)程的運(yùn)行速率與最終模型的準(zhǔn)確性。

    4.3 模型構(gòu)建與優(yōu)化

    本文將基于Spark分布式計(jì)算平臺(tái),利用機(jī)器學(xué)習(xí)方法選取多種模型來(lái)對(duì)訓(xùn)練樣本集進(jìn)行訓(xùn)練,并通過(guò)測(cè)試樣本集對(duì)其準(zhǔn)確性進(jìn)行檢驗(yàn),最終通過(guò)對(duì)原始數(shù)據(jù)字段及預(yù)處理的反復(fù)調(diào)整以期得出一個(gè)最優(yōu)的P2P平臺(tái)風(fēng)險(xiǎn)預(yù)警模型。在建模過(guò)程中,特征字段選取、模型選擇及結(jié)論解釋3部分內(nèi)容將是本部分研究的主要關(guān)注點(diǎn)。

    4.3.1 特征字段選取

    針對(duì)預(yù)處理之后大量的可用特征字段,需要通過(guò)相關(guān)性分析和卡方檢驗(yàn)等方法逐一驗(yàn)證這些特征與平臺(tái)欺詐事件的相關(guān)性,將對(duì)P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)影響不顯著的無(wú)效字段進(jìn)行有效剔除,以保證分析結(jié)果的準(zhǔn)確性及模型運(yùn)算效率。

    4.3.2 模型選擇

    能根據(jù)實(shí)時(shí)的數(shù)據(jù)集進(jìn)行學(xué)習(xí)并不斷修正優(yōu)化自身的判斷能力,是對(duì)優(yōu)質(zhì)模型的基本要求。由于模型輸出的風(fēng)險(xiǎn)指標(biāo)主要用于判斷P2P平臺(tái)存在欺詐的風(fēng)險(xiǎn)性,因此輸出變量是二項(xiàng)分布,且風(fēng)險(xiǎn)指標(biāo)必須是序數(shù)型變量??捎糜谠摲N情況的分析模型包括邏輯回歸、人工神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)等。系統(tǒng)為每一種備選模型進(jìn)行建模,通過(guò)對(duì)比并最終選擇出最佳的風(fēng)險(xiǎn)預(yù)警模型。

    4.3.3 結(jié)論解釋

    P2P平臺(tái)風(fēng)險(xiǎn)評(píng)估系統(tǒng)主要用于輔助系統(tǒng)使用者進(jìn)行決策。而系統(tǒng)使用者進(jìn)行決策后,往往需要向質(zhì)疑者提供充分的解釋。因此結(jié)論解釋功能尤為重要。例如當(dāng)系統(tǒng)面向某個(gè)平臺(tái)的某個(gè)風(fēng)險(xiǎn)指標(biāo)較高,系統(tǒng)使用者或者對(duì)象平臺(tái)直接質(zhì)疑系統(tǒng)的準(zhǔn)確性時(shí),就需要給出合理的解釋。而最佳的解釋依據(jù)應(yīng)當(dāng)為原始數(shù)據(jù)集合中的一般性統(tǒng)計(jì)結(jié)果。在機(jī)器學(xué)習(xí)的大多模型中,由于模型包含非線性的傳遞函數(shù),這使得模型通常具有較強(qiáng)的學(xué)習(xí)能力,但亦將輸入和輸出的直接聯(lián)系模糊化,增加了結(jié)論解釋的難度。在眾多的模型中,貝葉斯網(wǎng)絡(luò)是結(jié)論解釋能力較強(qiáng)的模型。其利用樸素貝葉斯理論的可逆推性,在輸出的結(jié)果與原始數(shù)據(jù)中的一般統(tǒng)計(jì)性結(jié)果中建立線性聯(lián)系,使得其結(jié)果較容易使用一般統(tǒng)計(jì)性結(jié)果進(jìn)行描述。

    圍繞以上3個(gè)核心問(wèn)題,在整個(gè)模型構(gòu)建與優(yōu)化的過(guò)程中,通過(guò)不斷地對(duì)比分析及交叉驗(yàn)證不同模型各個(gè)方面的表現(xiàn),以最終建立一個(gè)最佳的平臺(tái)風(fēng)險(xiǎn)預(yù)警模型。

    4.4 預(yù)警平臺(tái)功能展示

    整個(gè)建模過(guò)程最終的目的是搭建出可以面向用戶的P2P風(fēng)險(xiǎn)監(jiān)測(cè)預(yù)警平臺(tái)。該平臺(tái)可以實(shí)現(xiàn)兩方面的功能:對(duì)P2P平臺(tái)所面臨的風(fēng)險(xiǎn)進(jìn)行實(shí)時(shí)全面的評(píng)分,并針對(duì)其風(fēng)險(xiǎn)狀況生成詳細(xì)的風(fēng)險(xiǎn)分析報(bào)告,以為其風(fēng)險(xiǎn)的后續(xù)應(yīng)對(duì)工作提供必要的建議措施;多維度地展現(xiàn)行業(yè)整體風(fēng)險(xiǎn)情況,如將平臺(tái)按地區(qū)、時(shí)間、類型等不同內(nèi)容進(jìn)行風(fēng)險(xiǎn)分類統(tǒng)計(jì),以清晰直觀的方式滿足不同用戶的多樣化需求。

    5 結(jié)束語(yǔ)

    由于P2P行業(yè)在我國(guó)發(fā)展時(shí)間比較短,因此相比傳統(tǒng)金融機(jī)構(gòu),其在不斷的摸索創(chuàng)新過(guò)程中會(huì)面臨更加多樣的風(fēng)險(xiǎn)。而本文的創(chuàng)新之處正是在于將模型的建立與大數(shù)據(jù)相結(jié)合,借助于先進(jìn)的自動(dòng)文本采集、Spark分布式計(jì)算、文本挖掘等技術(shù)來(lái)建立更加全面的指標(biāo)體系,最終利用機(jī)器學(xué)習(xí)的方法對(duì)采集到的多維度歷史數(shù)據(jù)進(jìn)行反復(fù)的訓(xùn)練與改進(jìn),以構(gòu)建出一個(gè)準(zhǔn)確、有效的P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)預(yù)警模型。基于以上模型搭建的預(yù)警平臺(tái)通過(guò)數(shù)據(jù)每日自動(dòng)更新,便可實(shí)現(xiàn)對(duì)網(wǎng)貸企業(yè)的實(shí)時(shí)監(jiān)測(cè)預(yù)警,并從多種角度展現(xiàn)其風(fēng)險(xiǎn)狀況。該平臺(tái)不但可以用來(lái)協(xié)助政府監(jiān)管機(jī)構(gòu)開(kāi)展相關(guān)工作以有效地預(yù)防平臺(tái)跑路、詐騙等問(wèn)題事件的發(fā)生,還可以為廣大的平臺(tái)投資者提供投資風(fēng)險(xiǎn)警示以保障其資金安全。

    致謝

    本研究得到首都經(jīng)貿(mào)大學(xué)金融學(xué)院周曄老師、余穎豐老師以及北京大學(xué)常國(guó)珍博士的幫助,謹(jǐn)致謝意!

    [1] 陳文等. P2P中國(guó)式高收益?zhèn)顿Y指南. 北京: 機(jī)械工業(yè)出版社, 2015Chen W,et al. P2P Chinese High-Yield Bond Investing for Dummies. Beijing: China Machine Press, 2015

    [2] 黃葉苨, 齊曉雯. 網(wǎng)絡(luò)借貸中的風(fēng)險(xiǎn)控制. 金融理論與實(shí)踐, 2012(4): 101~105 Huang Y N, Qi X W. Risk control of the P2P lending. Financial Theory & Practice, 2012(4): 101~105

    [3] 胡旻昱, 孟慶軍. P2P網(wǎng)貸平臺(tái)發(fā)展中的風(fēng)險(xiǎn)及其系統(tǒng)分析. 武漢金融, 2014(6): 45~48 Hu M Y, Meng Q J. Risk of the developing P2P lending and its system analysis. Wuhan Finance, 2014(6): 45~48

    [4] 余及堯. 互聯(lián)網(wǎng)金融財(cái)務(wù)困境預(yù)警與監(jiān)管對(duì)策——基于2013-2014年P(guān)2P網(wǎng)貸平臺(tái)樣本數(shù)據(jù)分析. 福建金融, 2015(2): 42~47 Yu J Y. Internet financial early-warning and regulatory measures--based on P2P lending platform in 2013-2014 sample data analysis. Fujian Finance, 2015(2): 42~47

    [5] 馬玉娟. 互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)預(yù)警研究——以P2P網(wǎng)絡(luò)借貸模式為例(碩士學(xué)位論文). 錦州:遼寧工業(yè)大學(xué), 2015 Ma Y J. The warning research on internet financial risks--the study of P2P lending (master dissertation). Jinzhou: Liaoning University of Technology, 2015

    [6] 黃旭, 王素珍, 趙洋. P2P 平臺(tái): 發(fā)展與監(jiān)管.中國(guó)金融, 2014(5): 90~93 Huang X, Wang S Z, Zhao Y. P2P platform: the development and regulation. China Finance, 2014(5): 90~93

    [7] 李國(guó)杰, 程學(xué)旗. 大數(shù)據(jù)研究:未來(lái)科技及經(jīng)濟(jì)社會(huì)發(fā)展的重大戰(zhàn)略領(lǐng)域——大數(shù)據(jù)的研究現(xiàn)狀與科學(xué)思考. 中國(guó)科學(xué)院院刊, 2012(6): 647~657 Li G J, Cheng X Q. Big data research: the future of science and technology and economic and social development of major strategic areas--research status and scientific thinking of big data. Bulletin of Chinese Academy of Sciences, 2012(6): 647~657

    [8] 胡雄偉, 張寶林, 李抵飛. 大數(shù)據(jù)研究與應(yīng)用綜述(上). 標(biāo)準(zhǔn)科學(xué), 2013(9): 29~34 Hu X W, Zhang B L, Li D F. Overview of big data research and application (part A). Standard Science, 2013(9): 29~34

    [9] 黎連業(yè), 王安, 李龍.云計(jì)算基礎(chǔ)與實(shí)用技術(shù).北京: 清華大學(xué)出版社, 2013 Li L Y, Wang A, Li L. Cloud Foundations and Practical Technology. Beijing: Tsinghua University Press, 2013

    [10] Tom Mitchell. Machine Learning. New York: McGraw Hill Higher Education, 1997

    [11] 陳康, 向勇, 喻超. 大數(shù)據(jù)時(shí)代機(jī)器學(xué)習(xí)的新趨勢(shì). 電信科學(xué), 2012, 28(12): 88~95 Chen K, Xiang Y, Yu C. The new trend of big data era of machine learning. Telecommunications Science, 2012, 28(12): 88~95

    [12] 高承實(shí), 陳越, 榮星等. 網(wǎng)絡(luò)輿情幾個(gè)基本問(wèn)題的探討. 情報(bào)雜志, 2011(30): 52~56 Gao C S, Chen Y, Rong X,et al. Some basic problems on network opinion research. Journal of Intelligence, 2011(30): 52~56

    林春雨,男,現(xiàn)任北京拓爾思信息技術(shù)股份有限公司高級(jí)副總裁、助理研究員,負(fù)責(zé)公司大數(shù)據(jù)中心建設(shè)和云服務(wù)運(yùn)營(yíng)工作,在社會(huì)化媒體的技術(shù)運(yùn)營(yíng)和管理上有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn),其同時(shí)兼任北京金信網(wǎng)銀金融信息服務(wù)有限公司總經(jīng)理,為各地金融監(jiān)管機(jī)構(gòu)提供非法集資監(jiān)管服務(wù)。另外,作為國(guó)家信息安全專項(xiàng)輿情云服務(wù)項(xiàng)目組長(zhǎng)、中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟副秘書長(zhǎng),為多個(gè)國(guó)家部委、省級(jí)客戶、大型企事業(yè)單位提供過(guò)相關(guān)高端輿情服務(wù),并通過(guò)聯(lián)盟和產(chǎn)業(yè)對(duì)接,積極推動(dòng)大數(shù)據(jù)的發(fā)展。

    李崇綱,男,北京金信網(wǎng)銀金融信息服務(wù)有限公司常務(wù)副總經(jīng)理,拓爾思信息技術(shù)股份有限公司高級(jí)顧問(wèn),中國(guó)計(jì)算機(jī)學(xué)會(huì)大數(shù)據(jù)專家委員會(huì)委員,中關(guān)村互聯(lián)網(wǎng)金融協(xié)會(huì)副秘書長(zhǎng),中關(guān)村大數(shù)據(jù)產(chǎn)業(yè)聯(lián)盟專家組成員。專注于大數(shù)據(jù)在政府、金融等行業(yè)領(lǐng)域的應(yīng)用,擁有10多年網(wǎng)絡(luò)數(shù)據(jù)挖掘分析、互聯(lián)網(wǎng)大數(shù)據(jù)分析經(jīng)驗(yàn),擔(dān)任多家政府企業(yè)輿情管理咨詢顧問(wèn),是國(guó)內(nèi)首款輿情監(jiān)測(cè)系統(tǒng)的設(shè)計(jì)者,長(zhǎng)期跟蹤互聯(lián)網(wǎng)大數(shù)據(jù)行業(yè)變化。目前主持開(kāi)發(fā)國(guó)內(nèi)首個(gè)大數(shù)據(jù)防控金融信用風(fēng)險(xiǎn)與智能決策支持系統(tǒng)。

    許方圓,男,國(guó)網(wǎng)能源研究院能源決策支持技術(shù)研發(fā)中心中級(jí)工程師,主要從事智能電網(wǎng)技術(shù)和政策的分析研究,近年來(lái)主要研究方向?yàn)樾枨髠?cè)響應(yīng)實(shí)施與應(yīng)用、電力系統(tǒng)中的數(shù)據(jù)挖掘應(yīng)用、全球能源互聯(lián)網(wǎng),發(fā)表論文10余篇。

    許會(huì)泉,男,北京金信網(wǎng)銀金融信息服務(wù)有限公司研發(fā)總監(jiān),負(fù)責(zé)公司互聯(lián)網(wǎng)金融、機(jī)器學(xué)習(xí)、大數(shù)據(jù)產(chǎn)品研發(fā)、管理工作,在計(jì)算機(jī)系統(tǒng)架構(gòu)設(shè)計(jì)、大數(shù)據(jù)應(yīng)用、輿情產(chǎn)品應(yīng)用等方面具有豐富的實(shí)戰(zhàn)經(jīng)驗(yàn),近年負(fù)責(zé)主持研發(fā)了公司金融大數(shù)據(jù)打非監(jiān)測(cè)預(yù)警云平臺(tái)、互聯(lián)網(wǎng)金融風(fēng)險(xiǎn)模型等多個(gè)大數(shù)據(jù)產(chǎn)品。

    石磊,男,北京金信網(wǎng)銀金融信息服務(wù)有限公司互聯(lián)網(wǎng)金融行業(yè)數(shù)據(jù)分析師,主要負(fù)責(zé)研究行業(yè)目前所具有的非法集資風(fēng)險(xiǎn)特征,并基于大數(shù)據(jù)對(duì)相關(guān)企業(yè)風(fēng)險(xiǎn)進(jìn)行監(jiān)測(cè)與評(píng)判,擁有豐富的理論及實(shí)戰(zhàn)經(jīng)驗(yàn)。

    盧祥虎,男,北京金信網(wǎng)銀金融信息服務(wù)有限公司機(jī)器學(xué)習(xí)算法工程師,目前從事P2P風(fēng)險(xiǎn)預(yù)警建模相關(guān)的算法設(shè)計(jì)工作,在機(jī)器學(xué)習(xí)算法領(lǐng)域具有一定的理論與實(shí)戰(zhàn)經(jīng)驗(yàn),擅長(zhǎng)機(jī)器學(xué)習(xí)中數(shù)學(xué)算法的優(yōu)化與改進(jìn)等。

    Lin C Y, Li C G, Xu F Y,et al. A model of pre-warning based on the big data technology for P2P lending platform. Big Data Research, 2015037

    A Model of Pre-Warning Based on the Big Data Technology for P2P Lending Platform

    Lin Chunyu1, Li Chonggang1, Xu Fangyuan2, Xu Huiquan1, Shi Lei1, Lu Xianghu1

    1. Beijing JinXinWangYin Financial Information Service Co., Ltd., Beijing 100101, China;

    2. State Grid Energy Research Institute, Beijing 100101, China

    In recent years, P2P lending industry in China has appeared a lot of escape events in the process of its rapid development. Bases on deep analysis of the related concepts for P2P lending and big data, combining innovatively the risk pre-warning of platform with big data, an effective risk pre-warning model of P2P lending platform was constructed according to the collection of huge amounts of data, big data technology including Spark distributed computation and machine learning. Based on the establishment of multi-dimensional risk assessment, the model can be achieved on real-time, accurate, comprehensive monitoring for the risk of P2P lending, thus effectively reducing the frequency of financial fraud, escape malicious event, so as to the majority of investors’ money to maintain security and social stability.

    internet financial, P2P lending, big data, risk pre-warning, machine learning

    10.11959/j.issn.2096-0271.2015037

    2015-09-30

    林春雨,李崇綱,許方圓等. 基于大數(shù)據(jù)技術(shù)的P2P網(wǎng)貸平臺(tái)風(fēng)險(xiǎn)預(yù)警模型. 大數(shù)據(jù), 2015037

    猜你喜歡
    網(wǎng)貸模型
    一半模型
    p150Glued在帕金森病模型中的表達(dá)及分布
    重要模型『一線三等角』
    重尾非線性自回歸模型自加權(quán)M-估計(jì)的漸近分布
    P2P網(wǎng)貸中的消費(fèi)者權(quán)益保護(hù)
    P2P網(wǎng)貸頻繁“爆雷”的分析與對(duì)策
    網(wǎng)貸平臺(tái)未來(lái)亟需轉(zhuǎn)型
    商周刊(2017年17期)2017-09-08 13:08:58
    網(wǎng)貸十年:迎來(lái)“去偽存真” 時(shí)代
    商周刊(2017年17期)2017-09-08 13:08:58
    3D打印中的模型分割與打包
    網(wǎng)貸行業(yè)的SWOT分析
    彝良县| 惠来县| 绩溪县| 镇赉县| 德令哈市| 钟祥市| 乌拉特中旗| 安新县| 社会| 禹州市| 定兴县| 田林县| 常熟市| 东明县| 炉霍县| 德保县| 库车县| 湟中县| 林周县| 象州县| 济南市| 申扎县| 博野县| 南平市| 霸州市| 平顶山市| 平潭县| 曲阳县| 泊头市| 南川市| 旌德县| 当涂县| 蓬溪县| 南郑县| 德保县| 宜君县| 专栏| 长兴县| 台东县| 丹阳市| 和平区|