李志強,余炫樸
(江西財經(jīng)大學(xué) 統(tǒng)計學(xué)院,江西 南昌 330013)
隨著我國社會、經(jīng)濟的不斷發(fā)展,信用逐漸融入生活中的方方面面。誠信不僅是中華民族的傳統(tǒng)美德,而且是我國社會主義核心價值觀中公民基本道德規(guī)范的重要內(nèi)容。《社會信用體系建設(shè)規(guī)劃綱要(2014—2020年)》明確指出,社會信用體系是社會主義市場經(jīng)濟體制和社會治理體制的重要組成部分。近年來,我國高校中的學(xué)術(shù)不端、考試舞弊、校園非法借貸、證書造假等現(xiàn)象屢見不鮮,其部分案例對社會造成了嚴重的負面影響。因此,建立以大學(xué)生為主體的學(xué)術(shù)信用評價體系是維持社會經(jīng)濟穩(wěn)定運行和高校健康發(fā)展不可或缺的重要環(huán)節(jié)。中共教育部黨組和共青團中央聯(lián)合印發(fā)了《關(guān)于在各級各類學(xué)校推動培育和踐行社會主義核心價值觀長效機制建設(shè)的意見》,該意見明確指出,我國將建立健全內(nèi)容包含學(xué)業(yè)誠信、學(xué)術(shù)誠信、經(jīng)濟誠信、就業(yè)誠信在內(nèi)的大學(xué)生誠信檔案。2020年5月,教育部數(shù)據(jù)顯示,2019年全國各類高等學(xué)校在學(xué)總規(guī)模達4 002萬人。大學(xué)生已然成為不可忽視的重要社會群體。所以大學(xué)生學(xué)術(shù)信用研究不僅是我國高校急須面對的重要課題,而且是保障我國未來社會穩(wěn)定發(fā)展的基本要求。
我國大學(xué)生學(xué)術(shù)信用研究尚處于萌芽期,以往學(xué)者們普遍認為學(xué)術(shù)失信行為多發(fā)生在高校教師群體。目前越來越多的大學(xué)生參與學(xué)術(shù)研究,所以大學(xué)生學(xué)術(shù)誠信教育及其相關(guān)研究應(yīng)得到重視。但在現(xiàn)階段,與我國大學(xué)生學(xué)術(shù)信用研究相關(guān)的內(nèi)容大多圍繞大學(xué)生誠信建設(shè)與學(xué)業(yè)信用研究。于俊如、徐世強認為入世后誠信是現(xiàn)代市場經(jīng)濟條件下對大學(xué)生人格前提的基本要求[1]。江陽剛在對大學(xué)生誠信問題現(xiàn)狀的調(diào)查與分析中發(fā)現(xiàn),樣本中15.7%的被調(diào)查者對他人缺乏信任感,66.9%的被調(diào)查者對身邊的人信任感一般[2]。喻名峰、陳成文、李恒全在回顧2001年至2011年大學(xué)生就業(yè)問題時指出,大學(xué)生就業(yè)誠信問題是導(dǎo)致“就業(yè)難”的原因之一[3]。王藝對近15年我國青年信用建設(shè)相關(guān)政策性文件進行了梳理,共有34項相關(guān)文件及報道,具體數(shù)字見表1。經(jīng)過梳理后得出結(jié)論,這些相關(guān)政策文件內(nèi)容主要針對信用管理與體系的建設(shè)及守信激勵和失信懲罰兩個部分[4]。
表1 近15年我國青年信用建設(shè)相關(guān)政策性文件
目前,我國的大學(xué)生學(xué)術(shù)信用工作尚處于誠信檔案建設(shè)階段,大學(xué)生信用評價體系的建設(shè)也在不斷探索與完善中。不同于金融領(lǐng)域的信用,大學(xué)生信用指的是以學(xué)業(yè)信用為主體,并與社交信用、經(jīng)濟信用一起共同組成的信用體系。因此,大學(xué)生誠信建設(shè)不僅記錄了大學(xué)生在學(xué)校內(nèi)的誠信信息,而且記錄了其在校外活動中所產(chǎn)生的信用狀況。這些大數(shù)據(jù)都可用于大學(xué)生的信用及核心素養(yǎng)評估[5]。正因為大數(shù)據(jù)與通信技術(shù)上的不斷突破,互聯(lián)網(wǎng)數(shù)據(jù)與線下數(shù)據(jù)的相互補充為完善個人信用信息創(chuàng)造了巨大的可能性。盡管如此,我國大學(xué)生誠信建設(shè)與學(xué)業(yè)信用研究還存在著以下問題:
無論是大學(xué)生誠信檔案建設(shè)還是學(xué)業(yè)信用研究,若按照大學(xué)生信用信息發(fā)生的地點分類,可以分為校園內(nèi)信用信息與校園外信用信息。校園內(nèi)信用信息通常指的是學(xué)業(yè)信用,但包含了校園內(nèi)發(fā)生的社交信用與經(jīng)濟信用,如與同學(xué)間的經(jīng)濟不誠信、學(xué)費拖欠、校園活動中的不誠信行為等。若按照信息自身特質(zhì)分類,大學(xué)生信用信息可以分為學(xué)業(yè)信用、社交信用、經(jīng)濟信用等。這些類別的信息通常由不同主體進行收集,如學(xué)業(yè)信用信息及相關(guān)檔案被保存于網(wǎng)絡(luò)社交軟件中,而經(jīng)濟信用信息則是由相關(guān)金融機構(gòu)收集的。因此,無論從地點還是特質(zhì)分類,大學(xué)生誠信建設(shè)中需記錄的信用信息種類十分繁雜,獲取大學(xué)生完整的信用記錄難度大。
數(shù)據(jù)平臺壁壘指的是不同平臺的數(shù)據(jù)由于法律法規(guī)的限制無法進行信息互通。如上所述,大學(xué)生信用建設(shè)中的數(shù)據(jù)通常包含學(xué)業(yè)信用、社交信用與經(jīng)濟信用,這三類信用數(shù)據(jù)收集平臺為高校、社交平臺與金融機構(gòu)。平臺不同其監(jiān)管部門也不一致,這就導(dǎo)致了不同平臺間數(shù)據(jù)互通困難的現(xiàn)象。
數(shù)據(jù)結(jié)構(gòu)壁壘指的是數(shù)據(jù)自身結(jié)構(gòu)之間相互轉(zhuǎn)化較為復(fù)雜。大學(xué)生信用數(shù)據(jù)通常分為結(jié)構(gòu)化數(shù)據(jù)與非結(jié)構(gòu)化數(shù)據(jù),結(jié)構(gòu)化數(shù)據(jù)可以表現(xiàn)為二維形式的數(shù)據(jù),非結(jié)構(gòu)化數(shù)據(jù)則是沒有固定結(jié)構(gòu)的數(shù)據(jù),它可以是文本、圖片、音頻及視頻等數(shù)據(jù)。在大學(xué)生信用數(shù)據(jù)當(dāng)中,學(xué)業(yè)信用數(shù)據(jù)與經(jīng)濟信用數(shù)據(jù)均為結(jié)構(gòu)化數(shù)據(jù),社交信用數(shù)據(jù)由于其多樣化特點一般為非結(jié)構(gòu)化數(shù)據(jù)。將這些非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)后才能有效地對大學(xué)生信用進行評價。
成本壁壘指的是實現(xiàn)數(shù)據(jù)互通所需成本較高。這些成本包含了數(shù)據(jù)收集、篩選、處理的成本,出臺相關(guān)法律法規(guī)產(chǎn)生的成本,以及數(shù)據(jù)結(jié)構(gòu)間轉(zhuǎn)化的成本。隨著通信技術(shù)與計算機技術(shù)的不斷發(fā)展,大數(shù)據(jù)技術(shù)應(yīng)用愈發(fā)廣泛,這為大學(xué)生信用數(shù)據(jù)互通提供了良好的技術(shù)基礎(chǔ)。在實踐應(yīng)用中,由于政策、技術(shù)、經(jīng)濟等相關(guān)因素的制約,學(xué)業(yè)信用、社交信用與經(jīng)濟信用間的數(shù)據(jù)互通還未能完全實現(xiàn)。
2019年,國務(wù)院辦公廳印發(fā)了《關(guān)于加快推進社會信用體系建設(shè)構(gòu)建以信用為基礎(chǔ)的新型監(jiān)管機制的指導(dǎo)意見》,該意見在信用監(jiān)督建設(shè)方面提出了六項目標:健全失信聯(lián)合懲戒對象認定機制;督促失信市場主體限期整改;深入開展失信聯(lián)合懲戒;堅決依法依規(guī)實施市場和行業(yè)禁入措施;依法追究違法失信責(zé)任;探索建立信用修復(fù)機制。近年來,我國多地在信用聯(lián)合懲戒方面取得了一定的成效,基本實現(xiàn)了失信人“一處失信,處處受限”。信用聯(lián)合懲戒彌補了信用治理中的部分缺陷,提升了信用治理效率,但在復(fù)雜的失信情景中,懲戒措施常常忽略了其關(guān)聯(lián)性原則與比例性原則[7]。在信用修復(fù)機制建設(shè)方面,我國納稅信用管理體系的核心內(nèi)容分為失信懲戒與守信激勵,就目前我國信用建設(shè)情況而言,守信激勵機制的建立還有所欠缺,一定程度上導(dǎo)致了征納關(guān)系的失衡不能得到及時矯正,從而造成了“雙輸”的局面[8]。
大學(xué)生群體的特殊性使信用獎懲制度建設(shè)比納稅信用中的懲戒與激勵制度建設(shè)更困難。盡管如此,在國家的號召與政策的指導(dǎo)下,我國高校在建設(shè)大學(xué)生信用獎懲制度方面不斷探索。2019年10月我國某高校(以下簡稱A校)發(fā)布了《本科學(xué)生誠信評級獎懲制度(試行)》。該獎懲制度分為信用減分與加分信用兩部分。在信用懲戒制度的建設(shè)中,A校將誠信行為種類分為六個項目,分別是學(xué)業(yè)誠信、生活誠信、經(jīng)濟誠信、就業(yè)誠信、網(wǎng)絡(luò)誠信、安全誠信。這些項目下又含有15個評價內(nèi)容與45個信用評價指標。A校在懲戒制度上采用了扣分與信用降級的綜合性懲戒方式,但在信用獎勵中只簡單地羅列了參加校內(nèi)外活動、參加科研類活動、校內(nèi)外榮譽獎項、學(xué)風(fēng)幫扶工作及參與集體榮譽建設(shè)五項內(nèi)容。而其他高校的信用激勵制度建設(shè)還停留在取消處罰、處分等基礎(chǔ)激勵手段層面。由此可見,大學(xué)生信用獎懲制度建設(shè)存在與納稅信用中同樣的問題,信用激勵建設(shè)與信用懲戒建設(shè)發(fā)展失衡。
解決現(xiàn)階段大學(xué)生學(xué)術(shù)信用管理中存在的問題是一項需要長期研究的課題,其內(nèi)容包括信息技術(shù)、統(tǒng)計學(xué)與社會學(xué)等多學(xué)科交叉。本文基于現(xiàn)有的大學(xué)生信用相關(guān)研究,結(jié)合大數(shù)據(jù)技術(shù)與統(tǒng)計學(xué)方法,為平衡大學(xué)生誠信建設(shè)中獎懲制度提供客觀的、可靠的評價依據(jù)。多元線性回歸分析是統(tǒng)計學(xué)經(jīng)典的方法之一,是根據(jù)因變量與多個自變量的實際觀測值建立因變量對多個自變量的線性回歸方程[9],也是常用的分類器之一。大學(xué)生學(xué)術(shù)失信預(yù)測是典型的二分類問題,是根據(jù)大學(xué)生各項信用狀況對大學(xué)生產(chǎn)生學(xué)術(shù)失信可能性的預(yù)測。此類樣本集數(shù)據(jù)通常不具備正態(tài)分布的特點,因此大學(xué)生學(xué)術(shù)失信預(yù)測模型中的分類器采用線性邏輯回歸分析(LR)。大學(xué)生學(xué)術(shù)失信樣本數(shù)量一般遠遠小于守約樣本,數(shù)據(jù)集通常表現(xiàn)為不平衡狀態(tài)。合成少數(shù)類過采樣技術(shù)(SMOTE)是一種解決類別分布不平衡分類問題的抽樣方法。該算法的核心思想是:對于每個少數(shù)樣本,從這個樣本的最鄰近隨機選擇一個樣本,在這兩個樣本之間的連線上隨機選擇一點便是合成的新樣本。薛薇采用SMOTE算法對非平衡數(shù)據(jù)集進行再抽樣處理后得到新的數(shù)據(jù)集。實驗表明,分類器在新的數(shù)據(jù)集的正負兩類上均可獲得理想的分類效果[10]。衣柏衡等將改進后的SMOTE算法用于某小額貸款公司客戶信用風(fēng)險評估案例中,其分類精確度有所提升[11]。Chetna Kumari等運用SMOTE算法處理生物活性數(shù)據(jù)中的類別不平衡問題[12]。因此,本文基于SMOTE-LR來設(shè)計大學(xué)生學(xué)術(shù)失信預(yù)測模型,根據(jù)預(yù)測結(jié)果能夠判斷大學(xué)生學(xué)術(shù)信用狀況的好壞。
大學(xué)生學(xué)術(shù)失信預(yù)測研究離不開信用評價的發(fā)展,而評價指標體系是綜合評價中的重要內(nèi)容。蘇為華認為,評價指標體系理論應(yīng)包括構(gòu)建原則、構(gòu)建方法、測驗方法、優(yōu)化方法、單項指標設(shè)計方法、指標變換理論和定性變量的數(shù)量化技術(shù)六個方面[13]。如上所述,大學(xué)生信用評價體系的構(gòu)建與場景應(yīng)用尚處在探索階段,國內(nèi)眾多學(xué)者都嘗試構(gòu)建、優(yōu)化大學(xué)生信用評價指標體系。侯雨欣、王沖運用德爾菲法與因子分析相結(jié)合的方法確立了一套大學(xué)生信用評價的指標框架,該指標框架包含學(xué)業(yè)信用、經(jīng)濟信用、生活信用與社會信用四個維度,具體評價指標內(nèi)容見表2[14]。該框架的提出對建設(shè)我國大學(xué)生信用評價體系有著積極的作用。依據(jù)蘇為華提出的構(gòu)造綜合評價指標體系的全面性原則、科學(xué)性原則、層次性原則、目的性原則與可比性原則[13],此評價指標體系設(shè)置合理,具有一定的現(xiàn)實指導(dǎo)意義。盡管如此,表2所示的大學(xué)生信用評價指標在可行性方面還需進行進一步的驗證,如三級指標中I16信用數(shù)據(jù)是由相關(guān)金融機構(gòu)進行記錄的,而借貸記錄是信用評價指標中不可忽略的內(nèi)容;I26“愛占便宜”是由被評價個體的同學(xué)及老師提供的信息,而這類信息帶有很強的主觀性。
表2 基于德爾菲法與因子分析的大學(xué)生信用評價指標
基于侯雨欣等的大學(xué)生信用評價指標,本文結(jié)合調(diào)查對象所在學(xué)校的實際狀況、綜合評價的可行性及觀測效果,對大學(xué)生學(xué)業(yè)失信預(yù)測模型的設(shè)計與優(yōu)化進行進一步的信用評價指標合并與篩選[14]。在調(diào)查對象所在的高校,I7與I8經(jīng)常是作為一項數(shù)據(jù)進行統(tǒng)計,故將其合并為“篡改實驗數(shù)據(jù)或研究結(jié)果”;I11與I12中的“無故逾期”與“惡意拖欠”無法準確界定,故合并后更改為“逾期繳納學(xué)費的情況”;I13與I14因為在表2中是在“學(xué)費貸款”二級指標中,故將其修改為“逾期償還助學(xué)貸款”;I17因為處在“個人消費”二級指標中,應(yīng)區(qū)分于二級指標“學(xué)費貸款”,故將其與I16合并為“不良校外信貸記錄”;I20、I21與其他指標存在較多重合,故在此刪除;I23與I24在調(diào)查統(tǒng)計時存在較大重合面,故將其合并為“與朋友、同學(xué)相處,不守時、不守約定”;I26主觀性較強,故明確了“愛占便宜”的具體事項,更改為“與同學(xué)、朋友相處,在經(jīng)濟條件良好的情況下,集體社交活動中,經(jīng)常使用他人物品或錢財”;I27、I28中提到“擔(dān)任學(xué)生干部”,調(diào)查對象是高校大學(xué)生,并不是高校學(xué)生干部,故分別將其更改為“老師對你的不良評價”與“同學(xué)對你的不良評價”;I30與I31在調(diào)查對象所在高校均為實踐與課外活動,故將其合并為“在實踐與課外活動中,你的不良評價”;在二級指標“求職信用”中,調(diào)查對象均為在校大學(xué)生,故將原本三級指標更替為“評選學(xué)生干部,簡歷中存在虛假信息”“尋找兼職與工作時,簡歷中存在虛假信息”“尋找兼職與工作時,隱瞞學(xué)校處分”與“在兼職與實習(xí)中,提前結(jié)束實習(xí)”。最終,大學(xué)生信用評價指標共涉及4項一級指標與25項二級指標(見表3)。
首先,重點發(fā)展傳統(tǒng)專業(yè)。傳統(tǒng)專業(yè)是高職學(xué)校從建校以來在此方面就一直很有建樹的專業(yè),在長期的教學(xué)過程中,不但有專業(yè)師資隊伍,還形成了獨特的培養(yǎng)模式。對此,高職學(xué)校就應(yīng)該在自己優(yōu)勢專業(yè)的基礎(chǔ)上,迎合時代發(fā)展潮流,繼續(xù)增強優(yōu)勢專業(yè)的社會地位,讓優(yōu)勢專業(yè)成為學(xué)校的名片,在此基礎(chǔ)上廣泛吸收社會各種資源,從而進行其他專業(yè)的開設(shè)。
表3 大學(xué)生信用評價指標
構(gòu)建大學(xué)生學(xué)術(shù)失信預(yù)測模型的現(xiàn)實意義是:根據(jù)大學(xué)生的社會信用、經(jīng)濟信用、生活信用與學(xué)業(yè)信用中的各項信用狀況,判斷其產(chǎn)生學(xué)術(shù)失信行為的可能性,結(jié)果表示大學(xué)生學(xué)術(shù)信用狀況的“好”與“壞”。為了了解在校大學(xué)生信用狀況及獲得大學(xué)生學(xué)術(shù)失信預(yù)測模型的數(shù)據(jù),根據(jù)大學(xué)生信用評價指標中的25項二級評價指標,設(shè)計了大學(xué)生信用狀況調(diào)查問卷,調(diào)查問卷共25個選項,要求填寫人填寫是否存在二級指標中闡述的信用狀況,或“是”或“否”。問卷中不出現(xiàn)任何個人信息以保證問卷內(nèi)容的真實性及隱私性。完成調(diào)查問卷設(shè)計后,向南昌師范學(xué)院本科在校生發(fā)放了1 000份調(diào)查問卷,共回收948份有效的、完整的調(diào)查問卷。
首先,對回收的調(diào)查問卷進行編輯,問卷中選擇“是”的標記為“1”,選擇“否”的標記為“0”,編輯后為原始樣本集,其現(xiàn)實意義解釋為:“1”代表在該項評價指標下,被調(diào)查對象存在失信行為;“0”代表在該項評價指標下,被調(diào)查對象不存在失信行為;其次,在構(gòu)建失信預(yù)測模型前,需對樣本集A進行數(shù)據(jù)處理。因為學(xué)術(shù)誠信主要體現(xiàn)在考試、實驗、論文及其他科學(xué)研究,因此,在大學(xué)生信用評價的25項指標中,“學(xué)校記錄的考試違紀”“篡改實驗數(shù)據(jù)或研究結(jié)果”“論文(包含課程論文及作業(yè)中的小論文)中直接抄襲他人學(xué)術(shù)成果行為”“科研經(jīng)費與資源不當(dāng)使用”屬于學(xué)術(shù)失信行為,這四項指標將作為判斷學(xué)業(yè)是否存在學(xué)術(shù)失信行為的標準。數(shù)據(jù)處理具體操作為:對單個樣本中的“學(xué)校記錄的考試違紀”“篡改實驗數(shù)據(jù)或研究結(jié)果”“論文(包含課程論文及作業(yè)中的小論文)中存在直接抄襲他人學(xué)術(shù)成果行為”“科研經(jīng)費與資源不當(dāng)使用”數(shù)據(jù)進行算術(shù)相加,若結(jié)果等于0,那么記作結(jié)果“0”,若結(jié)果大于0,那么記作結(jié)果“1”,這些算術(shù)相加后的數(shù)據(jù)結(jié)果記在新變量“學(xué)術(shù)失信”下。其現(xiàn)實意義解釋為:只要樣本個體存在考試違紀、篡改實驗數(shù)據(jù)或研究結(jié)果、論文(包含課程論文及作業(yè)中的小論文)中存在直接抄襲他人學(xué)術(shù)成果行為、科研經(jīng)費與資源不當(dāng)使用的任意一項行為都將被認為是學(xué)術(shù)失信。處理后的數(shù)據(jù)記作樣本集A。在樣本集A中共有118人存在學(xué)術(shù)失信行為。最后為了確認樣本集A的可靠性,對樣本集A進行問卷可靠性信度分析,可靠性分析采用SPSS25.0軟件對調(diào)查數(shù)據(jù)進行研究,其具體結(jié)果見表4。Cronbachα系數(shù)為0.806,大于0.8,證明樣本集A信度質(zhì)量高,可以用于下一步模型的構(gòu)建。
表4 樣本集A可靠性分析
在線性邏輯回歸的函數(shù)表達式中(公式1.1),p表示結(jié)果為“1”發(fā)生的概率,也就是大學(xué)生學(xué)術(shù)失信的概率。1-p表示結(jié)果為“0”發(fā)生的概率,β表示需估計的模型參數(shù),而在個人信用評分的應(yīng)用中,p是最終需要計算的概率[15]251-266。
(1)
為了便于模型的設(shè)計與檢驗,將樣本集中的22個變量處理后得到新的樣本集B:Y學(xué)術(shù)失信;X1無故遲到;X2無故早退;X3老師記錄的課程作業(yè)抄襲;X4圖書館不良借還記錄;X5逾期繳納學(xué)費的情況;X6逾期償還助學(xué)貸款;X7隱瞞家庭真實情況,申請助學(xué)貸款、助學(xué)金等學(xué)校資助;X8不良校外信貸記錄;X9虛報信息向家長索要“考試費”等費用;X10缺席學(xué)校內(nèi)任何集體活動;X11向家長隱瞞或謊報成績或處分的行為;X12與朋友、同學(xué)相處,不守時、不守約定的行為;X13與朋友、同學(xué)相處,借物不還;X14與同學(xué)、朋友相處,在經(jīng)濟條件良好的情況下,集體社交活動中,經(jīng)常使用他人物品或錢財;X15老師對你的不良評價;X16同學(xué)對你的不良評價;X17在實踐與課外活動中,你的不良評價;X18評選學(xué)生干部,簡歷中存在虛假信息;X19尋找兼職與工作時,簡歷中存在虛假信息;X20尋找兼職與工作時,隱瞞學(xué)校處分情況;X21在兼職與實習(xí)中,提前結(jié)束實習(xí)。Xn代表大學(xué)生的各類信用狀況,Y代表大學(xué)生是否存在學(xué)術(shù)失信行為。根據(jù)公式(2),LR方程表達式如下:
(2)
將樣本集B采用Python3.7軟件實現(xiàn)LR分類,得出分類效果:F1_score:0.352;Accuracy_score:0.884;Recall_score:0.257;Precision_score:0.562;AUC:0.73。盡管AUC大于0.7具有一定的準確性,但是召回率分數(shù)與F1分數(shù)均小于0.5,分類效果并不理想。通過對樣本集觀測發(fā)現(xiàn),學(xué)術(shù)失信樣本只占總樣本的12.45%,因此考慮樣本分布不均衡導(dǎo)致的分類效果不佳。為了解決樣本分布不平衡的問題,采用Python3.7軟件對樣本集進行SMOTE算法。采用Python3.7軟件對樣本集B進行SMOTE算法,糾正樣本不平衡后,得到樣本集C,共1 660項數(shù)據(jù)。樣本比例見圖1。
圖1 樣本集“0”“1”比例
將得到均衡比例的樣本集C運用Python3.7軟件,實現(xiàn)LR分類,得出分類效果:F1_score:0.720;Accuracy_score:0.748;Precision_score:0.813;Recall_score:0.647;AUC:0.783。對比樣本集B得出的分類效果、ROC曲線和AUC(如圖2)發(fā)現(xiàn):F1、召回率與精確度分數(shù)得到了顯著的提升,AUC分數(shù)也得到了7.2%的提升,該模型分類的準確性得到了一定的提升。準確率分數(shù)有所下降是因為樣本均衡后,結(jié)果為“0”的樣本比例下降,結(jié)果為“1”的樣本比例增加后帶來的準確率變動。最終SMOTE-LR模型下的失信預(yù)測模型表達式為:
圖2 ROC曲線與AUC對比
ln(p/1-p)=-0.883+1.048*X1-0.399*X2+2.270*X3+1.942*X4-1.318*X5-22.993*X6-20.623*X7-2.424*X8-0.112*X9+1.687*X10+0.277*X11+0.593*X12+0.706*X13-0.487*X14+0.711*X15-1.547*X16+0.843*X17-1.498*X18-0.941*X19-1.372*X20-1.609*X21
SMOTE-LR模型是根據(jù)大學(xué)生學(xué)業(yè)信用、經(jīng)濟信用、生活信用與社會信用的狀況,對大學(xué)生發(fā)生學(xué)術(shù)失信的可能性進行預(yù)測,是管理大學(xué)生學(xué)術(shù)誠信問題行之有效的辦法。在大學(xué)生信用建設(shè)工作中,預(yù)測模型能夠幫助高校教師動態(tài)地掌握大學(xué)生產(chǎn)生學(xué)術(shù)失信的可能性,從而及時對“高風(fēng)險”的大學(xué)生采取必要的教育措施。在其他場景應(yīng)用中,SMOTE-LR模型是反映大學(xué)生學(xué)術(shù)誠信狀況的有效方法之一,為社會中其他活動提供了對大學(xué)生在道德品質(zhì)上科學(xué)的、客觀的評價。
《國家中長期人才發(fā)展規(guī)劃綱要(2010—2020年)》明確指出,人才是我國經(jīng)濟社會發(fā)展的第一資源。大學(xué)生作為我國青年主力軍,亦是未來各行各業(yè)中的人才儲備。大學(xué)生信用評價得出的評價等級代表其在大學(xué)期間的誠信質(zhì)量等級,評價等級越高表示其誠信度越可靠。董博在對中國人才發(fā)展治理的相關(guān)研究中認為,“人才”“人才發(fā)展”“人才發(fā)展治理”是三個逐層遞進的概念[16]。人才的挖掘與發(fā)展是人才強國的有效方法,而做好人才發(fā)展治理是我國社會穩(wěn)步增長的需要,是建設(shè)中國特色社會主義社會的重要保障。我國現(xiàn)階段的經(jīng)濟制度是以公有制為主體,多種所有制經(jīng)濟共同發(fā)展。在這種經(jīng)濟制度下,誠信是我國優(yōu)秀人才必備的首要條件,是保障我國經(jīng)濟穩(wěn)定發(fā)展的重要因素。2018年2月,國務(wù)院辦公廳印發(fā)了《關(guān)于分類推進人才評價機制改革的指導(dǎo)意見》,該意見指出我國在人才評價方面存在諸多問題,如標準單一、評價方法趨同、分類評價不足等。該意見還強調(diào)了分類健全人才評價標準需突出品德評價,品德是人才評價的首要內(nèi)容。
教育部最新公布的數(shù)據(jù)顯示,2020年碩士研究生報名人數(shù)達到341萬人。自2015年起,全國考研報名人數(shù)急劇增長,由此可見,越來越多的大學(xué)生在面對社會高層次人才需求的壓力下選擇提升自身的學(xué)歷。隨著高學(xué)歷的人群越來越多,學(xué)術(shù)造假、考試作弊等事件頻頻發(fā)生。高學(xué)歷考試是以考生誠實守信為基本前提考察考生的學(xué)業(yè)、科研水平。在以往的學(xué)歷考試中我國高校及研究機構(gòu)在考試中采取各種措施防止考生作弊,如由于疫情原因,2020年全國高校在研究生及以上學(xué)歷的考試和面試中采用遠程考核方式,為了保證考試的公平性,大多數(shù)高校采用了雙機位甚至是三機位的監(jiān)控方式。在通常情況下,這些方法在選拔過程中是非常有效的,但對通過了考試的學(xué)生卻無法起到任何的約束作用。因此,全國高校將大學(xué)生信用評價等級納入入學(xué)考核體系,一定程度上能夠降低通過學(xué)歷考試后學(xué)業(yè)失信事件發(fā)生的概率,是保障我國科學(xué)研究健康發(fā)展的有效方法。
我國現(xiàn)階段,政府主導(dǎo)型的征信機構(gòu)占絕對優(yōu)勢。社會征信體系是由征信立法系統(tǒng)、征信監(jiān)管體系、征信服務(wù)行業(yè)、失信懲罰機制與人才培養(yǎng)模式五個子體系構(gòu)成的[17]。個人征信主要是對個人信貸信息進行收集及處理。大學(xué)生學(xué)術(shù)信用研究中的各項信用數(shù)據(jù)是對我國個人征信數(shù)據(jù)收集的補充,尤其是未產(chǎn)生信貸記錄的人群。金融行業(yè)中貸款的發(fā)放是根據(jù)已產(chǎn)生的金融活動信息或者其資產(chǎn)狀況,大數(shù)據(jù)信貸則在此基礎(chǔ)上還需考核社交及其他非金融活動狀況。大數(shù)據(jù)時代,以ZestFinance公司為例,其個人信用評價指標多達幾萬個,而這些指標數(shù)據(jù)來源于互聯(lián)網(wǎng)活動、第三方數(shù)據(jù)以及用戶自身提交的數(shù)據(jù)[18]。大學(xué)生誠信檔案數(shù)據(jù)及大學(xué)生個人信用評價等級作為信貸活動中個人信用評估所需的第三方數(shù)據(jù),是對金融業(yè)個人信用評分體系的添補,是完善我國個人征信體系的重要環(huán)節(jié)。
基于以上研究,筆者對于未來大學(xué)生學(xué)術(shù)誠信建設(shè)提出以下建議:(1)政府設(shè)立專職部門。我國高校在大學(xué)生信用建設(shè)方面各有建樹,無論是對完善大學(xué)生信用檔案的建設(shè)還是對信用評價的探索,都已經(jīng)取得了初步的成效。我國高校數(shù)量龐大,不同高校所處地理位置及辦學(xué)定位不盡相同,具有一定的地域性、方向性及專業(yè)特色性。設(shè)立專職部門對我國大學(xué)生信用建設(shè)進行統(tǒng)籌規(guī)劃,將會降低上述因素對學(xué)術(shù)信用評價的影響,同時能夠加快我國大學(xué)生學(xué)術(shù)誠信建設(shè)的步伐。(2)行政機構(gòu)聯(lián)合行動。通過對我國大學(xué)生誠信建設(shè)及學(xué)業(yè)信用的探究,數(shù)據(jù)壁壘與獎懲制度失衡是現(xiàn)階段面對的主要問題。聯(lián)合政府各職能部門對大學(xué)生信用數(shù)據(jù)進行采集,不僅能打破數(shù)據(jù)壁壘,還能為高校及學(xué)者在今后的研究中提供更多真實可靠的樣本數(shù)據(jù),從而大幅度地提升研究效率。在獎懲制度建設(shè)方面,我國聯(lián)合行動實例已不勝枚舉,一定程度上改善了我國的失信問題。為了完善該項制度,優(yōu)化行政機構(gòu)聯(lián)合行動的具體方針政策將是未來研究重點。(3)加強思想道德教育。我國高等教育在學(xué)總規(guī)模每年都在不斷擴大,2019年該項數(shù)字已經(jīng)超過4 000萬人。面對如此龐大的人群,加強大學(xué)生思想道德建設(shè)必須放在首位,這也是保障大學(xué)生健康發(fā)展的基本。習(xí)近平總書記在紀念五四運動100周年大會上說,“青年的理想信念關(guān)乎國家未來”。堅決把增強“四個意識”、堅定“四個自信”、做到“兩個維護”融入大學(xué)生思想道德建設(shè)中,是大學(xué)生學(xué)術(shù)誠信建設(shè)最有效的途徑。