史轉轉 周靖博 寇冰
摘要:為解決黨校系統(tǒng)缺乏對黨務工作數(shù)據(jù)進行深層分析的功能從而制約了黨校教學事業(yè)發(fā)展的問題,文章對深度學習技術在黨校教學和管理工作領域的應用進行了深入探索。文章對黨務工作現(xiàn)狀進行了分析,對深度學習的概念與相關技術進行了介紹,從需求、數(shù)據(jù)、技術三個維度對深度學習技術在黨校工作中的應用基礎進行了說明,文章列舉了深度學習技術在黨校工作領域的三個應用場景,最后還對應用過程進行了詳細闡述。深度學習技術的應用對于提升黨校數(shù)據(jù)利用率、拓展相關功能、合理配置師資資源等方面具有積極的意義。
關鍵詞:深度學習;數(shù)據(jù)挖掘;黨校;模型構建;模型訓練
中圖分類號:G647;TP399 文獻標識碼:A
文章編號:1009-3044(2020)27-0034-03
開放科學(資源服務)標識碼(OSID):
1 背景
黨校是我國教育培訓黨員干部的主渠道和研究宣傳馬克思主義的主陣地。黨校的職責是,通過一系列有計劃地培訓,來提高廣大黨員干部用馬克思主義的立場、觀點和方法來處理實際問題的能力[1]。黨校系統(tǒng)的信息化建設,是我國干部教育事業(yè)發(fā)展的必然要求,也是新時代黨員教育事業(yè)應對科技快速發(fā)展形勢的必然選擇[2]。近些年來,我國黨校系統(tǒng)的信息化建設取得了跨越式發(fā)展,工作效率和教學能力都有了顯著提高,但在基于黨校需求方面的數(shù)據(jù)分析研究領域基本處于空白。目前,各黨政機關使用的應用系統(tǒng)均缺乏對黨務工作數(shù)據(jù)進行深層分析的功能,各黨校的日常教學工作也是如此,制約了黨校教學事業(yè)發(fā)展。
當前,黨校工作模式正由傳統(tǒng)經驗模式向以教學與科研有機融合為核心的模式轉變,因此引入深度學習技術對于提升黨校數(shù)據(jù)利用率、創(chuàng)新黨校辦學機制、優(yōu)化黨校師資資源、加強黨校內涵建設、提高黨校教學實效等方面具有積極的意義。
2 深度學習介紹
深度學習(Deep Learning)這一概念是Hinton等人在2006年提出的,屬于人工智能研究領域中的一個新的分支。深度學習可以通過各種深度神經網(wǎng)絡模型來對現(xiàn)實世界中的不同問題進行建模,依托大數(shù)據(jù)對模型進行訓練,從而進行數(shù)據(jù)間的相關性發(fā)現(xiàn),以此來實現(xiàn)現(xiàn)實問題的預測分析和推理分析[3]。經過多年的發(fā)展,以深度學習為代表的人工智能技術,已經在很大程度顛覆了傳統(tǒng)學科的研究方法。依托強大的感知能力、擬合能力和推理能力,深度學習能適用于很多的應用場景,例如:自然語言處理、計算機視覺,生物醫(yī)療、推薦系統(tǒng)等。鑒于深度學習在學術界和工業(yè)界的巨大影響力,2013年,深度學習技術被研究人員評為世界十大技術突破之首。
深度學習從概念提出至今,15年的時間里經歷了發(fā)展期、爆發(fā)期,中間新提出或衍生出了很多新的算法原理,這些算法在多項任務中都表現(xiàn)出色,典型的深度學習模型有:卷積神經網(wǎng)絡(CNN)、循環(huán)神經網(wǎng)絡(RNN)、深度神經網(wǎng)絡(DNN)、自編碼器(AE)等[4],其中CNN、RNN、DNN屬于監(jiān)督學習,AE屬于無監(jiān)督學習。
目前,深度學習技術應用正逐漸滲透到我們生活的不同領域,我們日常使用的很多技術都融人了深度學習的相關技術,比如:圖像識別、醫(yī)療數(shù)據(jù)分析、文字翻譯、網(wǎng)絡購物、廣告推送等,且都取得了非常好的應用效果。特別是2016年3月,Deep-Mind公司開發(fā)的AlphaGo與圍棋世界冠軍、職業(yè)九段棋手李世石進行圍棋人機大戰(zhàn),以4比1的總比分獲勝。
3 應用基礎
3.1 需求基礎
黨校系統(tǒng)經過多年的發(fā)展,雖然形成了相對完善的教學制度和管理理念,但工作模式相對固化、傳統(tǒng)思維掣肘,不利于黨校事業(yè)的進一步發(fā)展。為貫徹落實習總書記關于黨校工作的重要指示精神,提高黨校的智能化管理水平,黨校系統(tǒng)也需積極地探索大數(shù)據(jù),迎接人工智能時代。雖然目前以深度學習為代表的人工智能技術在黨校工作中的應用基本屬于空白,但深度學習技術在黨校領域應用潛力巨大,具有很強的可行性和實用性。在黨校的教學培訓、理論研究、日常管理等環(huán)節(jié)中,均可以利用深度學習技術進行黨校數(shù)據(jù)的二次開發(fā),提高管理服務水平。
3.2 數(shù)據(jù)基礎
數(shù)據(jù)是數(shù)字時代的新“石油”,是深度學習三大核心要素之一,由于黨校的正規(guī)化、信息化建設比較早,因此各黨校在日常的教學、管理等過程中產生了大量的信息數(shù)據(jù),包括結構化的數(shù)據(jù)和非結構的數(shù)據(jù)。結構化的數(shù)據(jù)指的是黨校信息系統(tǒng)在使用過程中產生的系統(tǒng)數(shù)據(jù),例如黨校電子文案系統(tǒng)、黨校人員管理系統(tǒng)、黨校財務管理系統(tǒng)等;非結構化數(shù)據(jù)指的是課程教案、公文資料、任職通知、工作記錄、年終總結、人事檔案等紙質資料。這些數(shù)據(jù)非常珍貴,為深度學習在黨校系統(tǒng)內的應用提供了非常好的數(shù)據(jù)基礎。
3.3 技術基礎
這些年,深度學習發(fā)展很快,新模型層出不窮,深度神經網(wǎng)絡、卷積神經網(wǎng)絡、深度信念網(wǎng)絡、生成對抗網(wǎng)絡、循環(huán)神經網(wǎng)絡等模型在不同領域都取得了非常好的應用效果。其中,在圖像分類方面,基于CNN的技術已經超過了人類的準確率[6];在語音識別方面,基于DNN的技術達到了95%的準確率[7];在機器翻譯方面,基于DNN的技術已經和人類的平均翻譯水平大致相當[8]。此外,面向深度學習的可用開源框架近些年也迎來了爆發(fā)式增長,例如:Tensorflow[9]、Caffe、MXNet、Theano.Torch和PyTorc等,這些為深度學習技術在黨校數(shù)據(jù)挖掘中的應用提供了非常好的技術基礎。
4 應用分析
4.1 在個性化教學中的應用
個性化教學是近些年為了提高黨校教學質量而提出的新方案,具體是針對不同類型的學員特點,在授課方式(講授式教學、互動式教學、研討式教學、體驗式教學等)、授課內容(理論、案例、實操等)、授課時長等方面制定個性化的教學活動,具有針對性強、教學效果好的優(yōu)點。在實施過程中,利用深度學習技術可以分析得出不同特征學員的特點和需求,以此來制定針對性的教學方案。例如,黃宏濤[10]基于BP神經網(wǎng)絡提出了一種認知診斷方法,探討該方法在個性化教學中的應用,結果表明:在小樣本診斷中該方法能夠為個性化補救教學提供依據(jù);牛亞男[11]基于神經網(wǎng)絡技術設計并實現(xiàn)了一個教學資源個性化推薦系統(tǒng),應用效果良好。
4.2 探索教學質量因素方面的應用
采用深度學習技術,可以從歷史的教學數(shù)據(jù)和教學結果之間的因素,分析教學管理中授課信息之間的隱藏關系,探索不同授課方式、不同授課對象等對教學質量的影響,為科學評估教學質量和教學管理提供決策支持。例如,溫新[12]提出了一種基于改進遺傳算法和BP神經網(wǎng)絡的教學質量評價模型;于權[13]基于神經網(wǎng)絡技術,結合軍校教學工作的實際特點和部隊教育發(fā)展對教學質量的要求開發(fā)了一種有效的軍校教學質量評價系統(tǒng)。
4.3 在合理配置師資資源中的應用
黨校教學資源有限,通過構建基于深度學習的教學資源優(yōu)化模型,來合理地配置教師、教具、場地、財力、信息等資源,從而達到黨校教學資源的最大化利用、最優(yōu)化配置。例如,徐曉明[14]在分析任務需求的基礎上,提出了一種基于SVM的仿真資源調度模型,取得了整體最優(yōu)的調度結果;夏鋒等[15]提出了一種基于神經網(wǎng)絡的教學資源推薦方法,取得了較好的應用效果。
5 應用過程
5.1 數(shù)據(jù)準備和數(shù)據(jù)預處理
黨校存儲的豐富數(shù)據(jù)是深度學習在該領域應用的基礎。數(shù)據(jù)從黨校各個部門采集,包括結構化的電子數(shù)據(jù)和非結構化的紙質數(shù)據(jù)。不過為了滿足深度學習數(shù)據(jù)分析處理的基本要求,需要提前對源數(shù)據(jù)進行數(shù)據(jù)預處理。對于以紙質文檔形式留存的數(shù)據(jù),比如:教學檔案、滿意度調查表、任職通知、工作記錄、年終總結、人事檔案等,需要進行數(shù)字化處理;對于系統(tǒng)內的數(shù)據(jù)庫數(shù)據(jù),主要包括以下操作:基于數(shù)據(jù)集成的數(shù)據(jù)抽取,基于數(shù)據(jù)審查的數(shù)據(jù)清洗,基于數(shù)據(jù)篩選的數(shù)據(jù)規(guī)約,基于數(shù)據(jù)序列化、歸一化的數(shù)據(jù)轉換,基于文本內容的關鍵詞提取等等。
5.2 模型構建及數(shù)據(jù)訓練
針對不同的應用場景,構建不同的深度學習模型,例如:在探索個性化教學中的應用時,考慮到授課時間長的因素,可以選用長短時間記憶網(wǎng)絡。模型構建涉及:深度學習模型的選擇和搭建以及參數(shù)的選擇和調優(yōu)等過程,相關參數(shù)包括輸入序列、層數(shù)、層節(jié)點數(shù)、激活函數(shù)和損失函數(shù)等等。訓練模型的過程中可以采用10折交叉驗證(10-fold Cross Validation)與留一法(Leave-One-Out)、分層采樣(Stratification)來測試模型的準確性。
5.3 功能實現(xiàn)及系統(tǒng)開發(fā)
模型在達到一定的精度之后即實現(xiàn)了相關功能,此時需要考慮基于該模型的軟件系統(tǒng)的開發(fā),系統(tǒng)在開發(fā)過程中需要與黨校工作人員廣泛交流,結合他們的工作經驗,以期達到實用、科學的目的,最終實現(xiàn)拓展黨校服務內涵,提高教學管理水平的目標。
6 結束語
現(xiàn)階段,黨校在數(shù)據(jù)分析研究方面基礎薄弱,目前黨校部門使用的系統(tǒng)均缺乏對數(shù)據(jù)進行深層分析以及對黨校知識進行自動獲取的功能,制約了黨校工作的進一步發(fā)展。而深度學習技術的使用,為我們開展黨校教學和管理工作大數(shù)據(jù)分析提供了技術基礎,因此,引入深度學習技術對于黨校系統(tǒng)具有非常重要的意義。雖然目前深度學習技術在黨校教學領域的研究尚處于研究階段,但隨著相關工作的開展,深度學習技術在黨校領域的發(fā)展趨勢必將越來越深入、越來越廣泛。
參考文獻:
[1]邱志奎.新時代加強黨員干部黨性教育的若干思考[J].才智,2019(32): 44.
[2]李志清,廣州干部教育培訓信息化建設研究——以廣州行政學院為例[J].科技風,2015(14): 225-226.
[3]李盼盼.基于深度學習的個性化特勤療養(yǎng)相關技術研究[D].長沙:國防科技大學,2017.
[4]段龍云,辛婷婷.遞歸神經網(wǎng)絡多目標跟蹤技術[J].電腦知識與技術,2017,13(26): 176-177,188.
[5]李盼盼,譚慶平,曾平,等,機器學習技術在療養(yǎng)數(shù)據(jù)挖掘中的應用初探[J]_中國醫(yī)療設備,2018,33(4): 104-107.
[6] Krizhevsky A,Sutskever I,Hinton G E.ImageNet classifica-tion with deep convolutional neural networks[Jl. Commumca-tions of the ACM, 2017, 60(6): 84-90.
[7]文銘,基于深度神經網(wǎng)絡的語音識別前端處理[D].合肥:中國科學技術大學,2019.
[8] Bahdanau D,Cho K,Bengio Y.Neural machine translation byjointly learning to align and translate[C]. Computer Science,2014.
[9]李河偉,一種移動式TensorFlow平臺的卷積神經網(wǎng)絡設計方法[J].電腦知識與技術,2017,13(22): 179-182.
[10]黃宏濤,李世珍,李世玉,等,基于BP神經網(wǎng)絡的認知診斷方法在個性化教學中的應用[J].中國遠程教育,2019(1): 86-91.
[11]牛亞男,教學資源個性化推薦系統(tǒng)的設計和實現(xiàn)[D].大連:大連理工大學,2013.
[12]溫新,基于改進遺傳算法和BP神經網(wǎng)絡的教學質量評價模型研究[D].哈爾濱:東北林業(yè)大學,2019.
[13]于權,基于BP神經網(wǎng)絡軍校教學質量評價系統(tǒng)[D].大連:大連理工大學,2016.
[14]徐曉明,基于SVM機器學習的仿真網(wǎng)格資源調度模型[J].武漢理工大學學報(信息與管理工程版),2013,35(4):555-559.
[15]夏鋒,牛亞男,孔祥杰.一種基于神經網(wǎng)絡的教學資源個性化推薦方法[EB/OL].[2019-12-20l. https://patents.google.com/patent/CN103353872B/zh.
【通聯(lián)編輯:謝媛媛】