• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      高校畢業(yè)生就業(yè)趨勢(shì)鄰接樹分析方法研究

      2021-11-05 03:27:48李兆飛熊興中湯勇VolchenkovDimitry
      關(guān)鍵詞:度量類別畢業(yè)生

      李兆飛,熊興中,湯勇,Volchenkov Dimitry

      (1.四川輕化工大學(xué)自動(dòng)化與信息工程學(xué)院,四川 宜賓 644002;2.人工智能四川省重點(diǎn)實(shí)驗(yàn)室,四川 宜賓 644002;3.比勒費(fèi)爾德大學(xué)先進(jìn)認(rèn)知交互技術(shù)中心,德國(guó) 比勒費(fèi)爾德 D-33718)

      引 言

      隨著20世紀(jì)90年代末中國(guó)高等教育實(shí)行擴(kuò)招政策以來(lái),高等院校畢業(yè)生數(shù)量持續(xù)增長(zhǎng),社會(huì)就業(yè)崗位需求相對(duì)不足,畢業(yè)生教育結(jié)構(gòu)、就業(yè)觀念與市場(chǎng)需求脫節(jié)的結(jié)構(gòu)性矛盾仍然突出,畢業(yè)生就業(yè)工作面臨極大壓力[1]。高等院校畢業(yè)生的就業(yè)情況是國(guó)家及地方各級(jí)主管部門、學(xué)校和社會(huì)都非常關(guān)心的問(wèn)題。高等院校畢業(yè)生信息數(shù)據(jù)庫(kù)涵蓋了高等教育環(huán)境的各個(gè)方面,能提供對(duì)各級(jí)教育機(jī)構(gòu)目前狀況的一個(gè)意義深遠(yuǎn)的觀察,通過(guò)對(duì)其分析,可以幫助指導(dǎo)專業(yè)建設(shè)和有針對(duì)性的課程改革,能預(yù)測(cè)復(fù)雜的教育系統(tǒng)發(fā)展的未來(lái)趨勢(shì)。然而,高等院校畢業(yè)生信息數(shù)據(jù)庫(kù)包含海量、結(jié)構(gòu)異構(gòu)、不同度量和非度量的陣列統(tǒng)計(jì)數(shù)據(jù),如何從這些模糊、有噪聲、不完全、隨機(jī)、事先無(wú)法預(yù)知卻又成倍增長(zhǎng)的潛在有用的“大數(shù)據(jù)”信息中獲取有價(jià)值的知識(shí)是目前亟需解決的問(wèn)題。

      傳統(tǒng)上用于高等院校畢業(yè)生就業(yè)趨勢(shì)分析系統(tǒng)的數(shù)據(jù)處理方法,使用簡(jiǎn)單的SQL 語(yǔ)句進(jìn)行數(shù)據(jù)庫(kù)查詢及基本的數(shù)據(jù)統(tǒng)計(jì)[2-4],并通過(guò)簡(jiǎn)單的圖表進(jìn)行可視化展示。這種方法雖然便于直接比較,但并沒有提供高等教育系統(tǒng)的綜合情況,其分析方法和呈現(xiàn)方式單一。目前,針對(duì)畢業(yè)生就業(yè)數(shù)據(jù)挖掘較多采用的技術(shù)主要是決策樹算法、神經(jīng)網(wǎng)絡(luò)算法、關(guān)聯(lián)規(guī)則算法和模糊集方法等。如文獻(xiàn)[5]基于修正函數(shù)和屬性優(yōu)先值的改進(jìn)ID3算法,從時(shí)間復(fù)雜度和準(zhǔn)確度方面進(jìn)行畢業(yè)生數(shù)據(jù)挖掘。文獻(xiàn)[6]通過(guò)對(duì)ID3 算法生成畢業(yè)生就業(yè)分析模型并進(jìn)行剪枝優(yōu)化。文獻(xiàn)[7]基于云服務(wù)決策樹分類算法提高了大學(xué)生思想政治教育效率。文獻(xiàn)[8]采用ID3 算法生成就業(yè)預(yù)測(cè)決策樹模型進(jìn)行就業(yè)決策分析。文獻(xiàn)[9]采用K-means 聚類分析和R-C4.5 決策樹方法挖掘影響高職畢業(yè)生就業(yè)質(zhì)量的相關(guān)因素。文獻(xiàn)[10]基于變精度粗糙集的決策樹模型進(jìn)行就業(yè)數(shù)據(jù)分析。但是這些決策樹方法計(jì)算量大,產(chǎn)生的決策分類規(guī)則魯棒性較弱。文獻(xiàn)[11]采用元分析方法對(duì)就業(yè)結(jié)果的影響進(jìn)行了分析,但該方法本質(zhì)上也是統(tǒng)計(jì)的方法,呈現(xiàn)方式單一。文獻(xiàn)[12]通過(guò)減少頻繁項(xiàng)集生成的數(shù)量,進(jìn)行候選項(xiàng)集剪枝效率優(yōu)化的改進(jìn)Apriori算法,提高了算法的時(shí)間和空間復(fù)雜度,并應(yīng)用于職業(yè)高中的教學(xué)評(píng)價(jià)與就業(yè)分析中。文獻(xiàn)[13]通過(guò)Apriori 算法在屬性選擇過(guò)程中進(jìn)行數(shù)據(jù)預(yù)處理量化操作,然后進(jìn)行對(duì)象聚類,得到支持度和置信度,形成對(duì)高校的就業(yè)分析規(guī)則。文獻(xiàn)[14]利用代價(jià)敏感的非頻集過(guò)濾矩陣尋找k-頻集構(gòu)造過(guò)濾矩陣的Apriori 算法,進(jìn)行高職院校就業(yè)數(shù)據(jù)挖掘。文獻(xiàn)[15]采用關(guān)聯(lián)規(guī)則挖掘Apriori 結(jié)合ID3 算法,對(duì)嘉華學(xué)院學(xué)生就業(yè)進(jìn)行了分析。但是,無(wú)論怎么改進(jìn)Apriori 算法,都會(huì)產(chǎn)生大量的中間項(xiàng)集,適應(yīng)性較窄。因此,為滿足對(duì)高校畢業(yè)生就業(yè)系統(tǒng)數(shù)據(jù)庫(kù)幾十萬(wàn),幾百萬(wàn),甚至上億條多樣化和異構(gòu)的畢業(yè)生信息數(shù)據(jù)進(jìn)行挖掘分析及呈現(xiàn)的需求,必須建立一種先進(jìn)而有效的畢業(yè)生就業(yè)趨勢(shì)分析系統(tǒng)的數(shù)據(jù)處理及呈現(xiàn)方法。

      基于此,通過(guò)研究提出一種統(tǒng)計(jì)頻率特征距離的高校畢業(yè)生就業(yè)趨勢(shì)鄰接樹分析方法。該方法通過(guò)對(duì)不同度量和非度量的海量、結(jié)構(gòu)異構(gòu)的陣列統(tǒng)計(jì)數(shù)據(jù),引入離散分布(圖)來(lái)合理的表征“待分析類別”間的距離,并基于相應(yīng)分布的待分析類別之間的距離矩陣,進(jìn)一步采用聚類分析技術(shù)進(jìn)行定量多標(biāo)準(zhǔn)比較、分析。

      1 方法和設(shè)計(jì)

      提出的統(tǒng)計(jì)頻率特征距離的高校畢業(yè)生就業(yè)趨勢(shì)鄰接樹分析模型構(gòu)建中,首先選擇一個(gè)“待分析類別”,而所有“比較特征”都是隨機(jī)變量,通過(guò)比較特征的離散概率統(tǒng)計(jì)分布(由隨機(jī)變量的值及其相應(yīng)的概率組成)來(lái)描述待分析類別的特性并快速進(jìn)行傅立葉變換(FFT);然后,通過(guò)待分析類別的頻域分布間的Wasserstein 距離(采用兩個(gè)向量間的標(biāo)準(zhǔn)歐幾里德距離)進(jìn)行量化計(jì)算,得到待分析類別間的對(duì)稱相似距離矩陣, 定量、多標(biāo)準(zhǔn)地進(jìn)行待分析類別的比較;最后,通過(guò)比較待分析類別聚類分析的鄰接生成樹的形式,對(duì)高校畢業(yè)生現(xiàn)狀進(jìn)行可視化表征。構(gòu)建的數(shù)據(jù)分析算法流程如圖1所示。

      圖1 高等院校畢業(yè)生就業(yè)趨勢(shì)數(shù)據(jù)分析算法流程圖

      1.1 表征待分析類別間的特征分布

      由于圖表是一種極好的工具,可以直觀地比較不同類別(如高校)的產(chǎn)品成果和其他重要特征,因此,該步驟中對(duì)“待分析的類別”(也稱為“類、分類”或者“被觀測(cè)特征”,如“高等院?!保┑拿恳粋€(gè)值,考慮每個(gè)相關(guān)的其他特征(如“專業(yè)”、“畢業(yè)生去向”和“工作單位類別”等,稱為“比較特征”)都是隨機(jī)變量X。X 作為一種可能的文本值(狀態(tài))具有X1,X2,…,Xn多種,則作為分析的類別,其概率也有多種情況P(X1),P(X2),…,P(Xn)。離散概率分布(通過(guò)常用的SQL 語(yǔ)言或者相關(guān)統(tǒng)計(jì)算法實(shí)現(xiàn))由隨機(jī)變量X 的值及其相應(yīng)的概率P(X ) 組成,通過(guò)圖能得到體現(xiàn)。最終,從數(shù)據(jù)庫(kù)中就可以直接計(jì)算待分析的類別(如“高等院?!保┑奈谋局祷驙顟B(tài)的經(jīng)驗(yàn)分布。例如,如果選擇的類別是“院?!?,選擇比較的特征是“就業(yè)單位行業(yè)”,那么部分院校畢業(yè)生就業(yè)單位行業(yè)可能的最終等級(jí)分布情況如圖2 所示。該方法具有可伸縮性、實(shí)時(shí)性、跨平臺(tái)性,允許與潛在的數(shù)據(jù)庫(kù)(如包括數(shù)十億個(gè)人信息的數(shù)據(jù)庫(kù))同時(shí)工作。

      圖2 部分院校畢業(yè)生就業(yè)單位行業(yè)可能的最終等級(jí)分布(從左到右依次排列)

      1.2 通過(guò)離散傅里葉變換計(jì)算分布向量間的距離

      雖然圖表便于對(duì)待分析類別進(jìn)行直接比較,但并沒有提供整個(gè)高等教育系統(tǒng)的綜合情況。因此,通過(guò)引入離散分布(圖)來(lái)合理地表征待分析類別之間的距離,將有助于進(jìn)行大規(guī)模的數(shù)據(jù)聚類分析。但該方法的主要問(wèn)題在于數(shù)據(jù)庫(kù)中特定狀態(tài)的文本數(shù)據(jù)不構(gòu)成度量空間,因此直接使用標(biāo)準(zhǔn)概率度量作為圖之間距離的方法不可取。在Volchenkov Dimitry 之前的研究中[16-19],常把離散分布圖視為由圖表示的信號(hào),形成了對(duì)非度量結(jié)構(gòu)數(shù)據(jù)集的分析技術(shù)。對(duì)圖上定義的擴(kuò)散過(guò)程的譜分析,能夠基于自回避隨機(jī)游動(dòng)的第一通道時(shí)間方法定義結(jié)構(gòu)化數(shù)據(jù)集上的度量。該框架擴(kuò)展了Wasserstein 度量的概念,Wasserstein 度量被定義為兩個(gè)概率分布在一個(gè)給定的度量空間的距離,如果是非度量空間則輔以圖形結(jié)構(gòu)進(jìn)行定義[20]。如果每一個(gè)分布被視為在頂點(diǎn)堆積的一個(gè)單位數(shù)量的“沙”,這樣的度量就是隨機(jī)行走者將一堆沙變成另一堆沙的最小“成本”(時(shí)間步長(zhǎng))。由于描述可能的文本值(狀態(tài))給待分析類別之間的精確圖形結(jié)構(gòu)關(guān)系未知,該步驟中假設(shè)它是一個(gè)完全圖,如圖3所示。

      圖3 文本值(狀態(tài))與待分析類別之間的完全圖結(jié)構(gòu)

      完全圖上定義的信號(hào)的譜等價(jià)于離散傅立葉變換(DFT),可以用酉DFT矩陣的形式表示如下:

      式中,ωN= e-2πiN,i 為虛數(shù)單位,e 為自然對(duì)數(shù)底數(shù),N 為數(shù)據(jù)個(gè)數(shù)。利用DFT,每個(gè)由圖表示的采樣信號(hào)yk(特別是直接從數(shù)據(jù)庫(kù)中計(jì)算狀態(tài)的分布)能被分解成頻域中的傅里葉模式Y(jié)k。

      離散傅里葉逆變換如式(2)所示:

      式中,N 為數(shù)據(jù)點(diǎn)個(gè)數(shù),n 為變換點(diǎn)數(shù),Yk為DFT 變換后的數(shù)據(jù),k = 0,1,…,N - 1,在頻域中傅立葉變換的振幅采用下式計(jì)算得到:

      式中,Re(Yk)和Im(Yk)分別表示Yk的實(shí)部和虛部, || Yk為頻域中傅里葉變換的振幅,分布的DFT 可以視為一個(gè)坐標(biāo)變換,它只是簡(jiǎn)單地指定一個(gè)新坐標(biāo)系中向量的分量,保 持 點(diǎn) 積 和 向 量 范 數(shù)y = (y1,y2,…,yn) →y?=(Y1,Y2,…,Yn)。

      DFT 的正交性對(duì)于該算法框架是最重要的,因?yàn)樗试S使用兩個(gè)向量之間的標(biāo)準(zhǔn)歐幾里德距離作為Wasserstein度量,標(biāo)準(zhǔn)歐式距離公式如下:式中,Distance(y - z ) 表示兩個(gè)向量y 和z 間的歐式距離表示兩個(gè)向量y 和z 編碼后的向量y?和z?間的歐式距離,Yk和Zk為y 和z 經(jīng)DFT 變換后的數(shù)據(jù)。為了評(píng)估向量y 和z 編碼后的兩個(gè)分布之間的距離,該算法框架中定義的距離為分布矢量中的對(duì)齊位置的不匹配分?jǐn)?shù)。并且采用快速傅立葉變換(FFT)得到頻域的處理過(guò)程,解決數(shù)據(jù)特征尺度的統(tǒng)一問(wèn)題,就可以使用統(tǒng)計(jì)特征分布間的標(biāo)準(zhǔn)歐式距離進(jìn)行量化計(jì)算,從而得到待分析類別間的對(duì)稱相似距離矩陣。

      離散傅立葉變換在很多領(lǐng)域都有廣泛的應(yīng)用,并且有著名的快速算法(快速傅立葉變換),有效地用于計(jì)算離散傅立葉變換。本文提出的方法通過(guò)離散傅立葉變換計(jì)算分布之間的距離,具有統(tǒng)計(jì)魯棒性,能夠容忍部分不完整和偽造數(shù)據(jù),使其可以用于不同的計(jì)算平臺(tái)且易于實(shí)現(xiàn)。

      1.3 鄰接樹算法推斷待分析類別間的相似距離

      由于采用DFT 計(jì)算待分析類別(如院校)之間的距離,得到了描述每?jī)蓚€(gè)待分析類別之間距離的一個(gè)對(duì)稱的、實(shí)值的、零對(duì)角的矩陣,基于相應(yīng)分布的類別之間的距離矩陣,可以進(jìn)一步采用各種聚類分析方法。本研究采用了系統(tǒng)進(jìn)化樹的聚類形式,將密切相關(guān)的類別(如院校)置于同一個(gè)內(nèi)部節(jié)點(diǎn),其分支長(zhǎng)度緊密再現(xiàn)了相關(guān)類別之間的觀察距離。特別地,使用鄰接樹方法[21]將一般數(shù)據(jù)聚類技術(shù)通過(guò)給定的距離,作為一個(gè)聚類度量應(yīng)用于序列分析。鄰接算法拓?fù)浣Y(jié)構(gòu)相當(dāng)于一個(gè)星型網(wǎng)絡(luò),從一個(gè)完全不具備決斷能力的樹,通過(guò)連接最近矩陣中歐式距離最近的元素進(jìn)行迭代,直至樹具有判斷的功能。并且,樹中所有分支的長(zhǎng)度是已知的,分支(花穗)長(zhǎng)度表明按照指標(biāo)或選擇特征對(duì)數(shù)據(jù)的分級(jí)及排名(擬合優(yōu)劣程度):分支越短,表明(與線性排序的距離矩陣)契合度越好;分支越長(zhǎng)越遠(yuǎn),擬合度及關(guān)聯(lián)度越低,說(shuō)明就業(yè)或單位等情況越不好。在每一步的近鄰連接貪婪的加入這對(duì)分類樹,最大限度地減少生成的鄰接樹的長(zhǎng)度(分支長(zhǎng)度的總和,距離矩陣中距離數(shù)值的一個(gè)特殊加權(quán)和),最終,生成一個(gè)接近最優(yōu)的拓?fù)浣Y(jié)構(gòu)。

      該步驟中,采用鄰接數(shù)算法對(duì)分析大型數(shù)據(jù)集(數(shù)百個(gè)或數(shù)千個(gè)分類單元)具有快速而實(shí)用的優(yōu)點(diǎn),并且有許多可用的程序?qū)崿F(xiàn)該算法,使該方法在不同的計(jì)算平臺(tái)可行且易于實(shí)現(xiàn)。也使分析結(jié)果可以實(shí)現(xiàn)直觀明了的可視化表征,解決了決策者對(duì)待分析類別間的相似關(guān)系進(jìn)行決策處理的困難,并且具有快速和魯棒分析的特點(diǎn)。

      2 試驗(yàn)結(jié)果及分析

      研究對(duì)象為四川省教育廳就業(yè)指導(dǎo)中心提供的截至2016 年8 月底的2016 屆畢業(yè)生就業(yè)信息數(shù)據(jù)庫(kù)(包含了390 000 多條省級(jí)高等院所畢業(yè)生信息)。該數(shù)據(jù)庫(kù)是一個(gè)矩形表,包括字段為:學(xué)籍信息(民族,政治面貌,學(xué)歷,專業(yè),專業(yè)方向等),就業(yè)信息(畢業(yè)生去向,就業(yè)單位名稱,就業(yè)單位組織機(jī)構(gòu),就業(yè)單位性質(zhì),就業(yè)單位行業(yè),就業(yè)單位所在地,工作職位類別),派遣信息(報(bào)到證簽發(fā)類別,報(bào)到證簽往單位名稱及簽往單位所在地)及報(bào)到證信息(報(bào)到證編號(hào)和報(bào)道起始時(shí)間)等。提出的統(tǒng)計(jì)頻率特征距離的高校畢業(yè)生就業(yè)趨勢(shì)鄰接樹分析方法中,統(tǒng)計(jì)特征選擇主要的14 個(gè)文本列或字段為:高等院校名稱、性別、政治面貌、學(xué)歷、專業(yè)、生源所在地、學(xué)制、師范生類別、困難生類別、畢業(yè)生去向、就業(yè)單位行業(yè)、就業(yè)單位性質(zhì)和工作職位類別及簽往單位所在地,每個(gè)列或字段中的每個(gè)記錄可以僅用幾個(gè)文本值來(lái)表示,例如,在列的“就業(yè)單位行業(yè)”,該值可以是采礦業(yè)、制造業(yè)、建筑業(yè)等。

      對(duì)該數(shù)據(jù)庫(kù)基于高等院校作為“待分析特征”,分別選擇畢業(yè)去向、就業(yè)地域類型、就業(yè)省份分布、就業(yè)行業(yè)分布、就業(yè)職位分布及就業(yè)單位性質(zhì)進(jìn)行了分類研究,由于篇幅所限,這里只給出了部分研究分析結(jié)果。

      2.1 畢業(yè)去向分布實(shí)驗(yàn)

      由四川省2016屆畢業(yè)生信息,統(tǒng)計(jì)了120所高等院校學(xué)生畢業(yè)去向(包括:簽就業(yè)協(xié)議形勢(shì)就業(yè)、科研助理、待就業(yè)、自主創(chuàng)業(yè)和升學(xué)等14種畢業(yè)去向)的分布。通過(guò)分析,大多數(shù)院校畢業(yè)生以簽勞動(dòng)合同形式、簽就業(yè)協(xié)議和其他錄用形式就業(yè)為主。通過(guò)本文所提出的算法,得到各高等院校畢業(yè)生去向的整體聚類結(jié)果如圖4所示。

      圖4 中,所生成的輻射樹左邊部分高校(四川大學(xué)、四川文理學(xué)院、四川化工職業(yè)技術(shù)學(xué)院)畢業(yè)生的畢業(yè)去向分布擬合最差(即該類高校畢業(yè)去向分布最分散);圖4 中下邊“燈泡”狀部分高校(西南財(cái)經(jīng)大學(xué)、四川職業(yè)技術(shù)學(xué)院及四川工業(yè)管理職業(yè)學(xué)院)表示高等院校集團(tuán),這部分高等院校的畢業(yè)去向分布雜亂無(wú)章,很難區(qū)分優(yōu)劣,但這部分學(xué)校中有兩類高校(四川郵電職業(yè)技術(shù)學(xué)院到四川工程職業(yè)技術(shù)學(xué)院為一簇,四川外國(guó)語(yǔ)大學(xué)成都學(xué)院到四川工業(yè)管理職業(yè)學(xué)院為另外一簇)具有較相似的畢業(yè)去向分布。圖4 中右上方分支部分高校(四川大學(xué)錦城學(xué)院到中國(guó)航空研究院611 研究所等)就業(yè)畢業(yè)去向分布擬合較好(即該類高校就業(yè)畢業(yè)去向分布較集中);圖4 中最右上方部分高校(中國(guó)燃?xì)鉁u輪研究院到等中共四川省委黨校)就業(yè)省份分布擬合最好(即該類高校就業(yè)類型分布最集中)。

      圖4 高等院校畢業(yè)生畢業(yè)去向的聚類結(jié)果

      2.2 就業(yè)地域類型分布實(shí)驗(yàn)

      由四川省2016屆畢業(yè)生信息,統(tǒng)計(jì)120所高等院校畢業(yè)生的就業(yè)地域類型(包括:直轄市、省會(huì)城市、計(jì)劃單列市、地級(jí)市和縣級(jí)市6 種地域類型)的分布。通過(guò)分析,大多數(shù)院校畢業(yè)生就業(yè)最多的地域是省會(huì)城市,其次是地級(jí)市。通過(guò)算法得到各高等院校畢業(yè)生就業(yè)地域類型的整體聚類結(jié)果如圖5所示。

      圖5 中,所生成的輻射樹最右邊的族,分別為核工業(yè)西南物理研究院、西南通信研究院、西南技術(shù)物理研究院、中共四川省委黨校、西南自動(dòng)化研究所、電信科學(xué)技術(shù)第五研究所、中國(guó)核動(dòng)力研究設(shè)計(jì)院及中國(guó)燃?xì)鉁u輪研究院在同一個(gè)節(jié)點(diǎn)下,表明這些高校具有相似的就業(yè)地域類型,該部分高校就業(yè)地域分布擬合較差(即該類高校就業(yè)類型分布較分散)。左上方“燈泡”狀部分(四川托普信息職業(yè)技術(shù)學(xué)院、四川師范大學(xué)文理學(xué)院及成都職業(yè)技術(shù)學(xué)院等)表示高等院校集團(tuán),這部分高等院校的就業(yè)地域類型分布雜亂無(wú)章,很難區(qū)分優(yōu)劣。右上方分支部分如四川大學(xué)、四川音樂(lè)學(xué)院、川北醫(yī)學(xué)院等高等院校畢業(yè)生的就業(yè)地域分布擬合最差(即該類高校就業(yè)類型分布最分散)。圖5 中,“燈泡”狀下邊部分高校(四川商務(wù)職業(yè)學(xué)院、四川藝術(shù)職業(yè)學(xué)院及四川西南科學(xué)大學(xué)城市學(xué)院等)就業(yè)地域分布擬合較好(即該類高校就業(yè)類型分布較集中)。圖5 中最右下方部分高校(中科院成都生物研究所、中國(guó)科學(xué)院光電技術(shù)研究所及中科院成都計(jì)算機(jī)應(yīng)用研究所等院校)就業(yè)地域分布擬合最好,即該類高校就業(yè)類型分布最集中。

      圖5 高等院校畢業(yè)生就業(yè)地域類型的聚類結(jié)果

      由于篇幅所限,高等院校作為“待分析類別”對(duì)其它比較特征(如就業(yè)省份、就業(yè)行業(yè)及就業(yè)單位性質(zhì)等)可以進(jìn)行類似的分析。同時(shí),也可以選擇畢業(yè)去向、就業(yè)地域類型、就業(yè)省份、就業(yè)行業(yè)及就業(yè)單位性質(zhì)等作為“待分析類別”,其它特征或字段作為比較特征對(duì)高校畢業(yè)生相關(guān)數(shù)據(jù)進(jìn)行聚類分析。

      3 結(jié)束語(yǔ)

      基于統(tǒng)計(jì)頻率特征距離的高校畢業(yè)生就業(yè)趨勢(shì)鄰接樹分析方法的研究,及對(duì)四川省2016 屆畢業(yè)生數(shù)據(jù)庫(kù)的部分待分析類別的研究分析表明,該方法可以實(shí)現(xiàn)省級(jí)或國(guó)家高等教育系統(tǒng)數(shù)百萬(wàn)大學(xué)畢業(yè)生大規(guī)模數(shù)據(jù)的研究分析(數(shù)據(jù)規(guī)模越大,效果越好),其算法效率及可視化效果優(yōu)于單純用SQL 語(yǔ)言進(jìn)行數(shù)據(jù)庫(kù)查詢并通過(guò)圖表呈現(xiàn)的方式。該方法比決策樹算法計(jì)算量小,決策分類魯棒性更強(qiáng);也較Apriori 算法簡(jiǎn)單、分析效率高,是一種先進(jìn)而有效的方法。能解決教育主管部門及相關(guān)機(jī)構(gòu)進(jìn)行大數(shù)據(jù)挖掘及戰(zhàn)略決策困難的問(wèn)題,也可用于經(jīng)濟(jì)、社會(huì)保障、衛(wèi)生保健系統(tǒng)等各種大規(guī)模統(tǒng)計(jì)數(shù)據(jù)庫(kù)的分析,具有較好的應(yīng)用前景。

      猜你喜歡
      度量類別畢業(yè)生
      有趣的度量
      模糊度量空間的強(qiáng)嵌入
      你根本不知道,這屆畢業(yè)生有多難
      意林(2020年15期)2020-08-28 11:10:24
      迷向表示分為6個(gè)不可約直和的旗流形上不變愛因斯坦度量
      一個(gè)沒什么才能的北大畢業(yè)生
      地質(zhì)異常的奇異性度量與隱伏源致礦異常識(shí)別
      服務(wù)類別
      最“叛逆”的畢業(yè)生
      論類別股東會(huì)
      商事法論集(2014年1期)2014-06-27 01:20:42
      中醫(yī)類別全科醫(yī)師培養(yǎng)模式的探討
      延边| 淮北市| 乐山市| 吉木乃县| 舞钢市| 丘北县| 临沂市| 剑阁县| 灯塔市| 明溪县| 平乐县| 大冶市| 三原县| 镇江市| 唐海县| 镇平县| 丹凤县| 庆阳市| 普安县| 万年县| 新安县| 仪陇县| 临泽县| 昌都县| 安康市| 庐江县| 化德县| 南漳县| 柳林县| 凤冈县| 耿马| 棋牌| 化州市| 东明县| 沁源县| 竹山县| 望城县| 清河县| 中方县| 日喀则市| 綦江县|