張哲
【摘要】在信息來源廣,傳播迅速的今天,海量信息充斥著社會的各個行業(yè),大數(shù)據(jù)時代已然到來。學(xué)會處理、分析并利用大數(shù)據(jù)將會對生產(chǎn)生活產(chǎn)生積極的影響。為了滿足教師隊伍管理現(xiàn)代化及教育體系科學(xué)化的要求,更需要利用現(xiàn)代手段關(guān)注、分析和預(yù)測教師大數(shù)據(jù)。本文作者收集了1994年-2014年東北地區(qū)數(shù)學(xué)專業(yè)教師收入、教齡、稅收、職業(yè)病情況等相關(guān)大數(shù)據(jù),利用高性能計算方法,與回歸分析、最小二乘法等數(shù)學(xué)模型[1]巧妙結(jié)合,以期對所獲數(shù)據(jù)加以推斷和預(yù)測。本文所獲結(jié)論可以作為教師生活工作狀況調(diào)研的重要案例,所涉及到的模型和方法為設(shè)計處理大數(shù)據(jù)的通用軟件提供重要參考依據(jù),為人們更好地融入到大數(shù)據(jù)時代提供可靠的支持。
【關(guān)鍵詞】教師 大數(shù)據(jù) 數(shù)學(xué)模型 matlab 最小二乘法
【中圖分類號】G64 【文獻標(biāo)識碼】A 【文章編號】2095-3089(2015)06-0155-02
大數(shù)據(jù),或稱巨量資料,指的是需要新處理模式才能具有更強的決策力、洞察力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產(chǎn)[2]。大數(shù)據(jù)技術(shù)的戰(zhàn)略意義不在于掌握龐大的數(shù)據(jù)信息,而在于對那些含有意義的數(shù)據(jù)進行專業(yè)化處理。本文將以東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù)為基礎(chǔ),通過“加工”實現(xiàn)數(shù)據(jù)的“增值”,使其為決策與預(yù)測服務(wù)。
一、東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù)來源及準(zhǔn)備
通過查閱資料與調(diào)查,收集到東北三省各高校數(shù)學(xué)教師相關(guān)大數(shù)據(jù),包括教師教齡(?誗年)、收入(?誗元)、稅收(?誗元)和職業(yè)病情況等方面的實際數(shù)據(jù)。由于得到的數(shù)據(jù)信息量大,輕重各異,所以首先需要進行數(shù)據(jù)預(yù)處理,即清除異常數(shù)據(jù)、錯誤糾正、格式標(biāo)準(zhǔn)化等,再通過數(shù)據(jù)挖掘技術(shù),利用一系列相關(guān)算法和數(shù)據(jù)處理技術(shù)從大量的數(shù)據(jù)中提取人們所需要的重要信息,也就是上面所提到的實現(xiàn)信息的“增值”,同時大大提高數(shù)據(jù)處理效率,下面具體介紹本項目所采用的模型和計算方法。
二、東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù)分析與結(jié)果
收集并處理好教師教齡、收入、稅收和職業(yè)病情況等方面的數(shù)據(jù)后,本文主要針對三個方面進行了詳細的分析:
1.教師收入隨年份的變化
(1)數(shù)據(jù)范圍:1994年-2014年東三省各高校數(shù)學(xué)教師收入(單位:元);
(2)計算條件:matlab軟件,最小二乘回歸分析,高性能計算工作站;
(3)求解過程:年份作為自變量x,收入為因變量y,從總體上看,二者統(tǒng)計關(guān)系大致符合一元線性的正態(tài)誤差模型[3],即對給定xi的有最小二乘一元線性回歸公式y(tǒng)i=b0+b1xi+εi,其中:
b■=■, ■=■■x■b0=■-b■■, ■ =■■y■
其中εi是由變量可能的內(nèi)在隨機性、未知影響因素等隨機擾動造成的誤差??傊?,它可看成是眾多細小影響因素的綜合代表。最后,由Matlab提供polyfit函數(shù)實現(xiàn)回歸函數(shù)擬合[4];
(4)結(jié)果分析:計算結(jié)果表明,隨著年份的增加,教師收入也在不斷增加。估計的因變量的系數(shù)b1約為191,也就是說,每過一年,教師收入大致可增加近191元。
2.教師職業(yè)病情況與教齡的關(guān)系
(1)數(shù)據(jù)范圍:1994年—2014年東三省各高校數(shù)學(xué)教師教齡(單位:年)、職業(yè)病情況;
(2)結(jié)果分析:首先利用matlab軟件,以橫軸為某年東三省數(shù)學(xué)教師教齡,縱軸反映相應(yīng)教齡的平均職業(yè)病情況(為方便,規(guī)定越接近縱軸正方向,職業(yè)病越嚴(yán)重)利用matlab軟件繪制圖形[5],發(fā)現(xiàn)教師教齡越長,職業(yè)病也愈加嚴(yán)重。每一年的教師職業(yè)病情況均可繪制一張圖表,通過將這11張圖表的最高值(即每一年職業(yè)病的最高值)做比較,發(fā)現(xiàn)其趨勢是先逐年下降,最后趨于穩(wěn)定。
3.對教師專業(yè)發(fā)展階段的研究
(1)數(shù)據(jù)范圍:2014年東三省各高校數(shù)學(xué)教師收入、教齡、稅收和職業(yè)病大數(shù)據(jù);
(2)計算條件:IBM處理器、大數(shù)據(jù)挖掘分類算法;
(3)求解過程:用神經(jīng)網(wǎng)絡(luò)研究方法(即模擬生物上神經(jīng)元工作的方法)。圖中每個橢圓形節(jié)點接受輸入數(shù)據(jù),將數(shù)據(jù)處理后輸出,輸入層節(jié)點接受教師信息的輸入,然后將數(shù)據(jù)傳遞給隱藏層,隱藏層將數(shù)據(jù)傳給輸出層,輸出層輸出教師專業(yè)發(fā)展處于哪一專業(yè)成熟階段;
(4)結(jié)果分析:若將教師專業(yè)成熟過程分為三個階段:形成期、發(fā)展期和成熟期。那么利用IBM處理器和以上算法,在所調(diào)查的教師中,約70%處于發(fā)展時期,是其基本適應(yīng)教育教學(xué)工作的時期;約20%處于形成期,是形成良好心理素質(zhì)和正確教育思想的關(guān)鍵時期;約10%處于成熟期,是掌握教學(xué)主動權(quán),成為學(xué)校教學(xué)骨干的時期;
(5)研究意義:研究東三省高校數(shù)學(xué)教師專業(yè)發(fā)展成熟階段,可以基本掌握教師資源結(jié)構(gòu),從而能夠遵循不同發(fā)展階段的不同特征、觀念、心理、發(fā)展需求,制定相應(yīng)教研活動、政策和制度,促進教師全面持續(xù)發(fā)展[6]。
三、結(jié)果討論
1.數(shù)據(jù)呈現(xiàn)以上結(jié)果的原因
(1)隨著國家科教興國戰(zhàn)略的深入實施,教師的工資和待遇將被逐步納入國家工作人員統(tǒng)一管理,教師的收入將得到很大的提高。另一方面,數(shù)學(xué)能力的培養(yǎng)是學(xué)習(xí)各專業(yè)、走入各行業(yè)的基礎(chǔ),國家將加大數(shù)學(xué)知識的教育力度,進而數(shù)學(xué)專業(yè)教師所付出的辛苦也更加不可小覷,綜合以上幾個重要原因,教師收入隨年份增加而增加也是符合經(jīng)濟理論的。
(2)教齡越長,職業(yè)病也越嚴(yán)重的依存關(guān)系,我們?nèi)菀桌斫?。但隨著時間的推移,職業(yè)病的嚴(yán)重性呈現(xiàn)下降趨勢正是反映了我國科技的革新:環(huán)境的改變、教學(xué)設(shè)備和教學(xué)技術(shù)的更新使得教師的課堂教學(xué)更加高效和輕松便捷,如多媒體、電子白板使得課堂不再“塵土飛揚”。
(3)在對教師專業(yè)發(fā)展階段的研究中,處于專業(yè)發(fā)展時期的教師所占比例最高,達到近70%。實際上,他們多數(shù)處于青壯年的人生階段,是社會的中堅力量,又曾在高等教育多樣化與綜合化的背景下受到過良好的教育,并具有較豐富的教學(xué)經(jīng)驗和緊跟新時代的創(chuàng)新思想,自然在專業(yè)發(fā)展的角度也占有較大比例。
2.合理的相關(guān)預(yù)測
大數(shù)據(jù)最有價值的特點就是其“預(yù)見性”。上述數(shù)值結(jié)果表明,在經(jīng)濟平穩(wěn)發(fā)展和社會穩(wěn)定的前提下,東三省數(shù)學(xué)專業(yè)教師的收入在未來的幾十年依舊處于增長趨勢,教師職業(yè)病總體減輕,專業(yè)發(fā)展越來越成熟,使得教師隊伍整體素質(zhì)越來越高,而未來教師的考核獎勵制度也會變得更加嚴(yán)格和全面。
3.建議
(1)無論是對教師行業(yè)還是其他行業(yè)感興趣,都要關(guān)注其變化,分析其形勢及趨勢,以便對此行業(yè)的認知更加科學(xué)合理。
(2)本文采用的大數(shù)據(jù)處理所用模型和方法,可以進一步推廣到其它相關(guān)領(lǐng)域,使之成為研究大數(shù)據(jù)的更通用的工具。
本文利用matlab軟件、最小二乘法模型及IBM處理器分析了東北地區(qū)數(shù)學(xué)專業(yè)教師大數(shù)據(jù),得出的結(jié)果對于掌握該地區(qū)數(shù)學(xué)教師基本情況并預(yù)測其發(fā)展趨勢有著重要的作用,還為熱心同類問題的研究者提供高效的方法和技術(shù)。當(dāng)我們不能有效處理所獲取的大數(shù)據(jù),它們就是一些平凡的數(shù)字和符號。如果我們能夠很好地駕馭大數(shù)據(jù),它們必定會為我們帶來諸多的方便。
最小二乘法模型在處理大數(shù)據(jù)時有一定的優(yōu)勢[7],統(tǒng)計分析,神經(jīng)網(wǎng)絡(luò)算法和遺傳算法都是處理大數(shù)據(jù)的有效方法,如果能將這些方法有機的結(jié)合起來,將更能獲得許多滿意的數(shù)值分析結(jié)果。當(dāng)大數(shù)據(jù)超過計算條件的時空允許時,不僅耗時費力,甚至使得計算成為不可能,通常需要采用并行算法等高效計算手段。在高性能計算方面,我們并沒有用到并行算法,如果能利用并行算法,所處理的數(shù)值結(jié)果容量會更大更有參考價值。
參考文獻:
[1]蔡鎖章主編.數(shù)學(xué)建模:原理與方法.北京:海洋出版社,2000.
[2]維克托邁爾舍恩伯格.大數(shù)據(jù)時代.浙江:浙江人民出版社,2012.
[3]吳翊,吳孟達,成禮智編著.數(shù)學(xué)建模的理論與實踐.長沙:國防科技大學(xué)出版社,1999.
[4]張德豐編著.Matlab數(shù)值分析與仿真案例.北京:清華大學(xué)出版社,2011.10(21世紀(jì)高等學(xué)校規(guī)劃教材計算機應(yīng)用)IBSN 978—7—302—26254—1.
[5]楊德平等編著.Matlab基礎(chǔ)教程.北京:機械工業(yè)出版社,2013.221世紀(jì)高等院校計算機輔助設(shè)計規(guī)劃教材 ISBN 978—7—111—41023—2.
[6]王少非.新課程背景下的教師專業(yè)發(fā)展[M].上海:華東師范大學(xué)出版社,2005.
[7]R.Hanson and M.Norris,Analysis of Messurements Based on the Singular Value Decomposition,SIAM J.on Sci.and Stat.Comp,2:3(1981).