張靜 劉危 楊兵 單文波
摘? 要:隨著我國“雙一流”建設的開展,學科建設的基礎地位愈發(fā)突顯,但傳統(tǒng)建設方法在新形勢下面臨嚴峻挑戰(zhàn),無法為“雙一流”建設提供長期有效指導。大數(shù)據(jù)分析具有善于處理大量、異構(gòu)、多變、關聯(lián)數(shù)據(jù)的優(yōu)勢,利用數(shù)據(jù)挖掘、可視化分析等技術可以在精準掌握教育數(shù)據(jù),合理配置教育資源,跟蹤監(jiān)測學科建設績效,預測學科發(fā)展趨勢,預警危機專業(yè)等方面發(fā)揮積極作用。
關鍵詞:大數(shù)據(jù)分析;學科建設;預警;績效評估
中圖分類號:G640 文獻標志碼:A 文章編號:2096-000X(2019)05-0001-05
Abstract: As China's "Double First-class" initiative operates, discipline construction is increasingly demonstrating its fundamental role. However, new circumstances have posed a severe challenge for traditional construction ways which fail to provide effective and long-term guidance to "Double First-class" construction. The big data analysis, if introduced in discipline construction, which enjoys its efficiency in handling numerous, heterogeneous, variable and associated data, can play a positive role in a view of the overall discipline construction, more scientific evaluation of performance in discipline construction, early warning of disciplines in crisis and provision of convenient service to collaborative innovation of "government, industry, study, research and practice". In the meantime, more efforts should be made to ensure big data security when they are extracted, applied, saved and released, and to improve the level and capacity of data used in decisions.
Keywords: big data analysis; discipline construction; early warning; evaluation of performance
2015年國務院印發(fā)的《統(tǒng)籌推進世界一流大學和一流學科建設總體方案》(以下簡稱《方案》)中指出:建設世界一流大學和一流學科,是黨中央、國務院作出的重大戰(zhàn)略決策,對于提升我國教育發(fā)展水平、增強國家核心競爭力、奠定長遠發(fā)展基礎,具有十分重要的意義。[1]《方案》指明了學科建設與教育發(fā)展、國家進步的關系。學科是“雙一流”建設的基礎,辦大學就是辦學科。隨著互聯(lián)網(wǎng)和信息技術的發(fā)展,使得用大數(shù)據(jù)分析描述學科建設動態(tài)、預測學科發(fā)展趨勢、為頂層決策機構(gòu)提供決策支持成為可能,因此,應盡早搭建為學科建設服務的大數(shù)據(jù)分析平臺,為加快推進我國雙一流建設及教育現(xiàn)代化提供決策支持。
一、當前學科建設存在的問題
廣義學科建設的內(nèi)涵包括結(jié)構(gòu)性要素和功能性要素。結(jié)構(gòu)性要素包括凝練學科方向、匯聚學科隊伍、搭建學科平臺;功能性要素包括人才培養(yǎng)、科學研究和社會服務。[2]
當前學科建設的主要問題包括:
第一,學科布局和結(jié)構(gòu)不合理,學位授予點并不能完全反映社會需求和科學技術的發(fā)展[3],學位點、科研基地的建設存在功利性、盲目性。據(jù)麥可思研究院近年來發(fā)布的《中國大學生就業(yè)報告》報道,生物工程、法學、歷史、英語、美術、體育等專業(yè)已連續(xù)幾年成為就業(yè)榜上的紅牌專業(yè)。曾幾何時,社會上流傳著“21世紀是生物學的世紀”的說法,可生物學近年來的就業(yè)率卻頻頻下降,甚至淪為十大較低就業(yè)率專業(yè)首位。培養(yǎng)目標的趨同化致使高校校際間生物工程學科專業(yè)畢業(yè)生差異性不大、競爭力不明顯,導致學生“功能性、結(jié)構(gòu)性失業(yè)”現(xiàn)象加劇。不僅生物專業(yè),經(jīng)歷了十余年擴張后表現(xiàn)出明顯的頹靡、萎縮之勢的專業(yè)不在少數(shù)。然而這些專業(yè)的招生人數(shù)、辦學規(guī)模、學位授予點卻在不斷增加,暴露出我國學科建設中存在盲目追求指標和規(guī)模,卻忽視人才培養(yǎng)與市場需求相結(jié)合的規(guī)律的現(xiàn)象,而這直接關系到高等教育的質(zhì)量及教育資源的合理配置。鄰國日本的例子更是前車之鑒。據(jù)日本《朝日新聞》報道:截至2017年7月日本停辦或準備停止招收法律碩士的高校多達36所,其中不乏新瀉大學、立教大學、京都產(chǎn)業(yè)大學這樣一些知名高校。而導致這些學校的法律碩士集體停辦的一個重要原因就是政府決策的失誤。2002年政府預計律師的需求量會加大,于是放寬了律師考試合格率的限制,并加大對法律碩士培養(yǎng)的投資力度,一些院校紛紛開辦法律碩士點,但是事與愿違,律師的需求量并沒有增加反而減少了,再加之攻讀法律碩士的學費比較高昂,一時之間法律碩士成了無人問津的專業(yè),一些院校因為招不到生源而無奈之下停辦[4]。給學校和政府造成巨大損失。
造成人才培養(yǎng)與市場需求不相適應的一個主要原因在于:目前的學科建設方法尚不支持前瞻性決策。由于教育數(shù)據(jù)沒有與政治、經(jīng)濟、社會領域的數(shù)據(jù)對接,因此無法在同一平臺對這些數(shù)據(jù)流進行整合分析,動態(tài)觀察教育與政治、經(jīng)濟、社會發(fā)展之間的聯(lián)動關系,使決策層不便于高屋建瓴,做出前瞻性決策。師資培養(yǎng)和引進,學生的教育與培養(yǎng)都具有周期性,一旦發(fā)現(xiàn)專業(yè)設置或?qū)W科建設中的不合理問題,可能已無法在短期內(nèi)消除,而這對于學校、教師和學生本人而言都得不償失。學科建設需要更具時效性、更有洞見性的分析工具,以實現(xiàn)前瞻性規(guī)劃。
第二,學科建設績效評估體制不完善,導致學科建設在培育人才、服務社會方面的價值難以量化。導致這些問題的原因主要有:第一,績效評價方法上存在局限性。目前學科建設績效評價的方法主要分為兩類:一是指標權(quán)重賦權(quán)法,二是數(shù)據(jù)包絡分析法。指標權(quán)重分析法的缺點在于:受主觀因素的影響較大,結(jié)論的科學性受到影響。而數(shù)據(jù)包絡分析法的問題在于:所選取的樣本量太少,使得求得的效益前沿面不夠科學,必然會影響到對學科建設績效是否有效的評價。[5]第二,由于評估方法的局限,導致評估結(jié)果只能從靜態(tài)上反映出當前學科建設的水平,不能預測學科建設的動態(tài)發(fā)展。第三,目前的學科績效評估只聚焦于學科,學科之外的信息被忽視,導致對學科的社會價值的漠視。因此學科外延審視的缺失影響了學科的社會價值計量。[6]
第三,“產(chǎn)學研”協(xié)同創(chuàng)新不夠,缺乏統(tǒng)籌協(xié)調(diào)機制,科研成果轉(zhuǎn)化率低等問題,也是當前我國學科建設中存在的突出問題。首先,政府在產(chǎn)學研用結(jié)合中的組織協(xié)調(diào)功能發(fā)揮不夠,政府的服務機構(gòu)不健全、服務水平有待提高。[7]其次,科技人員視野受限,創(chuàng)新能力不高,無法適應經(jīng)濟社會發(fā)展的重大需求,創(chuàng)新效率低下,高校人才隊伍建設與協(xié)同創(chuàng)新要求不相適應。[8]
二、學科建設中應用大數(shù)據(jù)分析的必要性及可行性
(一)大數(shù)據(jù)分析應用于學科建設的必要性
針對以上學科建設中存在的問題,穩(wěn)步推進一流大學和一流學科建設,實現(xiàn)“中國特色,世界一流”,必須對學科建設進行前瞻性研究。目前教育決策大多基于事后研判,事后研判固然必要,但對于學科建設總體而言,前瞻性的規(guī)劃,對于風險管控和優(yōu)化人才培養(yǎng)質(zhì)量和科研產(chǎn)出效率,都有著積極意義。盡可能發(fā)揮科學研究的領頭羊作用,從而帶動社會政治經(jīng)濟的發(fā)展,并根據(jù)社會政治經(jīng)濟發(fā)展和人才需求,適時調(diào)整人才培養(yǎng)規(guī)格、目標和課程體系,就要研究學科建設的規(guī)律,影響學科建設效率的重要因素,學科建設和經(jīng)濟社會發(fā)展之間的關系,人才培養(yǎng)和社會需求之間的關系等等,這些研究必然牽涉到政治、經(jīng)濟、教育、人口、環(huán)境等一系列海量、高速、類型多樣的數(shù)據(jù)流,僅用現(xiàn)有的數(shù)據(jù)庫難以實現(xiàn)前瞻性的設計,只有通過大數(shù)據(jù)分析才能獲取更多智能的、深入的、有價值的信息。大數(shù)據(jù)分析能用適當?shù)慕y(tǒng)計方法對海量、高速、類型多樣的數(shù)據(jù)進行整合與分析,從中提取有用信息并加以研究和概括之后形成知識,以指導決策。《方案》要求:以支撐創(chuàng)新驅(qū)動發(fā)展戰(zhàn)略、服務經(jīng)濟社會發(fā)展為導向,優(yōu)化學科結(jié)構(gòu),強化目標管理,突出建設實效,加快高等教育治理體系和治理能力現(xiàn)代化[9]?!斗桨浮分该髁藢W科建設與經(jīng)濟社會發(fā)展的內(nèi)在聯(lián)系,要實現(xiàn)《方案》的總體目標,必須加快大數(shù)據(jù)分析在學科建設方面的應用,以適應“雙一流”建設以及國家中長期改革和發(fā)展的需要。
(二)大數(shù)據(jù)分析應用于學科建設的可行性
隨著云存儲、云計算、互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、移動終端等信息技術的飛速發(fā)展,使得大數(shù)據(jù)分析成為可能。大數(shù)據(jù)分析能夠通過對歷史數(shù)據(jù)的分析和挖掘,科學總結(jié)與發(fā)現(xiàn)其中蘊藏的規(guī)律和模式,并結(jié)合源源不斷的動態(tài)流式數(shù)據(jù)去預測事物未來的發(fā)展趨勢。[10]這讓越來越多的組織認識到大數(shù)據(jù)的價值。美國普渡大學的Course Signals系統(tǒng)利用數(shù)據(jù)量化和監(jiān)測學生的學習狀態(tài),其數(shù)據(jù)來源包括課程考試分數(shù)、排名、學術經(jīng)歷以及學生與學習管理系統(tǒng)LMS的互動情況,預測學生在一門課程學習中的表現(xiàn)。2012年美國國家教育部發(fā)布了《通過教育數(shù)據(jù)挖掘和學習分析促進教與學》報告,對美國國內(nèi)大數(shù)據(jù)教育應用領域和案例,以及應用實施所面臨的挑戰(zhàn)進行了詳細介紹。2013年1月,德克薩斯大學(UT)推出SAS的可視化分析VA,VA為德克薩斯大學提供了對于學術界的更敏銳的洞見,現(xiàn)在員工們能夠很容易就看到不同學院、不同系及課程計劃等廣泛層面的學術測算指標。這些信息幫助UT能夠做出更好的決策[11]。加州大學同樣致力于教育數(shù)據(jù)分析。他們積累有關本科生學習狀況、學習經(jīng)歷的調(diào)查數(shù)據(jù),已經(jīng)有15年之久,涉及加州大學10個分校中的9所;他們還能通過互聯(lián)網(wǎng),從覆蓋美國所有高校96%的數(shù)據(jù)庫中提取學生入學前及入學后的相關數(shù)據(jù),做相關性分析、趨勢展望和政策建議[12]。2015年是中國的教育大數(shù)據(jù)元年,國內(nèi)開始對大數(shù)據(jù)分析在教育領域的應用展開了理論研究,而實證研究則剛剛起步。2017年3月20日——21日“教育大數(shù)據(jù)應用技術”國際學術研討會在華東師范大學舉行。會議精神認為:教育大數(shù)據(jù)將重構(gòu)教育生態(tài)系統(tǒng),宏觀層面為教育決策提供科學依據(jù),中觀層面推進教學管理和評價的創(chuàng)新實踐,微觀層面為個性化教學提供精準支持。[13]趙慧瓊,姜強,趙蔚,李勇帆,趙艷的《基于大數(shù)據(jù)學習分析的在線學習績效預警因素及干預對策的實證研究》表明:學習分析技術可以將大量學生數(shù)據(jù)轉(zhuǎn)換成有價值的教學信息,通過對最終分析結(jié)果的可視化展示,能夠發(fā)現(xiàn)影響學生學習成績的關鍵因素,識別可能存在學習危機的學生,從而為進行學業(yè)預警、教學干預、教學決策等服務提供有力支持。[14]盡管目前國內(nèi)外已有將大數(shù)據(jù)分析應用于教育領域的理論研究,大數(shù)據(jù)分析支持下的預警系統(tǒng)設計的可行性也已被證實,但是國內(nèi)的教育大數(shù)據(jù)分析多集中在學習分析,對于大數(shù)據(jù)分析在科學建設領域的應用研究還沒有。
本文將就大數(shù)據(jù)分析在學科建設中的應用及其作用進行分析和展望,旨在為高校學科建設提供有益的參考。
三、如何將大數(shù)據(jù)分析應用于學科建設
大數(shù)據(jù)分析普遍應用的方法有可視化分析、數(shù)據(jù)挖掘、預測分析等??梢暬钦故緮?shù)據(jù)的一種方式,可視化能夠直觀地呈現(xiàn)大數(shù)據(jù)特點,同時能夠非常容易被讀者所接受,具有良好的交互性,就如同看圖說話一樣簡單明了。數(shù)據(jù)挖掘是指從大量的、不完全的、有噪聲的、模糊的、隨機的實際數(shù)據(jù)中,提取隱含其內(nèi)的、人們事先所不知的、但又具有潛在價值的信息和知識的過程。如果說可視化是給人看的,那么數(shù)據(jù)挖掘就是給機器看的。數(shù)據(jù)的挖掘首先是搜集數(shù)據(jù),數(shù)據(jù)越豐富越好,數(shù)據(jù)量越大越好,只有獲得足夠的高質(zhì)量的數(shù)據(jù),才能獲得準確的判斷,才能產(chǎn)生認知模型[15]。數(shù)據(jù)挖掘是數(shù)據(jù)“模型”的發(fā)現(xiàn)過程,而機器學習是建模的重要方法之一。機器學習的過程是:將一些已知的并已被成功解決的問題作為范例輸入計算機,機器通過學習范例,總結(jié)并歸納具有通用性的規(guī)則[16]。預測分析是根據(jù)可視化分析和數(shù)據(jù)挖掘的結(jié)果做出預測性的判斷。只要在大數(shù)據(jù)中挖掘出信息的特點與聯(lián)系,就可以建立科學的數(shù)據(jù)模型,通過模型輸入新的數(shù)據(jù),從而預測未來的數(shù)據(jù)[17]。
利用上述技術,第一可以分析學科建設規(guī)律,找到制約學科建設和發(fā)展的因素,從而合理配置資源;第二可以預警危機專業(yè),控制人才培養(yǎng)的規(guī)模和數(shù)量,對于可能出現(xiàn)人才過剩的專業(yè),逐步放緩招生人數(shù)和師資的培養(yǎng);而對于可能出現(xiàn)人才緊缺的專業(yè),則適度增加人才培養(yǎng)的數(shù)量和師資的培養(yǎng)。將損失控制到最低。
基于上述的各類大數(shù)據(jù)分析技術,結(jié)合學科建設特點,構(gòu)建了如圖1所示的總體應用框架。
首先,整合數(shù)據(jù)源,搭建“教育大數(shù)據(jù)平臺”。抽取教育部高教司、學位辦、科技司、社科司、教育部直屬單位、全國哲學社會科學規(guī)劃辦公室、國家自然科學基金委員會、各省市級教育主管部門、科研團體、校級教學科研主管部門等的相關數(shù)據(jù)作為數(shù)據(jù)源。對數(shù)據(jù)源進行處理面臨兩個問題,一是除了結(jié)構(gòu)化數(shù)據(jù)以外,還要將圖像、視頻、課件等非結(jié)構(gòu)化或半結(jié)構(gòu)化數(shù)據(jù)也整合進來,這對數(shù)據(jù)關聯(lián)的發(fā)現(xiàn)提出了挑戰(zhàn)。二是現(xiàn)有教育數(shù)據(jù)分屬不同的部門管理,存在信息孤島現(xiàn)象。因此需要通過數(shù)據(jù)融合技術,對這些結(jié)構(gòu)相異、定義多樣的數(shù)據(jù)進行清洗和轉(zhuǎn)換,使其成為統(tǒng)一的語義學結(jié)構(gòu),在這種結(jié)構(gòu)下,將數(shù)據(jù)分解為少量但統(tǒng)一的基本元素。這些基本元素包括:組織、人、物(包括錢)、關系、場所、動作、條件、事件、時間等。經(jīng)過語義學分解之后,不同數(shù)據(jù)源的數(shù)據(jù)就具備了初步的一致性和相似性[18]。然后,通過人為設定的規(guī)則體系或人工智能和機器學習的方式,判斷不同數(shù)據(jù)源之間的聯(lián)系,如一個國家級項目的主持人同時也可以是一個省級項目的主持人、一篇權(quán)威期刊的作者、一門在線精品課的主講人、一所高校的教師,某院、系或者科研院所也可能是國家級重點實驗室或基地,某著作或論文可能是某個或幾個項目的科研成果等。經(jīng)過這些步驟,“教育大數(shù)據(jù)平臺”就基本形成了。
在此基礎上,就可以對整個學科建設的運行情況進行分析了。比如,可以分析高等教育司某項改革措施或建設工程所造成的影響,某一學科專業(yè)的人才流向,交叉學科的發(fā)展態(tài)勢等等,可以根據(jù)組織者的要求選擇不同“維度、顆粒度和路徑”的分析,數(shù)據(jù)越多、質(zhì)量越高,就越有利于建立模型,從錯綜復雜的數(shù)據(jù)中找到學科發(fā)展的規(guī)律。這就要用到前面提到的機器學習和數(shù)據(jù)挖掘技術。通過研究算法,讓機器在數(shù)據(jù)中查找制約學科建設的關鍵因素,并利用可視化,幫助決策層創(chuàng)建一個描述狀況的共享視圖,對學科建設中存在的問題本質(zhì)獲取更多洞見,并對需要采取的措施達成共識。
機器學習和數(shù)據(jù)挖掘除了可以幫助決策層掌握學科建設的發(fā)展規(guī)律,還可以設計算法將學科建設績效與資源配置聯(lián)動起來。根據(jù)組織者關于學科建設績效評價的目的、范圍、周期等,確定績效考核方案,在此基礎上設計資源配置方案,聯(lián)動考核結(jié)果與資源配置。構(gòu)建以師資隊伍和科研團隊、科研成果水平、人才培養(yǎng)質(zhì)量、社會服務與文化傳承等多維數(shù)據(jù)為核心的績效考核模型,為學科建設績效和資源配置提供技術支持。
另外,根據(jù)可視化分析和數(shù)據(jù)挖掘得到的學科建設規(guī)律,可以進一步作出預測性分析,預警危機專業(yè)就是預測分析的一個重要運用。傳統(tǒng)分析方法是對已經(jīng)發(fā)生的事件進行分析,屬于事后研判,而在大數(shù)據(jù)中,可以通過建立的數(shù)據(jù)模型,建立一個“智能全景模擬器”,這個模擬器可以幫助我們模擬各種政策和項目工程對整個學科建設及其各個局部的影響,對可能發(fā)生的事件進行預估,即預測分析。根據(jù)數(shù)據(jù)挖掘和可視化分析得到的學科建設規(guī)律,可以發(fā)現(xiàn)制約學科專業(yè)發(fā)展的關鍵因素,然后通過建模,預測某項政策措施或社會經(jīng)濟變化會對哪些學科或?qū)I(yè)造成影響以及造成怎樣的影響??梢园延绊懗潭扔玫梅值男问奖硎境鰜?,得分越高影響越大,危機程度越高,并根據(jù)危機程度給予不同等級的預警。危機學科或?qū)I(yè)設置為A、B兩類,A類表示需求增長過快,供不應求;B類表示需求放緩或逐漸萎縮,供過于求。例如師生比持續(xù)上升,人才市場供不應求、教學或科研績效高的專業(yè)可能預示著人才緊缺,可以歸為A類危機專業(yè),根據(jù)人才稀缺程度可下設三檔或四檔等級,等級越高,人才需求越旺,需要調(diào)整人才的增量和存量;而就業(yè)率持續(xù)下降、教學或科研績效低的專業(yè)可能預示著人才培養(yǎng)與市場需求不相適應,存在人才培養(yǎng)過剩的傾向,可以歸為B類,同樣下設幾個等級予以預警,等級越高代表危機程度越高,表明需要調(diào)整培養(yǎng)方案,減少招生規(guī)模。通過“智能全景模擬器”提供的危機預警,對危機學科專業(yè)進行盡早干預,可優(yōu)化資源配置,減少損失。
當然,模型的準確性不會一蹴而就,還需要對數(shù)據(jù)的持續(xù)觀察和對模型的反復驗證修改,形成“數(shù)據(jù)收集→整合平臺數(shù)據(jù)→數(shù)據(jù)挖掘、機器學習→智能全景模擬→危機預警(可視化)→數(shù)據(jù)挖掘、機器學習→智能全景模擬……”循環(huán)機制,從而不斷提高預測性能。
四、大數(shù)據(jù)分析應用于學科建設面臨的挑戰(zhàn)
大數(shù)據(jù)分析固然能解決學科建設中面臨的諸多問題,使學科管理和建設走向更加精準化和科學化的道路,但是也要看到應用大數(shù)據(jù)分析尚存在諸多問題。
首先,數(shù)據(jù)的篩選問題。大數(shù)據(jù)時代,人們對數(shù)據(jù)的認識始終處于不斷豐富和完善的過程,高質(zhì)量、高相關性的數(shù)據(jù)越多越能做出精準的決策。UT對大數(shù)據(jù)分析的應用就是一個典型的例子。該校為了減少學生貸款債務增加對辦學的影響,這些年來已經(jīng)采集了大量的學生數(shù)據(jù),包括入學和學位數(shù)據(jù)、學生財務資助數(shù)據(jù)、課程級別數(shù)據(jù)等,而數(shù)據(jù)可視化的新功能,使UT擁有與全州和全國學生債務相比較的有關UT學生貸款來源的信息,以便幫助UT的員工做出更好的決策[19]??蒲蟹矫?,UT也已經(jīng)開始采集教師生產(chǎn)力方面的數(shù)據(jù),包括不同學院、不同系的學術測算指標,研究經(jīng)費和學術產(chǎn)出等,并常規(guī)性地利用這些數(shù)據(jù)輔助決策[20]。但這些都只是一個開始,隨著大數(shù)據(jù)的不斷涌現(xiàn),大數(shù)據(jù)分析技術的推廣,需要獲取的數(shù)據(jù)源會不斷增加,然而目前工業(yè)界處理龐大數(shù)據(jù)的能力有限,因此對數(shù)據(jù)進行清洗,盡可能獲取高質(zhì)量、高相關性的數(shù)據(jù)顯得尤為重要,這需要機器學習和智能全景模擬等技術的支持。
第二,安全問題。大數(shù)據(jù)的挖掘與運用時刻伴隨著安全問題,數(shù)據(jù)安全關乎個人安全和國家利益,必須在數(shù)據(jù)安全性與隱私性之間找到平衡。隨著文化、教育領域公共數(shù)據(jù)資源向社會開放,大量在線課程的開放,“互聯(lián)網(wǎng)+教育”模式的發(fā)展,教育數(shù)據(jù)的安全性也面臨挑戰(zhàn)。數(shù)據(jù)一旦開放,誰將擁有這些數(shù)據(jù)?誰又將使用這些數(shù)據(jù)?科研人員或教師在網(wǎng)站或社交平臺發(fā)布與教學科研有關的圖片、視頻或言論時,這些數(shù)據(jù)是否仍然屬于本人,網(wǎng)站和社交平臺是否能合法擁有其中的內(nèi)容,當關閉網(wǎng)站和云服務時,用戶是否能將產(chǎn)生的數(shù)據(jù)帶走等,關系到能否在開放數(shù)據(jù)的同時保護好知識產(chǎn)權(quán)、數(shù)據(jù)的所有權(quán)和使用權(quán),個人隱私不受侵犯等問題。要治理學術環(huán)境,堅決杜絕盜用數(shù)據(jù)、利用數(shù)據(jù)造假、惡意轉(zhuǎn)載、剽竊他人研究成果等行為的發(fā)生。不斷提高數(shù)據(jù)安全意識和保密技術,不給假冒期刊網(wǎng)站、非法營利團體以可乘之機。要在從業(yè)人員和高校師生中普及安全使用數(shù)據(jù)的常識和政策法規(guī),讓大家建立起大數(shù)據(jù)時代的安全意識。
第三,數(shù)據(jù)融合問題。數(shù)據(jù)融合是一種處理大數(shù)據(jù)的手段,用于從大數(shù)據(jù)中發(fā)現(xiàn)知識,并按照知識的語義邏輯關聯(lián)融合形成更接近人類思維的知識,包括數(shù)據(jù)融合和知識融合2個步驟。數(shù)據(jù)融合負責將多源數(shù)據(jù)動態(tài)提取、整合并且轉(zhuǎn)化為知識資源,為知識融合奠定基礎。而知識融合負責對知識和知識間的關系進行不同粒度的理解,使知識具有不同層次的可理解性和可領悟性,進而方便解釋客觀現(xiàn)象[21]。就學科建設而言,不同領域、不同學科的科研數(shù)據(jù)來自不同的數(shù)據(jù)源;同一專家隸屬的機構(gòu)可能改變,同一專家也可能以不同語種發(fā)表成果,這意味著同一專家的信息可能涉及跨數(shù)據(jù)庫、跨語言的融合;不同信息源之間還可能存在隱含的關聯(lián)信息等。另外,各級、各地區(qū)院校在數(shù)據(jù)的統(tǒng)計、分類、管理上都存在不同程度差異,要將這些數(shù)據(jù)融合起來進行數(shù)據(jù)分析和挖掘,還要面臨模式對齊、實體鏈接、沖突解決、關系推演等方面的技術難題。
五、結(jié)束語
隨著大數(shù)據(jù)的不斷涌現(xiàn),以及開源軟件、云計算等的出現(xiàn),用數(shù)據(jù)驅(qū)動的管理已初見端倪。麻省理工學院、德克薩斯大學、加州大學等一批知名高校都已聘用專門的數(shù)據(jù)可視專家和工程師,為決策和研究提供支持。由日本文部省科學大臣認定的“跨學科大規(guī)模共享共用信息平臺研究基地(簡稱:JHPCN)”項目,于2010年正式啟動。該項目以東京大學信息平臺中心為核心,在北海道大學、東北大學、東京大學、東京工業(yè)大學、名古屋大學、京都大學、大阪大學、九州大學等八所院校的研究基地配備了超級計算機,形成了“網(wǎng)絡式”共享研究基地。項目希望通過超大容量數(shù)據(jù)平臺,解決地球環(huán)境、能源、材料、基因組信息、網(wǎng)絡數(shù)據(jù)等大型挑戰(zhàn)性課題,為日本學術研究基礎的進一步高度化和常態(tài)化做出貢獻。目前項目組已舉辦了10界論壇,取得了一些階段性成果,并于2016年新增了國際共同研究課題、企業(yè)共同研究課題、萌芽型共同研究課題,意在強化全球化、產(chǎn)學結(jié)合、孵化風險企業(yè)的功能[22]。大數(shù)據(jù)分析已經(jīng)將觸角伸向了高等教育教學、科研、管理等各個層面。不久的將來,用數(shù)據(jù)驅(qū)動的學科建設也定將展現(xiàn)其前所未有的優(yōu)勢。但是技術的進步也對使用技術的人提出了更高挑戰(zhàn),用好數(shù)據(jù),不等于一切依賴數(shù)據(jù),對學科建設做出科學決策,還要不斷提高對數(shù)據(jù)的甄別、思考和駕馭能力。
參考文獻:
[1]http://www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.
[2]梁傳杰.論學科建設績效評價[J].北京科技大學學報(社會科學版),2010(1):160.
[3]謝桂華.關于學科建設的若干問題[J].高等教育研究,2002(5):49.
[4]http://www.asahi.com/articles/ASK7Z5F06K7ZUTIL01K.html.
[5]梁傳杰.論學科建設績效評價[J].北京科技大學學報(社會科學版),2010(1):159-160.
[6]薛玉香,黃文浩.以投入產(chǎn)出比重新審視高校重點學科建設績效評估[J].中國高教研究,2010(4):39.
[7]朱路甲,劉迪,王寶軍.新時期產(chǎn)學研用合作機制創(chuàng)新中存在的問題及相關對策[J].河北大學學報,2011(2).
[8]陳冬梅.基于“產(chǎn)學研用”協(xié)同創(chuàng)新的高校人才隊伍建設探析[J].高教探索,2013(2).
[9]http://www.gov.cn/zhengce/content/2015-11/05/content_10269.htm.
[10]李金昌.從政治算數(shù)到大數(shù)據(jù)分析[J].統(tǒng)計研究,2014(11):10.
[11]Phil Simon.大數(shù)據(jù)可視化重構(gòu)智慧社會[M].人民郵電出版社,2018:110.
[12]龔放.把握學科特性 選準研究方法——高等教育學科建設必須解決的兩個問題[J].中國高教研究,2016(9):5.
[13]吳忭,顧小清.教育大數(shù)據(jù)的深度認知、實踐案例與趨勢展望——2017年“教育大數(shù)據(jù)應用技術”國際學術研討會評述[J].現(xiàn)代遠程教育研究,2017(3):11.
[14]趙慧瓊,姜強,趙蔚,等.基于大數(shù)據(jù)學習分析的在線學習績效預警因素及干預對策的實證研究[J].電化教育研究,2017(1).
[15]陳明.大數(shù)據(jù)基礎與應用[M].北京師范大學出版社,2016:228.
[16]陳明.大數(shù)據(jù)基礎與應用[M].北京師范大學出版社,2016:286.
[17]陳明.大數(shù)據(jù)基礎與應用[M].北京師范大學出版社,2016:209.
[18]王紋,毛彥.數(shù)據(jù)驅(qū)動的管理[M].清華大學出版社,2016:263.
[19]Phil Simon.大數(shù)據(jù)可視化重構(gòu)智慧社會[M].人民郵電出版社,2018:112-113.
[20]Phil Simon.大數(shù)據(jù)可視化重構(gòu)智慧社會[M].人民郵電出版社,2018:113.
[21]孟小峰,杜治娟.大數(shù)據(jù)融合研究:問題與挑戰(zhàn)[J].計算機研究與發(fā)展,2016(2):240.
[22]https://jhpcn-kyoten.itc.u-tokyo.ac.jp/ja/.