陸根書
(1.西安交通大學(xué) 人文學(xué)院, 西安 710049; 2.西安交通大學(xué) 中國西部高等教育評估中心, 西安 710049)
大數(shù)據(jù)是當今學(xué)術(shù)界談?wù)摰囊粋€時髦名詞,許多人都在通過電子郵件、社交媒體、金融交易以及教學(xué)、科研、醫(yī)療和商業(yè)平臺等各種方式,以文本、圖像、音頻和視頻等形式或以這些形式組合生成的數(shù)據(jù)為大數(shù)據(jù)做著貢獻。大數(shù)據(jù)常被應(yīng)用于不同的方面,如社會現(xiàn)象、基礎(chǔ)設(shè)施、信息資產(chǎn)、數(shù)據(jù)集以及數(shù)據(jù)的存儲、加工與分析技術(shù)等。因此,對大數(shù)據(jù)概念與內(nèi)涵的界定在學(xué)術(shù)界并沒有達成共識,大致可以分為如下3種不同的界定方式[1]:
一是生產(chǎn)導(dǎo)向的方式,強調(diào)大數(shù)據(jù)的各種信息特征,特別是它的大容量、高生產(chǎn)速度和多樣性等特征。比較流行的大數(shù)據(jù)定義大多屬于這一類。2001年,Laney在討論企業(yè)如何應(yīng)對21世紀初電子商務(wù)的發(fā)展面臨的數(shù)據(jù)管理挑戰(zhàn)時,曾提出了一個包括數(shù)據(jù)容量(volume)、速度(velocity)和多樣性(variety)的三維分析框架,并呼吁企業(yè)在作戰(zhàn)略決策時需要采取新的分析架構(gòu)和解決方案[2]。雖然這一分析框架沒有明確提到大數(shù)據(jù),但后來被稱之為大數(shù)據(jù)定義的“3V”模型。之后,一些學(xué)者又增加了價值(value)和準確性(veracity/validity)等特征。其中,容量是指隨著海量數(shù)據(jù)的產(chǎn)生和收集,數(shù)據(jù)的規(guī)模變得越來越大[3]。這是大數(shù)據(jù)最明顯的一個維度,因為有了大量的數(shù)據(jù)才產(chǎn)生了分析和處理的需求。在處理大數(shù)據(jù)時,存儲和分析數(shù)據(jù)的速度也是一個關(guān)鍵因素,因為要在盡可能短的時間內(nèi)或?qū)崟r地創(chuàng)造最大價值。多樣性維度是指數(shù)據(jù)來源與格式的多樣化。除了高度結(jié)構(gòu)化的數(shù)據(jù)外,還包括一些半結(jié)構(gòu)化以及音頻、視頻或文本文件等非結(jié)構(gòu)化的數(shù)據(jù)。數(shù)據(jù)的多樣性和大容量使得大數(shù)據(jù)分析更具挑戰(zhàn)性。價值維度是指數(shù)據(jù)能夠給組織增加的價值,即通過從數(shù)據(jù)中識別、轉(zhuǎn)換和提取信息,從而為業(yè)務(wù)增加價值。準確性是指數(shù)據(jù)統(tǒng)計的一致性和數(shù)據(jù)的可信性,包括數(shù)據(jù)的來源、采集和處理的方法以及信息基礎(chǔ)設(shè)施是否便捷、可靠等。
二是過程導(dǎo)向的方式,強調(diào)處理大量數(shù)據(jù)背后的技術(shù)要求。例如,大數(shù)據(jù)采集、儲存、處理和分析的方法以及大數(shù)據(jù)系統(tǒng)基準分析等[4]。美國國家標準與技術(shù)研究院(NIST)在定義大數(shù)據(jù)時就強調(diào)了對高效存儲、處理和分析數(shù)據(jù)的可擴展架構(gòu)的需求[5]。有研究者將大數(shù)據(jù)與某種閾值的跨越聯(lián)系起來,認為當數(shù)據(jù)超過了傳統(tǒng)數(shù)據(jù)庫系統(tǒng)的處理能力時,它就是大數(shù)據(jù),因而需要用不同的方式處理它。在這種意義上,大數(shù)據(jù)是指任何一組大到或復(fù)雜到傳統(tǒng)信息技術(shù)無法處理的數(shù)據(jù),是不能用常規(guī)方式存儲、不能存儲在單個服務(wù)器中的龐大的或非結(jié)構(gòu)化的數(shù)據(jù)。
三是認知導(dǎo)向的方式,關(guān)注大數(shù)據(jù)對人類認知能力的挑戰(zhàn)以及大數(shù)據(jù)對經(jīng)濟社會發(fā)展的影響。由于大數(shù)據(jù)之間的相互作用非常復(fù)雜,人類可能因認知能力限制而無法完全理解它們。Boyd和Crawford認為,大數(shù)據(jù)不僅數(shù)據(jù)量大,而且涉及搜索、匯集和交互引用大型數(shù)據(jù)集的能力[6]。他們把大數(shù)據(jù)定義為一種文化、技術(shù)和學(xué)術(shù)現(xiàn)象,認為大數(shù)據(jù)依賴于技術(shù)的相互作用(如最大化計算能力和算法精度)與分析(如識別大數(shù)據(jù)的形態(tài)),也是一種神話(如相信大數(shù)據(jù)能夠提供一種擁有事實、客觀性和準確性光環(huán)的更高形式的智力)。
隨著大數(shù)據(jù)的發(fā)展,其在高等教育領(lǐng)域的應(yīng)用也日漸廣泛,正成為高等教育領(lǐng)域快速發(fā)展的研究前沿。在中國知網(wǎng)以主題詞“大數(shù)據(jù)”加“高等教育”對2010—2021年的研究文獻進行檢索,并在英文數(shù)據(jù)庫ScienceDirect以“big data”和“higher education”為主題對同期英文文獻進行檢索,可以了解國內(nèi)外大數(shù)據(jù)在高等教育領(lǐng)域的一些應(yīng)用情況。雖然中英文文獻近10年來均有快速增長,但相比于英文文獻,中文文獻的數(shù)量相對較少。在中國知網(wǎng)中,2011年才出現(xiàn)有關(guān)研究文獻,且2011年和2012年的文獻數(shù)量很少,從2013年開始有較快增長,到2019年達到450篇,之后趨于下降;英文文獻比中文文獻多很多,2010年在ScienceDirect中有3 106篇,之后其數(shù)量一路上升,到2021年達到14 725篇。
大數(shù)據(jù)在高等教育領(lǐng)域的應(yīng)用涉及許多方面[7]。例如,大數(shù)據(jù)可以提升高校理解復(fù)雜環(huán)境的能力,為其識別早期發(fā)展風險、有效處理各種復(fù)雜問題、創(chuàng)新體制機制、改善決策和資源管理、改進學(xué)校規(guī)劃和提升管理與決策效能提供幫助;可以持續(xù)跟蹤、監(jiān)測和評估教師和學(xué)生的教與學(xué)狀態(tài),并通過有針對性的反饋幫助教師和學(xué)生改進教與學(xué)的策略,為提高教育教學(xué)質(zhì)量和優(yōu)化學(xué)生的學(xué)習經(jīng)歷提供幫助;可以為高校科學(xué)研究尤其是跨學(xué)科研究的發(fā)展提供重要機遇,為提升科研生產(chǎn)率等提供重要支持。
大數(shù)據(jù)可以幫助高校通過追蹤和分析本校與其他高校在一些關(guān)鍵指標上的差異,用證據(jù)來說明學(xué)校在哪些方面取得了成功,哪些方面還需要改進,進而更好地評估自己的優(yōu)勢、劣勢、機會和挑戰(zhàn),明確學(xué)校辦學(xué)目標和人才培養(yǎng)目標及其定位,規(guī)劃發(fā)展戰(zhàn)略,更加積極主動地追求進步,促進學(xué)校發(fā)展。
大數(shù)據(jù)可以幫助學(xué)校更好地了解教師和課程教學(xué)的實際,進而更好地理解、分析和預(yù)測教師教學(xué)的狀態(tài)。大數(shù)據(jù)還可以讓教師獲得即時、客觀的反饋,對其課程及教學(xué)過程的有效性進行評估,了解教學(xué)過程中的優(yōu)點和不足,進而為教師改進課程與教學(xué)提供支持。大數(shù)據(jù)還可以幫助管理者和教師監(jiān)控學(xué)生的學(xué)習過程,跟蹤他們的學(xué)習參與、師生互動和合作學(xué)習等情況,判斷他們成功與失敗的可能性,并及時回應(yīng)他們的需求,為其提供形成性評價,進行個性化指導(dǎo)。這為提升教學(xué)效能提供了可能性。
大數(shù)據(jù)及其基礎(chǔ)設(shè)施的發(fā)展,可以為師生提供更加適宜、高效和有效的教與學(xué)環(huán)境,為師生交流、知識獲取與創(chuàng)造提供更便利的條件。學(xué)??梢詰?yīng)用大數(shù)據(jù)跟蹤、分析學(xué)生的學(xué)習過程,利用大數(shù)據(jù)挖掘分析方法獲得有意義的信息,為優(yōu)化學(xué)生的學(xué)習經(jīng)歷、提高學(xué)習質(zhì)量、促進學(xué)生發(fā)展提供支持。
大數(shù)據(jù)的出現(xiàn)也引發(fā)了科學(xué)研究范式的變革。從歷史發(fā)展看,科學(xué)研究最早以描述自然現(xiàn)象的實驗科學(xué)(experimental science)為基礎(chǔ),之后出現(xiàn)了探求各種規(guī)律與定理的理論科學(xué)(theoretical science)。為了解決實際問題,之后又出現(xiàn)了計算科學(xué)(computational science),通過仿真模擬各種復(fù)雜現(xiàn)象以尋求解決方案。大數(shù)據(jù)的出現(xiàn)則催生了第4種研究范式,即數(shù)據(jù)密集的科學(xué)(data-intensive science),研究者直接從許多不同來源的大數(shù)據(jù)中挖掘所需的信息與知識[8]。大數(shù)據(jù)除了推動科學(xué)研究范式的變革和人們思考方式的更新之外[9],還促進了跨學(xué)科研究的發(fā)展與應(yīng)用。例如,推動了以大數(shù)據(jù)為研究對象,綜合應(yīng)用信息科學(xué)、數(shù)學(xué)、社會科學(xué)、系統(tǒng)科學(xué)、心理學(xué)和經(jīng)濟學(xué)等學(xué)科理論與方法,從數(shù)據(jù)中提取知識的跨學(xué)科的學(xué)科——數(shù)據(jù)科學(xué)的發(fā)展。
[21] Richardson H W., “Economies and Diseconomies of Agglomeration”, in Urban Agglomeration and Economic Growth, Springer Berlin Heidelberg, 1995, pp. 123-155.
由于大數(shù)據(jù)在高等教育領(lǐng)域的應(yīng)用十分廣泛,本研究主要討論兩種教育大數(shù)據(jù)分析方法,即教育數(shù)據(jù)挖掘和學(xué)習分析在高等教育的教與學(xué)領(lǐng)域中的應(yīng)用情況,以及大數(shù)據(jù)在高等教育領(lǐng)域應(yīng)用面臨的一些兩難挑戰(zhàn)。
在高等教育領(lǐng)域,教育大數(shù)據(jù)分析主要采用兩種技術(shù),即教育數(shù)據(jù)挖掘和學(xué)習分析。對這兩者的關(guān)系,不同的學(xué)者有不同的解讀。有的認為學(xué)習分析是教育數(shù)據(jù)挖掘的一個分支,有的則認為教育數(shù)據(jù)挖掘是學(xué)習分析的一個分支。無論如何,教育數(shù)據(jù)挖掘和學(xué)習分析技術(shù)的發(fā)展都促進了高等教育研究中定量研究能力的發(fā)展,適應(yīng)了高等教育政策和實踐中日益增長的循證分析的需求。
國際教育數(shù)據(jù)挖掘協(xié)會(The International Educational Data Mining Society)認為:“教育數(shù)據(jù)挖掘是一門新興學(xué)科,它關(guān)注開發(fā)探索來自教育系統(tǒng)的獨特類型數(shù)據(jù)的方法,并使用這些方法來更好地理解學(xué)生以及他們所在的學(xué)習系統(tǒng)?!盵10]教育數(shù)據(jù)挖掘是計算機科學(xué)、教育學(xué)和統(tǒng)計學(xué)等領(lǐng)域相互交叉形成的一門新興學(xué)科,它綜合應(yīng)用這些學(xué)科的理論與方法來理解教育系統(tǒng)中的教學(xué)、學(xué)習、管理和科學(xué)研究問題。教育數(shù)據(jù)挖掘應(yīng)用這些不同學(xué)科領(lǐng)域的理論與技術(shù)研究、開發(fā)和實施軟件工具以識別教育大數(shù)據(jù)的形態(tài)與特征。
學(xué)習分析研究協(xié)會(The Society for Learning Analytics Research)將學(xué)習分析定義為:“測量、收集、分析和報告關(guān)于學(xué)習者及其所處的情景的數(shù)據(jù),以便理解和優(yōu)化學(xué)習者的學(xué)習及其發(fā)生的環(huán)境。”[11]學(xué)習分析的目標是對大數(shù)據(jù)進行分析并向教師和學(xué)生提供反饋。例如,通過分析學(xué)生活動和同伴互動所獲得的信息,提出用于改進學(xué)生學(xué)習或課程教學(xué)的建議。
雖然學(xué)習分析和教育數(shù)據(jù)挖掘有許多相似的目標和共同的興趣,但它們之間也有一些差異。學(xué)習分析起源于語義網(wǎng)絡(luò)、智能課程和系統(tǒng)干預(yù),而教育數(shù)據(jù)挖掘則起源于教育軟件、學(xué)生建模和預(yù)測課程結(jié)果等。進行學(xué)習分析的研究者會更頻繁地使用統(tǒng)計、可視化、社會網(wǎng)絡(luò)分析、情感分析、影響分析、話語分析和概念分析等方法,而進行教育數(shù)據(jù)挖掘的研究人員則更多地依賴分類、聚類、關(guān)系挖掘和模型發(fā)現(xiàn)等。學(xué)習分析較側(cè)重對數(shù)據(jù)和結(jié)果的描述,而教育數(shù)據(jù)挖掘則更側(cè)重程序和技術(shù)。
應(yīng)用教育數(shù)據(jù)挖掘和學(xué)習分析方法進行教育大數(shù)據(jù)分析的基本過程包括多個不同環(huán)節(jié),如數(shù)據(jù)的采集、報告、預(yù)測、行動和完善等(如圖1)。
圖1 教育大數(shù)據(jù)分析的基本過程
教育大數(shù)據(jù)分析的基本取向可以分為兩類:一類是數(shù)據(jù)驅(qū)動的分析取向(如圖2),另一類是內(nèi)容或需求驅(qū)動的分析取向(如圖3)[12]。數(shù)據(jù)驅(qū)動的分析取向是從擁有的關(guān)鍵數(shù)據(jù)資源,如各類政策與管理文件、學(xué)校發(fā)展戰(zhàn)略、招生數(shù)據(jù)、課程數(shù)據(jù)、師生背景信息、校友數(shù)據(jù)、管理數(shù)據(jù)和督導(dǎo)反饋數(shù)據(jù)等出發(fā)進行分析。內(nèi)容或需求驅(qū)動的分析取向則強調(diào)從學(xué)生的需求出發(fā),并將不同類型的變量、學(xué)生需求和教育質(zhì)量指標聯(lián)系起來。
圖2 數(shù)據(jù)驅(qū)動的教育大數(shù)據(jù)分析取向
圖3 內(nèi)容或需求驅(qū)動的教育大數(shù)據(jù)分析取向
大數(shù)據(jù)在高等教育領(lǐng)域的應(yīng)用涉及許多方面,如知識建模、行為建模、經(jīng)歷建模、主題建模和課程分析等,其中在教與學(xué)領(lǐng)域常用的一些教育數(shù)據(jù)挖掘和學(xué)習分析方法包括以下幾個方面[13]:
分類與預(yù)測是指根據(jù)數(shù)據(jù)的過去狀態(tài)來搜索和識別自變量和因變量之間關(guān)系的數(shù)據(jù)挖掘方法。在大數(shù)據(jù)分類和預(yù)測分析中,采用的算法或方法有很多[14]。例如,Sivasakthi應(yīng)用學(xué)生人口統(tǒng)計數(shù)據(jù)以及編程導(dǎo)論課程的成績,采用multilayer perception, Na?ve Bayes, SMO, J48和REPTree等分類算法對學(xué)生進行分類,并利用基于上述分類算法的預(yù)測數(shù)據(jù)挖掘模型,對修讀編程導(dǎo)論課程的一年級本科生的成績進行預(yù)測[15]。
聚類是指識別一個完整的數(shù)據(jù)集里在某些方面相似的數(shù)據(jù)點,以便將其劃分為不同類別的小數(shù)據(jù)集。例如,Ding等利用西安理工大學(xué)管理系統(tǒng)大數(shù)據(jù)中的學(xué)生出席率、閱讀數(shù)量、利用圖書館的時間、學(xué)習時間、加權(quán)平均成績和課程通過率等指標,應(yīng)用優(yōu)化的K-means算法對學(xué)生的行為進行了聚類分析,以識別不同的學(xué)生群體及其行為特點,進而為學(xué)校更好地了解和管理學(xué)生提供支持[16]。大數(shù)據(jù)聚類涉及單機和多機的不同聚類技術(shù),其中單機聚類方法包括基于樣本的技術(shù)和減維技術(shù)等不同方法,多機聚類方法包括并行聚類方法(parallel clustering)和基于MapReduce的聚類方法等[17]。
異常值檢測方法是指識別與其他數(shù)據(jù)有顯著差異的數(shù)據(jù)點的過程。被檢測為異常值的數(shù)據(jù)點通常比其他數(shù)據(jù)要大或小許多。我們曾基于2008—2017學(xué)年全國高校博士研究生學(xué)位授予大數(shù)據(jù),采用異常值檢測方法,構(gòu)建了基于博士研究生學(xué)位平均攻讀年限的學(xué)位授權(quán)點監(jiān)測預(yù)警模型,篩選學(xué)位攻讀年限處于異常狀態(tài)的學(xué)位授權(quán)點進行監(jiān)測預(yù)警[18]。
關(guān)系挖掘是指發(fā)現(xiàn)數(shù)據(jù)集里變量間的關(guān)系,并將其編碼為規(guī)則以便今后使用的過程。有多種不同的關(guān)系挖掘方法,比較流行的是關(guān)聯(lián)規(guī)則挖掘。例如,Wang等提出了一種基于深度學(xué)習的“指導(dǎo)者—被指導(dǎo)者”關(guān)系的識別方法,探索了從PhDtree項目中爬取“指導(dǎo)者—被指導(dǎo)者”配對關(guān)系,并通過匹配作為實驗數(shù)據(jù)集的DBLP數(shù)據(jù)集來提取他們的發(fā)表信息的方法[19]。
社會網(wǎng)絡(luò)分析將個體視為網(wǎng)絡(luò)中的節(jié)點,將個體之間的關(guān)系視為節(jié)點之間的連接。社會網(wǎng)絡(luò)分析的目的是確定與理解網(wǎng)絡(luò)環(huán)境中個體之間的關(guān)系。例如,我們曾利用原美國科學(xué)情報研究所高被引數(shù)據(jù)庫(ISI Highly Cited Database)收錄的具有國際聲譽的高被引學(xué)者數(shù)據(jù),應(yīng)用社會網(wǎng)絡(luò)分析方法,從學(xué)科角度分析了2 636名高被引學(xué)者的受教育機構(gòu)與其工作機構(gòu)構(gòu)成的社會網(wǎng)絡(luò)類型及其特征[20]。
過程挖掘可以對信息系統(tǒng)中事件日志提供的有用知識進行可視化表達。過程挖掘包括過程發(fā)現(xiàn)、過程與質(zhì)量標準一致性評估、過程強化與支持等[21]。例如,Goel等利用互動和比較過程挖掘技術(shù),分析了澳大利亞某大學(xué)博士生實際學(xué)習歷程的類型,可視化分析了實際過程與要求過程之間的差異,比較了不同組別學(xué)生的表現(xiàn)并分析了出現(xiàn)不利結(jié)果的原因[22]。
文本挖掘是指用于分析非結(jié)構(gòu)化文本和從原始文本中獲得高質(zhì)量信息的過程。文本挖掘包括文本分類、聚類、名詞提取、情感分析和實體關(guān)系建模等。例如,Gurcan等應(yīng)用文本挖掘技術(shù)分析了2008—2018年發(fā)表的27 735篇期刊論文,以揭示遠程學(xué)習研究的主題和發(fā)展趨勢[23]。
為作判斷提取數(shù)據(jù)是指使用可視化和交互界面來表示數(shù)據(jù)以便讓人能夠快速識別或分類數(shù)據(jù)特征的過程。例如,研究者可以用這種方法分析教育大數(shù)據(jù),以便幫助人們識別學(xué)生的學(xué)習活動或行為模式[24]。
利用模型發(fā)現(xiàn)是一種技術(shù),它使用先前驗證過的現(xiàn)象模型(用預(yù)測、聚類或知識工程方法獲得)作為其他分析(如預(yù)測或關(guān)系挖掘)的一個組成部分。例如,在高等教育領(lǐng)域,利用模型發(fā)現(xiàn)可以用來發(fā)現(xiàn)學(xué)生行為與其特征或?qū)W習情境變量之間的關(guān)系,進而將相關(guān)模型應(yīng)用于機器學(xué)習中[25]。
上述教育數(shù)據(jù)挖掘和學(xué)習分析方法,有些是在教育大數(shù)據(jù)分析中專門使用的,有些在常規(guī)的高等教育研究中也會使用。盡管如此,常規(guī)的高等教育研究方法與教育大數(shù)據(jù)分析方法仍然存在一些差異,表1呈現(xiàn)了兩者之間的差異[26]。
表1 標準的研究方法與大數(shù)據(jù)研究方法的差異比較
大數(shù)據(jù)在高等教育領(lǐng)域的應(yīng)用,雖然為描述、分析與解決高等教育問題提供了前所未有的大樣本,但也面臨許多挑戰(zhàn)。首先,我們需要面對復(fù)雜的數(shù)據(jù)對象。在高等教育領(lǐng)域應(yīng)用大數(shù)據(jù),不僅需要面對高等教育大數(shù)據(jù)收集、處理與分析的安全性、隱私性和相關(guān)倫理要求,而且需要解決如何描述高等教育大數(shù)據(jù)的復(fù)雜性特征這一根本問題。其次,大數(shù)據(jù)計算的復(fù)雜性也是我們需要面對的問題。大數(shù)據(jù)的多源、海量、快速變化等特征,使得傳統(tǒng)的計算方法難以適應(yīng)大數(shù)據(jù)分析的要求,因此需要創(chuàng)新處理與分析高等教育大數(shù)據(jù)的方法,開發(fā)面向高等教育大數(shù)據(jù)的高效算法。第三,在高等教育領(lǐng)域應(yīng)用大數(shù)據(jù)還需要大數(shù)據(jù)基礎(chǔ)設(shè)施和處理系統(tǒng)的支持。大數(shù)據(jù)分析既需要解決計算的復(fù)雜性問題,也需要滿足處理的實時性要求,要求有相應(yīng)的基礎(chǔ)設(shè)施支持。這不僅對高等教育大數(shù)據(jù)的系統(tǒng)架構(gòu)、計算框架和處理系統(tǒng)的設(shè)計提出了新的挑戰(zhàn),而且對它們的運行效率和能源消耗提出了嚴格要求。
Ekbia等曾將大數(shù)據(jù)應(yīng)用面臨的兩難挑戰(zhàn)概括為如下幾個方面[1]:一是認識論的兩難挑戰(zhàn)。例如,在大數(shù)據(jù)分析中,是強調(diào)因果聯(lián)系還是統(tǒng)計相關(guān)?是強調(diào)探求因果機制還是基于表象預(yù)測發(fā)展趨勢?二是方法論的兩難挑戰(zhàn)。這涉及定量與定性方法應(yīng)用的長期爭論。例如,在收集、清洗數(shù)據(jù)時,是強調(diào)計量還是不強調(diào)計量?在分析數(shù)據(jù)時,是否需要以及如何選擇統(tǒng)計顯著性水平?三是審美的兩難挑戰(zhàn)。例如,進行數(shù)據(jù)可視化分析時,是強調(diào)呈現(xiàn)的精確性還是強調(diào)呈現(xiàn)的美觀性?四是技術(shù)的兩難挑戰(zhàn)。例如,計算機系統(tǒng)是強調(diào)連貫性還是創(chuàng)新性?是強調(diào)機器自動化還是人的作用?五是法律和倫理的兩難挑戰(zhàn)。例如,如何保護隱私?是參與還是不參與大數(shù)據(jù)的收集與分析?是開放還是保護大數(shù)據(jù)的知識產(chǎn)權(quán)?六是政治和經(jīng)濟的兩難挑戰(zhàn)。例如,大數(shù)據(jù)作為一種信息資產(chǎn),是為其形成積極地做貢獻還是只考慮如何利用它?對由大數(shù)據(jù)塑造的一些社會形象,是簡單服從還是抵制?這些兩難挑戰(zhàn),也是大數(shù)據(jù)在高等教育領(lǐng)域應(yīng)用時會面臨的問題。要推動大數(shù)據(jù)在高等教育領(lǐng)域應(yīng)用的發(fā)展,必須認真處理這些問題。