翟雪松 許家奇 陳鑫源 楚肖燕 李雨珊 李 媛
(1.浙江大學 教育學院,浙江杭州 310058;2.浙江省教育技術中心 數字資源部,浙江杭州 310012;3.浙江大學 外國語學院,浙江杭州 310058)
近年來,研究者圍繞人工智能技術與教育場景開展了大量交叉研究,重點聚焦人機交互數據,如資源瀏覽、在線討論、課堂互動等文本和行為,利用人工智能分類或預測算法進行學習分析,提高分析和預測的準確性,為數據驅動的教與學提供有效策略(李海峰等,2022)。然而,基于文本和行為數據的分析雖然能夠客觀反映學習者學習狀態(tài),但難以呈現相關狀態(tài)的生理過程,以及解釋學習者認知、情感和行為變化的內在機制(鄭旭東等,2020)。隨著腦神經科學理論的發(fā)展及腦科學分析工具的實時性和便攜性提高,教育神經學成為發(fā)現教育行為機制的重要學術研究領域(韋鈺,2022)。腦神經伴隨師生行為會產生海量數據。其中,腦電數據具有無侵入、輕量化、易采集、可視化強等特點,成為教育神經學的主要研究對象。然而,腦神經數據量大、多維性強,給描述性統計提出了挑戰(zhàn),也為教育神經學與人工智能的相互彌合帶來機遇。
基于腦神經大數據的教育人工智能可以更好地解釋學習行為產生的內在原因,然而兩大領域結合挑戰(zhàn)大,實證研究不足。究其原因,一方面要借助人腦神經工作機制,把知識驅動與數據驅動結合起來,充分發(fā)揮知識、數據、算法和算力四要素的作用;另一方面要從認知、行為層面的學習分析擴展到腦的活動模式及其與學習過程關系的分析(翟雪松等,2022a)?;诖?,本研究以在線學習者視覺舒適度的識別分析為案例,使用變分模態(tài)分解和樣本熵的方法提取和分析腦電數據特征,運用人工智能機器學習方法分類,探尋人工智能與神經科學在教育場景下協同分析的方法與路徑。
腦電(electroencephalogram,EEG)和人工智能的教育應用都經歷了多個發(fā)展階段,從不同階段的應用場景和挑戰(zhàn)分析兩個學科的協同價值為本研究提供理論基礎。此外,為解決不同教育問題,兩者不同階段的應用模式可以相互交叉,為研究者探索人工智能與腦神經科學的教育協同技術路徑提供參考。本研究對腦電教育應用現狀、數據視角下人工智能教育應用模式、腦電與人工智能融合的數據分析三方面進行綜述。
腦電分析是腦科學研究的典型方法,主要基于腦電波生理反饋技術,先后形成了自發(fā)腦電、誘發(fā)腦電和生物信息(bioinformatics)三種應用模式。1)自發(fā)腦電指在無明顯外界刺激時大腦呈現的規(guī)律及不同程度的電位變化。自發(fā)腦電分析以具有節(jié)律性的腦電信號頻段為基礎,主要聚焦分析δ、θ、α、β、γ五個頻率腦電波段(見表一)。多元頻段的腦電分析能直觀地觀察腦電各個節(jié)律的分布變化,探究學習過程中認知、情感等發(fā)生的內在機理。丹恩等(Dan et al.,2017)利用 α 和 θ 波比較學習者在虛擬3D與2D環(huán)境下面對相同任務時認知負荷的高低。馬敏元等(Ma et al.,2016)通過測量大腦的α波和β波,探究不同媒體形式的繪本對兒童注意力的影響。在認知神經科學實驗中,僅使用連續(xù)的自發(fā)腦電記錄不能提供足夠的信息,無法體現完成特定學習任務腦神經的發(fā)生機制(Beres,2017)。因此,借助額外的教育刺激提供必要的信息,即誘發(fā)腦電成為教育神經學第二個發(fā)展階段關注的重點。
表一 腦電信號波段及其特點
2)誘發(fā)腦電或稱之為事件相關電位(eventrelated potential,ERP),指給予神經系統特定刺激,或使大腦對刺激的信息進行加工,從而檢測腦的相應部位的生物電反應。事件相關電位始于神經傳遞過程產生的突觸后電位,反映了由重復刺激所引起的神經元活動。常見的事件相關電位成分包括外源性成分(P1、N1、P2)和內源性成分(N2、P3)兩種。相關研究一方面利用誘發(fā)腦電分析確切知道刺激在學習過程的哪個時間點呈現,從而分析大腦對特定刺激的反應,如聲音、單詞、圖片等(Beres,2017)。多媒體學習實驗研究發(fā)現,早期的圖片誘發(fā)了獨特的N300成分,晚期的圖、文均誘發(fā)了N400效應(李松清等,2015)。另一方面,用于教育實驗的誘發(fā)腦電能夠有效反映學習認知過程。例如,在刺激反應學習中,研究者可以通過檢測P1、P3 成分評判學習者獲得的價值效應(Molinero et al.,2021)。與自發(fā)腦電相比,誘發(fā)腦電振幅很小,難以在原始腦電記錄呈現,通常需借助獨立分量分析(independent component analysis,ICA)、極大似然估計 、 主 成 分 分 析(principal components analysis,PCA)、小波變換、時頻濾波、神經網絡等方法。此外,基于腦電的研究需要納入越來越多的被試,并采集長時間、多階段的數據,這些因素導致腦電數據量劇增(伏云發(fā)等,2021),大數據腦電分析由此需要創(chuàng)新人工智能應用方法。
3)在生物信息分析階段,基于人工智能實時、大規(guī)模的腦電數據分析成為研究熱點。常用的分析方法包括有監(jiān)督的機器學習和無監(jiān)督的機器學習。有監(jiān)督的機器學習包括分類和回歸,無監(jiān)督的機器學習包括聚類和降維。常用分析算法包括線性回歸、非線性回歸、支持向量機(SVM)、K最近鄰 (KNearest Neighbour,KNN)、神經網絡 (ANN)、樸素貝葉斯、決策樹和隨機森林、集成學習(EL)、模糊邏輯、強化學習等十余種。周筠等(Zhou et al.,2017)基于大規(guī)模在線課程環(huán)境的θ和α波段腦電數據,使用支持向量機方法將在線學習分為高認知負荷水平和低認知負荷水平。林福仁等(Lin et al.,2018)采用不同的監(jiān)督學習算法檢測在線學習活動的腦力勞動,發(fā)現決策樹方法的準確性優(yōu)于支持向量機方法和K近鄰方法。朱麗等(2022)發(fā)現基于卷積神經網絡和雙向長短時記憶(Bi-LSTM)網絡的腦電分析混合模型在效價度(potency degree)和喚醒度方面能夠有效進行情感識別。目前,基于人工智能的腦電分析在醫(yī)學、教育等領域應用已有一定探索,但面對復雜的教育活動,有效分析大腦信號,理解大腦如何進行認知仍是巨大的挑戰(zhàn)。
人工智能技術的發(fā)展及其與教育教學的深度融合,推動基于多模態(tài)數據的學習分析成為教育數字化轉型背景下挖掘教育數據價值的重要手段(王雪等,2022)。人工智能的基座是數據源,基于大數據分析的教育平臺建設是人工智能應用于學習分析的前提。教育數據源隨著學校信息化建設不斷豐富,適用人工智能的教育數據可分為三類:學習平臺的文本數據、現實場景的學習行為數據、學習者生理反饋數據。
1.學習平臺的文本數據。學習者使用學習平臺會產生交互文本和日志文本數據,前者能夠呈現學習者的學習內容和質量,后者能揭示學習行為和過程。賈文軍等(2020)通過采集學生在線評論文本數據,運用聚類分析識別和刻畫在線學習者課前、課中和課后的學習體驗,為線上教學提供參考。達科斯塔等(da Costa et al.,2020)基于學生與學習管理系統的互動數據,利用多層感知器算法自動識別學生的五種學習風格,為優(yōu)化學生在線學習方式提供依據。
2.現實場景的行為數據。物聯網、傳感器的不斷發(fā)展和學校信息化基礎設施的完善,使得采集在線學習者的表情、姿態(tài)、手勢、話語等行為數據越來越便捷?;谌斯ぶ悄茉诰€學習行為數據分析成為反映學習者認知和情感狀態(tài)的重要手段(張勁松等,2021):1)通過行為數據識別學習者的認知狀態(tài)。陳鴻仁等(Chen et al.,2012)使用圖像識別技術檢測面部表情,分析學習者的注意力狀態(tài)。齊永鋒等(2021)基于頭部姿態(tài)和表情數據,通過Resnext50神經網絡,識別學習者在線課堂參與度。2)通過行為數據分析識別學習者的情感狀態(tài)。撒哈等(Saha et al.,2014)采集被試的肢體動作數據,然后利用二元決策樹、集成樹、K近鄰、支持向量機等機器學習算法進行情感分類,發(fā)現集成樹的識別準確率最高。翟雪松等(2022b)基于VGG-16、ResNet等深度學習神經網絡算法,通過表情、姿態(tài)數據識別學習者的四類在線學習情感。
3.學習者生理數據。隨著生理反饋技術的不斷進步,低投入、無侵入、不接觸、易操作的輕量級生理反饋工具已經應用于教育教學(翟雪松等,2020)。這使得人工智能應用從分析學習者的成績和感知,逐步擴展到構建健康的學習環(huán)境。學習者的生理數據主要包括呼吸、心跳、腦電、眼動、皮膚電等信息,可用于分析心理健康和生理健康。帶有心律監(jiān)測器和情緒識別算法的emWave系統能夠通過檢測心率變化識別學習者視頻學習的心理狀態(tài)(Chen & Sun,2012)。貝葉斯網絡(BayesNet)在基于學習者眼動數據的在線學習專注度判別上取得了最好的識別結果。劉偉鋒等(Liu et al.,2018)提出了強化在線學習的機器學習方法,取得了較好的實時心理狀態(tài)預測效果。然而,現有研究主要聚焦在心理層面,對生理層面的健康研究相對較少(劉哲雨等,2022)。隨著全社會越來越關注健康的在線學習環(huán)境,協同生理參數和智能算法優(yōu)化現有的學習環(huán)境將成為重要的研究方向(翟雪松等,2022b)。
機器學習、大數據、深度學習等技術為人工智能的發(fā)展帶來新突破,越來越多的研究將人工智能技術與腦科學、認知科學等進行學科交叉與融合,并應用于研究在線學習環(huán)境,但腦電與人工智能融合在高質量數據處理、多通道和多頻段的腦電協同分析和學習者健康分析方面還存在不足。
首先,人工智能對訓練數據集的精確性和準確性要求較高,高質量的數據處理是保證數據分析準確的前提。當前,部分腦電研究直接將原始(或僅預處理后)的腦電信號嵌入模型進行訓練分析(李錦瑤等,2022)。這種方式一定程度上能保證完整的腦電數據片段和足夠的數據量,減少數據分析成本,但原始腦電數據會存在偽跡的非大腦信號,即大腦中的污染信號(Kaur & Kaur,2015)。腦電數據分析的準確性也會因偽跡象、噪音等的影響而大打折扣。原始腦電信號要經過各種處理(如降噪、特征提取等)才能變得可讀。納夫陽和阿爾達耶夫(Al-Nafjan & Aldayel,2022)使用腦電信號檢測學生在線學習注意力,對腦電數據進行帶通濾波、ICA濾波等去除偽跡操作后,利用功率譜密度(power spectral density,PSD)方法進行特征提取,并通過k-最近鄰、支持向量機和隨機森林三種機器學習方法評估系統對腦電數據的分類準確性,其中隨機森林方法的效果最佳。
其次,多通道、多頻段的腦電信號協同分析能夠有效解釋大腦的信息加工過程。基于腦電的在線學習分析往往通過單通道或者單頻段計算在線學習者的注意力、學習情感等,通過學習者的專注度和放松度表明學習者的認知和情感狀態(tài)。然而,單通道或頻段的數據分析可解釋性弱,不能準確反映大腦產生相關認知或情感狀態(tài)的內在機制和真實情況(許子明等,2021)。在線學習過程中,學習者的認知和情感狀態(tài)產生原因是復雜的,通過多通道和多頻段的協同分析,并考慮通道和頻段間的相互影響才是解釋學習者大腦信息加工過程、分析學習狀態(tài)的有效方法。沃特等(Walter et al.,2017)使用包含28個通道的腦電設備采集在線學習者的腦電數據,基于伯格最大熵譜分析法(Burg's maximum entropy method)分析學習者的 θ、α、δ和β波段的腦電信號,通過多通道和多頻段的協同分析,在線估計學習者的學習量,并及時調整學習材料難度,從而支持學習者學習。
最后,腦電分析應同時關注學習者認知、情感和健康。腦電與人工智能融合在線學習分析多關注學習者的認知和情感狀態(tài),缺少健康方面的分析、測量與干預?;谀X電的認知計算能夠準確反映學習者的認知負荷和注意力等認知狀態(tài)。阿加沃爾等(Aggarwal et al.,2021)通過腦電頻段評估學習者MOOC學習的注意力水平,并采用支持向量機的機器學習分類模型,將學生心理狀態(tài)分為專注型和非專注型。腦電分析可以反映學習者不同的情感狀態(tài)。瓦倫齊等(Valenzi et al.,2014)基于腦電數據測試七種分類方法對學習者觀看在線視頻的四種情緒效果發(fā)現,支持向量機方法的分類精度最高,達97.2%。在實時在線學習情感分類中,南迪等(Nandi et al.,2021) 基 于隨機 梯 度下降(stochastic gradient descent,SGD)算法和 Logistic 回歸開發(fā)了實時情緒分類系統,通過分析腦電數據流實現效價度和喚醒度維度的在線學習情緒狀態(tài)識別。然而,在線學習健康研究少。在線學習時間長和強度大,學習者會出現疲勞、干眼等癥狀,進而引發(fā)計算機視覺綜合征(翟雪松等,2021)。視覺健康是在線學習者健康的重要分析內容。視覺舒適度作為反映視覺健康的關鍵指標,基于腦電數據智能識別在線學習視覺舒適度,對改善在線學習環(huán)境,保護學習者的視覺健康有重要意義。
本研究利用腦電分析技術,探究不同媒體表征的文本材料對在線學習視覺舒適度的影響和腦電信號的反饋特征,并通過不同機器學習算法分析識別效果?;诖耍狙芯刻岢鋈齻€假設:
H1:學習者面對不同媒體表征的文本資料時,不同功能腦區(qū)腦電信號存在差異。
H2:反映學習者視覺舒適度的腦電信號的不同腦波頻段存在差異。
H3:不同人工智能分類模型對腦電信號識別具有差異性。
本研究的被試是我國東部某高校的40名德語專業(yè)研究生和本科生,均自愿參加實驗,知情并同意實驗內容。實驗內容為60個有一定難度的德語句子。選擇這一實驗內容的原因為:一是學習者閱讀句子需要理解單詞的含義和句法成分,這會增加學習者信息處理的認知負荷,有助于發(fā)揮腦電分析細顆粒度信息的優(yōu)勢(Britton et al.,2017);二是將德語作為唯一文本表征形式,避免了在線學習環(huán)境其他媒體因素對學習者認知的干擾,突顯媒體表征刺激的效果。
此外,為了驗證不同媒體表征的德語文本對學習者帶來的不同視覺舒適度,本研究基于多媒體學習認知理論設計了短閃、漸變模糊、模擬眨眼和顏色變化四種媒體表征形式(見圖1),將德語文本以四種表征形式分別呈現給學習者。
圖1 腦電協同人工智能分析技術路線
本研究的實驗工具包括腦電設備Emotiv Epoc X和問卷。腦電采集設備為包含14個電極(AF3,F7,F3,FC5,T7,P7,O1,O2,P8,T8,FC6,F4,F8,AF4)的移動便攜式腦電儀,采樣率為128 Hz。問卷內容包括基本信息和視覺舒適度,前者包括實驗對象的姓名、性別、年齡和班級;后者包括學習者觀看不同媒體表征教學視頻時視覺舒適程度,為后續(xù)視覺舒適程度劃分提供依據。本研究基于茨諾夫爾沙寧等(Crnovrsanin et al.,2014)研究結論,即不同的媒體表征(如短閃、模糊等)刺激會影響在線學習者的視覺舒適度,且被試對模糊刺激的滿意度高于短閃刺激。本研究將視覺舒適程度由高到低分為四個等級,媒體表征刺激對應情況為:顏色變化、模擬眨眼、漸變模糊、短閃。顏色變化媒體表征方式使被試的視覺最舒適,模擬眨眼、模糊次之,短閃的媒體表征方式讓學習者最不舒適,被試實驗后填寫的視覺舒適度問卷分析也印證了視覺舒適度的劃分標準。
1.數據預處理和智能特征提取
數據預處理過程包括:1)將Emotiv采集的腦電數據格式轉換為腦電分析軟件(electroencephalogram lab,EEGLAB)可以處理的數據格式;2)進行通道定位,剔除與本研究無關的眼電、心電、肌電等電極;3)對腦電信號進行降噪、全腦平均、分段,剔除壞段處理和不合格的腦電數據;4)進行ICA獨立成分分析和極端值去偽跡操作,去除眼動相關和超過正負100微伏的腦電偽跡。本研究選擇的通道包括 FC5、T7、O1-O2,選擇依據包括:1)FC5 對應負責認知處理的大腦額葉區(qū)域,O2對應負責視覺感知的枕葉區(qū)域(Khasnobish et al.,2013)。2)耳周圍電極(如T7,對應顳葉區(qū)域)能夠移動監(jiān)測腦電圖,受環(huán)境干擾小,且在視覺刺激任務中是有效的通道(Ergin et al.,2019)。本研究分析腦電信號低頻與高頻信號頻段發(fā)現:θ波與在線學習者的認知負荷和情緒狀態(tài)有關,分析該頻段能夠反映不同視覺舒適度與學習情感的關系;β波與緊張和注意力狀態(tài)有關,分析該頻段可反映不同視覺舒適度與學習認知的關系。
本研究采用變分模態(tài)分解(variational mode decomposition,VMD)方法進行腦電信號特征提取時發(fā)現:1)時頻分析能描述腦電信號的頻譜含量是怎樣隨時間變化的,相較于獨立的時域和頻域分析具有更高的時間精度和準確性。2)變分模態(tài)分解方法是一種自適應、完全非遞歸的模態(tài)變化和信號處理方法,能自主選擇模態(tài)個數,特征提取精度更高,更具魯棒性(Dragomiretskiy & Zosso,2013)。變分模態(tài)分解方法認為信號是由不同頻率占優(yōu)的子信號疊加而成的,其目的是要把信號分解成不同頻率的子信號。變分模態(tài)分解過程分為兩個階段(劉長良等,2015):1)變分問題構造,包括利用希爾伯特變換(Hilbert)得到每個模態(tài)的解析信號和對應頻譜,然后將每個模態(tài)分量頻譜平移到基帶,再利用高斯平滑(Gaussian smoothness)估計信號的帶寬。2)變分問題求解,即通過引入二次懲罰因子和拉格朗日乘法算子將約束性變分問題變?yōu)榉羌s束性變分問題,并采用乘法算子交替方向法解決變分問題。
樣本熵(SampEn)的計算步驟包括:構建一組時間序列向量、計算不同向量之間的最大距離、給定相似容度、計算樣本熵。腦電信號樣本熵的大小表示腦電信號的復雜程度,樣本熵越大,腦電信號越復雜,樣本熵越小,腦電信號越穩(wěn)定(Richman et al.,2004;丁正敏等,2018)。
2.智能識別模型構建
在選擇分類模型上,機器學習的選擇標準是輕量化、效率高且能夠同時執(zhí)行多類標簽分類任務。本研究腦電數據分析采用離線模式,便于對數據進行無限次掃描,成本較低。本研究的在線學習視覺舒適度智能識別模型(見圖2),包括數據獲取和預處理、數據分析、分類識別三個模塊。其中,數據獲取和預處理指采集在線學習者學習過程的腦電數據并進行預處理。基于此,本研究數據在腦電特征提取后基于決策樹、支持向量機、K最鄰近、邏輯回歸和集成學習建立在線學習視覺舒適度分類識別模型,并通過比較選出最優(yōu)分類模型,據此得到四類在線視覺舒適度。
圖2 基于腦電的在線學習視覺舒適度智能識別模型
本研究利用變分模態(tài)分解方法分解被試腦電信號特征。腦電信號FC5導聯變分模態(tài)分解效果和頻譜分析結果見圖3。腦電信號分解為5個IMF分量,避免了模態(tài)重疊。此外,該方法還能自適應地將腦電信號分解成不同頻段,實現腦電信號的頻段分離(謝平等,2016)。分解效果和頻譜分析結果表明,變分模態(tài)自適應分解后的腦電信號的各個分量能較準確地對應不同的功能頻帶,如IMF2頻率范圍為 4 Hz-7 Hz,對應θ 頻帶;IMF4 頻率范圍為30 Hz-33 Hz,對應 β 頻帶。
圖3 腦電信號FC5導聯變分模態(tài)分解效果(左)和頻譜分析結果(右)
θ頻段腦電樣本熵均值隨時間變化情況(FC5、T7、O2電極)見圖4。β頻段腦電樣本熵均值隨時間變化情況(FC5、T7、O2電極)見圖5。其中,Comf1、Comf2、 Comf3、 Comf4 分別對應模擬眨眼、顏色變化、模糊和短閃四種視覺刺激下視覺舒適度的腦電樣本熵均值變化。
圖4 θ 頻段腦電樣本熵均值隨時間變化(FC5、T7、O2 電極)
圖5 β 頻段腦電樣本熵均值隨時間變化(FC5、T7、O2 電極)
三個電極中,β頻段的樣本熵均值整體大于θ頻段的樣本熵均值。這說明在有媒體表征刺激的在線學習中,學習者θ頻段腦電信號比β頻段腦電信號更規(guī)則,即β波更活躍,說明學習者注意力水平較高。隨著在線學習時間的延長,θ頻段的四類視覺舒適度樣本熵均值呈下降趨勢。這說明隨著視覺刺激時間的增加,腦電信號變化更加規(guī)則。這可能與在線學習者逐漸適應媒體表征刺激有關,引發(fā)認知負荷相關的腦波活躍程度降低。隨著在線學習時間的延長,β頻段四類視覺舒適度樣本熵均值變化波動不太明顯。
θ頻段樣本熵均值變化結果(見表二)顯示,O2導聯(枕葉區(qū))的樣本熵均值大于FC5導聯(額葉區(qū))和T7導聯(顳葉區(qū))的樣本熵均值。由此可見,四類視覺刺激引起的θ波信號中,枕葉區(qū)的θ波信號最復雜。這與枕葉區(qū)的功能與視覺信息的感知和加工處理有關。從枕葉區(qū)不同媒體刺激對應視覺舒適度的樣本熵均值可以看出,漸變模糊和短閃的樣本熵均值較高,這兩種視覺舒適度的腦電信號較復雜,腦波活動比較頻繁;顏色變化樣本熵均值最低,腦電信號相對穩(wěn)定。
表二 θ頻段不同視覺舒適度在不同腦區(qū)的樣本熵均值大小
β頻段的樣本熵均值變化結果(見表三)顯示,O2導聯(枕葉區(qū))和FC5導聯(額葉區(qū))的樣本熵均值幾乎相等,且大于和T7導聯(顳葉區(qū))的樣本熵均值。由此可見,四類視覺刺激引起的β波活動中,枕葉區(qū)和額葉區(qū)的腦電信號最復雜,即腦波活動最頻繁。這與枕葉區(qū)視覺信息處理功能有關,也與學習者在線學習需要額葉區(qū)參與認知處理有關。比較枕葉區(qū)不同媒體刺激對應視覺舒適度的腦電情況表明,漸變模糊樣本熵均值最大,容易引起較強的腦波活動。比較額葉區(qū)不同媒體刺激對應視覺舒適度的腦電情況表明,漸變模糊和模擬眨眼樣本熵均值最大,腦電信號最復雜。枕葉區(qū)和額葉區(qū)的顏色變化的樣本熵值最小,腦電信號相對穩(wěn)定。
表三 β頻段不同視覺舒適度在不同腦區(qū)的樣本熵均值大小
綜上,在線學習視覺舒適度的腦電數據樣本熵分析結果表明:1)不同視覺刺激會提高學習者的注意力水平;2)短閃、漸變模糊的視覺舒適度對腦電信號影響較大,能引起枕葉區(qū)較強的大腦活動;3)顏色變化的視覺舒適度對腦電影響最小,三個腦區(qū)的腦電信號都較穩(wěn)定。
本研究對四類視覺舒適度的腦電數據進行識別發(fā)現,四類腦電數據的區(qū)分度不高,識別效果不夠良好?;谀X電數據的樣本熵分析結果,本研究選取腦電數據區(qū)分度較高的兩類視覺舒適度(短閃和顏色變化)進行基于人工智能算法的識別分析。
五種識別算法可較好地識別在線視覺舒適度,準確率均高于50%(見表四)。其中,顳葉區(qū)的識別準確率高于其他兩個區(qū)域,K近鄰算法的準確率最高,為62.5%;支持向量機和集成學習的準確率也超過60%;邏輯回歸準確率為58.4%;決策樹模型識別準確率最低,為57.5%。
表四 五種人工智能算法的視覺舒適度識別結果
腦電等生理數據能夠反映學生學習的真實狀態(tài)。相較于表情、姿態(tài)等行為數據,它具有高精確和低侵入的特點。然而,腦電分析的困難源于信號的復雜性。腦電數據的成倍增加和所需分析解讀的信號類型日益復雜,對腦電信號分析算法提出了更高要求,即海量數據下腦電信號分析算法能保持高效、穩(wěn)定和較高的精度。人工智能算法能夠提高數據處理的效率和準確度,數據越多、越廣,人工智能算法的效果越好?;诖?,腦電與人工智能協同彌合了兩者的內在張力,確保腦電數據的客觀真實和人工智能算法的準確高效。本研究通過腦電和人工智能協同分析,從在線學習角度豐富了腦電與人工智能協同分析理論。未來研究應繼續(xù)關注神經生物學、認知心理學和人工智能之間的聯系,結合知識驅動與數據驅動,豐富和創(chuàng)新人工智能協同腦神經教育分析理論(單美賢等, 2021)。
人工智能協同腦神經的分析方法可用于探究學習者大腦的信息加工和組織方式,并結合腦波和腦區(qū)解釋學習認知、情感和健康狀態(tài)背后的原因。但實驗室的腦電分析方法已無法滿足教育研究的個性化和規(guī)?;?。一方面,現有腦電數據集主要集中在情感分析數據集,如上海交通大學BCMI實驗室提供的SEED腦電數據集、英國倫敦瑪麗皇后大學等研究機構提供的DEAP腦電數據集(Koelstra et al.,2011)。學習分析領域腦電數據集不完善使得個性化教學評價難以實現。另一方面,現有研究大多基于常規(guī)人工智能算法,尚未建立針對大規(guī)模在線學習的腦電分析方法。本研究針對在線學習者視覺舒適度的識別問題,構建了面向在線學習者的視覺舒適度腦電數據集,可為后續(xù)研究提供數據基礎;利用變分模態(tài)分解和樣本熵的智能特征提取分析方法,結合大腦額葉、顳葉和枕葉三個區(qū)域兩個頻段的腦波變化情況,討論了不同視覺刺激對在線學習者認知和注意力的影響。未來人工智能和腦神經協同分析應考慮教育問題的綜合性和多維立體性,既要構建多維度、高質量、大規(guī)模的教育腦電數據集,也要針對具體教育問題,找到有效分析方法。
人工智能與腦神經的協同為在線學習分析創(chuàng)造了更多空間。這包括揭示在線學習者的大腦工作原理和學習認知、情感的發(fā)生機制;通過人工智能算法模型解決多種學習場景問題,賦能教學變革和教學質量提升(翟雪松等,2023)?,F有腦電分析更多關注學習者認知和情感,對在線學習環(huán)境的生理健康因素關注較少。本研究從視覺健康視角出發(fā),基于腦電數據識別在線學習者視覺舒適度,有助于解決極端環(huán)境下大規(guī)模開放性課程帶來的視覺疲勞問題,提高視覺疲勞診斷和調控的客觀性、準確性,并實現智能干預。未來人工智能協同腦神經分析應注重在線學習健康狀態(tài)與學習行為、認知、情感等的關系,深化新時代教育評價改革。