董衛(wèi)華,王圣凱,王雪元,楊天宇
1. 北京師范大學(xué)地理科學(xué)學(xué)部,北京 100875; 2. 北京師范大學(xué)地理空間認(rèn)知與可視分析實(shí)驗(yàn)室,北京 100875
近年來(lái),眼動(dòng)追蹤技術(shù)在地圖學(xué)領(lǐng)域得到了廣泛發(fā)展[1],并應(yīng)用于用戶行為分析[2-3]、人機(jī)交互[4-5]、產(chǎn)品可用性評(píng)價(jià)等方面[6-7]。地圖在提高人的空間認(rèn)知效果方面具有顯著作用[8],但當(dāng)前地圖信息傳輸模式在一定程度上限制了人的空間感知與認(rèn)知[9]。研究發(fā)現(xiàn),地圖信息的傳輸效率依賴于人腦信息處理效率和視覺注意的認(rèn)知能力[10-12]。相比于傳統(tǒng)信息傳輸設(shè)備,眼動(dòng)交互被認(rèn)為是更自然、更直接的交互手段[13]。已有研究通過(guò)眼動(dòng)追蹤技術(shù)探究了用戶閱讀不同類型地圖時(shí)的讀圖行為以及信息搜索與加工過(guò)程[14-15]。如何自動(dòng)識(shí)別用戶閱讀地圖要素的眼動(dòng)行為,對(duì)于提高用戶地圖交互、信息搜索的效率,具有重要應(yīng)用價(jià)值。
現(xiàn)有地圖要素眼動(dòng)識(shí)別研究主要以視點(diǎn)位置直接對(duì)地圖要素進(jìn)行匹配。文獻(xiàn)[16]提出了一種基于馬爾可夫的視點(diǎn)-地圖要素匹配的算法。該研究主要針對(duì)路網(wǎng)圖進(jìn)行視點(diǎn)與路線矢量要素的匹配問(wèn)題,在算法層面上對(duì)眼動(dòng)數(shù)據(jù)與實(shí)際觀看的地圖要素的匹配進(jìn)行了探究。文獻(xiàn)[17]建立了一個(gè)城市旅行規(guī)劃系統(tǒng)——iTourist。系統(tǒng)以某地的地圖和一些圖片作為交互刺激材料,通過(guò)對(duì)用戶的視點(diǎn)進(jìn)行興趣得分建模,當(dāng)?shù)梅诌_(dá)到某一閾值時(shí)激活該目標(biāo)。但是,采用視點(diǎn)位置進(jìn)行匹配時(shí),準(zhǔn)確率較低,尤其對(duì)線狀要素的提取效果較差。
研究表明,用戶地圖讀圖行為受地圖類型和讀圖任務(wù)的影響較大[18],基于用戶對(duì)地圖的認(rèn)知特征以及要素閱讀行為構(gòu)建模型有助于提高地圖要素識(shí)別準(zhǔn)確率。此外,眼動(dòng)視覺行為識(shí)別算法的效率也是目前的研究難點(diǎn)。文獻(xiàn)[3]通過(guò)支持向量機(jī)(support vector machine,SVM)利用眼動(dòng)數(shù)據(jù)識(shí)別用戶讀圖行為,包括自由查看、搜索、路線規(guī)劃、中心搜索、路線追隨和多邊形比較,算法平均識(shí)別準(zhǔn)確率為77.7%。但該算法涉及了大量的特征參數(shù),效率較低。文獻(xiàn)[19]關(guān)于某文檔編輯軟件使用的日常行為識(shí)別中采用機(jī)器學(xué)習(xí)的方法識(shí)別出書寫、閱讀和復(fù)制等操作行為,識(shí)別準(zhǔn)確率在62%~83%。該算法采用了特征選擇處理,提高了模型效率。因此,需要結(jié)合用戶視覺行為特征,同時(shí)進(jìn)行特征選擇,降低特征冗余度,以提高模型效率。
線狀要素作為狹長(zhǎng)的空間實(shí)體,其閱讀行為識(shí)別相較與點(diǎn)要素和面要素具有特殊性,無(wú)法通過(guò)空間位置定位和面積占優(yōu)的方法進(jìn)行有效識(shí)別。線狀要素閱讀行為較為復(fù)雜,包括起點(diǎn)終點(diǎn)搜索、流線跟蹤、要素對(duì)比等[15]。因此,本文擬圍繞對(duì)線狀要素閱讀行為的眼動(dòng)識(shí)別,通過(guò)設(shè)計(jì)眼動(dòng)追蹤試驗(yàn),采集用戶地圖讀圖過(guò)程中的視覺行為數(shù)據(jù),基于樸素貝葉斯分類器(naive Bayesian classifier,NBC)的機(jī)器學(xué)習(xí)方法,實(shí)現(xiàn)眼控交互過(guò)程中地圖線狀要素閱讀行為識(shí)別算法,最后對(duì)算法的效率和準(zhǔn)確率進(jìn)行評(píng)估。
試驗(yàn)分為試驗(yàn)準(zhǔn)備、眼動(dòng)試驗(yàn)、眼動(dòng)數(shù)據(jù)獲取、數(shù)據(jù)分析、特征提取和結(jié)論6個(gè)部分。
(1) 試驗(yàn)準(zhǔn)備階段,根據(jù)試驗(yàn)?zāi)康?,分別選取30幅以線條為主的線型地圖和30幅普通地圖。為確保眼動(dòng)試驗(yàn)的可靠性,對(duì)被試者進(jìn)行合理選取,樣本容量足夠大。被試者選取應(yīng)考慮的因素:年齡、性別、專業(yè)分布,是否色盲、近視或遠(yuǎn)視。
(2) 眼動(dòng)試驗(yàn)階段,保證試驗(yàn)環(huán)境的穩(wěn)定性,被試者在試驗(yàn)過(guò)程中不應(yīng)受到任何非試驗(yàn)因素的干擾。
試驗(yàn)共選取25名被試者進(jìn)行試驗(yàn)。這些被試者都來(lái)自北京師范大學(xué)地理科學(xué)學(xué)部專業(yè)的學(xué)生,分別是12女13男,年齡在19至25。所有被試者的視力均正?;虺C正至正常,且未報(bào)告患有眼疾,能夠產(chǎn)生正常的眼動(dòng)數(shù)據(jù)。每名被試者產(chǎn)生60個(gè)眼動(dòng)樣本數(shù)據(jù)。
試驗(yàn)選用的儀器為:Tobii REX for developer眼動(dòng)儀(精確度為0.5°),數(shù)據(jù)傳輸率/采樣頻率為30 Hz;聯(lián)想揚(yáng)天一體機(jī)(22.9寸TFT顯示屏),1280×1024像素,數(shù)據(jù)傳輸率/采樣頻率30 Hz,Tobii Interaction Engine 2.0.4,TobiiEyeX SDK for .NET 1.8。試驗(yàn)和數(shù)據(jù)處理過(guò)程是在Visual Studio平臺(tái)下進(jìn)行算法模型的開發(fā)和試驗(yàn)的設(shè)計(jì)。
試驗(yàn)過(guò)程中選取的試驗(yàn)材料遵循以下原則:
(1) 同一任務(wù)下采用同樣風(fēng)格的地圖,因?yàn)榉诸惼餍枰獏^(qū)分的是用戶的地圖行為,而不需要考慮地圖設(shè)計(jì)。
(2) 參加試驗(yàn)的被試者需要對(duì)地圖產(chǎn)品熟悉,即有地學(xué)背景,這樣可以讓采樣數(shù)據(jù)缺少噪聲。
(3) 試驗(yàn)材料對(duì)于被試者是陌生的,防止先驗(yàn)經(jīng)驗(yàn)對(duì)于試驗(yàn)數(shù)據(jù)的影響。
基于上述原則,總共設(shè)計(jì)出60幅圖,30幅圖用于進(jìn)行線狀要素的跟蹤和瀏覽選取,為防止用戶受其他因素干擾,地圖中僅包含線狀要素。另外30幅圖選取自網(wǎng)絡(luò),進(jìn)行其他任務(wù),地圖為普通地圖,包括自由觀看地圖、點(diǎn)的選擇等。
(1) 針對(duì)線狀要素的跟蹤和瀏覽行為所采用的地圖,被試者需要針對(duì)地圖中的路線設(shè)計(jì)1—3條路線。為模擬現(xiàn)實(shí)生活中的路線規(guī)劃,用戶要求在所設(shè)計(jì)路線中選取一條最佳的路線并指出,如圖1所示。
圖1 眼動(dòng)試驗(yàn)刺激材料Fig.1 Samples of eye tracking experiment materials
圖1所包含的任務(wù)分別如下。
圖1(a):指出從A地到B地的3條不同鐵路路線示意圖?;蛑赋鰪腁地到B地的最佳路線,并用鼠標(biāo)沿線指出。
圖1(b):指出從A地途徑B地到達(dá)C地的2條不同路線走法,并用鼠標(biāo)沿線指出。
圖1(c):指出從start到end的3條不同走法,并結(jié)合換乘次數(shù)和路線長(zhǎng)度給出最佳路線。
總共30幅圖30個(gè)不同的任務(wù)需要被試者去完成,這些地圖全部由筆者自己設(shè)計(jì)或來(lái)自于互聯(lián)網(wǎng),保證用戶在進(jìn)行試驗(yàn)之前沒有接觸過(guò)類似的地圖。
(2) 針對(duì)非線狀要素的閱讀行為,對(duì)另外30幅圖則讓用戶自由觀看地圖和進(jìn)行面狀要素識(shí)別,用戶在進(jìn)行自由觀看行為的時(shí)候?yàn)榉乐巩a(chǎn)生數(shù)據(jù)量過(guò)大,限制用戶自由觀看地圖的時(shí)間為25 s。面狀要素識(shí)別具體為讓用戶選取地圖中形狀類似生活中常見物體的圖形,并指明該面狀編號(hào)以及所像物體,時(shí)間限制在30 s以內(nèi)。
本文的算法框架共有5部分,具體如下:
2.1.1 眼動(dòng)數(shù)據(jù)獲取和預(yù)處理
對(duì)于采集到的1500個(gè)眼動(dòng)樣本,應(yīng)用I-VT算法對(duì)注視點(diǎn)進(jìn)行識(shí)別。I-VT算法通過(guò)點(diǎn)與點(diǎn)之間的速率差異來(lái)區(qū)分注視點(diǎn)與眼跳點(diǎn)。當(dāng)速率高于某一閾值的時(shí)候,該點(diǎn)就被定義為眼跳點(diǎn);反之,則被認(rèn)為是注視點(diǎn)。
2.1.2 眼動(dòng)特征集構(gòu)建
對(duì)上一步驟生成的注視點(diǎn)數(shù)據(jù)、眼跳數(shù)據(jù)、眼動(dòng)軌跡數(shù)據(jù)進(jìn)行進(jìn)一步計(jì)算,一共提取了四大類特征,包括基于注視點(diǎn)的特征、基于眼跳點(diǎn)的特征、基于眼跳方向的特征以及基于視點(diǎn)編碼序列的特征,共得到250個(gè)眼動(dòng)特征,以作為算法輸入數(shù)據(jù)集。
2.1.3 特征離散化過(guò)程
為了提高算法精度和效率,對(duì)生成的特征進(jìn)行離散化。主要針對(duì)特征集進(jìn)行了降維歸約,針對(duì)連續(xù)的特征值使用平均值絕對(duì)差法進(jìn)行離散化,將所有的數(shù)值用離散化的0/1/-1等值表示。
2.1.4 特征選擇
由于特征較多,為了避免低效特征帶來(lái)的輸入冗余,需要對(duì)離散化后的特征進(jìn)行特征選擇。在特征選擇過(guò)程中,采用最小冗余最大相關(guān)算法(minimum redundancy maximum relevance,MRMR)[20],通過(guò)計(jì)算特征與目標(biāo)類別之間的相關(guān)性、特征與特征間的冗余性,從最初的特征集中選取出新的一套最優(yōu)的特征子集,使模型達(dá)到更高的準(zhǔn)確度或者在保持原有準(zhǔn)確度的基礎(chǔ)上保持更優(yōu)的效率。
2.1.5 基于樸素貝葉斯的眼動(dòng)特征分類
眼動(dòng)特征分類是典型的多類分類問(wèn)題,本文采用樸素貝葉斯分類模型進(jìn)行學(xué)習(xí)和分類[21],構(gòu)建地圖線狀要素閱讀行為眼動(dòng)識(shí)別方法。樸素貝葉斯分類模型是一種用于多類分類的集成機(jī)器學(xué)習(xí)方法,其核心思想在于特征的獨(dú)立性。在樸素貝葉斯分類模型中,對(duì)于待分類的數(shù)據(jù),根據(jù)其所具有的特征或?qū)傩?,依?jù)貝葉斯公式計(jì)算出各個(gè)類別的概率。最后算法選擇概率最大的類別作為最終預(yù)測(cè)。
通過(guò)眼動(dòng)試驗(yàn)總共采集到了1500個(gè)眼動(dòng)樣本,各個(gè)數(shù)據(jù)的具體描述見表1。
表1 眼動(dòng)樣本數(shù)據(jù)描述
對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,視點(diǎn)導(dǎo)出后為gaze point at (x,y) @time的格式,應(yīng)用I-VT算法對(duì)注視點(diǎn)進(jìn)行識(shí)別。I-VT算法的原理如下:它是最簡(jiǎn)單的一種識(shí)別方法,通過(guò)點(diǎn)與點(diǎn)之間的速率差異來(lái)區(qū)分注視點(diǎn)與眼跳點(diǎn)。當(dāng)速率高于某一閾值的時(shí)候,該點(diǎn)就被定義為眼跳點(diǎn);反之,則被認(rèn)為是注視點(diǎn)。這種方法的優(yōu)點(diǎn)是運(yùn)行效率高、直接簡(jiǎn)單并且便于實(shí)時(shí)運(yùn)行。但是缺點(diǎn)也很明顯,由于眼動(dòng)追蹤的噪音或平均時(shí)間數(shù)據(jù)造成的影響使點(diǎn)的速率在閾值附近擺動(dòng)出現(xiàn)識(shí)別問(wèn)題,造成本該單一的注視點(diǎn)被劃分為多個(gè)注視點(diǎn)。
I-VT的算法步驟如下:
(1) 計(jì)算每一個(gè)視點(diǎn)與視點(diǎn)之間速度值,該速度的計(jì)算結(jié)合時(shí)間戳與屏幕像素位置得出。
(2) 設(shè)置閾值,結(jié)合文獻(xiàn)[21]研究中所提到的閾值,速度小于3250像素/s時(shí),定義該視點(diǎn)為注視點(diǎn),直到下一個(gè)點(diǎn)的速度大于該閾值;而當(dāng)速度大于3250像素/s時(shí),將其定義為眼跳點(diǎn)。
(3) 將提取出的注視點(diǎn)存儲(chǔ)至注視點(diǎn)組當(dāng)中,而移除位于注視點(diǎn)區(qū)間的眼跳點(diǎn)序列。
(4) 計(jì)算注視點(diǎn)的質(zhì)心坐標(biāo),并存儲(chǔ)至系統(tǒng)當(dāng)中。
共有242個(gè)樣本由于采樣率不合格被排除。其中103個(gè)樣本被剔除是因?yàn)椴蓸狱c(diǎn)中出現(xiàn)NaN(非數(shù)字)的情況,而另外139個(gè)樣本則是樣本中注視點(diǎn)采樣異常,最終樣本選取個(gè)數(shù)見表2。
表2 眼動(dòng)樣本數(shù)據(jù)統(tǒng)計(jì)
對(duì)于單個(gè)被試者刺激材料眼動(dòng)片段,采用以下3類特征來(lái)分別量化眼動(dòng)統(tǒng)計(jì)特征和眼動(dòng)時(shí)空特征,共計(jì)算了250種特征。
2.3.1 基本統(tǒng)計(jì)特征
這種類型的特征基于基本的眼動(dòng)行為(注視和眼跳),它們?cè)谘蹌?dòng)追蹤研究中被廣泛采用為眼動(dòng)指標(biāo)[22-25]。注視點(diǎn)的識(shí)別是對(duì)觀察到的眼動(dòng)行為的一種固有統(tǒng)計(jì)描述。通常視覺和認(rèn)知加工被認(rèn)為發(fā)生在這一行為進(jìn)行之間。眼跳點(diǎn)是位于兩個(gè)注視點(diǎn)之間的一種眼動(dòng)數(shù)據(jù)分類,是反映用戶搜索情況的眼動(dòng)行為。分別對(duì)注視點(diǎn)和眼跳點(diǎn)指標(biāo)進(jìn)行統(tǒng)計(jì),最終得到32個(gè)基本統(tǒng)計(jì)特征。
2.3.2 眼跳方向特征
這種類眼跳方向特征可用于量化眼球運(yùn)動(dòng)的方向特征,可以直觀反映用戶在完成不同任務(wù)時(shí)的信息搜索方式的不同。首先使用幅度(大幅度、小幅度)和主方向(4方向、8方向)方案對(duì)眼跳行為進(jìn)行分類編碼,得到8分類和16分類兩種編碼標(biāo)準(zhǔn),如圖2所示。其中大幅度眼跳和小幅度眼跳的區(qū)分基于眼跳之間的視角角度閾值7.9°,結(jié)合用戶到屏幕距離(一般認(rèn)為是60 cm),結(jié)合屏幕像素我們定義大幅度的眼跳距離閾值為259像素值[26]。
圖2 眼跳方向特征Fig.2 Schematic diagram of saccade direction features
進(jìn)而,對(duì)于每個(gè)編碼類別分別計(jì)算其眼跳幅度和眼跳持續(xù)時(shí)長(zhǎng)的最大值、最小值平均值,方差和偏度,共計(jì)120個(gè)特征。此外,本研究還統(tǒng)計(jì)了相鄰相同方向的連續(xù)眼跳點(diǎn)發(fā)生的頻率,即對(duì)連續(xù)兩個(gè)眼跳點(diǎn)落入同一方向的或者相鄰方向的眼跳子集的個(gè)數(shù)進(jìn)行統(tǒng)計(jì),共計(jì)兩個(gè)特征。
2.3.3 眼跳編碼序列特征
受文獻(xiàn)[19]的啟發(fā),采用滑動(dòng)窗口算法,對(duì)眼跳編碼字符串,按順序從左至右并且產(chǎn)生子字符串,最后再將這些子字符串存入到字典中進(jìn)行統(tǒng)計(jì)分析。圖3給出了滑動(dòng)窗口算法依次存儲(chǔ)長(zhǎng)度為3的字符串的示例。
圖3 應(yīng)用滑動(dòng)窗口對(duì)視點(diǎn)編碼序列進(jìn)行字符串統(tǒng)計(jì)的示意(滑動(dòng)窗口大小為3)Fig.3 Schematic diagram of saccade code sequence statistics using a sliding window (size=3)
將滑動(dòng)窗口大小,所有子字符串的數(shù)量,出現(xiàn)某一子字符串的最大值、最小值、平均值、方差及極差作為特征。其中滑動(dòng)窗口大小取值為1~4。最終得到96個(gè)眼跳編碼序列特征。
2.3.4 特征提取結(jié)果
表3為通過(guò)采集上述3類特征得到的樸素貝葉斯分類器的特征集,每一行中的具體特征以“特征參數(shù)”的“指標(biāo)”來(lái)表示。在后文中,以每個(gè)特征指標(biāo)的英文字母來(lái)表示,如GS-size3-16LS-max表示的是,基于視點(diǎn)編碼序列的特征集中字符串長(zhǎng)度為3時(shí)16分類大幅度眼跳字符串序列出現(xiàn)次數(shù)的最大值。
表3 眼動(dòng)特征提取結(jié)果
本研究分別使用信息熵(mutual information quotient,MIQ)和信息差(mutual information difference,MID)的方法進(jìn)行基于最小冗余最大相關(guān)的樸素貝葉斯模型訓(xùn)練,準(zhǔn)確率結(jié)果如圖4所示?;贛ID和MIQ的兩種曲線準(zhǔn)確率并不相同,采用MIQ方法時(shí),當(dāng)特征數(shù)m=1時(shí)分類準(zhǔn)確率已經(jīng)達(dá)到了68.53%,但也是整個(gè)模型準(zhǔn)確率的最低值;隨后分類準(zhǔn)確率出現(xiàn)了遞增,在m=5時(shí),出現(xiàn)最大值為78.28%;之后模型準(zhǔn)確率出現(xiàn)降低,當(dāng)模型特征數(shù)大于50的時(shí)候,模型趨于穩(wěn)定,準(zhǔn)確率可達(dá)73%,并且最終穩(wěn)定在72.73%,這與未進(jìn)行特征排序時(shí)的模型準(zhǔn)確率結(jié)果是基本一致的。
圖4 算法準(zhǔn)確率曲線Fig.4 Algorithm accuracy curve
應(yīng)用MID方法時(shí),m=1時(shí),分類準(zhǔn)確率同樣為68.53%,這是因?yàn)槎咚x取的第1個(gè)特征是一樣的,與MIQ曲線不同的是,在m=4分類準(zhǔn)確率達(dá)到最大值為77.01%,之后曲線總體呈現(xiàn)下降趨勢(shì),在m>50以后,分類準(zhǔn)確率也穩(wěn)定在了73%左右。之所以二者在后面的準(zhǔn)確率趨向一致,是因?yàn)楫?dāng)選擇的特征數(shù)量值m越大時(shí),兩種算法所重合的特征數(shù)量越來(lái)越多,到最后基本一致,所以結(jié)合算法原理,兩種算法所得出的先驗(yàn)概率、條件概率和后驗(yàn)概率等均一樣,所以模型準(zhǔn)確率也一致。區(qū)別就在于特征數(shù)量較少時(shí),由于不同特征組合導(dǎo)致準(zhǔn)確率有差異。
針對(duì)MIQ和MID方法達(dá)到準(zhǔn)確率最大值時(shí)的m值,對(duì)精度和召回率進(jìn)行驗(yàn)證,生成的混淆矩陣分別見表4、表5,模型準(zhǔn)確率最大時(shí)特征選擇結(jié)果見表6。
表4 基于MRMR(MIQ)-NBC算法模型在特征數(shù)量m=5時(shí)的混淆矩陣
表5 基于MRMR(MID)-NBC算法模型在特征數(shù)量m=4時(shí)的混淆矩陣
表6 模型準(zhǔn)確率最大時(shí)特征選擇結(jié)果
從中可以看出,對(duì)于線狀要素的閱讀行為,在最主要的召回率方面,無(wú)論是基于MIQ(表4)還是MID(表5)方法,召回率均接近80%;同時(shí),精度也基本維持在80%以上。此外,線狀要素的識(shí)別行為F1值也達(dá)到了較高的水平。在性能方面,此模型所需要的特征數(shù)量為5,顯著提升了模型的特征使用效率。
文獻(xiàn)[3]使用SVM模型對(duì)地圖中的閱讀行為進(jìn)行過(guò)識(shí)別和預(yù)測(cè)。地圖閱讀行為包括自由瀏覽、全局搜索、路線規(guī)劃、中心搜索、線狀要素跟蹤、面狀對(duì)比等行為。其中的線狀要素跟蹤和路線規(guī)劃與本文試驗(yàn)中的線狀要素的跟蹤選取行為基本一致。
文獻(xiàn)[3]研究的最終模型結(jié)果與本研究中各算法模型的準(zhǔn)確率及特征數(shù)對(duì)比如表7所示。結(jié)果表明,準(zhǔn)確率最高的是基于MRMR(MIQ)的模型,其次是SVM模型,最后是基于MRMR(MID)的模型。其中,MRMR(MIQ)模型相較于SVM模型準(zhǔn)確提升0.57%。在運(yùn)算性能上,由于SVM要將229種特征屬性加入到模型當(dāng)中,MRMR(MIQ)模型(m=5)與MRMR(MID)(m=4)模型的運(yùn)算性能遠(yuǎn)好于SVM模型。綜上所述,MRMR(MIQ)模型在準(zhǔn)確率優(yōu)于SVM模型,而無(wú)論是MRMR(MIQ)還是MRMR(MID)模型,運(yùn)算性能均遠(yuǎn)高于SVM模型。
表7 算法準(zhǔn)確率比較
本文提出了一種基于樸素貝葉斯的地圖線狀要素閱讀行為眼動(dòng)識(shí)別算法。針對(duì)用戶在實(shí)際閱讀地圖中閱讀線狀要素的行為,總共設(shè)計(jì)了30個(gè)任務(wù)?;谌蝿?wù)結(jié)果,一共提取了3大類特征,包括基本眼動(dòng)統(tǒng)計(jì)特征、基于眼跳方向的特征以及基于視點(diǎn)編碼序列的特征,總共250種特征。研究所采用的機(jī)器學(xué)習(xí)模型為樸素貝葉斯分類模型,該模型分類效率較高,對(duì)小規(guī)模的數(shù)據(jù)表現(xiàn)很好。通過(guò)輸入特征屬性和訓(xùn)練樣本構(gòu)造模型,之后輸入眼動(dòng)測(cè)試樣本數(shù)據(jù),通過(guò)輸出的結(jié)果對(duì)比實(shí)際樣本類型,計(jì)算模型準(zhǔn)確率。
本研究通過(guò)最小冗余最大相關(guān)對(duì)眼動(dòng)也進(jìn)行了特征選擇,最終結(jié)果顯示利用信息熵法得到的算法準(zhǔn)確率最高可以達(dá)到了78.28%。并且,由于在達(dá)到最大值時(shí)所需要的特征數(shù)量只需要5個(gè)特征,與同類研究相比,大大提升了分類器的性能,也降低了算法的冗余度。也解決了傳統(tǒng)方法對(duì)于地圖閱讀行為眼動(dòng)識(shí)別方法分類性能差的問(wèn)題,并且在準(zhǔn)確率方面也進(jìn)一步提升。
本文的研究還較為初步,主要提高了線要素識(shí)別算法的性能,今后的工作將集中在以下兩方面。首先,將地圖復(fù)雜度、地圖要素分布類型等變量引入地圖刺激材料設(shè)計(jì),開展嚴(yán)格的控制性試驗(yàn),分析用戶要素閱讀行為模式。在此基礎(chǔ)上,改進(jìn)要素眼動(dòng)識(shí)別算法,實(shí)現(xiàn)更為精細(xì)的地圖要素識(shí)別。其次,進(jìn)一步增加被試者的數(shù)量、類型,如年齡、專業(yè)和空間能力等,提高算法對(duì)具有不同類型人群的適配性。