陳嘉緒,張少偉,周穎,楊昌瑋,孟恬,陳秋婷,許賢春,胡文涵上海理工大學醫(yī)療器械與食品學院,上?!?00093
基于眼動技術的醫(yī)療器械說明書可用性評估
陳嘉緒,張少偉,周穎,楊昌瑋,孟恬,陳秋婷,許賢春,胡文涵
上海理工大學醫(yī)療器械與食品學院,上海200093
目的為今后能夠?qū)︶t(yī)療器械使用說明書的可用性進行準確可靠的評價并提出合理的改進意見,提出一種基于眼動技術的可用性評估方法。方法利用一臺Tobii眼動儀進行測試,根據(jù)得出的眼動數(shù)據(jù)建立初步可用性初步評估眼動模型,并且利用SPSS對不同興趣區(qū)下的眼動數(shù)據(jù),如:注視時間長度、訪問時間長度、首次注視時間等進行單因素方差分析和多重比較,分析得出不同醫(yī)療器械說明書下被試的視覺行為差異以及說明書可用性差異。結果結合調(diào)查問卷發(fā)現(xiàn)眼動模型可靠準確,且利用方差分析和多重比較法能夠定量地反映出說明書可用性的差異和需要改進的興趣區(qū)。 結論利用眼動技術,可以在被試的視覺行為和可用性指標間建立一種定量、精準的關系及評價體系,從而為今后醫(yī)療器械說明書的可用性評估及改進提供了一種可靠的方法。
眼動技術;可用性評估;眼動模型;方差分析
[Abstract]Objective To accurately and reliably evaluate the availability of medical device instructions in the future and provide rational improvement suggestions and availability evaluation method based on eye movement technique.Methods A Tobii eye tracker was used for test,and the eye movement model was initially established according to the eye movement data,and the availability was initially evaluated,and the eye movement data such as visual fixation time,access time and initial visual fixation time under different interest areas were given factor analysis of variance and multiple comparisons by SPSS,and the differences in the visual behavior of subjects and instruction availability of different medical device instructions were analyzed.Results The questionnaire showed that the eye movement model was reliable and accurate,which can quantificationally reflect the instruction availability difference and interest areas needing improvement by using variance analysis and multiple comparison method.Conclusion A quantitative and accurate correlation and assessment system can be built between the visual behavior of subjects and availability index by using the eye movement technique thus providing a reliable method of availability evaluation and improvement of future medical device instructions.
[Key words]Eye movement technology;Availability evaluation;Eye movement model;Variance analysis
概念清晰的說明書對醫(yī)療器械的安全使用起著重要作用??捎眯詼y試可以評估使用書存在的缺點并提供改進意見。往往醫(yī)療器械廠家認為可讀性很強的信息,在用戶看來卻并非如此。因此,針對醫(yī)療器械使用說明書,生產(chǎn)商需要進行可用性評估從而確保使用書是有效的,這對防止用戶因誤讀說明書而導致違規(guī)操作有著重要意義。以往,人因工程師多采用調(diào)查問卷和模擬操作的方法來進行可用性評估。然而1998年,Ellis S,Candera R等人[1]首先把眼動跟蹤技術作為一種評估技術來評價網(wǎng)站的可用性水平,通過記錄被試視線運動情況來分析操作過程中對界面視覺信息加工情況。這種方法對傳統(tǒng)可用性測試是一種有益補充[2]?,F(xiàn)今,在人因工程學領域,眼動追蹤技術已經(jīng)被認為可用性評價最主要的方法之一,而眼動特征也被認為是表征認知活動的重要性指標[3-4]。然而,眼動追蹤在可用性評估方面依舊面領著如何將眼動數(shù)據(jù)與認知活動建立對應聯(lián)系的困難[5]。該文將詳細論述如何將眼動儀、數(shù)據(jù)處理軟件和統(tǒng)計學方法相結合,利用眼動數(shù)據(jù)針對醫(yī)療器械使用說明的可用性進行定量準確的分析,為以后醫(yī)療器械使用書的可用性評估提供了一種全新而可靠的方法。
2.1被試者選取
該次試驗選取受試者共40名,其中男、女生各20名,要求年齡差異不能過大,均在18~22歲之間,裸眼視力均為正常,使得眼球曲率半徑不會影響眼動測試結果。此外,所有受試者之前從未閱讀過實驗中的說明書,也都是第1次使用眼動儀。
2.2實驗儀器與材料
該次實驗選取了Tobii公司出品的Tobii TX300系列眼動儀一臺,以及配套使用的數(shù)據(jù)處理軟件TobiiStudioTM 2.X,在實驗中TobiiStudioTM 2.X可以自動根據(jù)眼動結果生成眼動軌跡圖、熱點圖、不同興趣區(qū)內(nèi)的各項眼動數(shù)據(jù)以及所有眼動點的順序、瞳孔大小和坐標等原始數(shù)據(jù)。并且使用SPSS Statistics 21.0對原始數(shù)據(jù)進行深入分析和處理。材料則選取飛利浦偉康呼吸機和德國Raphael呼吸機的使用說明手冊各一份,兩手冊均包含了細體字、粗體字、圖片及表格,排除了因設計不同而導致的實驗誤差。同時,兩份手冊每頁字數(shù)相差均在每頁總體字數(shù)的5%以內(nèi),排除了字數(shù)差異對于結果的干擾。顯示器則選取分辨率為1024×768的19英寸液晶顯示屏一臺。
2.3實驗設計
實驗采用2(材料組別:偉康說明書、Raphael說明書)×4(興趣區(qū)組別:細體字、粗體字、圖片、表格)混合設計。因變量為測得的五類數(shù)據(jù),五類數(shù)據(jù)名稱及其含義如表1所示。測試過程中,被試坐在一臺顯示器前,顯示器下方安有眼動儀,可在被試觀察屏幕是自動記錄眼動情況,顯示器和操作電腦之間用USB接線鏈接,如圖1所示。
圖1 受試狀態(tài)及儀器鏈接
2.4實驗步驟
實驗過程中具體操作步驟如下:①按照圖1所示鏈接好眼動儀、主操作電腦、顯示器和眼動儀充電電源,開啟Tobii Studio軟件,檢查眼動儀是否安裝完成;②選取本測試材料后,編輯好被試姓名等信息,被試雙目平視顯示器,屏幕中出現(xiàn)雙眼且下方指示條變綠后開始進行校準。被試受試者盯著屏幕上出現(xiàn)的紅點并隨之移動,之后根據(jù)校準結果(如圖2)判斷是否符合規(guī)定,若否,重新開始校準;③開始進行測試;④選取需要的數(shù)據(jù)類型,并導出數(shù)據(jù)和其他熱點圖等;⑤將數(shù)據(jù)分組導入SPSS進行進一步分析。
表1 五類不同眼動數(shù)據(jù)及其含義
圖2 校準結果
2.5AOI法及興趣區(qū)(AOI)劃分
AOI是眼動實驗刺激材料上被人為定義的區(qū)域,可用于分析其中的眼動數(shù)據(jù)[6]?;贏OI的眼動數(shù)據(jù)可視化,可表示用戶在AOI中消耗的注意時長,以及在不同AOI之間的訪問與轉移等情況[7]。兩款說明書中的不同字形、樣式均為表2所示的4種,將它們?nèi)窟x為興趣區(qū)后進行對比分析。
表2 興趣區(qū)種類及組號
3.1眼動模型的建立
該文根據(jù)眼動實驗得出的各種數(shù)據(jù)建立相應評估指標,并利用這些指標建立評估模型(見表3),對兩款說明書的可用性進行預測性評估,并根據(jù)調(diào)查問卷反饋結果檢驗模型的合理性。
表3 指標種類及符號
(1)首次興趣程度評估。
吸引度F
首次進入時間 (Time to First Fixation)W表征被試被吸引至相應AOI所需時間,時間越短,相應興趣區(qū)對被試吸引度越大;而首次注視時間長度X越短,則被試對于該AOI的加工及認知難度越低、興趣越高。定義吸引度公式為:
F=X+W(1)
F越小,則表示被試對于該AOI首次興趣程度更高;
(2)搜索速度評估。
搜索速度S[8]
注視時間長度(Fixation Duration)表征認知過程的困難程度。注視時間越長表明受試者認知過程中困難程度越高。此前的實驗已經(jīng)驗證,受試者在閱讀文本材料的所花的時間要超過閱讀圖片材料的時間[9-10]。計算出眼動軌跡首次進入該AOI至最后離開該AOI所歷經(jīng)的平均時間——注視時間長度Y的倒數(shù):
S=Y-1(2)
可知,注視時間Y越長,搜索速度S越低
(3)搜索準確率A。
在閱讀過程中,由于受試者經(jīng)常由于當前注視點獲取信息不足而重返上一個注視點的位置重新獲取信息,此時這個新產(chǎn)生的注視點被稱為“第一類回溯注視”;另一方面,由于該次注視時間過長而導致的疲勞也會造成被試重返其他注視點,此類注視點被稱為“第二類回溯注視”。而兩類注視點的產(chǎn)生都會造成訪問時間長度V大于注視時間長度Y,且產(chǎn)生的越多,V就越大。但由于第二類回溯注視主要取決于人眼視覺感知的生理特性,在統(tǒng)計學上表現(xiàn)出一定的穩(wěn)定性[11],故V的增大主要可視為是由于被試在閱讀中無法獲取足夠信息導致的,故定義搜索準確率A為:
A=V/Y(3)
可知當A大于1時,有回溯現(xiàn)象發(fā)生,而A越大,也表明搜索準確率越低。
3.2基于眼動模型的兩款說明書可用性評價分析
3.2.1兩款呼吸機說明書數(shù)據(jù)處理 將所有被試的數(shù)據(jù)進行整合,得到如表4~表9所示的原始數(shù)據(jù),并計算出相應指標。可知偉康說明書中表格吸引度最高、圖片次之而細體字最低,搜索速度圖片最高,搜索準確率則是細體字最差;至于Raphael說明書則是以細體字和表格吸引度最高、粗體字最差,同時粗體字的搜索速度最高、細體字最差。但是粗體字的搜索準確率卻和表格是最低的兩組,圖片則最高。
表4 偉康說明書吸引度的計算
表5 偉康說明書搜索速度的計算
表6 偉康說明書搜索準確率的計算
表7 Raphael說明書吸引度的計算
表8 Raphael說明書搜索速度的計算
表9 Raphael說明書搜索準確率的計算
3.2.2數(shù)據(jù)比較及分析將計算好的結果進行匯總分析,得到如表10所示的眼動模型評價結果表。
表10 眼動模型評價結果
通過分析表內(nèi)數(shù)據(jù)可知,偉康說明書在圖、表吸引度方面明顯強于細、粗體字組,也明顯超過了Raphael說明書的圖、表吸引度,但是Raphael說明書細、粗體字的吸引度則明顯強于偉康說明書,搜索速度S方面Raphael說明書也是明顯優(yōu)于偉康說明書。此外,通過表格,也可清晰反應出兩款說明書各自存在的問題,譬如雖然在吸引度和搜索準確率方面,偉康說明書的圖、表優(yōu)勢明顯,而搜索速度則不明顯;Raphael說明書的圖片的搜索準確率則過于偏低,圖表也不夠吸引被試。將模型評估結果與得到的被試反饋表結果比較后,誤差基本控制在10%,可見此眼動模型評價結果具有一定的有效性。
3.3基于SPSS方差分析的可用性評估
3.3.1單因素方差分析的思路及原理 單因素試驗設計的主要思路如下:設因子為A,A有m個不同取值(一般稱為水平),每個水平重復進行n次試驗,則每次試驗結果均可看作一個隨機變量,同一水平下的n個試驗結果都可看作同一總體的一個樣本。設第i號水平的總體為Xi,第i號水平下第j次的試驗結果為xij,則 (xi1,xi2,…,xin)就是X i的一個容量為n的樣本。對應于m個總體,有m個這樣的樣本。 根據(jù)這m個樣本值即可分析不同水平的變化對所考察指標有無顯著影響,實際上就是考察m個總體的數(shù)學期望有無顯著差異。因而將上述問題轉換為一個假設檢驗問題[12]。
3.3.2單因素方差分析
(1)不同興趣區(qū)的組間差異影響分析 將不同興趣區(qū)的眼動原始數(shù)據(jù)輸入SPSS,選取單因素ANOVA分析,在方差齊性的前提下得到兩種呼吸機說明書不同興趣區(qū)的組間差異表(表11、12),由顯著性數(shù)據(jù)可以得知針對不同眼動數(shù)據(jù),由興趣區(qū)的種類而導致的差異的大小。
表11 偉康說明書組間差異
由表11可知,在偉康呼吸機說明書測試結果中,不同興趣區(qū)導致的組間差異以“訪問時間長度”最為顯著,其次是“首次進入時間”,最不顯著的是“注視時間長度”。
表12 Raphael說明書組間差異
由表12可知,在Raphael呼吸機說明書測試結果中,不同興趣區(qū)導致的組間差異以“訪問點次數(shù)”最為顯著,其次是“首次注視時間長度”,最不顯著的是“首次進入時間”。
(2)多重比較結果分析。為進一步探究不同興趣區(qū)之間對于各眼動數(shù)據(jù)的影響,通過多重比較結果表來進行對照分析。其中設置顯著性水平α=0.1,當顯著性小于0.1時,可認為組間差異明顯。
表13 兩個說明書首次注視時間長度的多重比較結果
表14 兩個說明書注視時間長度的多重比較結果
在偉康呼吸機說明書測試結果中,1、3組,即細體字和表格的首次注視時間差異較為顯著(α<0.1),而據(jù)表4數(shù)據(jù)可知,細體字首次注視時間最長、表格最短。據(jù)吸引度F公式(1)可知,首次注視時間越短,F(xiàn)越小,吸引度越高,故在偉康呼吸機說明書中,細體字對于吸引度影響最大,應該設法改良從而提高可用性。同理,Raphael說明書中1、3(細體字、表格)以及1、4(細體字、粗體字)差異顯著,而細體字首次注視時間最長,使得吸引度下降最嚴重,應設法改良。
雖然表14中偉康說明書無顯著性差異,但是亦可看出2、4組(粗體字、圖片)差異較其他組更為顯著,而粗體字的注視時間最長,對搜索速度S影響最大;Raphael說明書測試中,1、4組(細、粗體字)差異顯著,而根據(jù)表8,細體字的注視時間最長,對搜索速度S影響最大。均應設法改良。
表15 兩個說明書訪問時間長度的多重比較結果
根據(jù)表15可知,偉康說明書中1、4組(細體字、圖片)、2、4組(粗體字、圖片)、3、4組(表格、圖片)差異顯著,且細體字訪問時間最長,圖片最短;而Raphael說明書中2、3組(圖片、表格)差異最為顯著,其中表格訪問時間最長,圖片最短。
結合表14、15分析可知,偉康說明書中細體字在注視時間長度與其他組差異不顯著,而在訪問時間里顯著且時間最長,可知偉康呼吸機說明書細體字導致的回溯現(xiàn)象較為嚴重,使得搜索準確率下降最為嚴重,故應設法提高細體字的閱讀準確率。而粗體字和表格注視時間均較圖片不顯著,同時在訪問時間方面顯著,可知訪問時間過長是導致粗體字和表格相較于圖片搜素準確率較低的主要原因;在Raphael呼吸機說明書中細體字較粗體字注視時間差異顯著,說明細體字注視時間過長導致了搜索速度的下降。而圖片和表格在訪問時間差異顯著且表格訪問時間最長,同時在注視時間差異不顯著,表明表格導致的回溯現(xiàn)象較為嚴重,使得表格的搜索準確率下降嚴重。
表16 兩個說明書訪問點次數(shù)的多重比較結果
根據(jù)表16可知,維康說明書中的1、2組(細體字、粗體字組)以及1、4組(細體字、圖片組)在訪問點次數(shù)方面差異顯著,且根據(jù)均值差大于0可知都以1組(細體字組)的訪問點數(shù)為最多。而根據(jù)表15可知,1、2組在訪問時間長度方面差異不明顯。故1組的每個訪問點的平均持續(xù)時間較短,而訪問點數(shù)偏多。1、4組雖然在訪問時間長度上差異也顯著,但是1組的每個訪問點上的平均時間長度較少(用訪問時間長度除以訪問點數(shù))。兩組結果均再次驗證了上述結論中偉康說明書細體字組回溯現(xiàn)象的嚴重性;而Raphael說明書測試中2、3組(圖片組、表格組)差異顯著,且3組(表格組)的訪問點數(shù)多于2組(圖片組)。但根據(jù)表15可知,2、3組在訪問時間長度上亦差異顯著而以3組時間較長。比較其每個訪問點的平均時間長度,發(fā)現(xiàn)3組的較短。再次驗證了上述中Raphael說明書表格組回溯現(xiàn)象嚴重的結論。
表17 兩個說明書首次進入時間的多重比較結果
由表17可知,偉康說明書中1、3(細體字、表格)和1、4(細體字、圖片)在首次進入時間方面差異顯著,細體字時間最長而表格圖片均較短,可知細體字的首次進入時間過長影響到了說明書的吸引度。而Raphael說明書在首次進入時間上興趣區(qū)差異均不顯著,表明在這一數(shù)據(jù)上,并無某個區(qū)域?qū)ξ仍斐奢^大的影響。
該文利用Tobii TX300眼動儀測試受試者閱讀醫(yī)療器械使用說明書時不同的眼動情況,并結合數(shù)學建模以及SPSS單因素方差分析,針對得到的結果對醫(yī)療器械使用說明書可用性的改進提供了有力的數(shù)據(jù)支持。利用模型可以初步對于說明書進行指標評價。根據(jù)不同指標評價結果,可使用方差分析具體研究得出不同類型興趣區(qū)對于眼動數(shù)據(jù)的影響。研究表明,不同說明書同一興趣區(qū)和同一興趣區(qū)不同說明書的眼動情況均有較大差異,而利用模型和方差分析結合的評估方法,可以得知不同指標下可用性的評估結果,并根據(jù)結果通過方差分析來探究具體某一興趣區(qū)的可用性對指標的影響最大(或最?。瑥亩弥纳圃搮^(qū)域可最大程度上提高說明書的可用性。傳統(tǒng)的可用性評價主要依靠推測和調(diào)查用戶喜好等方式,缺乏科學依據(jù)。而該文利用眼動追蹤技術,對得到的眼動數(shù)據(jù)基于統(tǒng)計學方法進行了定量分析,從而為今后醫(yī)療器械說明書的可用性測試提供了一種有效的評估方法。
[1]Ellis S,Candera R Misner J,et al.Window to the Soul What Eye Movements Tell US about Software Usability.Proceedings oftheUsabilityProfessionals'Association[C].Washington,DC: UPAPress,1998:151-178.
[2]趙新燦,左洪福,任勇軍.眼動儀與視線跟蹤技術綜述[J].計算機工程與應用,2006,42(12):118-120.
[3]M.A.Just,P.A.Carpenter.Eye fixations and cognitive processes[J].Cognitive Psychology,1976,8:441-480.
[4]Goldberg J H,Wichansky A M.Eye tracking in usability evaluation:a practitioner's guide[M]//Themind's Eye:Cognitive and Applied Aspects of Eye Movement Research[J].Oxford:Elsevier Science,2003:573-605.
[5]Robert J.K.Jacob,Keith S.Karn.Commentary on Section 4 -Eye Tracking in Human-Computer Interaction and Usability Research:Ready to Deliver the Promises[J].Mind, 2003,2(3):573-605.
[6]Holmqvist K,NystrOm M,Andersson R,et al.Eyetracking:a comprehensive guide to methods and measures[M].Oxford: Oxford University Press,2011.
[7]程時偉,孫凌云.眼動數(shù)據(jù)可視化綜述[J].計算機輔助設計與圖形學學報,2014,26(5):698-707.
[8]程時偉,孫守遷.手機用戶界面可用性評估的眼動模型[C].第四屆和諧人機環(huán)境聯(lián)合學術會議.2008.
[9]G.R.Loftus,N.H.Mackworth.Cognitive determinants of fixation location during picture viewing[J].Journal ofExperimental Psychology:Human Perception and Performance,1978,4:565-572.
[10]J.M.Henderson,P.A.Weeks,and A.Hollingworth.The effects of semantic consistency on eye movements during complex scene viewing[J].Journal ofExperimental Psychology:Human Perception and Performance,1999,25:210-228.
[11]張光強,沈模衛(wèi),陶嶸.可用性測試中的視線跟蹤技術[J].人類功效學,2001,7(4):9-13.
[12]焦鵬,費惠佳.方差分析法在制導仿真系統(tǒng)VV&A中的應用[J].計算機仿真,2010,27(6):115-117.
Availability Evaluation of Medical Device Instructions Based on Eye Movement Technique
CHEN Jia-xu,ZHANG Shao-wei,ZHOU Ying,YANG Chang-wei,MENG Tian,CHEN Qiu-ting,XU Xian-chun,HU Wen-han
College of Medical Device and Food,University of Shanghai for Science and Technology,Shanghai,200093 China
R197.39
A
1672-5654(2016)05(a)-0035-07
2015年度“精品本科”教學改革項目《BME專業(yè)卓越工程師培養(yǎng)方案優(yōu)化設計》;2014年上海市大學生創(chuàng)新創(chuàng)業(yè)訓練計劃項目(SH10252142)。
陳嘉緒(1994-),男,甘肅蘭州人,本科,研究方向:醫(yī)療器械工程。
周穎(1973-),女,福建廈門人,碩士,講師,研究方向:生物醫(yī)學工程,E-mail:jenniferzhy@hotmail.com。
2016-02-27)