葛翔,許詩卉,王璟銘,楊帆,劉玳言,趙敏,徐濛
(百度(中國)有限公司,北京 100193)
隨著各類傳感器、語音交互、機器視覺、SLAM等技術(shù)的不斷成熟,以及公眾和B端客戶(如商家、各類機構(gòu))對機器人的認知越來越高,服務(wù)機器人行業(yè)蓬勃發(fā)展,服務(wù)機器人走進越多越多的公共場合,比如銀行、機場、酒店、博物館、餐廳等等,提供信息查詢、業(yè)務(wù)辦理、引導、娛樂等服務(wù)。
憑借在信息展示(視覺)和交互上(觸覺)的優(yōu)勢,屏幕仍然是人和機器人交互的主要界面[1],幾乎成為服務(wù)機器人的標配。按照外型和屏幕形態(tài),現(xiàn)有的公共場合服務(wù)機器人大致可分為兩大類:第一大類是有“頭部”這一擬人特征,這樣的擬人機器人的屏幕設(shè)計可以分為三種,第一種是單屏,胸口帶著一塊屏幕,如日本軟銀的Pepper[2];第二種也是單屏,但機器人頭部就是一塊屏幕,如科沃斯的旺寶[3];第三種是雙屏,其頭部是屏幕,身體上也有一塊屏幕,比如百度的小度機器人[4];第二大類是沒有“頭部”這一擬人特征,機器人由一體化大屏幕組成,其形態(tài)擬人度較低,如云跡科技的云帆機器人[5]。那么,不同的屏幕形態(tài)是否會影響用戶的偏好、認知甚至行為呢?如果存在影響,又是何種影響呢?這是本研究聚焦的問題。
機器人外觀一直是人—機器人交互領(lǐng)域的研究熱點。已有大量研究發(fā)現(xiàn),機器人的外觀會影響人們對機器人的認知和行為[6-9],這種影響甚至在無意識層面起作用,影響人們的行為和感知[10]。尤其是在公共場合,許多與機器人互動的人都是經(jīng)驗很少的新手,他們的初步印象可能都是基于機器人的外觀形成的[11]。遺憾的是,現(xiàn)有機器人外觀研究主要集中在整體造型、身體形狀、頭部與面部設(shè)計、擬人化等方面,而對機器人屏幕涉獵較少。
當前針對機器人屏幕的研究主要集中在屏幕顯示內(nèi)容,對屏幕形態(tài)研究較少。Broadbent等研究發(fā)現(xiàn),機器人頭部屏幕上的“臉”會影響人對機器人的感知,具有人形面部表情的機器人最受歡迎,被認為最有頭腦、最有活力、最善交際以及最和藹可親[12];Jung等人研究發(fā)現(xiàn),和機器人身體相比,位于機器人屏幕上的性別線索對用戶感知機器人性別影響更大。這意味著,機器人的屏幕為嵌入社交線索提供了一個令人信服的“場所”,在不改變機器人形態(tài)和運動設(shè)計的情況下,就能獲得用戶強烈的社交反應(yīng)[13]。Broadbent等人研究了用戶對8類不同形狀機器人的偏好,發(fā)現(xiàn)和頭部屏幕相比,用戶更喜歡機器人身體上的屏幕,部分原因是屏幕比較大[14]。但是該研究針對的是老年護理機器人,且設(shè)計的屏幕形態(tài)也比較有限,研究結(jié)論能否推論到公共場合的服務(wù)機器人值得商榷。
本研究中,探索了用戶對公共場合服務(wù)機器人屏幕形態(tài)的偏好,關(guān)注了三類屏幕形態(tài):頭部單屏(機器人頭部為屏幕);雙屏(機器人頭部和身體均帶有屏幕)以及一體屏,Pepper這類單屏機器人(胸口帶屏幕)并不在本次研究范圍。之所以如此,是因為越來越多的商業(yè)機器人在頭部使用屏幕,并將“臉”渲染到屏幕上,以此來代替靜態(tài)的機械頭部[15]。這是由平板電腦的易用性、編程的便捷性等推動的,并且在屏幕上呈現(xiàn)臉部使其設(shè)計更加靈活,同時也可以讓臉部更易展示眨眼、凝視和面部表情[15],因此我們有理由相信,頭部為屏幕是未來機器人發(fā)展的一大趨勢。
針對服務(wù)機器人的屏幕設(shè)計,了解用戶三類屏幕形態(tài)(頭部單屏、雙屏、一體屏)的偏好??紤]到屏幕是信息呈現(xiàn)的載體,同時探索屏幕是否呈現(xiàn)信息時,用戶偏好是否有差異。
實驗采用3*2被試內(nèi)設(shè)計,自變量一為屏幕設(shè)計方案,包括頭部單屏(在后續(xù)研究中簡稱單屏)、雙屏、一體屏三個水平;自變量二為屏幕是否顯示信息,包括有信息顯示和無信息顯示兩個水平。
實驗因變量為用戶的偏好選擇、互動意愿以及用戶對于機器人的智能度、擬人度感知。用戶的偏好選擇通過對偶比較法得到,互動意愿、智能度、以及擬人度使用李克特7點量表評分獲取。
機器人模型制作成本高、周期長,為了還原用戶對機器人設(shè)計(如:機器人高度、屏幕大小等)的真實感知,研究員通過Rhino建模制作了三種不同屏幕形態(tài)的機器人(如圖1),并使用1:1等高投影設(shè)計方案。雙屏和單屏機器人具有典型的頭部。為了控制其它因素的影響,三種設(shè)計形態(tài)遵循以下原則:(1)控制尺寸,保證每個模型的高度和寬度一致;(2)控制顏色,統(tǒng)一使用白色作為機器人的主要顏色,排除顏色對用戶的影響;(3)控制肢體設(shè)計,機器人模型沒有設(shè)計雙手,在實驗中向用戶明示并強調(diào)忽略該影響;(4)所有機器人都具備雙輪,并告知用戶機器人可移動。
在信息呈現(xiàn)方面,考慮到機場是機器人未來的使用場景之一,研究員在屏幕上呈現(xiàn)某一航班信息(如圖1),并保證三類屏幕上的信息含量一致(注:向用戶說明單屏機器人的頭部屏幕將會表情和信息交替呈現(xiàn))。
本次實驗使用1:1等高投影設(shè)計方案,機器人高度為1.5 m。并且為了能讓用戶近距離感受,使用了攝影硫酸紙作為屏幕進行背面投影,投影設(shè)備為極米Z6,分辨率:1 920*1 080,亮度:700ANSI流明。為保證投影效果在實驗過程中嚴格控制燈光。
首先進行屏幕無信息顯示時對偶比較。研究員將設(shè)計方案按照1:1等高投影,兩兩呈現(xiàn),用戶選擇自己更喜歡的方案(方案用A/B代替),總共比較3次。為了控制順序?qū)嶒灲Y(jié)果的影響,通過拉丁方平衡對比呈現(xiàn)順序。選擇完畢后,邀請用戶針對每個設(shè)計方案進行相應(yīng)指標評分并闡述原因。
然后進行屏幕有信息顯示時對偶比較,實驗流程同上。
實驗邀請了30名用戶,男女各半,年齡在18-44歲之間,用戶均為互聯(lián)網(wǎng)公司員工,涵蓋不同崗位(包括:人事、財務(wù)、技術(shù)、產(chǎn)品等),且均有公共場所服務(wù)機器人使用經(jīng)驗。實驗后每名用戶都能收到一定價值的禮品卡作為酬謝。
首先,將對偶結(jié)果轉(zhuǎn)化為每種設(shè)計被選擇的概率,計算方法為:每種設(shè)計實際被選擇的次數(shù)與每種設(shè)計最多可能被選擇的次數(shù)(此處為2次)的比率,即為每種設(shè)計被選擇的概率。對每種設(shè)計的選擇概率進行描述統(tǒng)計,結(jié)果如表1。
表1 每種設(shè)計的選擇概率的平均值(標準差)
為了檢驗用戶對三種屏幕設(shè)計的偏好是否具有顯著差異,我們分別在有或無信息的條件下,對三種屏幕設(shè)計選擇概率進行Friedman雙向方差分析。我們發(fā)現(xiàn)三種設(shè)計的選擇概率在有無信息呈現(xiàn)條件下均存在顯著差異(無信息時:χ2(2) = 16.759,P<0.001;有信息時,χ2(2) = 34.067,P<0.001)。隨后,我們使用Wilcoxon T檢驗對三種屏幕設(shè)計進行進一步的成對比較,發(fā)現(xiàn)在無信息時,雙屏設(shè)計的選擇概率顯著高于單屏與一體屏,而單屏和一體屏之間無顯著差異。而在有信息時,單屏設(shè)計的選擇概率顯著低于雙屏設(shè)計與一體屏設(shè)計。此外,雙屏的選擇概率高于一體屏,達到了邊緣顯著(P=0.051)的水平(結(jié)果如表2所示)。因此,總體而言,無論在有無信息的條件下,雙屏設(shè)計的優(yōu)勢較其它兩種設(shè)計都較為明顯。
表2 有無信息時,各個設(shè)計的成對比較(基于Wilcoxon T 檢驗)
*表示差異在統(tǒng)計上顯著(P<=0.05)。
此外,我們想檢驗呈現(xiàn)信息是否會使用戶對每種屏幕設(shè)計的偏好產(chǎn)生影響。因此,針對三種屏幕設(shè)計,分別對有無信息設(shè)計選擇概率進行Wilcoxon T檢驗,發(fā)現(xiàn)在有信息時,單屏設(shè)計的選擇概率顯著低于無信息時(Z=-3.398,P=0.001),而一體屏設(shè)計的選擇概率顯著高于無信息時(Z=-2.831,P=0.005)。而雙屏設(shè)計在有無信息時選擇概率無顯著區(qū)別(-0.258,P=1.000)。即用戶對雙屏設(shè)計的偏好不受有無信息呈現(xiàn)的影響,而呈現(xiàn)信息,使用戶對一體屏的偏好升高,對單屏的偏好下降。
每個設(shè)計在各個維度的主觀評分結(jié)果如表3所示。
表3 每種設(shè)計的觀評分的平均值和標準差
為了檢驗用戶對于三種設(shè)計在不同的維度打分是否具有差異,我們分別在有無信息的情況下對三種設(shè)計的打分進行顯著性檢驗。由于數(shù)據(jù)不滿足單因素重復測量方差分析的假設(shè),因此我們依舊采用了非參數(shù)檢驗。首先以各個維度為因變量,分別在有無信息的情況下,對三種設(shè)計的評分進行了Friedman雙向方差分析(如表4所示)。如果發(fā)現(xiàn)顯著差異,再進一步用Wilcoxon T檢驗進行成對檢驗。
表4 有無信息時,三個設(shè)計各個維度的得分Friedman檢驗
互動意愿 在無信息時,用戶對雙屏的互動意愿顯著高于單屏和一體屏設(shè)計,而它們之間無顯著差異。在有信息時,單屏的互動意愿最低,而雙屏和一體屏之間沒有區(qū)別(見表5)。
表5 有無信息時,各個設(shè)計互動意愿的成對比較(基于Wilcoxon T 檢驗)
*表示差異在統(tǒng)計上顯著(P<=0.05)。
智能度 無論有無信息,雙屏設(shè)計的智能度評價都顯著高于單屏和一體屏。而在無信息時,單屏和一體屏之間沒有顯著差異,但在有信息時,一體屏的智能度評價比單屏更高(見表6)。
表6 有無信息時,各個設(shè)計智能度的成對比較(基于Wilcoxon T 檢驗)
*表示差異在統(tǒng)計上顯著(P<=0.05)。
擬人度 在有無信息時,一體屏的擬人度評價都顯著低于單屏和雙屏,在無信息時,單屏和雙屏之間無顯著差異。但在有信息時雙屏的擬人度顯著高于單屏(見表7)。
表7 有無信息時,各個設(shè)計擬人度的成對比較(基于Wilcoxon T 檢驗)
*表示差異在統(tǒng)計上顯著(P<=0.05)。
本研究探討了用戶對三種機器人屏幕設(shè)計的偏好,結(jié)果發(fā)現(xiàn):無論屏幕是否呈現(xiàn)信息,用戶最偏好的都是雙屏設(shè)計。結(jié)合定性分析發(fā)現(xiàn),用戶選擇時主要考慮了“擬人度”與 “信息展現(xiàn)效率”兩個因素。雙屏設(shè)計同時具備“擬人度高”以及“信息展現(xiàn)效率高”兩個優(yōu)勢。首先,雙屏具有“頭部”這一擬人的特征,一方面頭部是擬人機器人的擬人程度最直觀的標志[16],另一方面用戶期待“頭部”呈現(xiàn)“表情”,表情是人際交往中傳達信息很重要的一個部分,尤其是情緒的傳遞[17]。所以主觀評分中其擬人度感知顯著高于一體屏。而擬人度會進一步影響用戶“互動意愿”。用戶認為服務(wù)機器人承擔一定社會職能,擬人化顯得更加友好,能夠增加互動意愿。其次,人-機器人交互效率備受用戶關(guān)注。服務(wù)機器人承擔著信息查詢、業(yè)務(wù)辦理、引導等功能,屏幕是重要的信息載體和交互載體,在第一輪對比中,機器人并未呈現(xiàn)信息,部分用戶會主動代入使用場景,認為雙屏設(shè)計屏幕大,在交互的過程中效率更高,體驗更好。第二輪對比中,機器人屏幕呈現(xiàn)信息進一步加強了用戶的選擇。最后,擬人度、屏幕也會影響用戶對于機器人智能度的感知。一方面,用戶認為機器人在造型、表情等層面擬人度高時,其智能度越高,這一點在Mirnig[18]等人的研究中也得到驗證。另一方面,當機器人的屏幕面積越大,其所能承擔的功能更多,“辦事”效率更高,因此也會被認為更加智能。
有意思的是,用戶對單屏、一體屏的偏好因屏幕是否呈現(xiàn)信息而存在差異。無信息時,單屏和一體屏沒有顯著差異;而有信息時,用戶對一體屏偏好顯著高于單屏。 這一差異反映出用戶在“感性”和“理性”中取舍。第一輪對偶比較不呈現(xiàn)信息,雖然部分用戶會代入使用場景考慮交互效率,但整體上單屏設(shè)計因其因擬人度,營造了親切友好的想象,受到用戶青睞。第二輪對偶比較呈現(xiàn)信息,單屏受到兩方面影響。首先,頭部屏幕用戶呈現(xiàn)信息,表情傳遞受到影響。其次,單屏屏幕更小,信息傳遞效率不如一體屏。相反,一體屏屏幕上方顯示了表情,使其擬人度評分較無信息時有所升高,同時信息更易讀、交互更便捷,所以用戶對于一體屏的偏好顯著高于單屏,甚至接近雙屏。該結(jié)果對于后續(xù)設(shè)計和研究重要啟示。在設(shè)計上,當因為各種成本、場景等各種因素只能采用一體屏設(shè)計時,可以考慮在屏幕的上添加部分“擬人”元素來彌補用戶訴求。在研究上,我們在測試某一因素而控制其它因素得出結(jié)論時,也需考慮其它被控制的因素會對結(jié)果產(chǎn)生什么樣的影響。尤其是當用戶純粹從外觀考慮偏好時,容易低估實用性的影響。
考慮到機器人設(shè)計初期,制作機器人真實模型時間和金錢成本高,本次研究采用建模并投影的方式最大程度還原用戶對于機器人的感知。實驗中用戶不能和機器人實際交互,所以采用主觀評價作為衡量指標。但在人機互動中,用戶的客觀行為是反應(yīng)用戶體驗、偏好的重要衡量標準。后續(xù)將待機器人投入市場后,深入用戶使用場景研究用戶和機器人交互的各類行為,優(yōu)化雙屏類機器人的交互體驗。
(1)雙屏設(shè)計的機器人最受用戶偏好,因其“擬人度高”且“信息展現(xiàn)效率高”;(2)當不呈現(xiàn)信息時,用戶對頭部單屏和一體屏設(shè)計存在個體差異,但整體無顯著差異,但當呈現(xiàn)信息時,用戶對一體屏設(shè)計的偏好顯著高于頭部單屏設(shè)計,這可能是由于呈現(xiàn)信息時,“信息展現(xiàn)效率”這一因素的影響被放大;(3)在進行外觀屏幕設(shè)計時,需考慮用戶的選擇誤差。