王思邁
摘 要 人機交互是計算機科學的主要分支領域之一,旨在研究計算機、機器人等系統(tǒng)如何與用戶進行合理的交流互動。自第一臺計算機在賓夕法尼亞大學誕生以來,人機交互技術就深深地影響著計算機科學的發(fā)展進程,每一次人機交互技術的革新都會給個人電腦與互聯網的普及帶來新的曙光。文章梳理了人機交互的發(fā)展歷程,并將人機交互分為傳統(tǒng)人機交互技術和先進人機交互技術進行分別闡述,并在文章的最后對未來人機交互的形式進行了展望。
關鍵詞 人機交互;計算機;用戶;互聯網
中圖分類號 TP3 文獻標識碼 A 文章編號 1674-6708(2019)230-0142-03
所謂人機交互,是指用戶與系統(tǒng)之間的交流、互動。此處的系統(tǒng),既可以是電腦、手機、機器人等機器,也可以指軟件或操作系統(tǒng)等。而人機交互界面則通常指用戶可見的部分,如電視機上的按鈕、汽車的儀表盤、生產車間的控制室等,都是人機交互界面的典型案例。系統(tǒng)可用性和用戶友好性是人機交互設計需要考慮的兩大因素。
人機交互的最新研究成果有什么?人機交互的發(fā)展經歷了哪些歷程?人機交互有哪些典型技術和新興技術?本文將一一對此進行介紹。
1 人機交互發(fā)展歷程
1.1 人機交互最新研究成果
2018年10月31日,柔宇科技的第一款消費級可折疊式手機問世,這也是世界上第一款可折疊手機。在發(fā)布會上,該手機最引人矚目的特征就是“可折疊”,一部手機可以延展成一臺iPad大小。近年來,智能手機、iPad、超級本等消費級電子產品已經走進千家萬戶,但是材料屬性的限制使得用戶需要購買不同尺寸的電子產品,其經濟性和便攜性難以保證。
從軟件的角度看,可折疊技術會給UI(User Interface,用戶界面)設計帶來一次革命性的變化,而電腦手機“合二為一”,則意味著移動互聯網將成為互聯網時代的“霸主”,Web2.0時代即將走向終結。
除了柔性屏帶來的電子產品交互方式的變化,近年來,語音交互、手勢識別、虛擬現實等先進交互技術的誕生,極大地拓展了人機交互的可能性。而人機交互帶來的用戶體驗的提升,正在為計算機和互聯網帶來數以億計的用戶。
這就是技術變革對交互方式真正的價值,從鍵盤鼠標的發(fā)明,到語音助手、人臉識別技術的應用,再到如今的“柔性屏”技術,人機交互形式的變化,真正使得計算機科學和互聯網惠及大眾、讓世界更美好。
1.2 人機交互發(fā)展歷史
自從世界上第一臺計算機ENIAC被發(fā)明以來,人機交互就成為計算機科學非常重要的一個分支學科。二戰(zhàn)期間的ENIAC被用于密碼破譯、火炮彈道計算等,此時的人機交互非常原始,通過打孔紙條來實現指令的輸入和輸出,一個功能簡單的程序也需要幾天時間來制作打孔紙條,并改變開關和電纜的設置。如此“原始”的人機交互方式極大地影響了計算機操作的便捷性,因此急需一種更為先進的人機交互方式。
本文通過表格(表1)的形式梳理了人機交互的發(fā)展歷程,將每個時代最前沿、最流行的人機交互技術進行呈現[ 1 ]。
由上可見,人機交互的發(fā)展是一段人(用戶)適應機器到機器適應人(用戶)的過程。總結人機交互的發(fā)展歷史,可以分為成以下幾個階段:第一階段,手工作業(yè)階段,以打孔紙條為代表;第二階段,交互命令語言階段,用戶通過編程語言操作計算機;第三階段,圖形用戶界面階段,Windows操作系統(tǒng)是這一階段的代表;第四階段,語音交互、虛擬現實等智能人機交互的出現[ 2 ]。
2 傳統(tǒng)人機交互技術
2.1 用戶界面
用戶界面又被稱為UI(User Interface),通過關注軟件的人機交互、使用邏輯和界面的美觀程度來提升用戶使用體驗,稍具規(guī)模的互聯網公司都有自己的UI設計團隊。好的UI設計既能讓軟件美觀而有格調,還能讓軟件操作變得方便、人性化。在1970年的時候,如果用戶想使用電腦,必須在命令行界面輸入命令,繁瑣的命令行使得使用電腦變成一件“高門檻”的事情。10年之后,計算機科學研究者們才開發(fā)出第一款搭載圖形用戶界面(GUI)的電腦,窗口、菜單欄、文件夾、圖標等元素和復制、粘貼、移動、刪除等現如今稀疏平常的操作,在當時為用戶使用計算機帶來了極大的方便。近年來,互聯網、智能硬件領域的各大企業(yè)愈發(fā)重視UI設計,要求既要滿足用戶日益增長的多元化要求,又要展示出產品的質量和價值觀,UI設計已經成為高新技術企業(yè)的一張“名片”[ 3 ]。
2.2 外接硬件設備
2.2.1 鼠標
鼠標是計算機的一種輸入設備,其本質上是計算機顯示系統(tǒng)橫縱坐標定位的指示器。鼠標的發(fā)明和普及使得計算機操作變得簡單便捷,用戶再也不必記憶復雜的指令集。根據其工作原理的差異,鼠標可分為滾球鼠標、光電鼠標和無線鼠標。鼠標誕生于1964年,真正成為計算機標準配件是在1984年,蘋果公司推出的Macintosh讓鼠標走進大眾視野,為計算機用戶帶來了全新的交互體驗。
2.2.2 鍵盤
鍵盤也是一種輸入設備,英文字母、阿拉伯數字、標點符號等字符都可以通過鍵盤直接輸入。同時,快捷鍵也是鍵盤的一大特色,最常見的如“Ctrl+C”為復制、“Ctrl+V”為粘貼。計算機鍵盤發(fā)源自打字機鍵盤,目前最為經典的“QWERTY”設計之初的目的也是降低打字員打字速度以免卡鍵。鍵盤操作雖然不如鼠標方便,但是作為計算機最重要的外部設備,有著無法替代的作用。
3 先進人機交互技術
3.1 語音交互
語音交互主要包含以下步驟:
首先,語音識別,即通過麥克風提取聲波信號,將聲波的振動信號轉化為電信號,再將電信號進行處理(如進行拉普拉斯變換得到頻域信號),分析處理后的信號特征且與數據庫中的文字信息進行匹配,數據庫越大、樣本信息越多,則語音識別的準確率越高。
其次,語義識別,即讓計算機通過識別出的文字信息“讀懂”句子的含義。相比于語音識別,語義識別技術仍不夠成熟,目前在消費級產品上只能實現喚醒、設置鬧鐘等簡單的指令理解。但是值得期待的是,谷歌、蘋果等各大科技巨頭都加大了對智能音箱的投入,機器學習可以使計算機不斷“自學”,通過大量數據來自我提升語義識別的準確度,隨著時間的推移,計算機在未來可以真正做到理解用戶的指令,進而更加精確地滿足用戶需求。
最后,語音合成。語音合成又可分為在線語音合成和離線語音合成兩部分,在線語音合成無需占用大量內存,可通過云端數據庫合成接近甚至超越人聲的合成聲音,但是網絡環(huán)境會極大地影響音質和合成速率,翻譯機、智能小助手通常采用在線語音合成技術。離線語音合成則需要用戶提前下載本地語音包,計算機接收到需要合成的句子后直接調用本地語音包進行合成,占用較大內存,且音色稍遜于在線語音合成。但其優(yōu)勢在于不受網絡環(huán)境的限制,合成速度更快,機場、商店等地的廣播通常采用離線語音合成技術[ 4 ]。
3.2 虛擬現實
虛擬現實技術(virtual reality,簡稱VR)本質上是一種仿真技術,并融合了計算機圖形學、人機接口、多媒體融合技術、傳感器技術等諸多學科的前沿科技。虛擬現實技術主要包含以下幾方面。
1)模擬環(huán)境:即計算機生成、動態(tài)三維立體圖像,并對逼真程度要求很高。
2)感知:理想的虛擬現實技術應該具備人類所具有的一切感知能力,除了與計算機視覺所對應的視覺感知能力,還應具備聽覺、觸覺、運動感知、壓力感知甚至嗅覺等能力。
3)自然技能:是指虛擬現實可以檢測并跟蹤到人的各種動作,如頭部、眼球、手勢、肢體等,并將感知到的動作信號轉化成數據進行分析和實時反饋,其中反饋的對象為用戶的五官和皮膚等感知器官,主要通過交互設備來實現。
虛擬現實技術目前仍存在許多瓶頸,傳感器精度有限、網絡傳輸速度限制影響著虛擬現實技術的用戶體驗,相信隨著“中國智造”的實現和5G通信網絡的應用,虛擬現實技術的軟硬件需求終將得到滿足[ 5 ]。
3.3 先進人機交互技術展望
展望人機交互的發(fā)展未來,可總結為以下4個特征。
1)集成化:即集成了語音識別、手勢識別、表情識別、肢體動作識別的交互形式,通過融合各種識別結果輸出最終判斷。
2)智能化:在人機交互中,使計算機更好地自動捕捉人的姿態(tài)、手勢、語音和上下文等信息,了解人的意圖,并做出合適的反饋或動作,提高交互活動的自然性和高效性,使人-機之間的交互像人-人交互一樣自然、方便,是計算機科學家正在積極探索的新一代交互技術的一個重要內容。人機交互與人工智能的結合,使得交互技術產生極大的提升。人機交互的智能化,其終極追求就是使“人-機”互動變得像“人-人”互動一樣自然、流暢。
3)標準化:人機交互設備的標準化可降低制造成本、挺高不同設備之間的兼容性,鼠標和鍵盤就是一個很好的案例,當先進人機交互技術逐漸從“百花齊放”走向“大一統(tǒng)”的時候,標準化就是用戶乃至整個社會的必然需求[ 6 ]。
4 結論
人機交互技術是計算機科學一門重要分支,從發(fā)展歷程的角度看,人機交互方式的進步使得計算機操作更加便捷,進而使得計算機從軍隊、大型企業(yè)的專屬物轉變成千千萬萬用戶的日常工具。人機交互可分為傳統(tǒng)人機交互方式和先進人機交互方式兩大類,本文分別以用戶界面、外界硬件設備和語音交互、虛擬現實為例,分析了這兩類交互方式的原理和主要特征,并對未來的交互方式進行了展望。隨著更為便捷、高效的交互方式的誕生,計算機將會在生產、生活中為人類帶來更多的福祉。
參考文獻
[1]俞宏良.科技創(chuàng)新視域下我國人機交互發(fā)展問題研究[D].延吉:延邊大學,2018.
[2]劉晶.面向老年人的聲音增強交互認知研究[D].廣州:廣東工業(yè)大學,2018.
[3]周莉莉.人機交互界面的藝術表現研究[D].合肥:合肥工業(yè)大學,2009.
[4]禹琳琳.語音識別技術及應用綜述[J].現代電子技術,2013,36(13):43-45
[5]廖斯羽.虛擬現實技術的特點及應用[J].科技傳播,2018,10(21):127-128,135.
[6]馬浩.多媒體英語智能客戶端的交互設計和實現[D].北京:北京郵電大學,2011.