陳栩聰 鄭宇煜 唐鈺霖 丘洪偉
摘要:在計(jì)算機(jī)普及的現(xiàn)在,仍有著一定數(shù)量的人們不懂如何使用計(jì)算機(jī),且現(xiàn)今計(jì)算機(jī)操作的步驟繁多,暫時(shí)找不到一種人機(jī)交互的簡(jiǎn)單方式,現(xiàn)市場(chǎng)上也出現(xiàn)了用于提高人機(jī)交互效果的軟件,但是,均存在功能不完善、設(shè)計(jì)不夠人性化等問(wèn)題,該文將介紹計(jì)算機(jī)云端助理的研究與設(shè)計(jì),幫助更多的用戶輕松愉快的使用計(jì)算機(jī)。
關(guān)鍵詞:精簡(jiǎn)操作;人機(jī)交互;語(yǔ)音操作
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2019)31-0029-04
1概述
1.1項(xiàng)目可行性分析與應(yīng)用前景
隨著計(jì)算機(jī)滲入到我們生活中,計(jì)算機(jī)的操作逐漸簡(jiǎn)化,但目前智能語(yǔ)音操作的交互模式還存在著一些缺陷,為了解決這一問(wèn)題,我們把日常生活中的人機(jī)交互歸納成多種情景或者模式,為了使人們的計(jì)算機(jī)操作能夠進(jìn)一步簡(jiǎn)化,減少人們使用電腦的時(shí)間成本,我們?cè)O(shè)計(jì)了計(jì)算機(jī)云端助理軟件。
本軟件所屬的領(lǐng)域是計(jì)算機(jī)輔助操作系統(tǒng),是一種附帶電腦精靈情緒表達(dá)程序,一種新型電腦互動(dòng)模式、一種游戲娛樂(lè)和生活工作相結(jié)合的計(jì)算機(jī)輔助操作系統(tǒng)。
本作品使用c#言基礎(chǔ)編寫(xiě),unity3D作為基本引擎,人物形象使用Live 2D軟件制作,數(shù)據(jù)庫(kù)使用SQL數(shù)據(jù)庫(kù),語(yǔ)音識(shí)別使用訊飛API進(jìn)行輔助。
為了更好地了解市場(chǎng),我們專門(mén)做了市場(chǎng)調(diào)研和需求分析。此次調(diào)查的對(duì)象共有247人,其中大部分人群的職業(yè)是學(xué)生。
1)超過(guò)55%的人群對(duì)自己的日常生活沒(méi)有較為系統(tǒng)的規(guī)劃,而在此人群中有59%的人愿意使用能夠規(guī)劃日程的軟件。
2)有51%的人表示沒(méi)有養(yǎng)過(guò)桌寵或使用過(guò)此類軟件,但在養(yǎng)過(guò)桌寵的121人中僅有32%的人表示厭惡,其主要原因是在于桌寵的占屏問(wèn)題,選擇了此選項(xiàng)的人數(shù)占據(jù)了84%的比例。
3)此次調(diào)查玩游戲的情況,僅有16%的人不怎么接觸游戲,而玩游戲的人群中以悠閑類游戲居多,占據(jù)了43%的比例。
4)在此軟件盈利的問(wèn)題上,占了44%的人表示不會(huì)為游戲裝扮氪金,還有34%的人覺(jué)得只要做得好看,就會(huì)為游戲氪金,而有高達(dá)58%的人群會(huì)為一款好用的軟件付費(fèi)。
通過(guò)以上數(shù)據(jù)得出人們想擁有一款計(jì)算機(jī)桌面寵物可愛(ài)的外表的計(jì)算機(jī)輔助軟件。其中有9%的人完全不用語(yǔ)音功能進(jìn)行交流,有46%希望能夠通過(guò)語(yǔ)音指示完成自己想要完成的操作,也有14%的人認(rèn)為用語(yǔ)音指示,比自己動(dòng)手操作會(huì)更快速、便捷。大部分人都有過(guò)為收集各路資源到處奔波各種軟件的煩惱,僅有21%的人群沒(méi)有這個(gè)煩惱。
在計(jì)算機(jī)常常遇到的問(wèn)題方面,有55%的人常因?yàn)殡娔X故障無(wú)法自修,有51%的人對(duì)計(jì)算機(jī)的使用并沒(méi)有完全了解,認(rèn)為計(jì)算機(jī)使用操作過(guò)于冗雜的人占了34%。
在軟件功能方面,占了77%的人認(rèn)為當(dāng)今人工智能應(yīng)該具有智能協(xié)助操作的功能,而認(rèn)為需要具有智能語(yǔ)音聊天和自我成長(zhǎng)學(xué)習(xí)功能的人均占了50%左右。82%的人認(rèn)為人工智能應(yīng)該在生活中幫助我們收集資料,日程計(jì)劃安排和聊天娛樂(lè)的分別占據(jù)了63%和52%的比例。
通過(guò)本次調(diào)查,目前社會(huì)上存在的此類軟件應(yīng)用,均存在功能不完善或不好用,一部分用戶不知道如何操作此類軟件應(yīng)用,此類軟件應(yīng)用解決計(jì)算機(jī)操作問(wèn)題的范圍小,如:微軟小娜對(duì)計(jì)算機(jī)的操作雖然可以解決一部分的問(wèn)題,但不支持應(yīng)用功能拓展,沒(méi)有開(kāi)放模塊拓展給用戶,導(dǎo)致其他軟件不能對(duì)接,造成了操作局限。導(dǎo)致這種操作局限的問(wèn)題,一是沒(méi)有開(kāi)放模塊功能;其次是人機(jī)交互方式還做不到很自然的交互。
用戶對(duì)計(jì)算機(jī)各種操作量日益增長(zhǎng),故現(xiàn)在社會(huì)急需一款能簡(jiǎn)化計(jì)算機(jī)操作和一款屬于自己的桌寵的軟件應(yīng)用。我們?cè)O(shè)計(jì)本軟件的目的是讓電腦操作進(jìn)一步進(jìn)行簡(jiǎn)化,減少人們使用電腦工作的時(shí)間成本,并且提供一款擁有可愛(ài)外表的計(jì)算機(jī)桌面寵物的計(jì)算機(jī)輔助軟件。
1.2當(dāng)前國(guó)內(nèi)外同類課題研究水平概述
國(guó)內(nèi):小愛(ài)同學(xué),天貓精靈
以天貓精靈的硬件產(chǎn)品“天貓精靈x1”為例,它內(nèi)置AliGe-nie系統(tǒng),通過(guò)中文普通話語(yǔ)音指令,目前可實(shí)現(xiàn)智能家居控制、語(yǔ)音購(gòu)物、手機(jī)充值、音樂(lè)音頻播放等功能,帶來(lái)人機(jī)交互的體驗(yàn)。
我們的作品Juli是以u(píng)nity為制作工具,使用Live2D技術(shù)和c#編寫(xiě)的一個(gè)以電腦為平臺(tái)精簡(jiǎn)電腦操作的軟件,目前已實(shí)現(xiàn)語(yǔ)音控制該軟件、語(yǔ)音控制電腦、使用自主打包的精簡(jiǎn)操作包、場(chǎng)景對(duì)話功能、快捷搜索功能等。
天貓精靈與我們的作品相比,天貓精靈現(xiàn)在以語(yǔ)音控制智能家居并實(shí)現(xiàn)相關(guān)功能為主,而我們的作品是建立在windows平臺(tái)上的一個(gè)可以使用語(yǔ)音控制電腦操作并可實(shí)現(xiàn)自己編譯的操作流程的便利化電腦操作的功能性軟件。
國(guó)外:微軟小娜,Siri
以微軟小娜為例,小娜在windows中幫助人們使用電腦。她雖然擁有微軟團(tuán)隊(duì)的技術(shù)保證,和擁有高語(yǔ)音識(shí)別的性能,但平臺(tái)拓展性不高,功能受限,例如:遇到不懂的問(wèn)題就直接打開(kāi)必應(yīng)搜索等等。
本軟件與小娜相比,在持續(xù)發(fā)展上擁有優(yōu)勢(shì),雖然目前擁有功能不完善的相同缺點(diǎn),但本軟件使用unity引擎編寫(xiě),可以在多平臺(tái)發(fā)布版本,建立服務(wù)器。與小娜不同的是,本軟件有具現(xiàn)化表情和動(dòng)作,可以拓展使用更多的電腦操作,并且能作為一個(gè)共享電腦自動(dòng)化操作集成平臺(tái)進(jìn)行免費(fèi)共享集成操作。
2軟件的設(shè)計(jì)與實(shí)現(xiàn)
2.1主程序架構(gòu)設(shè)計(jì)思路與流程圖
軟件各功能通過(guò)主菜單進(jìn)行使用,用右鍵打開(kāi)菜單或用語(yǔ)音打開(kāi)菜單。一共設(shè)置19個(gè)功能,分別是新聞,世界,附加系統(tǒng),日程,商店,賬號(hào)信息,任務(wù),活動(dòng),每日獎(jiǎng)勵(lì),倉(cāng)庫(kù),好友,收件箱,設(shè)置,juli的家,呼喚iuli,精簡(jiǎn)操作,文件分類,數(shù)據(jù)搜索,時(shí)間規(guī)劃,如圖1所示。
菜單界面主要顯示新聞,世界,附加系統(tǒng),日程,商店,賬號(hào)信息的界面人口,其余功能收錄在一個(gè)更多功能界面里面。
使用戶可以用鼠標(biāo)直接操作需要的功能,或者使用語(yǔ)音操作對(duì)應(yīng)的功能,實(shí)現(xiàn)語(yǔ)音輸入+鼠鍵輸入的多輸入模式控制框架。
客戶端使用stock協(xié)議通信與服務(wù)端進(jìn)行交互,打開(kāi)軟件彈出商標(biāo)視頻,進(jìn)入到登錄界面,判斷用戶的賬號(hào)密碼是否正確,在服務(wù)端進(jìn)行驗(yàn)證,驗(yàn)證成功就進(jìn)入日期變量判斷,驗(yàn)證失敗就返回登錄界面。進(jìn)入日期變量判斷,判斷今天是否打開(kāi)過(guò)新聞公告,若無(wú)則打開(kāi)新聞界面,若有則進(jìn)入主界面。
在主界面中進(jìn)行功能操作,執(zhí)行對(duì)應(yīng)的功能,點(diǎn)擊關(guān)閉按鈕,則軟件關(guān)閉。
2.2數(shù)據(jù)設(shè)計(jì)思路與流程圖
數(shù)據(jù)儲(chǔ)存在自主搭建的服務(wù)器,使用SQL數(shù)據(jù)庫(kù),如圖2所示。
2.3服務(wù)端設(shè)計(jì)思路與流程圖
使用VS軟件的c#言編寫(xiě)服務(wù)器界面功能,使用stock協(xié)議通信與客戶端進(jìn)行交互。
2.4功能開(kāi)發(fā)
2.4.1情緒表達(dá)
計(jì)算機(jī)云端助理會(huì)通過(guò)服務(wù)器數(shù)據(jù)庫(kù)中的記錄的心情值來(lái)進(jìn)行情緒表達(dá)和動(dòng)作體現(xiàn);
原理:情緒表達(dá)→讀取數(shù)據(jù)庫(kù)→進(jìn)行算法演變選擇已經(jīng)設(shè)置好的表情動(dòng)作程序→通過(guò)動(dòng)畫(huà)人物表情和動(dòng)作來(lái)表現(xiàn)給用戶→進(jìn)而達(dá)到與人的情緒相似。這方法用來(lái)解決一個(gè)人類不理解電腦AI情緒的問(wèn)題,如圖3所示。
2.4.2計(jì)算機(jī)助理互動(dòng)模式
1)語(yǔ)音互動(dòng)模式
用戶可以通過(guò)語(yǔ)音喚醒軟件,告訴軟件執(zhí)行已經(jīng)制作好的精簡(jiǎn)的計(jì)算機(jī)操作包,或者進(jìn)行場(chǎng)景對(duì)話一邊與計(jì)算機(jī)助理聊天,一邊自然地告訴計(jì)算機(jī)助理,要執(zhí)行的操作。
2)文字互動(dòng)模式
用戶可以通過(guò)點(diǎn)擊動(dòng)畫(huà)形象來(lái)喚醒軟件,進(jìn)行文字輸入,發(fā)送文字給軟件執(zhí)行相應(yīng)的計(jì)算機(jī)操作包,點(diǎn)擊文字選項(xiàng)進(jìn)行與助理互動(dòng)。如圖4所示。
2.4.3數(shù)據(jù)搜索
以每個(gè)標(biāo)簽為一塊的內(nèi)容展示在搜索結(jié)果的窗口上,實(shí)現(xiàn)資源搜索整合,信息精簡(jiǎn),不用打開(kāi)每個(gè)標(biāo)簽網(wǎng)站上進(jìn)行搜索,即可看到每個(gè)標(biāo)簽網(wǎng)站的與搜索內(nèi)容相關(guān)的內(nèi)容。
2.4.4精簡(jiǎn)操作
將編寫(xiě)好的日常電腦操作集合成一個(gè)操作包,可以通過(guò)語(yǔ)音和文字與人物進(jìn)行對(duì)話執(zhí)行,可以添加操作包和編輯操作包,添加或編輯操作包使用模塊圖形來(lái)修改代碼,每一個(gè)模塊就是一種可編輯的簡(jiǎn)單計(jì)算機(jī)操作,將組合好的圖形層序通過(guò)內(nèi)置編譯器進(jìn)行編譯,編譯出一個(gè)操作包dll程序,這個(gè)操作包就可以接入本軟件進(jìn)行模塊化功能擴(kuò)展,如圖5所示。
3結(jié)論
在語(yǔ)音識(shí)別之后的操作匹配功能已經(jīng)完成,對(duì)應(yīng)檢測(cè)到的文字可以執(zhí)行特定的操作。語(yǔ)音識(shí)別的精確度進(jìn)行優(yōu)化,在一定的噪聲環(huán)境下能比較準(zhǔn)確地識(shí)別。關(guān)鍵詞的提取進(jìn)行了優(yōu)化,將網(wǎng)上檢索到的資源進(jìn)行過(guò)濾,再存入數(shù)據(jù)庫(kù)。云端助理的屬性參數(shù)則是參考現(xiàn)階段自己設(shè)計(jì)的算法流程圖,進(jìn)行心情實(shí)時(shí)演算。