摘要:為了提升企業(yè)辦公應(yīng)用的使用體驗,研發(fā)了具備機器學(xué)習(xí)功能的智能化企業(yè)辦公助理應(yīng)用系統(tǒng)。該應(yīng)用系統(tǒng)集成實現(xiàn)了語音識別模塊,并接入了企業(yè)生產(chǎn)經(jīng)營管理相關(guān)流程和數(shù)據(jù),實現(xiàn)了通過語音智能化查詢企業(yè)數(shù)據(jù),處理業(yè)務(wù)流程的功能。提升了用戶的交互體驗,提供了面向用戶的反饋評價功能,采用機器學(xué)習(xí)的框架優(yōu)化識別查詢的結(jié)果。應(yīng)用的建設(shè)部署改善了用戶的交互模式和使用體驗,提升了企業(yè)辦公應(yīng)用的智能化水平,提升企業(yè)管理效率。
關(guān)鍵詞:企業(yè)應(yīng)用;辦公應(yīng)用;語音助理;語音識別;機器學(xué)習(xí)
中圖分類號:TP311.52;TN912.3? ? 文獻標(biāo)識碼:A? ? 文章編號:1007-9416(2020)10-0000-00
0 引言
近年來,互聯(lián)網(wǎng)和信息技術(shù)的飛速發(fā)展,語音識別技術(shù)也得到了長足的進步,在各類系統(tǒng)中逐漸得到應(yīng)用[1]。個人消費領(lǐng)域中,語音助手類型的應(yīng)用已經(jīng)得到了比較廣泛的應(yīng)用[2]。而在企業(yè)內(nèi)部應(yīng)用場景中,由于企業(yè)業(yè)務(wù)專業(yè)性強,系統(tǒng)操作互動性要求不高,基于語音識別技術(shù)的辦公助理類型應(yīng)用較少[3]。一版的企業(yè)辦公助理應(yīng)用往往交互方式比較傳統(tǒng),用戶使用的體驗也不是很好,交互的功能單一,同時也不具備學(xué)習(xí)能力[4][5]。本研究中,構(gòu)建了一套基于語音識別技術(shù),并采用用戶反饋評價數(shù)據(jù)作為系統(tǒng)學(xué)習(xí)參考,實現(xiàn)了智能化的企業(yè)辦公助理的應(yīng)用系統(tǒng)。
1 系統(tǒng)架構(gòu)設(shè)計
智能交互應(yīng)用系統(tǒng)包含了語音輸入和識別,數(shù)據(jù)處理提取,頁面數(shù)據(jù)推送和后臺學(xué)習(xí)反饋等功能模塊。傳統(tǒng)企業(yè)辦公助理應(yīng)用由于系統(tǒng)功能單一,業(yè)務(wù)數(shù)據(jù)未融合等原因,并未引入后臺學(xué)習(xí)反饋的架構(gòu)設(shè)計,導(dǎo)致助理應(yīng)用難以具備自動學(xué)習(xí)的功能[6][7]。本研究在傳統(tǒng)辦公助理應(yīng)用的基礎(chǔ)上,引入了學(xué)習(xí)反饋的架構(gòu)設(shè)計,融合了語音技術(shù)框架,開發(fā)出了智能化的企業(yè)辦公助理應(yīng)用。
應(yīng)用系統(tǒng)整體上采用典型的B/S架構(gòu)構(gòu)建,氛圍用戶界面層、業(yè)務(wù)邏輯層、數(shù)據(jù)訪問層。前端用戶界面層采用html5技術(shù)實現(xiàn)。業(yè)務(wù)邏輯層基于Java編程語言,采用了springMVC框架進行開發(fā)。數(shù)據(jù)訪問層中,采用mybatis框架實現(xiàn)數(shù)據(jù)持久層,采用mysql開源版本數(shù)據(jù)庫存儲關(guān)系型數(shù)據(jù),采用redis作為高性能存儲。與業(yè)務(wù)系統(tǒng)采用RESTful接口進行數(shù)據(jù)訪問。同時,為了提升用戶體驗,實現(xiàn)頁面數(shù)據(jù)實時更新,采用了長鏈接技術(shù)保持前后臺通信。系統(tǒng)架構(gòu)如圖1所示。
2 系統(tǒng)功能設(shè)計
2.1總體功能架構(gòu)
系統(tǒng)以企業(yè)辦公經(jīng)營數(shù)據(jù)為基礎(chǔ),通過語音識別、數(shù)據(jù)挖掘、機器學(xué)習(xí)等技術(shù)手段,實現(xiàn)企業(yè)辦公經(jīng)營數(shù)據(jù)的智能化查詢,實現(xiàn)了新型的辦公助理應(yīng)用的交互方式。關(guān)鍵業(yè)務(wù)流程為用戶通過使用語音助理,完成辦公管理流程處理,查詢生產(chǎn)經(jīng)營數(shù)據(jù)信息并對查詢結(jié)構(gòu)進行評價反饋等。包括用戶管理和認(rèn)證,語音輸入和處理,數(shù)據(jù)檢索和查詢以及查詢結(jié)果反饋和學(xué)習(xí)等功能模塊。系統(tǒng)功能結(jié)構(gòu)如圖2所示。
2.2功能模塊研發(fā)
2.2.1用戶管理和認(rèn)證
用戶的管理和認(rèn)證功能在各類信息系統(tǒng)中都是必須的基礎(chǔ)功能,在企業(yè)辦公應(yīng)用中更是如此。企業(yè)的各類流程處理、經(jīng)營數(shù)據(jù)查詢等業(yè)務(wù)功能都是基于企業(yè)用戶的實際角色和權(quán)限進行管理。在傳統(tǒng)的辦公助理應(yīng)用中,用戶的認(rèn)證通常是采用用戶名密碼的方式進行認(rèn)證。本研究中,用戶除了可以采用傳統(tǒng)的用戶民密碼的方式進行用戶認(rèn)證以外,還可以使用人臉識別的方式進行認(rèn)證。用戶在第一次登錄的時候可以選擇錄入個人的人臉圖像,錄入成功后再次登錄系統(tǒng)時,即可以使用人臉認(rèn)證的方式完成登錄。
2.2.2語音輸入和處理
用戶使用終端設(shè)備的麥克風(fēng)輸入語音,與企業(yè)辦公助理應(yīng)用進行互動交互。通過輸入查詢指令,系統(tǒng)對輸入的語音進行識別和轉(zhuǎn)換。對文本信息進行分詞處理,識別出關(guān)鍵詞后與系統(tǒng)預(yù)置的詞庫進行對比,查找出符合項,過濾出查詢目標(biāo)。
2.2.3數(shù)據(jù)檢索和查詢
系統(tǒng)后臺對語音識別處理后的結(jié)果在業(yè)務(wù)數(shù)據(jù)中進行查詢。可查詢的企業(yè)經(jīng)營管理數(shù)據(jù)內(nèi)容包括三類,分別是:一般數(shù)據(jù),即通用互聯(lián)網(wǎng)數(shù)據(jù)查詢,例如天氣信息等;辦公協(xié)同信息,主要包括同事聯(lián)系方式,會議情況查詢,待處理流程等;業(yè)務(wù)數(shù)據(jù)查詢,主要包括經(jīng)營、生產(chǎn)、管理等業(yè)務(wù)信息查詢。
2.2.4查詢結(jié)果反饋和學(xué)習(xí)
查詢完成后,查詢結(jié)果會在用戶界面上顯示,同時會提示用戶對查詢的結(jié)果進行評價。通過用戶打分的方式,對查詢的結(jié)果的匹配程度和數(shù)據(jù)準(zhǔn)確性進行打分評價。系統(tǒng)將采集到的評價信息進行記錄,并用于提升后續(xù)查詢結(jié)果的質(zhì)量。
3 系統(tǒng)功能實現(xiàn)
3.1總體功能
用戶通過終端設(shè)備,如個人PC、手機等,訪問企業(yè)辦公助理應(yīng)用系統(tǒng),完成用戶登錄認(rèn)證。認(rèn)證通過后,用戶通過語音發(fā)出指令,應(yīng)用系統(tǒng)識別用戶語音指令并進行解析處理。解析處理得到查詢關(guān)鍵詞后,系統(tǒng)后臺對關(guān)鍵詞進行檢索查詢,查詢得到相關(guān)的業(yè)務(wù)數(shù)據(jù)查詢結(jié)果,并通過長鏈接的形式推送到系統(tǒng)頁面端。查詢結(jié)果被展示的同時,用戶還會在頁面上看到評價反饋結(jié)果的選項,用戶可以對本次查詢的結(jié)果進行打分評價。系統(tǒng)總體流程如圖3所示。
3.2語音識別
通過采集用戶輸入的語音信息,包裝成為流的形式進行傳遞,調(diào)用語音識別服務(wù)進行語音轉(zhuǎn)換,將輸入的語音流轉(zhuǎn)化成文本信息。轉(zhuǎn)換成文字文本信息后,系統(tǒng)對文本進行中文分詞操作,并在后臺預(yù)置的查詢列表中進行檢索,查找相符合的檢索項。
3.3學(xué)習(xí)模型
評價包含了兩個維度,分別是查詢結(jié)果的匹配性的和查詢結(jié)果的準(zhǔn)確性,用戶的評價將會被記錄在后臺。匹配性的反饋數(shù)據(jù)用于從技術(shù)角度衡量識別的準(zhǔn)確性,系統(tǒng)得到正向的評價后,會將該條記錄反饋至語音識別服務(wù)中并進行記錄,以用于優(yōu)化語音識別模型。準(zhǔn)確性的反饋數(shù)據(jù)用于從業(yè)務(wù)角度衡量提供業(yè)務(wù)數(shù)據(jù)的質(zhì)量,該結(jié)果將在系統(tǒng)中進行統(tǒng)計,用于反饋給相應(yīng)的業(yè)務(wù)系統(tǒng),以輔助業(yè)務(wù)系統(tǒng)優(yōu)化升級。
4 結(jié)語
本研究基于語音識別技術(shù)構(gòu)建的企業(yè)辦公助理應(yīng)用應(yīng)用了語音識別技術(shù)對企業(yè)辦公應(yīng)用的用戶交互體驗進行了提升和優(yōu)化。通過采用用戶提交反饋信息的方式,引入了機器學(xué)習(xí)的機制改善了識別的效率和準(zhǔn)確性。本項目的建設(shè)實施,提高了企業(yè)辦公應(yīng)用的智能化水平,提升了企業(yè)管理效率。
參考文獻
[1]顧亞平.基于智能語音交互技術(shù)的智慧語音助理系統(tǒng)實現(xiàn)[D].南京:南京郵電大學(xué),2015.
[2]吳文強.面向場景化的語音用戶界面設(shè)計研究[D].上海:華東理工大學(xué),2019.
[3]師錦鵬.企業(yè)辦公自動化系統(tǒng)的設(shè)計與實現(xiàn)[D].北京:北京交通大學(xué),2017.
[4]高巖.某移動公司企業(yè)辦公助理系統(tǒng)的設(shè)計與實現(xiàn)[D].成都:電子科技大學(xué),2014.
[5]亓東霞,馬琳,朱大銘,等.企業(yè)信息孤島現(xiàn)狀及對策研究[J].信息技術(shù)與信息化,2019(8):166-168.
[6]韓飛.基于OA系統(tǒng)的煤炭企業(yè)信息化集成管理研究[D].西安:西安科技大學(xué),2019.
[7]寧智明.應(yīng)用SaaS平臺的集團企業(yè)協(xié)同辦公系統(tǒng)模式研究[J].企業(yè)改革與管理,2019(20):47-48.
收稿日期:2020-08-05
作者簡介:趙竟(1987—),男,江蘇南京人,碩士,工程師,研究方向:企業(yè)信息化、計算機技術(shù)。
Research and Development of Enterprise Office Application Based on Speech Recognition Technology
ZHAO Jing
(Guodian Nanjing Automation Co., Ltd,Nanjing Jiangsu? 210000)
Abstract:In order to improve user exprience of enterprise application, an intelligent enterprise office application with the ability of mechine learning was developed. Processes and data of the enterprise in production, operation and management were accessed into the application. Speech recognition is integrated into the application, in order to realize the intelligent function of querying data and handling processes. The application improves user experience, provides a function of evaluation for users, and applies a machine learning based framework to optimize recognition. With the development and deployment of the application, interactive mode is improved, the level of intelligence in enterprise office application is upgraded, and efficience of enterprise in management is lifted.
Key words:Enterprise application;Office Application;Voice assistant;Speech recognition;Machine learning