沙永兵 肖豐明 曹德勤 余偉 劉小軍
為滿足集控中心和調(diào)控電廠發(fā)展需求,保證電廠生產(chǎn)的安全性,現(xiàn)設(shè)計(jì)一款功能完善、實(shí)用性強(qiáng)的智能調(diào)度平臺(tái)。在該平臺(tái)中,主要用到以下四種關(guān)鍵技術(shù),分別是人臉識(shí)別、語音智控、智能機(jī)器人和智能告警。本文結(jié)合智能調(diào)度平臺(tái),重點(diǎn)研究和實(shí)現(xiàn)該平臺(tái)四大人工智能技術(shù)。希望通過這次研究,為相關(guān)人員提供有效的借鑒和參考。
通過運(yùn)用人臉識(shí)別、語音智控、智能機(jī)器人和智能告警等多種人工智能技術(shù),完成對(duì)智能調(diào)度平臺(tái)的設(shè)計(jì),不僅可以實(shí)現(xiàn)集控中心現(xiàn)有生產(chǎn)模式的改革和創(chuàng)新,還能促使電力調(diào)度過程管理變得更加智能化、高效化,有效地提高調(diào)控電場(chǎng)運(yùn)維操作的可靠性和安全性,促使智能調(diào)度平臺(tái)能夠正常、穩(wěn)定、安全地運(yùn)行。在設(shè)計(jì)智能調(diào)度平臺(tái)期間,加強(qiáng)對(duì)以上幾種人工智能技術(shù)的研究顯得尤為重要。
采集終端設(shè)備包括平板、PC所收錄的語音數(shù)據(jù)上傳至聲紋庫(kù),再根據(jù)提取的說話人聲音特征和說話內(nèi)容信息,對(duì)比聲紋庫(kù)自動(dòng)核驗(yàn)說話人身份,達(dá)到精準(zhǔn)的聲紋識(shí)別要求?;谝勋@授權(quán)輸入的圖片中人像破綻及成像畸形,可有效識(shí)別目標(biāo)是否為活體,并給出置信度參考,通過提取兩張人臉的特征進(jìn)行相似度對(duì)比,最終返回相應(yīng)的置信度得分,系統(tǒng)根據(jù)特征匹配程度決定“拒絕”或者“接受”。用于判斷兩個(gè)輸入人臉是否屬于同一人,用于系統(tǒng)身份識(shí)別登錄及指令發(fā)布權(quán)限的核實(shí)。提供服務(wù)調(diào)用接口,提供聲紋識(shí)別和人臉識(shí)別標(biāo)準(zhǔn)調(diào)用接口,給需要調(diào)用的系統(tǒng)調(diào)用。
(一)客戶端設(shè)計(jì)
通過運(yùn)用客戶端,可以采集用戶或錄音語音輸入發(fā)送到服務(wù)端進(jìn)行轉(zhuǎn)寫和語義解析,同時(shí)根據(jù)語義解析結(jié)果執(zhí)行指令,控制終端設(shè)備顯示和語音播報(bào)??蛻舳酥С諻indows和Android操作系統(tǒng),支持PC、數(shù)字大屏、一體機(jī)、機(jī)器人等終端設(shè)備??蛻舳嗽O(shè)計(jì)采用如下方式進(jìn)行:
通過自然語言交互方式實(shí)現(xiàn)常用對(duì)應(yīng)用軟件的操控,如PPT、Word等文件的打開,并其內(nèi)容展示進(jìn)行操控。如:用戶說“打開訊飛語音智控系統(tǒng)白皮書,詳細(xì)版”,接著用戶可以通過語音進(jìn)行上下翻頁,或者跳轉(zhuǎn)到第N頁,甚至用戶可以說“幫我打開系統(tǒng)架構(gòu)”,該Word文件即會(huì)自動(dòng)跳轉(zhuǎn)到該頁。
通過語音控制音視頻文件播放,用戶說“音頻播放”,會(huì)聽到“請(qǐng)選擇您要播放的音頻”,同時(shí)看到可供選擇的音頻列表,通過語音交互方式選擇即可播放。視頻播放支持同樣交互方式。用戶也可以直接說出“播放展館介紹”,即可播放對(duì)應(yīng)音頻或者視頻。
(二)服務(wù)端設(shè)計(jì)
智控內(nèi)容即智控方案管理。針對(duì)不同的智控對(duì)象可設(shè)置不同智控方案。
(1)網(wǎng)頁智控方案。通過運(yùn)用該方案,對(duì)Web應(yīng)用系統(tǒng)進(jìn)行演示操作。具體操作步驟如下:首先,直接配置網(wǎng)頁操控指令,即接收并識(shí)別用戶語音后執(zhí)行的操控指令,如頁面跳轉(zhuǎn)、按鈕點(diǎn)擊等操作。其次,配置錄音播報(bào)場(chǎng)景,既針對(duì)某個(gè)業(yè)務(wù)場(chǎng)景,實(shí)現(xiàn)全自動(dòng)化演示與操作,無需人工參與:上傳真人錄音或者錄入講解內(nèi)容合成錄音,在客戶端語音控制播放該錄音,系統(tǒng)即可識(shí)別、解析并執(zhí)行錄音中相關(guān)操控指令,充分釋放人力。
(2)軟件智控方案。軟件智控方案主要是指應(yīng)用軟件內(nèi)容操控,如打開PPT、Word等文件,對(duì)PPT、Word文件進(jìn)行上下翻頁、跳轉(zhuǎn)到指定頁(如用戶說“回到第8頁”)、調(diào)轉(zhuǎn)到指定內(nèi)容頁(如用戶說“打開系統(tǒng)架構(gòu)”),其中上下翻頁、跳轉(zhuǎn)到指定頁指令在“通用指令管理”中已配置,這里無需重復(fù)配置。
在設(shè)計(jì)智能調(diào)度平臺(tái)時(shí),重點(diǎn)應(yīng)用智能機(jī)器人技術(shù),通過應(yīng)用該技術(shù),可以完成對(duì)智能服務(wù)器機(jī)器人的設(shè)計(jì),該機(jī)器人主要由主控板、工控機(jī)、底盤控制板、IMU、激光掃描儀、華為TD-無線數(shù)據(jù)終端、語音識(shí)別模塊、表情顯示器、業(yè)務(wù)辦理顯示器、人臉識(shí)別模塊、3D攝像頭、手臂控制板、手指控制等模塊組成。
該機(jī)器人主要包含以下功能。(1)行走播報(bào)。支持設(shè)定特定時(shí)間端,按照既定路線行走,當(dāng)遇到人員時(shí),會(huì)提醒讓行,機(jī)器人可以一邊行走,一邊播報(bào)預(yù)定內(nèi)容,同時(shí)支持智能打斷播報(bào)內(nèi)容。(2)定點(diǎn)講解。語音或者屏幕觸發(fā)機(jī)器人按照既定路線或者單點(diǎn)講解,到達(dá)指定地點(diǎn),播放既定內(nèi)容(語音/圖片/視頻),可設(shè)計(jì)機(jī)器人在指定地點(diǎn)等待時(shí)長(zhǎng)。同時(shí)可以讓機(jī)器人做相關(guān)動(dòng)作(按照系統(tǒng)內(nèi)置動(dòng)作組選擇)。(3)定制對(duì)話。本地?zé)o限量QA對(duì)話輸入,可以滿足對(duì)話內(nèi)容輕松錄入和編輯,快速響應(yīng);支持通過語音輸入控制大屏數(shù)據(jù)頁面切換,頁面切換順滑,數(shù)據(jù)能夠聯(lián)動(dòng)刷新。(4)遠(yuǎn)程監(jiān)控。Android手機(jī)或者PAD端可以通過網(wǎng)絡(luò)遠(yuǎn)程監(jiān)控,通過機(jī)器人頭部攝像頭到現(xiàn)場(chǎng)情況進(jìn)行監(jiān)控巡邏。(5)自動(dòng)充電。機(jī)器人可根據(jù)指令或者電量情況,自行充電。(6)人臉識(shí)別。支持2000人本地人臉識(shí)別,本地錄入人臉,編輯識(shí)別后,問候內(nèi)容。在待機(jī)界面中,只要錄入人臉人員經(jīng)過就可以主動(dòng)問候。(7)主動(dòng)迎賓。設(shè)置機(jī)器人歡迎詞,當(dāng)機(jī)器人待機(jī)狀態(tài),只要有人進(jìn)入1.5米內(nèi),就會(huì)迎賓問候,同步也有人臉識(shí)別打開,按設(shè)置內(nèi)容主動(dòng)問候。問候結(jié)束彈出對(duì)話框交流。(8)編程。Android手機(jī)或者PAD端可以編程控制機(jī)器人做動(dòng)作、表情、視頻和語音,起到表演的作用。
在設(shè)計(jì)智能調(diào)度平臺(tái)時(shí),通過應(yīng)用智能告警技術(shù),可以將語音助手、應(yīng)急平臺(tái)故障分析和話務(wù)系統(tǒng)深度集成,保證平臺(tái)多樣化告警提醒功能實(shí)現(xiàn)效果。該平臺(tái)具體設(shè)計(jì)步驟如下:
(1)智能話務(wù)平臺(tái)對(duì)接報(bào)警分級(jí)系統(tǒng)。智慧告警平臺(tái)提供接口,可以實(shí)時(shí)接收水電系統(tǒng)發(fā)送的故障信息,故障信息包括故障類型、故障時(shí)間、故障內(nèi)容等信息。智慧告警平臺(tái)與報(bào)警分級(jí)系統(tǒng)通過接口進(jìn)行對(duì)接,智慧告警平臺(tái)接收到告警信息后,可以根據(jù)故障信息從數(shù)據(jù)庫(kù)中檢索關(guān)聯(lián)的人員列表,如果檢索失敗或者未設(shè)置關(guān)聯(lián)人員,則可以關(guān)聯(lián)系統(tǒng)設(shè)置的緊急處理人員。
(2)對(duì)接語音合成引擎。智慧告警平臺(tái)將文本告警信息通調(diào)用語音合成引擎轉(zhuǎn)換成語音,通過智能話務(wù)平臺(tái)撥打給告警處理人員并進(jìn)行告警信息播報(bào)。
(3)對(duì)接實(shí)體機(jī)器人或者現(xiàn)場(chǎng)播音設(shè)備,實(shí)現(xiàn)告警內(nèi)容播報(bào)。智慧告警平臺(tái)在接收到告警信息時(shí)調(diào)用語音合成引擎,通過實(shí)體機(jī)器人或現(xiàn)場(chǎng)播音設(shè)備,將預(yù)警內(nèi)容合成語音信息進(jìn)行播報(bào)。
(4)當(dāng)發(fā)生故障時(shí),系統(tǒng)自動(dòng)識(shí)別當(dāng)前故障關(guān)聯(lián)的人員,獲取人員電話號(hào)碼,并打通相關(guān)人員調(diào)度電話,對(duì)告警信息進(jìn)行播報(bào)。
在人工智能技術(shù)的應(yīng)用背景下,為促使智能調(diào)度平臺(tái)向智能化、高效化、數(shù)字化方向不斷發(fā)展,技術(shù)人員要重視對(duì)人臉識(shí)別、語音智控、智能機(jī)器人和智能告警四大關(guān)鍵技術(shù)的運(yùn)用,通過運(yùn)用以上技術(shù),不僅可以保證調(diào)度指揮的智能性和便捷性,還能提高調(diào)控電廠生產(chǎn)的安全性和可靠性,為確保智能調(diào)度平臺(tái)在集控模式下能夠穩(wěn)定、高效地運(yùn)行提供重要的技術(shù)支持。
作者單位:五凌電力有限公司