鄧家斌
摘? ?要:2018年被稱為人工智能全面落地應(yīng)用的元年,國家先后確立了阿里、百度、騰訊和科大訊飛4家公司為人工智能的4大平臺(tái)。其中作為人工智能的重要分支之一的智能機(jī)器人也逐漸開始嶄露頭角。文章主要從智能陪護(hù)角度出發(fā),探討了陪護(hù)機(jī)器人交換系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)。
關(guān)鍵詞:智能陪護(hù);人工智能;交互系統(tǒng)
2018年,國家統(tǒng)計(jì)局?jǐn)?shù)據(jù)顯示我國0~14歲的兒童數(shù)量達(dá)到2.5億人。尤其是二胎政策全面開放后,預(yù)計(jì)我國每年新生嬰兒數(shù)量會(huì)逐漸增加。根據(jù)騰訊數(shù)據(jù)實(shí)驗(yàn)室發(fā)布的《2018中國少兒家庭洞察白皮書》估算,中國兒童消費(fèi)市場(chǎng)的規(guī)模已突破4.5萬億元,與此同時(shí),兒童消費(fèi)經(jīng)濟(jì)也正以年增長(zhǎng)率超過30%的速度增長(zhǎng)。而未來5年的時(shí)間里,兒童智能產(chǎn)品將會(huì)有75%的年均增速,迅速成為下一個(gè)千億級(jí)別的市場(chǎng)。
迄今為止,基于大數(shù)據(jù)技術(shù)的跨平臺(tái)學(xué)習(xí)型智能趣味陪護(hù)機(jī)器人的交互系統(tǒng)研究依然處于初級(jí)階段,距離最終目標(biāo)還有很長(zhǎng)的路要走,價(jià)格也比較高,稍微好一些的品牌動(dòng)輒上千元,甚至數(shù)千、上萬元不等。高昂的價(jià)格和相對(duì)不太成熟的技術(shù),已經(jīng)成為迫切需要解決的難題。
1? ? 智能趣味陪護(hù)機(jī)器人系統(tǒng)的設(shè)計(jì)思路
1.1? 算法的核心思想
人機(jī)交互的語音通信主要有兩種情況:第一種情況為人類主動(dòng),機(jī)器受動(dòng)(Speech Recog,SR)。第二種情況為剛好想法,機(jī)器主動(dòng)說話(回答),即從文本到語音(Text To Speech,TTS)。無論是哪種情況,都牽扯到機(jī)器學(xué)習(xí)中語音、語義識(shí)別方法。
常見語音識(shí)別的方法主要有3種:基于聲道模型和語音知識(shí)的方法、基于模板匹配的方法和人工神經(jīng)網(wǎng)絡(luò)的方法。早些年前兩種方法比較盛行,但由于機(jī)器學(xué)習(xí)能力較弱,效果不太好。近2~3年來,基于神經(jīng)網(wǎng)絡(luò),尤其是卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)發(fā)展迅速,在圖形圖像、語音、語義等方面有了長(zhǎng)足的進(jìn)步,現(xiàn)已經(jīng)成為主流的解決方法,如圖1所示。
1.2? 設(shè)計(jì)思想
(1)通過選擇目前已經(jīng)比較成熟的人工語音平臺(tái),將其作為模板,進(jìn)行修改,使之成為適合本項(xiàng)目的人工智能云系統(tǒng)。能完成一定的語義識(shí)別、趣味問答、語音聊天等功能,真正實(shí)現(xiàn)人機(jī)無障礙溝通。
(2)結(jié)合大數(shù)據(jù)技術(shù),將海量成語、兒歌等寓教于樂,使得學(xué)習(xí)更生趣,讓孩子在享受快樂生活的同時(shí),潛移默化地接受智能化教育。
1.3? 解決方法
(1)底層使用了大數(shù)據(jù)技術(shù):詞典、數(shù)據(jù)集、語料庫、知識(shí)圖譜以及外部世界常識(shí)性知識(shí)等都是語義識(shí)別算法模型的基礎(chǔ)。
(2)應(yīng)用層:包括行業(yè)應(yīng)用和智能語音交互系統(tǒng)、技術(shù)應(yīng)用。
(3)核心技術(shù)是神經(jīng)語言程序?qū)W(Neuro-Linguistic Programming,NLP)技術(shù)層:以語言學(xué)、計(jì)算機(jī)語言等學(xué)科為背景,采用當(dāng)下比較流行和成熟的神經(jīng)網(wǎng)絡(luò)等技術(shù),對(duì)簡(jiǎn)單的兒童自然語言進(jìn)行詞語解析、信息抽取、時(shí)間因果、情緒判斷等技術(shù)處理,最終讓計(jì)算機(jī)“懂”人類的自然語言認(rèn)知,把計(jì)算機(jī)數(shù)據(jù)轉(zhuǎn)化為自然語言生成。
詞語解析與信息抽取包括分詞、詞性標(biāo)注、命名實(shí)體識(shí)別、詞義消歧、從給定文本中抽取重要的信息等,如圖2—3所示。
2? ? 結(jié)論
本文通過結(jié)合當(dāng)?shù)仄髽I(yè)的實(shí)際生產(chǎn)能力以及現(xiàn)行國內(nèi)類似產(chǎn)品的具體情況和問題,提出了一種基于兒童的在人工智能環(huán)境下的智能趣味人工智能交互系統(tǒng)。通過該交互系統(tǒng),基本實(shí)現(xiàn)與幼兒或兒童交流,孩子們可向機(jī)器人發(fā)送簡(jiǎn)單語音指令,機(jī)器人相應(yīng)做出對(duì)應(yīng)反饋,甚至可以實(shí)現(xiàn)一定機(jī)器學(xué)習(xí)等功能。
[參考文獻(xiàn)]
[1]桂林電子科技大學(xué).一種適用于噪聲環(huán)境下的語音識(shí)別方法:中國,201910581762.8[P].2019.
[2]周志華.機(jī)器學(xué)習(xí)[M].北京:清華大學(xué)出版社,2016.
[3]張晴晴,劉勇,潘接林,等.基于卷積神經(jīng)網(wǎng)絡(luò)的連續(xù)語音識(shí)別[J].工程科學(xué)學(xué)報(bào),2015(9):1212-1217.
[4]劉偉波,曾慶寧,卜玉婷,等.基于雙微陣列與卷積神經(jīng)網(wǎng)絡(luò)的語音識(shí)別方法[J].計(jì)算機(jī)應(yīng)用,2019(11):3268-3273.