• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于視障人群聲J空3D導航APP的應用與探究

      2020-05-03 13:46:53彭忠欣張帆
      視界觀·下半月 2020年1期

      彭忠欣 張帆

      摘要:視覺障礙者簡稱視障者,其中我國視障人群1300多萬人,約占全世界盲人總數(shù)的28%,也就是說平均每80個人中就有1人存在視力障礙。本文推出的聲控3D導航系統(tǒng),其通過聲音輔助視障人群在腦海中構建畫面,輔助用戶將所在位置設置成中心點,把周圍的地標按順時針方向念出來,為用戶勾勒出一幅實時地圖,對于視障人群獨自出行有著重要意義。這些特別的開發(fā)創(chuàng)新將有助于讓視障人群成為獨自出行探索世界的主導者,也能反哺促進我國場所的無障礙的建設和和諧社會的構建。

      關鍵詞:聲控3D導航;視障人群;信息無障礙

      視覺障礙者,根據(jù)第六次全國人口普查及中國互聯(lián)網(wǎng)視障用戶基本情況2017比對,當前全世界大約有4500萬視覺障礙者。在視障網(wǎng)民中,90后、80后占75%,其中90后占據(jù)45%,80后占據(jù)30%,特別在網(wǎng)民學歷的構成中高中學歷占比最高為42%。然而,在日常生活中,我們卻很少能見到這些視障人群,因此大多數(shù)存在視障人群不敢獨自出門,雖然都有出行的愿望,可由于無法保證自身出行安全,不得己要出行時,依然要求助家人、鄰居或志愿者。

      為了幫助視障人群克服視力障礙,更好地幫助他們獨立探索世界,我們設計了基于視障人群獨自出行聲控3D導航APP。開發(fā)是在指導老師的設計下,通過用戶把手機端平,聲控3D導航就能說出當前地點,前方有什么以及目的地的行進方向等;當用戶經(jīng)過一些具體地標時,聲控3D導航會自動提示相關信息與路線。并且本系統(tǒng)特別之處在于用戶越靠近目的地,手機會發(fā)出穩(wěn)定持續(xù)的、類似心跳聲的鼓點,這種類似鼓點的聲響會隨著用戶需要移動的方向的變化,及用戶與目的地的距離的變化而改變,用戶越靠近目標,鼓點聲頻率就會越高,而且這些鼓點聲足夠響亮,不會被都市喧鬧嘈雜的聲音所覆蓋。這些特別的開發(fā)創(chuàng)新將有助于讓視障人群成為獨自出行探索世界的主導者。

      下面我們就以聲控3D導航系統(tǒng)總體架構設計為例,結合研究內容中體現(xiàn)四個技術方面進行具體的介紹:

      一、從視障人群的感知角度進行導航位置確定

      在為視障群設計的聲控3D導航中,為了幫助他們快速定位,需要通過語言準確地描述出方位所處的朝向,周圍標志性的建筑物,周圍的情況前方三米、左右一米等。同時這些用詞要貼近視障人士的語言系統(tǒng),這里的語言描述要盡可能地準確及客觀,以此來幫助視障人群形成他們的心智地圖和空間畫面,在APP程序開發(fā)界面要通過“我的位置”按鈕,快速幫助視障人群確定當前的位置?!拔业奈恢谩睍嬖V您當前的位置,包括您所面對的方向,附近道路或十字路口的位置以及附近景點的位置。當您需要弄清楚自己的位置或所面臨的主要方向時,“我的位置”非常有用。

      二、不同場景情況下不同功能的音效進行聲音上下文的音頻標注

      視障人群“聽覺”功能的宗旨是帶來聲音信息,而聲音信息可以分為兩種:差異化的聲音信息和同質化的聲音信息。差異化的聲音信息,分貝大小不同,基于差異化的聲音,視障人群可以通過敏銳的聽覺判斷方向。同質化的聲音信息,即同類型聲音的分貝大小相同甚至相互混淆或者同類型聲音發(fā)出的分貝值一樣。在這種情況下,視障人群的聽覺會受到嚴重影響,從而可能缺失辨別方向的能力,以及輔助記憶和其他的功能,這對視障人群來說是非??膳碌氖虑?。那么首先借用傳統(tǒng)GPS或高德、百度地圖API調用應用程序提供的轉向指示,使用空間3D聲音信息標注,將視障人群行走時從他們身體所處的方向調出興趣點,公園,道路和十字路口。圍繞在視障人群附近的目的地設置信標允許此APP軟件通過播放來自該目的地方向的可聽信標聲音來通知其位置。該信標可以在主屏幕上靜音或取消靜音。此外,聲控3D導航APP在主屏幕上顯示有關目的地的信息,包括與其的距離及其街道地址。

      特別針對本項目研發(fā)過程中,需要解決關鍵問題如何在聲控3D導航中縮小“語義鴻溝”問題。本創(chuàng)新團隊認為提出相應的模型和算法最為關鍵,作為對音頻標注過程中如何縮小低層特性與高層語義之間的積極作用不容小視。特別作為一種重要的上下文,語義概念之間的關聯(lián)在多標記標注中尤為重要,因為傳統(tǒng)的音頻概念檢測對每個概念單獨訓練分類器的處理思路實際上是講多標記問題退化為一個多個二類分類型的集成問題,這樣做最終語義信息的丟失將制約標注結果,也就會反射在視障人群大腦中語義的原始想法和意圖的高層語義信息出現(xiàn)中斷現(xiàn)場,不利于在腦海中構筑3D導航場景再現(xiàn)。所以本項目提出結合關聯(lián)主題混合高斯模型,利用該模型假定音頻片段由特征概念對構成的共現(xiàn)模型來提高導航過程中產(chǎn)生語音的原始表達意圖的最大性能輸出。

      三、結論

      筆者根據(jù)指導老師的意見,結合四人小組協(xié)同合作下共同完成,首先對系統(tǒng)總體架構設計,所述系統(tǒng)包括:一個具有攝像頭的安卓智能手機一部、一個具有揚聲器、收音器功能的一對立體聲耳機,以便可以利用3D空間音頻進行標注、編寫計算單元程序、和一個導航地圖API接口的購置。在相關技術實施過程中,我們會借用Android原生操作系統(tǒng)中內置添加無障礙輔助服務功能結合自動語音識別技術的利用,編程過程中采用廣泛認可的基于上下文相關的深度神經(jīng)網(wǎng)絡隱馬爾可夫模型來解決大詞匯量語音識別的難題,最后結合判決算法對語音進行輸出。另一個場景是在更大的空間里, 某處有一個標簽, 標簽里儲存著一些聲音, 它一直在這里使用經(jīng)典藍牙進行信號發(fā)射,當視障人士走進了信號感應區(qū)內,且開啟了Voicer或者手機讀取聲音的功能,他們就會立馬讀取儲存在這周圍的聲音。相信伴隨“互聯(lián)網(wǎng)+”為很多人打開了認識世界的另一扇門,對視障人群而言也是如此,他們對互聯(lián)網(wǎng)信息的渴望不亞于健全人。該項目目前在國內外市場都極度匱乏,市場潛力極大,在這種大環(huán)境下,我們所做的聲控3D導航APP將有極大的應用前景和市場潛力。

      衡水市| 岑溪市| 博客| 五峰| 浦城县| 天长市| 伊宁市| 普兰店市| 延寿县| 邛崃市| 玛纳斯县| 栾城县| 岳西县| 白银市| 比如县| 尖扎县| 同仁县| 嘉黎县| 曲水县| 德江县| 临邑县| 西安市| 陕西省| 天全县| 夏河县| 天峨县| 陆丰市| 上虞市| 西乌珠穆沁旗| 苍南县| 儋州市| 同德县| 海南省| 巴青县| 浙江省| 禹城市| 雅安市| 蒙阴县| 林周县| 阿坝县| 奎屯市|