吳亞樂 劉希瑞
引用格式:吳亞樂,劉希瑞.國內(nèi)語音科學(xué)研究的知識圖譜分析:基于CiteSpace和VOSviewer的綜合應(yīng)用[J].鄭州輕工業(yè)學(xué)院學(xué)報(社會科學(xué)版),2020,21(5):93-102.
中圖分類號:H01? 文獻標識碼:A
DOI:10.12186/2020.05.014
文章編號:1009-3729(2020)05-0093-10
摘要:基于文獻計量工具CiteSpace和VOSviewer繪制的科學(xué)知識圖譜,進行有關(guān)語音科學(xué)的期刊發(fā)文量、關(guān)鍵詞共現(xiàn)時區(qū)分布圖、主要作者及其機構(gòu)共現(xiàn)時區(qū)分布圖、關(guān)鍵詞共現(xiàn)標簽視圖共4類知識圖譜分析發(fā)現(xiàn):目前,國內(nèi)語音科學(xué)研究在期刊發(fā)文量方面整體呈上升態(tài)勢,學(xué)科發(fā)展趨勢向好;1980—2020年該領(lǐng)域研究聚焦的熱點主題主要有:“語音識別”“語音合成”“言語合成”“人工智能”“語音技術(shù)”“人機交互”等,其中人工智能是該領(lǐng)域的研究前沿。該領(lǐng)域研究目前存在的主要問題是:雖有新的學(xué)者和機構(gòu)不斷加入語音科學(xué)研究,但各研究者與機構(gòu)之間的合作較少,各研究團隊之間尚未形成研究合力和網(wǎng)狀研究協(xié)作網(wǎng)絡(luò)。未來國內(nèi)語音科學(xué)研究將呈現(xiàn)出語言學(xué)語音科學(xué)研究領(lǐng)域不斷拓展,非語言學(xué)語音科學(xué)研究向跨學(xué)科融合化和語言科學(xué)研究向社會化應(yīng)用發(fā)展的趨勢。
關(guān)鍵詞:語音科學(xué);知識圖譜;CiteSpace;VOSviewer;人工智能
語音學(xué)作為語言學(xué)的一個重要分支,是專門研究人類發(fā)音的學(xué)科,包括發(fā)音語音學(xué)、聲學(xué)語音學(xué)和感知語音學(xué)三個領(lǐng)域[1]。語音科學(xué)又稱為“大語音學(xué)”,包括語言學(xué)語音學(xué),以及其他學(xué)科領(lǐng)域?qū)φZ音的相關(guān)研究,如聲學(xué)、生物學(xué)、計算機科學(xué)、人工智能、醫(yī)學(xué)、公安、司法、通信等[2]。鑒于此,本文將語音科學(xué)區(qū)分為語言學(xué)語音科學(xué)(又稱“語言學(xué)語音學(xué)”)和非語言學(xué)語音科學(xué)兩個方面,前者研究與語言學(xué)有關(guān)的語音問題,后者研究語言學(xué)領(lǐng)域之外與語音相關(guān)的問題。
國外語音科學(xué)研究起步較早,研究較為系統(tǒng),涉及領(lǐng)域較廣,研究成果也相對豐富;國內(nèi)語音科學(xué)研究早期主要是借鑒國外語音科學(xué)的發(fā)展經(jīng)驗。國外的語音科學(xué)研究情況可通過國際語音科學(xué)大會(International Congress of Phonetic?? Sciences,縮寫為ICPHS)的議題來管窺,如2019年在墨爾本舉辦的第19屆ICPHS的議題涵蓋社會語音學(xué)、語音情感研究、語音史、司法語音學(xué)、生理語音學(xué)、語音語料庫與大數(shù)據(jù)、聲學(xué)語音學(xué)、語音教學(xué)、發(fā)聲態(tài)與音質(zhì)、母語語音習(xí)得、雙語/多語語音學(xué)、音變、語音音系接口、會話和不流利言語研究、語音學(xué)田野調(diào)查、韻律、語音技術(shù)、實驗音系學(xué)、演化語音學(xué)、臨床語音學(xué)、語音共性和類型、語音產(chǎn)出和感知、心理語音學(xué)、神經(jīng)語音學(xué)、多模態(tài)語音學(xué)等多個領(lǐng)域。在國內(nèi),1925年北京大學(xué)劉復(fù)(劉半農(nóng))先生主持建立的“語音樂律實驗室”,標志著我國現(xiàn)代語音科學(xué)研究的開端;之后,我國語音科學(xué)研究逐步開展,研究領(lǐng)域不斷拓展,并不斷有新的團隊和高校加入,研究成果逐漸豐富,研究態(tài)勢逐步走向國際化。傳統(tǒng)語音學(xué)大多采用口耳之學(xué),以語言調(diào)查為主,且研究人員需經(jīng)過嚴格訓(xùn)練;現(xiàn)代語音學(xué)多采用實驗的方法分析語音,采集語音樣本進而開展實驗分析[3]。
近年來,隨著人工智能、語音識別和言語工程項目的發(fā)展,圍繞人工智能、人機交互、語音技術(shù)等以語音科學(xué)應(yīng)用為目的的科學(xué)研究層出不窮,鑒于目前國內(nèi)關(guān)于語音科學(xué)研究的期刊文獻計量分析匱乏,本文將使用文獻計量分析軟件CiteSpace和VOSviewer分別繪制科學(xué)知識圖譜,對1980—2020年近40年國內(nèi)語音科學(xué)相關(guān)論文進行科學(xué)知識圖譜分析,對國內(nèi)語音科學(xué)研究發(fā)展狀況進行客觀闡述,并對我國語音科學(xué)領(lǐng)域的發(fā)展作出客觀的分析。
一、研究方法
1.研究問題
本論文主要回答以下4個問題:(1)國內(nèi)語音科學(xué)研究的總體發(fā)展趨勢如何?(2)國內(nèi)語音科學(xué)研究的前沿領(lǐng)域和熱點主題有哪些?(3)目前語音科學(xué)研究存在的問題有哪些?(4)語音科學(xué)研究的未來發(fā)展趨勢怎樣?
2.研究工具
本文將采用CiteSpace和VOSviewer兩種文獻計量工具繪制國內(nèi)語音科學(xué)研究的科學(xué)知識圖譜。CiteSpace是美國德雷塞爾大學(xué)信息科學(xué)與技術(shù)學(xué)院教授陳超美博士開發(fā)的一種科學(xué)文獻計量軟件,可用于分析文獻的來源期刊、作者、機構(gòu)、關(guān)鍵詞等,自動生成可視化知識圖譜,探析該領(lǐng)域的研究現(xiàn)狀、熱點和前沿動態(tài)[4]。VOSviewer是荷蘭萊頓大學(xué)科技研究中心的Van Eck和Waltman博士聯(lián)合開發(fā)的一款通過網(wǎng)絡(luò)數(shù)據(jù)的關(guān)系(主要是文獻知識單元關(guān)系)構(gòu)建文獻可視化分析,實現(xiàn)科學(xué)知識圖譜繪制,展現(xiàn)科學(xué)知識領(lǐng)域的結(jié)構(gòu)、進化、合作等共現(xiàn)關(guān)系的網(wǎng)絡(luò)分析軟件[5]。VOSviewer的主要功能有文獻耦合、共被引、合作和共詞分析等[6],其突出特點是圖形展示能力強,側(cè)重科學(xué)知識的可視化,適合進行大規(guī)模數(shù)據(jù)分析。
3.數(shù)據(jù)提取與處理
本論文數(shù)據(jù)來源于中國知網(wǎng)全文數(shù)據(jù)庫,在基礎(chǔ)學(xué)科、哲學(xué)與人文科學(xué)、社會科學(xué)Ⅱ輯、信息科技文獻類別下以“語音”和“語言學(xué)”進行主題詞檢索;為確保精確檢索到與語音科學(xué)相關(guān)的各研究領(lǐng)域,同時以“語音”與“科學(xué)”“技術(shù)”“工程”組合進行篇名檢索,日期不限,期刊不限,在此條件下檢索到相關(guān)中文文獻3274篇,檢索日期為2020年3月5日。為盡量實現(xiàn)可視化分析的科學(xué)性,經(jīng)人工剔除如人物傳記、訪談、綜述、評論性文章、會議信息、出版信息、培訓(xùn)信息等無效文獻,最終獲得1980—2020年有效中文文獻1167篇,導(dǎo)出可在CiteSpace和VOSviewer軟件內(nèi)進行分析的Ref\|works文獻格式,并對之進行網(wǎng)絡(luò)科學(xué)知識圖譜繪制。
二、語音科學(xué)研究知識圖譜分析與討論
1.國內(nèi)語音科學(xué)研究的總體發(fā)展趨勢
本論文的文獻來源于以“語音”和“語言學(xué)”為主題詞的檢索,對論文發(fā)文量進行可視化分析能夠反映出該領(lǐng)域的總體發(fā)展趨勢。根據(jù)收集到的文獻所作的期刊文獻發(fā)表量年度走勢圖見圖1。由圖1可以看出,我國語音科學(xué)研究領(lǐng)域在發(fā)文量方面整體處于上升趨勢,發(fā)展態(tài)勢良好。20世紀80年代到90年代,該領(lǐng)域年發(fā)文量大多保持在20—50篇,發(fā)展相對緩慢,根據(jù)中國社會科學(xué)院語言研究所劉丹青主編的《新中國語言文字研究70年》中所記錄的國內(nèi)語音學(xué)發(fā)展史,此階段正值我國語音科學(xué)研究創(chuàng)立初期[7];20世紀90年代以后,語音科學(xué)研究進入全面發(fā)展時期,不斷有新的高??蒲袌F隊加入該研究領(lǐng)域,如北京大學(xué)的孔江平團隊、南開大學(xué)的石鋒團隊、香港科技大學(xué)的朱曉農(nóng)團隊等,1995年該領(lǐng)域發(fā)文量突破50篇,之后每年的發(fā)文量雖有波動,但均保持在50篇以上;進入21世紀后,隨著計算機技術(shù)和智能語音技術(shù)的發(fā)展,語音科學(xué)研究發(fā)展更加迅速,2002年發(fā)文量突破100篇,2003年出現(xiàn)小幅回落,2004年之后一直保持在100—150篇,2018年突破150篇,達到語音科學(xué)發(fā)文量的最高點,2019年雖有小幅回落,但不影響語音科學(xué)研究發(fā)展的總體趨勢。整體上我國語音科學(xué)研究處于發(fā)展上升期,不斷有新的學(xué)者和高校團隊加入,并持續(xù)開展相關(guān)領(lǐng)域研究和技術(shù)研發(fā),科研成果豐富。
2.國內(nèi)語音科學(xué)研究的前沿領(lǐng)域和熱點主題
關(guān)鍵詞作為論文內(nèi)容的核心所在,通常是根據(jù)文章主題高度概括提煉而來的,高頻關(guān)鍵詞常被認為是其所在研究領(lǐng)域的焦點。關(guān)鍵詞共現(xiàn),即當(dāng)同一關(guān)鍵詞出現(xiàn)在不同文獻中時,這些文獻將會有一條線相連,它是論文主題相關(guān)性的體現(xiàn),代表該領(lǐng)域研究各學(xué)科間的關(guān)聯(lián)性。關(guān)鍵詞共現(xiàn)時區(qū)圖或關(guān)鍵詞主題路徑圖,是在關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)知識圖譜的基礎(chǔ)上增加時間維度,從而更加清晰直觀地解讀該學(xué)科的研究概況和發(fā)展趨勢?;跁r間維度的分析最大的特點是能夠直觀體現(xiàn)該領(lǐng)域研究熱點主題的變化趨勢。以每兩年為一個時間切片,提取節(jié)點類型為關(guān)鍵詞,繪制出1980—2020年國內(nèi)語音科學(xué)研究關(guān)鍵詞共現(xiàn)時區(qū)圖(見圖2),圖中圓形節(jié)點的大小代表關(guān)鍵詞頻次的多少,字號大小代表其研究熱度的高低,圖片上方代表年份的彩色進度條與圖中線條色彩相對應(yīng),關(guān)鍵詞對應(yīng)出現(xiàn)的年份為該關(guān)鍵詞在期刊文獻中首次出現(xiàn)的年份,是學(xué)科研究熱點和前沿的重要判定指標。
由圖2可知,2015年左右人工智能開始出現(xiàn),之后圍繞其開展的相關(guān)研究較為集中,是語音科學(xué)研究領(lǐng)域的前沿。人工智能(Artificial Intelligence,縮寫為AI),是計算機科學(xué)的一個分支,研究領(lǐng)域包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng),是專門研究和開發(fā)用于模擬、延伸和擴展人的智能的理論、方法、技術(shù)和應(yīng)用系統(tǒng)的一門新的技術(shù)科學(xué),是語音科學(xué)跨學(xué)科研究的重要領(lǐng)域之一。1927年,德國電影《大都會》中的人造機器人“瑪利亞”是最早的人工智能機器人形象;1956年,人工智能被確立為一門學(xué)科,之后伴隨著計算機的問世,全世界范圍內(nèi)計算機領(lǐng)域的科學(xué)家都在研究人工智能。人工智能發(fā)展包括深度神經(jīng)網(wǎng)絡(luò)、大數(shù)據(jù)和漣漪效應(yīng)三個要素[8]。近年來,隨著科大訊飛股份有限公司(以下簡稱為“科大訊飛”)深度神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)FSMN——訊飛構(gòu)型的提出,國內(nèi)與人工智能有關(guān)的深度學(xué)習(xí)研究逐漸興起?!吧疃葘W(xué)習(xí)”的概念來源于人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,縮寫為ANN),ANN是人工智能領(lǐng)域中的重要模型之一[9]。
目前,人工智能語音交互技術(shù)已被廣泛應(yīng)用,基于深度學(xué)習(xí)的語音分離技術(shù)研究頗受關(guān)注和重視。
由圖2還可看出,過去40年我國語音科學(xué)研究領(lǐng)域涌現(xiàn)出的熱點主題共有14個,按其頻次多少依次為“語音識別”“語音合成”“語音”“語音技術(shù)”“言語合成”“人工智能”“語言學(xué)”“語音處理”“音系學(xué)”“智能語音”“智能家居”“聲學(xué)模型”“人機交互”“社會語言學(xué)”(見表1)。結(jié)合圖2中節(jié)點的色調(diào)可以看出,
1980—2020年,
以“語音識別”為主題的語音科學(xué)研究始終保持其研究熱度;1988年“語音合成”首次成為熱詞;1990年新增“言語合成”熱詞;1996年新增“語音技術(shù)”“多媒體技術(shù)”“人工神經(jīng)網(wǎng)絡(luò)”等熱詞;2000年新增“文語轉(zhuǎn)換”“聲學(xué)模型”熱詞;2004年新增“科大訊飛”“自動語音識別”熱詞;2008年新增“人機交互”“模式識別”“模式匹配”“語音信號處理”等熱詞;2015年以來新增“人工智能”“智能家居”“智能語音”“智能控制”“語音交互”“深度學(xué)習(xí)”“神經(jīng)網(wǎng)絡(luò)”等熱詞;其他年份雖有相關(guān)主題出現(xiàn),但并未形成研究熱點。從語音科學(xué)研究熱點主題的變化可以看出,語音科學(xué)研究從單純的語言學(xué)語音科學(xué)研究逐漸轉(zhuǎn)向非語言學(xué)語音科學(xué)研究,并逐步聚焦于非語言學(xué)語音科學(xué)的創(chuàng)新性和實用性研究;語音科學(xué)主要運用科學(xué)研究結(jié)合實驗語音學(xué)和傳統(tǒng)語言學(xué)的研究方法,以聲學(xué)參數(shù)為基礎(chǔ),設(shè)計言語聲學(xué)參數(shù)分析系統(tǒng),實現(xiàn)語音的自動切分、保存、語音類型標記、聲學(xué)參數(shù)提取等語音分析的基本功能,為語音分析研究提供了方便。此外,語音科學(xué)跨學(xué)科交叉研究趨勢明顯,且研究成果大多直接服務(wù)于經(jīng)濟社會發(fā)展需要與實際社會需求,如智能家居、智能控制等。智能家居是在互聯(lián)網(wǎng)影響之下物聯(lián)化的體現(xiàn)[10]。智能家居能夠?qū)⒓抑械穆曇曨l設(shè)備、照明設(shè)備、窗簾、空調(diào)等連接在一起,與人進行全方位的信息交互,且能夠提升家居環(huán)境的便利性和舒適性,而智能家居利用的語音科學(xué)技術(shù)主要是語音識別和語音合成。
3.目前語音科學(xué)研究存在的問題
以每兩年為一個時間切片,提取節(jié)點類型為作者和機構(gòu),繪制出1995—2020年國內(nèi)從事語音科學(xué)研究的主要作者及其機構(gòu)共現(xiàn)時區(qū)分布圖(見圖3)。在時間段選取方面,之所以選擇1995—2020年,是因為繪制知識圖譜時即使將詞頻閾值調(diào)至最低,1995年之前研究語音科學(xué)的主要機構(gòu)在知識圖譜上也無法出現(xiàn),這說明我國語音科學(xué)研究起步較晚,從1990年代后期開始我國語音科學(xué)研究才進入全面發(fā)展期,與前面期刊發(fā)文量年度趨勢圖所顯示的結(jié)果一致。在研究機構(gòu)方面,1995—1997年,中國科學(xué)院聲學(xué)研究所、上海交通大學(xué)、北京郵電大學(xué)、中國科學(xué)技術(shù)大學(xué)陸續(xù)開展語音科學(xué)研究;2003年,哈爾濱工程大學(xué)、清華大學(xué)、廈門大學(xué)加入語音科學(xué)研究;2007年,新疆大學(xué)和湖北師范學(xué)院加入語音科學(xué)研究;2011年,廣西大學(xué)加入語音科學(xué)研究;2015年前后,各公司團隊陸續(xù)加入語音科學(xué)研究,如科大訊飛、北京宇音天下科技有限公司、珠海多玩信息技術(shù)有限公司等;2018年以來,山東農(nóng)業(yè)大學(xué)、河北大學(xué)、西北民族大學(xué)加入語音科學(xué)研究,我國語音科學(xué)研究蓬勃發(fā)展。盡管不斷有新的學(xué)者和機構(gòu)加入語音科學(xué)領(lǐng)域的相關(guān)研究,但由圖3可知,各機構(gòu)和作者之間的連線較少,說明其研究的關(guān)聯(lián)性較弱,各作者和研究機構(gòu)之間開展的語音科學(xué)研究相對孤立,并未形成科研合作網(wǎng)狀網(wǎng)絡(luò)。
由圖3可知,近年來加入語音科學(xué)研究的作者與機構(gòu)越來越多,語音科學(xué)研究整體上處于發(fā)展上升期,與圖2所顯示的結(jié)果一致。綜合分析可知,在作者及其機構(gòu)分布方面,語音科學(xué)研究領(lǐng)域呈現(xiàn)以下4個特點:(1)作者發(fā)文量較高且其所在機構(gòu)突顯,如中國科學(xué)院聲學(xué)研究所的杜利民、中國科學(xué)技術(shù)大學(xué)的王仁華、清華大學(xué)的劉加、新疆大學(xué)的吾守爾·斯拉木、湖北師范大學(xué)的高紅亮等,其研究成果豐碩,其所在機構(gòu)該學(xué)科發(fā)展建設(shè)較好;(2)作者發(fā)文量較高但其所在機構(gòu)并未出現(xiàn),如朱曉農(nóng)(香港科技大學(xué))、王炳錫(解放軍信息工程大學(xué))、韓紀慶(哈爾濱工業(yè)大學(xué)),可能與該機構(gòu)研究該學(xué)科的人員較少、學(xué)科建設(shè)發(fā)展緩慢有關(guān);(3)作者所在位置與其所在機構(gòu)位置相距較遠,如西北民族大學(xué)的于洪志、廈門大學(xué)的李無未,這可能與作者所屬機構(gòu)更名、工作變動或該領(lǐng)域研究熱點變化有關(guān);(4)語言學(xué)語音科學(xué)研究作者及其機構(gòu)顯現(xiàn)較弱,如北京大學(xué)的孔江平、同濟大學(xué)的馬秋武、南開大學(xué)的石鋒等都并未顯現(xiàn),這說明與非語言學(xué)語音科學(xué)研究相比,語言學(xué)語音科學(xué)研究所占比例較小,語音科學(xué)研究跨學(xué)科性強,其發(fā)展空間與研究態(tài)勢發(fā)展良好。最后還值得一提的是,2015年前后劉豫軍、夏聰、胡郁等均是公司職員,與其所在公司機構(gòu)分布一致,這說明企業(yè)在該學(xué)科研究方面也有所貢獻,研究成果直接轉(zhuǎn)化為社會生產(chǎn)的趨勢漸強;2018年前后張玲、張海波、周民偉、劉琳等所在研究領(lǐng)域均為醫(yī)學(xué),這說明語音科學(xué)具有跨學(xué)科交叉研究的趨勢,也說明該學(xué)科的研究熱點和前沿聚焦于語音科學(xué)的跨學(xué)科研究,與圖2所顯示的結(jié)果一致。
4.國內(nèi)語音科學(xué)研究的未來發(fā)展趨勢
在聚類方面,VOSviewer的技術(shù)更為成熟,且聚類主題突出,線條色彩明晰。利用VOSviewer選擇分析單元類型為關(guān)鍵詞共現(xiàn),計數(shù)方式為全部計算,繪制出國內(nèi)語音科學(xué)研究關(guān)鍵詞共現(xiàn)標簽視圖(見圖4)。圖4中各節(jié)點的交叉重疊表示各期刊論文研究中相同關(guān)鍵詞的共現(xiàn)關(guān)系,節(jié)點處分叉越多表明其研究主題的相關(guān)性越大;圖中節(jié)點線條色彩顏色與右下方年份進度條相對應(yīng),表示該領(lǐng)域研究的主要關(guān)鍵詞隨時間變化的發(fā)展走勢;圓形節(jié)點的大小表示關(guān)鍵詞出現(xiàn)頻次的多少,頻次越多節(jié)點越大,其對應(yīng)的關(guān)鍵詞字號也就越大;圖中①②③④⑤是對關(guān)鍵詞共現(xiàn)后大致聚類的劃分,以便增強知識圖譜的可讀性。由圖4可見,語音科學(xué)研究可分為社會語音學(xué)、語言學(xué)語音學(xué)和非語言學(xué)語音學(xué)三類,逆時針羅列的五大聚類是有關(guān)語音科學(xué)研究的不同領(lǐng)域。其一是有關(guān)社會語言學(xué)的聚類(見①),主要節(jié)點有方言學(xué)、方言語音、比較語言學(xué)、漢藏語等,說明方言是語言學(xué)語音學(xué)研究必不可少的組成部分。語音是人類語言的主要載體。社會語言學(xué)是運用語言學(xué)和社會學(xué)等學(xué)科的主要理論和方法,從社會科學(xué)的不同角度研究語言的一門學(xué)科,對方言的研究能夠促進語音科學(xué)
尤其是語言學(xué)語音學(xué)的不斷發(fā)展和完善。其二是有關(guān)語言學(xué)語音學(xué)的聚類(見②),主要節(jié)點有音系學(xué)、音位系統(tǒng)、元音、輔音等,這些屬于語言學(xué)語音學(xué)的本體研究,其對應(yīng)年份主要在1990年之前,說明我國語音科學(xué)研究起步較晚,早期以語言學(xué)語音學(xué)研究為主,與前面結(jié)論一致。國內(nèi)傳統(tǒng)的語音學(xué)研究以音韻學(xué)為主,語音學(xué)研究充分借鑒了國外語音學(xué)的理論、方法和技術(shù)[11]。其三是有關(guān)語音技術(shù)的聚類(見③),主要節(jié)點有語音系統(tǒng)、計算機、語音輸入、語音處理、語音轉(zhuǎn)換等,語音技術(shù)的兩項關(guān)鍵技術(shù)是語音合成和語音識別,語音合成技術(shù)使機器說話成為現(xiàn)實;語音識別技術(shù)能夠使機器聽懂人說話,最終達到人機交互。語音技術(shù)的聚類說明國內(nèi)語音科學(xué)研究逐漸由語言學(xué)語音學(xué)轉(zhuǎn)向以語音技術(shù)為主的非語言學(xué)語音學(xué)研究。其四是有關(guān)人機交互的聚類(見④),主要節(jié)點有人工智能、智能語音、語音交互、深度學(xué)習(xí)等,人機交互是自然人與計算機或智能機器之間通過語言對話,完成確定任務(wù)的信息交換過程;語音科學(xué)研究是實現(xiàn)人機交互必不可少的關(guān)鍵領(lǐng)域研究,這說明語音科學(xué)具有跨學(xué)科研究發(fā)展趨勢。其五是有關(guān)智能家居的聚類(見⑤),主要節(jié)點有語音控制、機器人控制、智能控制等,這些屬于語音科學(xué)的應(yīng)用性發(fā)展研究,說明語音科學(xué)技術(shù)反哺于社會實際應(yīng)用,先進科學(xué)技術(shù)的發(fā)展離不開學(xué)界的科研支撐。綜上所述,目前國內(nèi)語音科學(xué)研究主要有語言學(xué)語音學(xué)研究和非語言學(xué)語音學(xué)研究兩大類,研究趨勢是語言學(xué)語音學(xué)逐漸轉(zhuǎn)向非語言學(xué)語音學(xué)研究,該領(lǐng)域的發(fā)展逐步以社會應(yīng)用為最終目的。
三、國內(nèi)語音科學(xué)研究展望
綜合以上基于1167篇有關(guān)語音科學(xué)的期刊文獻進行的科學(xué)知識圖譜分析,并通過對語言學(xué)語音學(xué)和非語言學(xué)語音學(xué)領(lǐng)域高被引文獻的研讀,未來國內(nèi)語音科學(xué)研究凸顯以下三個方面特點。
1.語言學(xué)語音科學(xué)研究向縱深化方向發(fā)展
語音是語言的主要載體,語音學(xué)是專門研究人類語言的科學(xué),語音學(xué)研究以實驗研究為主,主要依靠儀器的幫助精密分析發(fā)音生理和物理現(xiàn)象的科學(xué),即所謂的實驗語音學(xué)[12]。語言學(xué)語音學(xué)研究多是基于聲學(xué)實驗的研究,如聲調(diào)、語調(diào)、發(fā)音器官運動等。近年來,隨著科學(xué)技術(shù)的飛速發(fā)展,學(xué)術(shù)界的研究也逐漸向科學(xué)性方向發(fā)展,而在語音學(xué)領(lǐng)域,實驗語音學(xué)在傳統(tǒng)語音研究領(lǐng)域的發(fā)展,為我們觀察人類語言中的語音現(xiàn)象提供了新的理論視角與方法工具[13]。在研究對象上,國內(nèi)語音學(xué)研究更加注重方言和少數(shù)民族語言研究。少數(shù)民族語言,由于在人數(shù)方面存在劣勢,加之受到標準漢語普通話的影響,有瀕危甚至消失的危險,21世紀初瀕危語言問題引起了政府的關(guān)注,各種基金開始資助這類研究[14]。此外,少數(shù)民族語音研究也逐漸向多元化和多模態(tài)化方向發(fā)展,如少數(shù)民族唱法研究,少數(shù)民族語音病理研究,誦經(jīng)發(fā)聲、少數(shù)民族語聲紋鑒定研究,以及少數(shù)民族語唇形研究等[15]。在研究內(nèi)容上,傳統(tǒng)語音學(xué)研究多圍繞聲韻調(diào)等內(nèi)容,而現(xiàn)代語音學(xué)逐漸注重韻律、語調(diào)音系、語音情感的研究,特別是隨著語音識別技術(shù)的發(fā)展,語音情感研究不斷深入發(fā)展。韓文靜等[16]指出,語音情感識別在眾多具有自然人機交互需求的領(lǐng)域內(nèi)應(yīng)用廣泛。在研究方法上,語音學(xué)研究大都是基于聲音語料的實驗研究,以生理分析、聲學(xué)分析、感知分析等為主,腦科學(xué)的儀器和方法越來越多地得到應(yīng)用;同時,在語料選取方面,除實驗室操控語料外,自然語料也逐漸納入進來。
2.非語言學(xué)語音科學(xué)研究向跨學(xué)科融合化方向發(fā)展
語音技術(shù)、人工智能、人機交互、智能控制等都是語音科學(xué)跨學(xué)科研究的重要領(lǐng)域。語音技術(shù)的發(fā)展離不開語音科學(xué)方向的科研支撐,語音技術(shù)在計算機領(lǐng)域中的關(guān)鍵技術(shù)有自動語音識別技術(shù)和語音合成技術(shù)。語音識別是計算機通過識別語音信號,將語音轉(zhuǎn)換為相應(yīng)文本的技術(shù),屬于多維模式識別和智能計算機接口的范疇[17];語音合成涉及聲學(xué)、語言學(xué)、數(shù)字信號處理、計算機科學(xué)等多個學(xué)科,主要解決將文字信息轉(zhuǎn)化為聲音信息的相關(guān)問題,即使機器像人一樣開口說話[18]。語音技術(shù)的相關(guān)研究和廣泛應(yīng)用說明語音科學(xué)具有跨學(xué)科融合發(fā)展趨勢。在語音教學(xué)方面,語音科學(xué)與計算機IT行業(yè)相融合開發(fā)的可視化智能發(fā)音軟件,可大大提高語言學(xué)習(xí)者的發(fā)音準確率;在病理語音研究方面,現(xiàn)代語音科學(xué)與醫(yī)學(xué)相結(jié)合,研制上市的可調(diào)節(jié)頻率的助聽器、“人工耳蝸”等,可把紐扣般的器具埋在內(nèi)耳來感應(yīng)聲浪,獲得更好的聽音效果。這些都表明語音科學(xué)的跨學(xué)科融合化發(fā)展趨勢。
3.語音科學(xué)研究向社會應(yīng)用化方向發(fā)展
從最初信息查詢的自助語音服務(wù)系統(tǒng),到目前常見的以語音交互為技術(shù)核心的移動智能終端,如智能音箱、智能家居、智能車載語音系統(tǒng)等,都是語音技術(shù)的社會化應(yīng)用。語音科學(xué)以社會終端應(yīng)用為目的的研究將語音科學(xué)研究成果直接轉(zhuǎn)化為社會生產(chǎn)的趨勢逐漸增強。以科大訊飛的語音識別技術(shù)為例,2010年科大訊飛首次推出訊飛語音輸入法,正確率僅為55%;2014年科大訊飛正式推出“訊飛超腦計劃”;2015年科大訊飛語音識別系統(tǒng)全面升級;之后依托人工智能技術(shù),科大訊飛不斷向面對面翻譯、文字掃描識別、方言識別、醫(yī)療等領(lǐng)域發(fā)展?;谡Z言學(xué)語音學(xué)基礎(chǔ)理論的語音識別、語音合成、言語合成、人工智能、人機交互等技術(shù)性研究應(yīng)用均屬于語音科學(xué)的社會應(yīng)用實踐性研究,是新時代語音科學(xué)研究的重要發(fā)展方向。同時,這些研究也將逐漸應(yīng)用于醫(yī)療、金融、軍事、公安、司法等領(lǐng)域,服務(wù)于新時代的社會主義現(xiàn)代化建設(shè)。
四、結(jié)語
采用文獻計量工具CiteSpace和VOSviewer繪制科學(xué)知識圖譜,進行有關(guān)語音科學(xué)的期刊發(fā)文量、關(guān)鍵詞共現(xiàn)時區(qū)分布圖、主要作者及其機構(gòu)共現(xiàn)時區(qū)分布圖、關(guān)鍵詞共現(xiàn)標簽視圖共4類知識圖譜分析發(fā)現(xiàn):目前,國內(nèi)語音科學(xué)研究在期刊發(fā)文量方面整體呈上升態(tài)勢,學(xué)科發(fā)展趨勢向好;1980—2020年該領(lǐng)域研究聚焦的熱點主題主要有“語音識別”“語音合成”“言語合成”“人工智能”“語音技術(shù)”“人機交互”等,其中人工智能是該領(lǐng)域的研究前沿。該領(lǐng)域研究目前存在的主要問題是:雖有新的學(xué)者和機構(gòu)不斷加入語音科學(xué)研究,但各研究者與機構(gòu)之間的合作較少,各研究團隊之間尚未形成研究合力和網(wǎng)狀研究協(xié)作網(wǎng)絡(luò)。未來國內(nèi)語音科學(xué)研究將呈現(xiàn)出語言學(xué)語音學(xué)研究領(lǐng)域不斷拓展,非語言學(xué)語音學(xué)研究向跨學(xué)科融合化和語言科學(xué)研究向社會化應(yīng)用發(fā)展的趨勢。以上是基于語音科學(xué)知識圖譜對我國國內(nèi)語音科學(xué)發(fā)展現(xiàn)狀作出的客觀性總結(jié),研究結(jié)果是對期刊文獻數(shù)據(jù)的科學(xué)性解讀,雖數(shù)據(jù)來源有限,結(jié)論也相對受限,但仍具有一定的參考價值。國內(nèi)語音科學(xué)研究有較大的研究空間和研究價值,希望相關(guān)學(xué)者能夠繼續(xù)深入研究,為我國語音科學(xué)相關(guān)領(lǐng)域的發(fā)展貢獻力量。
參考文獻:
[1]LADEFOGED P,JOHNSON K.A course in phonetics[M].7th ed.影印本.北京:北京大學(xué)出版社,2015:1-56.
[2] 朱曉農(nóng).語音學(xué)[M].北京:商務(wù)印書館,2010:1-5.
[3] 石鋒,時秀娟.語音樣品的選取和實驗數(shù)據(jù)的分析[J].語言科學(xué),2007(2):23.
[4] CHEN C M.CiteSpace Ⅱ: Detecting and visualizing emerging trends and transient patterns in scientific literature[J].Journal of the American Society for Information Science and Technology,2006(3):359.
[5] ECK N J V,WALTMAN L.Software survey: VOSviewer,a computer program for bibliometric mapping[J].Scientometrics,2010(2):523.
[6] 李杰.科學(xué)知識圖譜原理及應(yīng)用:VOSviewer和CitNetExplorer初學(xué)者指南[M].北京:高等教育出版社,2018:21-25.
[7] 劉丹青.新中國語言文字研究70年[M].北京:中國社會科學(xué)出版社,2019:108-125.
[8] 胡郁.人工智能與語音識別技術(shù)[J].電子產(chǎn)品世界,2016(4):23.
[9] 戴禮榮,張仕良,黃智穎.基于深度學(xué)習(xí)的語音識別技術(shù)現(xiàn)狀與展望[J].數(shù)據(jù)采集與處理,2017(2):221.
[10]李天祥.Android物聯(lián)網(wǎng)開發(fā)細致入門與最佳實踐[M].北京:中國鐵道出版社,2016:14-15.
[11]史寶輝.我國語音學(xué)與音系學(xué)研究現(xiàn)狀和發(fā)展方向[J].外語教學(xué)與研究,1996(2):20.
[12]吳宗濟,林茂燦.實驗語音學(xué)概要[M].北京:高等教育出版社,1989:1-11.
[13]胡方.漢語方言的實驗語音學(xué)研究旨趣[J].方言,2018(4):385.
[14]范俊軍.中國的瀕危語言保存和保護[J].暨南學(xué)報(哲學(xué)社會科學(xué)版),2018(10):1.
[15]金雅聲,胡阿旭.少數(shù)民族語音多元化和多模態(tài)研究[J].西北民族大學(xué)學(xué)報(哲學(xué)社會科學(xué)版),2009(3):77.
[16]韓文靜,李海峰,阮華斌,等.語音情感識別研究進展綜述[J].軟件學(xué)報,2014(1):37.
[17]高新濤,陳乖麗.語音識別技術(shù)的發(fā)展現(xiàn)狀及應(yīng)用前景[J].甘肅科技縱橫,2007(4):13.
[18]張斌,全昌勤,任福繼.語音合成方法和發(fā)展綜述[J].小型微型計算機系統(tǒng),2016(1):186.
[收稿日期]2020-04-10
[基金項目]國家社科基金項目(19CYY042);河南省哲學(xué)社會科學(xué)規(guī)劃項目(2017CYY026)
[作者簡介]吳亞樂(1992—),女,河南省平頂山市人,河南工業(yè)大學(xué)碩士研究生,主要研究方向:語音學(xué)與音系學(xué);劉希瑞(1984—),男,河南省洛陽市人,河南工業(yè)大學(xué)副教授,博士,主要研究方向:語音學(xué)與音系學(xué)。