周學(xué)文,呼 和
(中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)研究所語(yǔ)音研究室,100081)
語(yǔ)音語(yǔ)料庫(kù)建設(shè)是實(shí)驗(yàn)語(yǔ)音學(xué)基礎(chǔ)研究的主要方向,在刻畫(huà)(目標(biāo)語(yǔ))全面的語(yǔ)音特征、研究語(yǔ)音演化和語(yǔ)言親屬關(guān)系、發(fā)音機(jī)理和協(xié)同發(fā)音、瀕危語(yǔ)言保護(hù)等方面具有重要意義,能夠有力推動(dòng)語(yǔ)音本體描寫(xiě)研究和言語(yǔ)工程研究。按照使用目的,語(yǔ)音語(yǔ)料庫(kù)可分為面向基礎(chǔ)研究和面向應(yīng)用兩大范疇,前者包括聲學(xué)、語(yǔ)言產(chǎn)生、言語(yǔ)感知、韻律等,后者包括語(yǔ)音識(shí)別、語(yǔ)音合成、人機(jī)交互技術(shù)等。國(guó)際上主要的研究和發(fā)布語(yǔ)音數(shù)據(jù)庫(kù)的機(jī)構(gòu)有ELRA(歐洲語(yǔ)言資源協(xié)會(huì))、ESCA/ISCA(歐洲/國(guó)際言語(yǔ)通訊協(xié)會(huì))、LDC(語(yǔ)言數(shù)據(jù)聯(lián)盟)和 Oriental COCOSDA等。歐洲共同體上世紀(jì)90年代初建立了基于歐洲7種語(yǔ)言的語(yǔ)音數(shù)據(jù)庫(kù)研究計(jì)劃“EUR-ACCOR”,目的是建立歐洲共同體7種語(yǔ)言的語(yǔ)音聲學(xué)參數(shù)和生理參數(shù)數(shù)據(jù)庫(kù)。國(guó)內(nèi)也開(kāi)發(fā)了大量規(guī)模和目的不一的語(yǔ)音數(shù)據(jù)庫(kù),如中國(guó)社會(huì)科學(xué)院語(yǔ)言所開(kāi)發(fā)的漢語(yǔ)口語(yǔ)語(yǔ)音庫(kù)、語(yǔ)音識(shí)別語(yǔ)音語(yǔ)料庫(kù)RASC863、兒童語(yǔ)言習(xí)得語(yǔ)音庫(kù)和中國(guó)英語(yǔ)學(xué)習(xí)者語(yǔ)音特征的數(shù)據(jù)庫(kù)ESCCL等。除了中國(guó)社會(huì)科學(xué)院民族學(xué)與人類學(xué)所外,尚未有開(kāi)發(fā)面向基礎(chǔ)研究的中國(guó)少數(shù)民族語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)的報(bào)道。
為了有效使用語(yǔ)音語(yǔ)料庫(kù),必須對(duì)其內(nèi)容進(jìn)行標(biāo)注。根據(jù)語(yǔ)音語(yǔ)料庫(kù)的內(nèi)容和目標(biāo),語(yǔ)音標(biāo)注分為音段標(biāo)注和韻律標(biāo)注,二者的標(biāo)注內(nèi)容有很大不同。廣泛使用的標(biāo)注系統(tǒng)有用于英語(yǔ)韻律標(biāo)注的ToBI(Tone Break Index)系統(tǒng)和由此擴(kuò)展而來(lái)的J-ToBI(日語(yǔ))、K-ToBI(韓語(yǔ))和C-ToBI(漢語(yǔ)普通話)等。C-ToBI系統(tǒng)的標(biāo)注層次主要包括語(yǔ)調(diào)特性、停頓邊界、強(qiáng)調(diào)與重音、拼音轉(zhuǎn)寫(xiě)、調(diào)類號(hào)、漢字等,并不包含用于基礎(chǔ)研究的語(yǔ)音聲學(xué)參數(shù)的全部信息。目前語(yǔ)音學(xué)界也沒(méi)有統(tǒng)一的語(yǔ)音聲學(xué)參數(shù)的標(biāo)注格式和標(biāo)注系統(tǒng),必須根據(jù)各自的研究目的開(kāi)發(fā)各自的標(biāo)注格式和標(biāo)注系統(tǒng)。
為了擯棄傳統(tǒng)小作坊式的語(yǔ)音聲學(xué)研究方法以及缺乏統(tǒng)一標(biāo)準(zhǔn)、缺乏比較基準(zhǔn)、缺乏數(shù)據(jù)延續(xù)性、缺乏全面性的弊端,自上世紀(jì)90年代初開(kāi)始,中國(guó)社會(huì)科學(xué)院民族所語(yǔ)音研究室在國(guó)家自然科學(xué)基金、國(guó)家社會(huì)科學(xué)基金項(xiàng)目、教育部和社科院科研局的資助下,與少數(shù)民族地區(qū)大學(xué)和研究所合作完成了“藏語(yǔ)拉薩話語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”(國(guó)家自然基金項(xiàng)目,1991年)[1]、“哈薩克語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”(國(guó)家自然基金項(xiàng)目,1992年)[2]、“蒙古語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”(自然基金項(xiàng)目,1992年)[3-4]等項(xiàng)目。2006年提出“中國(guó)少數(shù)民族語(yǔ)言語(yǔ)音聲學(xué)參數(shù)統(tǒng)一平臺(tái)”建設(shè)思路[5],在教育部的資助下,已完成了“藏、維、彝、鄂溫克、鄂倫春、達(dá)斡爾等語(yǔ)言的語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”[6],目前正在實(shí)施“錫伯語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”“土族語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”和“東部裕固語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”等的研制工作。
盡管通過(guò)二十多年的語(yǔ)音聲學(xué)研究工作建立了一些少數(shù)民族語(yǔ)音聲學(xué)參數(shù)語(yǔ)料庫(kù)并積累了豐富的研制經(jīng)驗(yàn),但是聲學(xué)參數(shù)采集工作仍然非常艱難。這是因?yàn)閮H僅依靠手工標(biāo)注和采集,一方面,工作量大,錯(cuò)誤率高,效率低,無(wú)法保證實(shí)驗(yàn)方法和實(shí)驗(yàn)數(shù)據(jù)的可重復(fù)性,更無(wú)法實(shí)現(xiàn)語(yǔ)音聲學(xué)研究工作的規(guī)范化和標(biāo)準(zhǔn)化;另一方面,由于聲學(xué)特征定義及其提取方法和標(biāo)準(zhǔn)難以統(tǒng)一等原因,導(dǎo)致了語(yǔ)言之間難以相互比較,研究成果無(wú)法相互借鑒的后果。為了避免上述弊端,必須解決語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)研制工作的自動(dòng)化問(wèn)題,語(yǔ)音聲學(xué)參數(shù)自動(dòng)標(biāo)注和提取是首先要解決的問(wèn)題。
針對(duì)以上問(wèn)題,必須設(shè)計(jì)出全面穩(wěn)妥的解決思路。經(jīng)過(guò)分析和討論,解決方法分三個(gè)方面:
第一,設(shè)計(jì)完備合理的標(biāo)注文件。該文件必須能夠存儲(chǔ)和計(jì)算得到全部的聲學(xué)參數(shù),包括功能性參數(shù)和聲學(xué)特征參數(shù),并且方便用戶操作。
第二,開(kāi)發(fā)自動(dòng)標(biāo)注軟件。用戶只需要在標(biāo)注文件選定少量位置,執(zhí)行該軟件就可得到所有聲學(xué)參數(shù),用戶只需要校對(duì)、修改和確認(rèn)。
第三,開(kāi)發(fā)自動(dòng)提取軟件。系統(tǒng)可一次性將所有已標(biāo)注的文件經(jīng)逐個(gè)計(jì)算,得到所有參數(shù)后存入到一個(gè)文本文件中,然后用戶導(dǎo)入EXCEL就完成了聲學(xué)參數(shù)庫(kù)的建立。
標(biāo)注文件和自動(dòng)標(biāo)注/提取系統(tǒng)是在語(yǔ)音學(xué)界廣泛使用的語(yǔ)音分析平臺(tái)Praat 5.2.23版本上開(kāi)發(fā)的[7],音標(biāo)編碼使用改進(jìn)的 SAMPA-C編碼,所有使用Praat進(jìn)行語(yǔ)音分析和語(yǔ)音聲學(xué)語(yǔ)料庫(kù)建設(shè)的用戶均可使用本系統(tǒng)。
語(yǔ)音的聲學(xué)特征是實(shí)驗(yàn)語(yǔ)音學(xué)主要的研究成果,語(yǔ)音聲學(xué)特征參數(shù)是描寫(xiě)和刻畫(huà)語(yǔ)音的音素(元音、輔音)、音段(音節(jié)、詞等)和超音段的重要手段,比如元音音色主要由其前三個(gè)共振峰決定,對(duì)聲調(diào)語(yǔ)言,音高值及其變化決定了調(diào)類和調(diào)值,VOT(Voice Onset Time)可以較好區(qū)分塞音與塞擦音中的塞/塞擦、送氣/不送氣、清音/濁音等特征,譜重心可以區(qū)分某些擦音等①每個(gè)聲學(xué)特征的具體含義,可參考相關(guān)的實(shí)驗(yàn)語(yǔ)音學(xué)書(shū)籍。
完整而系統(tǒng)的功能性字段和聲學(xué)特征參數(shù)集是實(shí)現(xiàn)語(yǔ)音聲學(xué)參數(shù)自動(dòng)標(biāo)注/提取以及開(kāi)發(fā)參數(shù)查詢統(tǒng)計(jì)平臺(tái)的重要前提。通過(guò)二十幾年的努力,中國(guó)社會(huì)科學(xué)院民族所語(yǔ)音研究室已探索出統(tǒng)一的11個(gè)功能性字段和36個(gè)聲學(xué)特征參數(shù)。這些特征集具有確定性、唯一性、全面性和權(quán)威性等特點(diǎn),能夠涵蓋所有少數(shù)民族語(yǔ)言的語(yǔ)音特征。其中,功能字段用于查找、統(tǒng)計(jì)和分類每一種語(yǔ)言、每一個(gè)詞、每一個(gè)音節(jié)中每一個(gè)音段的每個(gè)聲學(xué)參數(shù),因此必須包含足夠的信息量。功能性字段分詞層、音節(jié)層、音段層、發(fā)聲類型層和聲調(diào)類型層等5層11個(gè)字段,如表1所示。
表1 功能性字段集
續(xù)表
聲學(xué)特征參數(shù)負(fù)載著音段所有的聲學(xué)特征信息,是觀察了解音段特征及其變化的密鑰,是語(yǔ)音描寫(xiě)研究的基石。為了對(duì)不同語(yǔ)言音段或超音段特征之間進(jìn)行比較研究,需要設(shè)計(jì)一套統(tǒng)一的聲學(xué)特征參數(shù)集。表2為元音聲學(xué)特征集及其定義,表3為輔音聲學(xué)特征集及定義,表4為韻律特征集及其定義。
表2 元音聲學(xué)特征集及其定義
表3 輔音聲學(xué)特征集及其定義
表4 韻律特征集及其定義
為了對(duì)聲學(xué)參數(shù)進(jìn)行標(biāo)準(zhǔn)化標(biāo)注和自動(dòng)提取以及減少人工標(biāo)注的隨意性,在提出八層標(biāo)注文件結(jié)構(gòu)(請(qǐng)見(jiàn)表5)的同時(shí),制訂了歸一化的標(biāo)注標(biāo)準(zhǔn)和標(biāo)注點(diǎn)。該結(jié)構(gòu)涵蓋了音段和超音段主要聲學(xué)特征。標(biāo)注方法如下:在Praat環(huán)境下將標(biāo)注文件與語(yǔ)音文件同時(shí)打開(kāi)后,用戶按照統(tǒng)一的標(biāo)注標(biāo)準(zhǔn)和方法,選定少量標(biāo)注位置,執(zhí)行自動(dòng)標(biāo)注軟件,系統(tǒng)就能把具體值自動(dòng)標(biāo)注到所選位置上,用戶只需校對(duì)、修改和確認(rèn)即可。有了該系統(tǒng),語(yǔ)音實(shí)驗(yàn)人員可以把主要精力集中到語(yǔ)音特征的分析和比較上,不再為手工填寫(xiě)大量數(shù)據(jù)而發(fā)愁。這樣既減少工作量,又降低錯(cuò)誤率。表5為標(biāo)注文件結(jié)構(gòu)。
下面簡(jiǎn)單解釋表5中每層的填寫(xiě)內(nèi)容、選點(diǎn)規(guī)則及取值含義。
第一層為音素層,采用音素記音法,以實(shí)際發(fā)音為準(zhǔn),用SAMPA-C碼標(biāo)注。如果實(shí)際發(fā)音為目標(biāo)語(yǔ)言的非典型變體,則該層的音標(biāo)與第二、三層的音標(biāo)可能不同。
表5 八層標(biāo)注文件結(jié)構(gòu)(以一個(gè)3音節(jié)5音素詞的標(biāo)注結(jié)構(gòu)為例)
第二層為音節(jié)層,采用音位記音法,根據(jù)目標(biāo)語(yǔ)言的音位系統(tǒng),用SAMPA-C碼標(biāo)注。
第三層為詞層,也采用音位記音法,根據(jù)目標(biāo)語(yǔ)言的音位系統(tǒng),用SAMPA-C碼標(biāo)注。
第四層為音高層(韻律層)。該層的標(biāo)注方法:以音節(jié)為單位,每個(gè)音節(jié)自動(dòng)取音高曲線的起點(diǎn)、折點(diǎn)和終點(diǎn)等三點(diǎn),如果沒(méi)有折點(diǎn),則取起、終兩點(diǎn)。其中,折點(diǎn)為音高曲拱的明顯轉(zhuǎn)折點(diǎn),既包括H-LH型,也包括L-H-L型以及音高斜率的劇變點(diǎn)。至于斜率的劇變?nèi)绾味x,閾值是多少,目前由用戶根據(jù)經(jīng)驗(yàn)判斷和選擇,在該軟件的升級(jí)版本中將會(huì)由系統(tǒng)自動(dòng)實(shí)現(xiàn)。
第五層為音強(qiáng)層,以音素為單位,每個(gè)音素取一點(diǎn)。其中,對(duì)元音,選其最大音強(qiáng);對(duì)塞音和塞擦音,選其沖直條上的音強(qiáng)。因?yàn)樵撎幰魪?qiáng)可以表征沖直條的強(qiáng)弱;對(duì)其他輔音,如擦音、鼻音、邊音等,選輔音的前三分之一處的音強(qiáng),因?yàn)樵撎庉o音已達(dá)到了發(fā)音的目標(biāo)位置。本軟件已實(shí)現(xiàn)音強(qiáng)的自動(dòng)標(biāo)注功能。
第六層為共振峰層,對(duì)元音,如果共振峰呈水平走向,則可以只選一點(diǎn),即目標(biāo)點(diǎn),否則選元音起始(前過(guò)渡)、目標(biāo)和結(jié)尾(后過(guò)渡)等三點(diǎn);對(duì)塞音和塞擦音,選沖直條上的共振峰;對(duì)其他輔音,如擦音、鼻音、邊音等,選輔音的前三分之一處的共振峰。因?yàn)樵撎庉o音已經(jīng)達(dá)到了目標(biāo)位置;無(wú)論元音,還是輔音,系統(tǒng)對(duì)每個(gè)點(diǎn)自動(dòng)提取最多5個(gè)共振峰。本系統(tǒng)采集共振峰的依據(jù)是LPC分析線,因此為了確保共振峰參數(shù)的準(zhǔn)確性,用戶標(biāo)注共振峰位置時(shí)應(yīng)盡量避免LPC分析線上的野點(diǎn)(錯(cuò)誤)。為了校對(duì)和確認(rèn)系統(tǒng)自動(dòng)采集的參數(shù)值,用戶必須提前掌握目標(biāo)語(yǔ)言音位系統(tǒng)和每個(gè)音段大致的聲學(xué)表現(xiàn),特別是共振峰模式。另外,用逗號(hào)代替所缺省的共振峰。如共振峰串 ,660,,2 200,系統(tǒng)解釋為F2=660,F(xiàn)4=2 200,F(xiàn)1和F3空缺。共振峰點(diǎn)的自動(dòng)選擇問(wèn)題,已在該軟件中解決。
第七層為塞音/塞擦音的沖直條和濁音杠層,對(duì)詞首清塞音/清塞擦音,因沖直條與詞的左邊界重合,故不標(biāo)注。但要標(biāo)注詞首濁塞音/濁塞擦音的沖直條,不標(biāo)注其濁音杠起始點(diǎn)(其濁音杠起始點(diǎn)與詞的左邊界重合);對(duì)非詞首塞音/塞擦音要標(biāo)注沖直條和濁音杠。其中,如果標(biāo)注一點(diǎn),系統(tǒng)則認(rèn)為是沖直條(清)。如果標(biāo)注兩點(diǎn),系統(tǒng)則認(rèn)為:第一點(diǎn)為濁音杠,第二點(diǎn)為沖直條(濁)。這些點(diǎn)的具體含義解釋均由系統(tǒng)自動(dòng)判斷,用戶只需標(biāo)注具體位置即可。在該軟件的升級(jí)版本中,將能夠?qū)崿F(xiàn)全自動(dòng)標(biāo)注。
第八層為輔音譜層,系統(tǒng)自動(dòng)計(jì)算除塞音/塞擦音以外輔音的譜特征,包括譜重心(單位赫茲)、相對(duì)于譜重心的譜偏移量(單位赫茲)和偏離度(低于譜重心的譜與高于譜重心的譜之比)。該層參數(shù)是根據(jù)熊子瑜博士的提議新增加的。主要用于描寫(xiě)輔音特征,特別是擦音、鼻音、邊音等的譜分布區(qū)別特征。通過(guò)實(shí)驗(yàn)比較,最后選定從輔音中間三分之一部分中提取輔音譜,這樣能夠最大程度地反映該輔音的譜特征并減少其前后音素的影響。通過(guò)東部裕固語(yǔ)少量詞的實(shí)驗(yàn),發(fā)現(xiàn)該語(yǔ)言擦音[s]和[?]的譜重心差別較大,可以達(dá)到1 500赫茲。其中前者約為7 000赫茲,后者為5 500赫茲左右。
在以上八層標(biāo)注層中,前三層(音素、音節(jié)和詞),采用界面層(interval tier)標(biāo)注,后五層采用點(diǎn)層(point tier)標(biāo)注。
圖1為對(duì)東部裕固語(yǔ)Sk_h(yuǎn)@n一詞進(jìn)行自動(dòng)標(biāo)注的界面。界面中的參數(shù)都是自動(dòng)提取的。
圖1 自動(dòng)標(biāo)注軟件版本1.0運(yùn)行界面
在運(yùn)行上述自動(dòng)標(biāo)注軟件后,每個(gè)聲音文件(發(fā)音詞)都形成一個(gè)同名的文本標(biāo)注文件(TextGrid)。自動(dòng)提取軟件將對(duì)這些標(biāo)注文件進(jìn)行批量自動(dòng)處理,最后生成一個(gè)文本文件(.txt),只需要手工幾步即可導(dǎo)入EXCEL表格,就生成了用戶聲學(xué)參數(shù)庫(kù)。圖2為自動(dòng)提取軟件的運(yùn)行界面。
圖2 自動(dòng)提取軟件運(yùn)行界面
自動(dòng)提取軟件是一款高效而穩(wěn)定的軟件,它主要完成如下工作:(1)根據(jù)SAMPA-C碼定義,判斷音素的元音/輔音屬性。如果是輔音,還要判斷其清/濁,塞音塞擦音/非塞音塞擦音屬性;(2)根據(jù)音節(jié)內(nèi)音素的組合,判斷音節(jié)類型并得到類型號(hào),音節(jié)位置和數(shù)量,詞/音節(jié)/音素長(zhǎng)度,將音高值賦予音素,將共振峰值串(可能有逗號(hào)分隔的缺省值)分解得到F1-F5,并根據(jù)元音/輔音屬性,分別賦予各自的共振峰,將音高賦予音節(jié)的屬性;(3)根據(jù)第七層的沖直條和濁音杠標(biāo)記,與第一層的音素進(jìn)行匹配,根據(jù)詞首/非詞首、清/濁屬性,將各個(gè)標(biāo)記解釋為沖直條或濁音杠,計(jì)算得到GAP、VOT和音長(zhǎng),再賦值給音素;(4)第八層將計(jì)算得到的輔音譜特征值賦予輔音等等。
該軟件具有一定的靈活性,可以處理二音高值/三音高值、有缺省值的共振峰值串、一點(diǎn)/三點(diǎn)共振峰、自動(dòng)判斷沖直條或濁音杠、處理輸入的多余空格和回車符等。
目前自動(dòng)標(biāo)注/提取軟件已投入使用,并得到了語(yǔ)音聲學(xué)實(shí)驗(yàn)研究者們的贊同和認(rèn)可。該系統(tǒng)具有標(biāo)準(zhǔn)統(tǒng)一、數(shù)據(jù)完整、簡(jiǎn)單高效、可校對(duì)、能容錯(cuò)的特點(diǎn)。與手動(dòng)采集聲學(xué)參數(shù)相比,能夠減少大量的填寫(xiě)數(shù)據(jù)的工作量,減少人工標(biāo)注的隨意性,既減少工作量,又降低錯(cuò)誤率,能夠有效提高語(yǔ)音聲學(xué)參數(shù)庫(kù)研制效率,確保實(shí)驗(yàn)方法和實(shí)驗(yàn)數(shù)據(jù)的可重復(fù)性。
在上述工作的基礎(chǔ)上,系統(tǒng)將實(shí)現(xiàn)沖直條和濁音杠位置的自動(dòng)標(biāo)注,進(jìn)一步提高自動(dòng)化程度,并逐步實(shí)現(xiàn)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)研制工作的全面自動(dòng)化目標(biāo),從而推動(dòng)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)研制和語(yǔ)音聲學(xué)實(shí)驗(yàn)研究工作的規(guī)范化和標(biāo)準(zhǔn)化。
[1]鮑懷翹,徐昂,陳嘉猷.藏語(yǔ)拉薩話語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)[J].民族語(yǔ)文,1992,(5):10-20.
[2]Huai-qiao BAO.An acoustic parameter database of speech sound of Kazakh and harmony theory of vowel[C]//Oriental COCOSDA'99,Second International Workshop on East-Asian Language Resources and E-valuation,May 13-14,Taipei,Taiwan,1999:82-86.
[3]呼和,鮑懷翹,陳嘉猷.關(guān)于“蒙古語(yǔ)語(yǔ)音聲學(xué)參數(shù)數(shù)據(jù)庫(kù)”[J].Journal of the altaic society of korea,ISSN 1226-6582,1998,12:201-210.
[4]呼和,陳嘉猷,鄭玉玲.蒙古語(yǔ)韻律特征聲學(xué)參數(shù)數(shù)據(jù)庫(kù)[J].內(nèi)蒙古大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)漢文版),2001年,21:39-43.
[5]周學(xué)文,鄭玉玲,呼和.“中國(guó)少數(shù)民族語(yǔ)言語(yǔ)音聲學(xué)參數(shù)平臺(tái)”簡(jiǎn)介[C]//COCOSDA2009,北京,2009年8月,2009:24-128.
[6]Huhe,Zhouxuewen,Wurigexiletu,Hasiqimuge.A-coustic parameter databases of daur,evenki,oroqen nationalities[C]//COCOSDA2011,臺(tái)灣,2011:78-82.
[7]熊子瑜.Praat語(yǔ)音軟件使用手冊(cè)[M].北京:中國(guó)社會(huì)科學(xué)院語(yǔ)言研究所,2004.
[8]李愛(ài)軍,陳肖霞,孫國(guó)華,華武,殷治綱.CASS:一個(gè)具有語(yǔ)音學(xué)標(biāo)注的漢語(yǔ)口語(yǔ)語(yǔ)音庫(kù)[J].當(dāng)代語(yǔ)言學(xué),2002,(2).