李憲武
山東女子學(xué)院 山東濟(jì)南 250300
語料庫,通常是指為語言研究收集的、用電子形式保存的語言材料,由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體[1]。早期的語料庫一般只包括帶有語言學(xué)信息標(biāo)注的文字資源,在信息技術(shù)高速發(fā)展的今天,隨著攝像技術(shù)和數(shù)字?jǐn)z像機(jī)的普及應(yīng)用,數(shù)字視頻資源已成為語料庫的重要組成部分。國家組織或批準(zhǔn)建設(shè)的大型語料庫項(xiàng)目,如2008年10月教育部、國家語委啟動(dòng)的“中國語言資源有聲數(shù)據(jù)庫”(簡稱“有聲數(shù)據(jù)庫”),2012年國家社會(huì)科學(xué)基金重大項(xiàng)目“漢語方言自然口語有聲基礎(chǔ)語料庫”(簡稱“有聲基礎(chǔ)語料庫”),2015年5月教育部、國家語委正式啟動(dòng)的“中國語言資源保護(hù)工程”(簡稱“語保工程”)等,均將視頻資源作為重要的基礎(chǔ)組成部分,并提出了明確的采集要求。
數(shù)字視頻技術(shù)是利用數(shù)字化手段對視頻進(jìn)行錄制、存儲、編輯以及播放的一種計(jì)算機(jī)技術(shù),以數(shù)字文件形式保存的視頻可以通過計(jì)算機(jī)進(jìn)行檢索和編輯處理。將數(shù)字視頻技術(shù)應(yīng)用于語料庫建設(shè)中既有利于語言資源的保存和傳承,又便于檢索和加工處理,還有利于語言資源研究成果的立體化、多樣化和信息化、網(wǎng)絡(luò)化。
不同的語料庫項(xiàng)目有不同的建設(shè)標(biāo)準(zhǔn)?!坝新晹?shù)據(jù)庫”“有聲基礎(chǔ)語料庫”“語保工程”對視頻資源的采錄均制訂了相應(yīng)的技術(shù)標(biāo)準(zhǔn)和規(guī)范要求,具體見表1。
表1 語料庫項(xiàng)目視頻資源采錄技術(shù)標(biāo)準(zhǔn)和規(guī)范要求
3個(gè)語料庫建設(shè)項(xiàng)目在拍攝器材、視頻分辨率等方面的要求存在明顯的差別,主要是由于標(biāo)準(zhǔn)的制訂時(shí)間不同(分別為2010年、2013年、2015年制訂)和當(dāng)時(shí)的主流拍攝設(shè)備和技術(shù)普及程度不同。目前,全高清已逐漸成為視頻攝制的主流標(biāo)準(zhǔn),便攜式全高清攝像設(shè)備也已普及,全高清視頻的畫面大小(1 920×1 080)是標(biāo)清視頻畫面大小(720×576)的4倍以上,在信息量方面具有顯著優(yōu)勢,因此,應(yīng)盡可能地采用全高清模式拍攝。
錄制內(nèi)容方面,“有聲數(shù)據(jù)庫”只需錄制話語故事和話語話題等語篇內(nèi)容,其他兩個(gè)項(xiàng)目均有單字錄制要求且要求每個(gè)調(diào)查條目保存為一個(gè)視頻文件。針對單字、詞匯等內(nèi)容的錄制,可以分為間斷性錄制和連續(xù)性錄制兩種方式。間斷性錄制是指在錄制時(shí)每完成一個(gè)條目即停止錄像,攝像機(jī)自動(dòng)生成該條目的視頻文件,直接將每個(gè)調(diào)查條目錄制為一個(gè)獨(dú)立的視頻文件,在錄制時(shí)即完成了分條目保存,但需要頻繁的啟動(dòng)和停止攝像機(jī),容易影響發(fā)音人狀態(tài),在單位時(shí)間內(nèi)錄制的調(diào)查條目數(shù)量少,錄制效率低。連續(xù)性錄制是指攝像機(jī)處于持續(xù)錄制工作狀態(tài),一次連續(xù)錄制多個(gè)調(diào)查條目,即錄制的每個(gè)視頻文件中包括多個(gè)調(diào)查條目,在單位時(shí)間內(nèi)錄制的條目數(shù)量多、效率高,但需要后期將視頻文件按調(diào)查條目進(jìn)行拆分并重命名。錄制方式的選擇不僅要考慮錄制人員的技術(shù)能力,還要考慮發(fā)音人的狀態(tài)、時(shí)間安排和配合程度。
由于采用間斷性錄制時(shí)很難確保發(fā)音開始和結(jié)束部分預(yù)留了合適的空白時(shí)間,采用連續(xù)性錄制方式需要對視頻文件進(jìn)行拆分,因此,錄制完成后需要對視頻文件進(jìn)行適當(dāng)?shù)木庉嬏幚?。?shù)字視頻文件的編輯處理通過視頻處理軟件完成,在選擇視頻處理軟件時(shí),不僅要考慮軟件的功能和特點(diǎn),還應(yīng)考慮工作人員的技術(shù)水平和軟件使用的熟練程度,同時(shí)要盡量減少因軟件原因?qū)Ξ嬞|(zhì)產(chǎn)生影響。攝像機(jī)的隨機(jī)光盤中一般附帶配套的專用編輯軟件,如索尼攝像機(jī)的PMB、松下攝像機(jī)的HD Writer AE以及佳能攝像機(jī)的PIXELA video browser等。這些隨機(jī)軟件都具備視頻分割、視頻合并、視頻截取等基本的編輯處理功能,可以對視頻文件進(jìn)行基本的編輯處理,但不能跨品牌使用,如用索尼攝像機(jī)拍攝的視頻不能用佳能的隨機(jī)軟件編輯。使用隨機(jī)軟件對視頻文件進(jìn)行的編輯處理是一種無損操作,不會(huì)對畫面質(zhì)量產(chǎn)生影響,可以有效地確保視頻文件的質(zhì)量,且隨機(jī)軟件的操作方式多為流程式操作,使用方法比較簡單,對計(jì)算機(jī)的硬件配置要求也相對較低。特殊情況下需要進(jìn)行其他技術(shù)處理時(shí),可以選擇Premiere,Edius等第三方通用視頻編輯軟件進(jìn)行技術(shù)處理,但這類軟件操作使用復(fù)雜且通常需要安裝不同的插件才能支持各種格式的高清視頻文件,對人員的技術(shù)要求較高,使用這類軟件最重要的是確保輸出時(shí)畫面質(zhì)量不會(huì)產(chǎn)生明顯的損失。
“漢語方言自然口語有聲基礎(chǔ)語料庫”是2012年國家社會(huì)科學(xué)基金重大項(xiàng)目,采錄內(nèi)容包括基礎(chǔ)語料和語篇語料兩大部分,基礎(chǔ)語料又分為語音、詞匯和語法例句,語篇語料又分為話本語篇、話題語篇和自話語篇?;A(chǔ)語料中的音系例字需要錄制4位發(fā)音人的視頻,語篇語料中的話本語篇、話題語篇全部需要錄制視頻。根據(jù)項(xiàng)目建設(shè)要求,我們?nèi)缙谕瓿闪怂幸曨l資源的拍攝和處理工作,并提交總項(xiàng)目組。
項(xiàng)目組對場所的環(huán)境條件進(jìn)行了嚴(yán)格的限定。第一次錄制時(shí),我們選擇了遠(yuǎn)離市區(qū)、隱匿在山中的賓館客房,第二次錄制是在經(jīng)過專業(yè)裝修的演播室,拍攝場所的聲學(xué)條件和光線均符合項(xiàng)目要求。
拍攝前首先檢查攝像機(jī)的運(yùn)行狀況,選擇攝像機(jī)的最高畫質(zhì),進(jìn)行試錄和回放,確保攝像機(jī)工作正常、剩余存儲空間充足,然后開始正式錄制。為了便于后期編輯處理,每次錄制前先拍攝場記內(nèi)容。用三腳架固定好攝像機(jī),調(diào)整好攝像機(jī)與發(fā)音人的距離和角度,確定好拍攝景別和畫面構(gòu)圖后,鎖定三腳架的各個(gè)調(diào)節(jié)旋鈕。提醒發(fā)音人在錄制過程中不要隨意擺動(dòng)身體,以免影響畫面構(gòu)圖和聲音效果。
攝錄人員對攝像機(jī)的操作和視頻編輯處理十分熟練,因此在錄制時(shí),無論是音系例字、話本語篇還是話題語篇,均采用了連續(xù)性錄制模式。攝像機(jī)處于持續(xù)錄制工作狀態(tài),發(fā)音人在不同條目之間稍作停頓,發(fā)音狀態(tài)穩(wěn)定,發(fā)音相對連續(xù),錄制過程中發(fā)音人無意識的動(dòng)作和發(fā)音前的呼吸聲明顯減少,相同時(shí)間內(nèi)錄制的條目數(shù)量多、錄制效率高。337個(gè)音系例字,兩位老年發(fā)音人均在30分鐘內(nèi)完成了錄制。
錄制完成后,利用發(fā)音人休息時(shí)間及時(shí)進(jìn)行回放和審音,檢查錄制內(nèi)容是否完整、發(fā)音是否準(zhǔn)確、構(gòu)圖是否合理,并對缺失和不準(zhǔn)確、不合適的內(nèi)容進(jìn)行當(dāng)場補(bǔ)錄、重錄。及時(shí)將錄制內(nèi)容轉(zhuǎn)存到電腦中,并用移動(dòng)硬盤進(jìn)行備份保存。
錄制完成后得到的是原始視頻文件,不符合項(xiàng)目歸檔要求,需要進(jìn)行相關(guān)的技術(shù)處理。后期需要進(jìn)行的技術(shù)處理包括拆分、合并和重命名。
根據(jù)“漢語方言自然口語有聲基礎(chǔ)語料庫”采錄文本要求,“語音、詞匯、語法部分,每一采錄條目錄(字、詞、句)為一個(gè)獨(dú)立的文件;語篇部分,每一語篇為一個(gè)文件?!睂?shí)際錄制時(shí)采用了連續(xù)性錄制模式,得到的原始視頻文件中,無論基礎(chǔ)語料中的音系例字還是話本語篇、話題語篇,都存在一個(gè)文件中包括多個(gè)條目的現(xiàn)象,因此必須對原始視頻文件進(jìn)行拆分,使其與采錄文本要求一致。拆分只是將一個(gè)視頻文件切分為多個(gè)視頻文件,并去掉多余內(nèi)容,不需要其他的技術(shù)處理,使用攝像機(jī)附帶的隨機(jī)軟件即可完成相關(guān)操作。為便于后續(xù)的重命名,拆分后的文件按照采錄文本的先后順序進(jìn)行編號保存,編號可以不連續(xù),但須體現(xiàn)先后順序,且文件名中不能有空格。
由于攝像機(jī)硬盤格式的限定,當(dāng)錄制的視頻文件達(dá)到4 GB時(shí)會(huì)自動(dòng)分段保存,這會(huì)使有的調(diào)查條目被分到兩個(gè)視頻文件中,尤其是在錄制話本語篇和話題語篇時(shí)更容易出現(xiàn)這種情況,這時(shí)可以使用攝像機(jī)附帶的隨機(jī)軟件將兩個(gè)視頻文件合并為一個(gè)。合并后的文件名同樣用編號體現(xiàn)與前后內(nèi)容的順序關(guān)系,只保留合并后的文件,原文件另外保存。
拆分、合并后的視頻文件需要按照采錄文本的要求進(jìn)行重命名。語篇語料條目少,可以手動(dòng)重命名,但音系例字拆分后的視頻文件累計(jì)上千個(gè)(4位發(fā)言人,每人337個(gè)音系例字),手動(dòng)重命名顯然不可行。視頻文件拆分、合并保存時(shí)已進(jìn)行了有順序的臨時(shí)命名,且文件數(shù)量、排列順序與采錄文本一致,因此,可以采用DOS批處理文件進(jìn)行批量重命名。
利用Excel編寫重命名命令,第一行為表頭,A列為“視頻拆分、合并后的文件名”,B列為“采錄文本規(guī)定的文件名”,C列為編寫的重命名命令(如圖1所示)。首先確保A列內(nèi)容與現(xiàn)有視頻文件名和順序完全對應(yīng);采錄文本規(guī)定的文件名是完全按順序編號的,因此,采用Excel的拖拽填充功能完成B列的輸入;切換至英文輸入狀態(tài),在C2單元格中輸入公式:="ren "&A2&".mpg "&B2&".mpg",“ren”是DOS重命名命令,“&”是Excel中的文本運(yùn)算符,回車后C2單元格顯示內(nèi)容為“ren 老男單字視頻1.mpg 10001lm.mpg”,其意思是將“老男單字視頻1.mpg”重命名為“10001lm.mpg”,C列其他單元格采用Excel的拖拽填充功能完成輸入。從C2到C338單元格的內(nèi)容均為DOS重命名命令,將該部分內(nèi)容復(fù)制到記事本,執(zhí)行菜單命令“文件—保存”,指定擴(kuò)展名為“.bat”,文件類型選擇所有文件,如保存為“批量重命名.bat”,將文件保存到整理后的視頻文件所在文件夾,然后以管理員身份運(yùn)行該文件即可完成批量重命名。
圖1 利用Excel編寫重命名命令
經(jīng)過上述處理后,視頻文件完全符合采錄文本的規(guī)范要求。
目前攝像機(jī)的分辨率主要有全高清(Full HD 1 920×1 080)、高清(HD 1 280×720)和標(biāo)清(SD 720×576)三種,三者的寬高比、畫面大小和呈現(xiàn)的內(nèi)容存在明顯差別(如圖2所示)。攝像機(jī)選用不合適或者拍攝參數(shù)設(shè)置不當(dāng)都會(huì)導(dǎo)致分辨率不符合要求。雖然后期可以通過技術(shù)處理調(diào)整分辨率,但一般只能將較高的分辨率調(diào)整為較低的分辨率,當(dāng)將較低的分辨率調(diào)高時(shí)會(huì)引起畫面清晰度下降、畫面比例失調(diào)、背景不一致或產(chǎn)生黑邊等問題。
圖2 不同分辨率的視頻畫面對比示意圖
語料庫建設(shè)過程中,要求采錄各種視頻文件,不僅是為了完成“語言資源匯聚”和項(xiàng)目建設(shè)任務(wù),同時(shí)也是對語言資源的一種保護(hù)、搶救和傳承?!罢Z保工程”已明確要求采用全高清模式錄制,其他項(xiàng)目雖然沒有明確要求,但應(yīng)采用盡可能高的標(biāo)準(zhǔn)進(jìn)行錄制,這樣既保存了較高標(biāo)準(zhǔn)的原始資料,可以確保若干年后視頻技術(shù)標(biāo)準(zhǔn)仍不落后,也為后續(xù)的技術(shù)處理提供了更多的可能,如調(diào)整分辨率、截取局部畫面內(nèi)容等。
語料庫項(xiàng)目視頻資源采錄技術(shù)標(biāo)準(zhǔn)和規(guī)范要求雖然對拍攝背景和取景范圍(景別)進(jìn)行了限定,但未對視頻畫面的構(gòu)圖提出明確的要求。構(gòu)圖合理是一個(gè)主觀的概念,合理與否也是相對的,難以統(tǒng)一要求,“讓大多數(shù)人看著舒服”是一個(gè)基本的標(biāo)準(zhǔn)。單人發(fā)音時(shí)最理想的構(gòu)圖是新聞聯(lián)播主持人單人播音時(shí)的畫面構(gòu)圖,雙人發(fā)音的構(gòu)圖則可對應(yīng)新聞聯(lián)播開始和結(jié)束時(shí)兩位主持人播音的畫面,多人發(fā)音時(shí)可參照雙人發(fā)音進(jìn)行構(gòu)圖。
對于構(gòu)圖不合理的視頻文件,在不影響畫面質(zhì)量的前提下,可以通過適當(dāng)?shù)募夹g(shù)處理進(jìn)行微調(diào),但當(dāng)技術(shù)處理對畫質(zhì)產(chǎn)生明顯影響時(shí)只能重新拍攝。構(gòu)圖不合理最常見的情形是發(fā)音人在畫面中所占的比例較低、人物偏小,對此類情況,除非降低分辨率,否則進(jìn)行技術(shù)處理時(shí)會(huì)嚴(yán)重影響畫面質(zhì)量。例如,某調(diào)查點(diǎn)采用全高清模式錄制的“有聲數(shù)據(jù)庫”視頻文件中,發(fā)音人在畫面中所占的比例明顯偏低(如圖3所示),由于其錄制的原始視頻文件分辨率為1 920×1 080,而“有聲數(shù)據(jù)庫”要求編輯輸出時(shí)采用720×576的分辨率,因此可以通過對畫面進(jìn)行裁剪,獲得構(gòu)圖合理且符合技術(shù)要求的視頻文件(如圖4所示)。相同的情況,對“語保工程”而言只能重新錄制,因?yàn)椤罢Z保工程”要求視頻文件的分辨率為1 920×1 080,后期調(diào)整構(gòu)圖時(shí)需要對視頻畫面進(jìn)行放大處理,會(huì)對畫質(zhì)產(chǎn)生明顯影響。
圖3 構(gòu)圖不合理的原始全高清視頻畫面(截圖)
圖4 裁剪后的標(biāo)清視頻畫面(截圖)
后期技術(shù)處理是對錄制內(nèi)容的刪減、修補(bǔ)和美化,是將前期錄制內(nèi)容按要求進(jìn)行整合處理的過程,也是視頻制作的最后一個(gè)流程。對影視藝術(shù)作品而言,后期技術(shù)處理是十分重要的,可以彌補(bǔ)前期拍攝的不足、制作完成前期無法拍攝或錄制的內(nèi)容,如添加字幕和各種特效、人物與特定場景合成等。語料庫項(xiàng)目建設(shè)中采錄的視頻是對語言資源的一種實(shí)錄,需要記錄語言的實(shí)際情況,后期技術(shù)處理主要是確保技術(shù)標(biāo)準(zhǔn)符合項(xiàng)目建設(shè)要求,同時(shí)刪減各種多余內(nèi)容、口誤和不準(zhǔn)確、不規(guī)范、不美觀的內(nèi)容,不宜進(jìn)行過多的技術(shù)處理,更不宜添加特效。
視頻文件已成為語料庫的重要組成部分,采用數(shù)字視頻技術(shù)進(jìn)行語料錄制并對錄制后的視頻文件進(jìn)行適當(dāng)技術(shù)處理,不僅可以確保視頻文件符合語料庫建設(shè)要求,同時(shí)對語料庫的建設(shè)和研究成果的推廣、對語言資源的發(fā)掘和保護(hù)都具有重要意義。
[1] 中國社會(huì)科學(xué)院語言研究所.中國語言學(xué)年鑒:1999-2003[M].北京:商務(wù)印書館,2006:363-385.
[2] 中國語言資源有聲數(shù)據(jù)庫建設(shè)領(lǐng)導(dǎo)小組辦公室.中國語言資源有聲數(shù)據(jù)庫調(diào)查手冊?漢語方言[S].北京:商務(wù)印書館,2010.
[3] 教育部語言文字信息管理司,中國語言資源保護(hù)研究中心.中國語言資源調(diào)查手冊?漢語方言[S].北京:商務(wù)印書館,2015.