孫滔
我們的語(yǔ)言不僅僅是一種交流工具,它還是一種數(shù)學(xué),一種信息科學(xué)。當(dāng)我們?cè)谶M(jìn)行語(yǔ)言表達(dá)時(shí),音節(jié)是我們的信息編碼單元,是可以用信息最小單位“比特”來(lái)衡量的。這些音節(jié)將我們要表達(dá)的信息傳遞給討論對(duì)象,并進(jìn)一步降低了表達(dá)主題的不確定性。
新的研究給出了人類(lèi)不同語(yǔ)言信息傳輸效率比較的數(shù)學(xué)計(jì)算結(jié)果。這是一個(gè)奇特的數(shù)學(xué)研究結(jié)論:盡管人類(lèi)的語(yǔ)言種類(lèi)成千上萬(wàn),但他們不約而同選擇了同樣的信息傳輸速度,即39.15bit/s。
顯然,這個(gè)速度與我們目前的電腦效率不可同日而語(yǔ),要知道,1959年第一臺(tái)計(jì)算機(jī)的傳輸速度為每秒110比特,而今天的家庭互聯(lián)網(wǎng)帶寬為100兆(1億比特)。然而這個(gè)研究似乎意味著,39.15bit/s的語(yǔ)言信息傳輸效率是人類(lèi)進(jìn)化的必然,是一個(gè)最佳的結(jié)果。
這個(gè)研究來(lái)自法國(guó)里昂大學(xué)Franois Pellegrino團(tuán)隊(duì),該研究成果以題為《不同的語(yǔ)言,接近的編碼效率:跨種族信息交流的效率比較》發(fā)表在9月4日的《科學(xué)進(jìn)展》上。
人類(lèi)的各種語(yǔ)言之間有巨大的差異,這些語(yǔ)言的音素(Phoneme)數(shù)量、音節(jié)數(shù)量和音高復(fù)雜性迥異。研究人員分析了包括英語(yǔ)、日語(yǔ)、普通話和廣東話在內(nèi)的17種語(yǔ)言的音節(jié)信息密度,讓每種語(yǔ)言的母語(yǔ)使用者朗讀15篇同一文章的不同譯本(每種語(yǔ)言10人,共計(jì)170人),受試者被要求熟悉這些文本,然后以舒適的節(jié)奏和清晰的發(fā)音來(lái)大聲朗讀。
結(jié)果發(fā)現(xiàn),盡管人們的講話速度各異,但口語(yǔ)信息密度高的語(yǔ)言使用者的語(yǔ)速較慢。那么,一個(gè)奇妙的結(jié)果就出現(xiàn)了:巴斯克語(yǔ)的音節(jié)信息密度為4bit,而越南語(yǔ)的音節(jié)信息密度為8bit,而巴斯克語(yǔ)的語(yǔ)速為平均每秒八個(gè)音節(jié),而越南語(yǔ)的語(yǔ)速平均每秒五個(gè)音節(jié)。也就是說(shuō),信息密度的大的語(yǔ)言表達(dá)速度更慢,信息密度小的語(yǔ)言表達(dá)速度更快??偟膩?lái)說(shuō),這些不同語(yǔ)言的信息傳輸速度是接近的。
換個(gè)例子而言,英語(yǔ)的音節(jié)多達(dá)6949個(gè),而日語(yǔ)的音節(jié)只有643個(gè),也就是說(shuō),每個(gè)日語(yǔ)音節(jié)相當(dāng)于11個(gè)英語(yǔ)音節(jié)之多,但日語(yǔ)的表達(dá)速度并不比英語(yǔ)表達(dá)速度高出多少。
語(yǔ)言是人類(lèi)相互之間的信息交流方式
為何會(huì)有這么巧合的結(jié)果呢?研究人員推測(cè)說(shuō),人類(lèi)的大腦結(jié)構(gòu)是類(lèi)似的,發(fā)音器官也很接近,那么我們對(duì)語(yǔ)言的理解能力也就相似。作者之一Dan Dediu猜測(cè)說(shuō),這可能與腦電波頻率有關(guān)。
一個(gè)可以理解的解釋是,我們的語(yǔ)言表達(dá)難以兼顧語(yǔ)速和信息密集,因?yàn)閮烧呓Y(jié)合帶來(lái)的信息高通量對(duì)于發(fā)言者的表達(dá)能力與聽(tīng)者的接受能力都是巨大挑戰(zhàn)。
作者認(rèn)為,這個(gè)研究結(jié)果是發(fā)言者在其母語(yǔ)語(yǔ)言結(jié)構(gòu)特性與交際壓力下的神經(jīng)認(rèn)知和生物學(xué)的反饋,也就是說(shuō),語(yǔ)言是一種交流環(huán)境中生物學(xué)、環(huán)境學(xué)和文化環(huán)境多尺度的進(jìn)化產(chǎn)物。
高智商的人會(huì)邁過(guò)39.15比特門(mén)檻嗎?對(duì)于這個(gè)問(wèn)題,論文的第一作者、香港大學(xué)的Christophe Coupe博士在接受媒體采訪時(shí)表示了謹(jǐn)慎的態(tài)度。他認(rèn)為都有可能,是值得進(jìn)一步研究的問(wèn)題。
不過(guò)他說(shuō),沒(méi)有調(diào)查就沒(méi)有發(fā)言權(quán),對(duì)于此問(wèn)題,需要調(diào)查很多樣本,分析語(yǔ)速(信息率與智商之間的關(guān)聯(lián)),并且這還可能需要調(diào)查包括認(rèn)知、社交在內(nèi)的其他變量。
Christophe Coupe博士關(guān)注語(yǔ)言進(jìn)化和語(yǔ)言多樣性研究,特別是以計(jì)算方法和統(tǒng)計(jì)方法來(lái)研究語(yǔ)音。他于2003年在里昂大學(xué)獲得認(rèn)知科學(xué)博士學(xué)位,之后他在法國(guó)國(guó)家科學(xué)研究中心(CNRS)擔(dān)任研究員,最近加入了香港大學(xué),目前希望利用數(shù)據(jù)科學(xué)來(lái)探索語(yǔ)言多樣性。
那么,對(duì)于目前熱門(mén)的腦機(jī)接口研究有什么啟示呢?腦機(jī)接口解碼的效率是否會(huì)突破人類(lèi)大腦生物學(xué)的局限并實(shí)現(xiàn)更高的效率?換句話說(shuō),腦機(jī)接口的解碼效率是否受限于39.15 bit/s?
對(duì)此,Christophe Coupe博士同樣表示出科學(xué)家的嚴(yán)謹(jǐn)。他說(shuō),這是一個(gè)令人著迷的問(wèn)題,但目前沒(méi)有答案,并且還需要很長(zhǎng)的時(shí)間才可能有進(jìn)展。
不過(guò)腦機(jī)接口研究終究會(huì)推動(dòng)我們對(duì)語(yǔ)言發(fā)生和處理過(guò)程的深入了解。Chfistophe Coupe認(rèn)為,腦機(jī)接口在近年來(lái)有了巨大進(jìn)步,只是我們對(duì)大腦和語(yǔ)言處理的理解還很有限。
Christophe Coupe強(qiáng)調(diào)說(shuō),因?yàn)檎Z(yǔ)言的個(gè)體差異很大,語(yǔ)言的測(cè)量研究需要大量實(shí)驗(yàn)來(lái)推動(dòng)。
對(duì)于39.15bit/s語(yǔ)言傳輸效率的研究,研究人員準(zhǔn)備將研究范圍擴(kuò)展到非洲、美洲和巴布亞新幾內(nèi)亞的語(yǔ)言。語(yǔ)言種類(lèi)越多,這個(gè)研究的普適性會(huì)更強(qiáng)。 (摘自美《深科技》)(編輯/華生)