□ 祝傳海
工作中的曾兵
一切回歸得那么自然,就像溪水流向湖泊、山巒聳入云霧,世界知名的圖像與視頻處理專家曾兵,在縱橫四海20余年后,將自己的事業(yè)完美地嵌入了母校。此時(shí),他已是中、美、歐、日、韓等國8項(xiàng)專利的擁有者、國家“千人計(jì)劃”特聘專家以及多個(gè)著名國際會(huì)議和頂級國際期刊的核心成員。
2015年4月,在電子科技大學(xué)的國際青年論壇上,曾兵這樣描述回歸后的生活:“這是一個(gè)令人激動(dòng)的時(shí)代,國家的發(fā)展正在逐步引領(lǐng)世界大潮,我們有幸能夠投入其中。在這樣一種環(huán)境中,你停不下來,因?yàn)槟惆l(fā)現(xiàn),總有這么一種催人奮進(jìn)的號(hào)角在鞭策你前行?!?/p>
穿著得體、氣宇軒昂,他在講臺(tái)中央向世界微笑,代表自己,也代表浪潮之巔的民族科技力量。
銀杏、白鷺、花海、湖光。電子科技大學(xué)拉開了與鬧市的距離,清雅中更可窺見學(xué)術(shù)空間的獨(dú)立與開闊。
1979年,年僅15歲的高考狀元曾兵,進(jìn)入這所學(xué)校的前身——成都電訊工程學(xué)院?!爱?dāng)時(shí)報(bào)考國內(nèi)任何一所高校都可以去,不過家人不愿意放手讓我出去闖蕩,就留在了成都,成電的電訊電子專業(yè)是出類拔萃的?!?/p>
本科、碩士、留校任教……水到渠成。早慧少年成長為青年學(xué)者,世俗自有一套平穩(wěn)妥帖的成功標(biāo)準(zhǔn),但是逮到一個(gè)機(jī)會(huì),曾兵還是“跑”了。1988年,他放棄了母校的教職,進(jìn)入芬蘭坦佩雷理工大學(xué),攻讀博士學(xué)位。之后先后進(jìn)入加拿大多倫多大學(xué)、蒙特利爾協(xié)和大學(xué)做博士后研究?!澳莻€(gè)時(shí)代,國內(nèi)的信息還不夠靈通,畢竟跟外面脫節(jié)了這么多年,圖書館查到的資料也相對落后。我們當(dāng)年的導(dǎo)師追求是很高的,但他們能帶出來的一些研究方向和題目并不一定跟國際前沿吻合。我們到了國外很快就眼睛大亮,別人在做什么我們終于清楚了?!?/p>
1993年,在奠定了一定的研究基礎(chǔ)之后,曾兵加入了香港科技大學(xué),先后擔(dān)任電子及計(jì)算機(jī)工程系助理教授、副教授、教授,期間,還在微軟中國研究院任研究員。在香港的20年,他培養(yǎng)出數(shù)十位博士、碩士生,主持多項(xiàng)香港重大科研項(xiàng)目,擁有各國專利8項(xiàng),在國際會(huì)議和學(xué)術(shù)刊物上發(fā)表論文200多篇,論文被引用3000多次。
沒有成就是一蹴而就的,具備了國際視野,捕捉前沿和熱點(diǎn)會(huì)更加輕松,但這才只是戰(zhàn)役的第一槍,曠日持久的研究容易讓人感到疲憊,最重要的就是“興趣”“堅(jiān)持”“堅(jiān)持有興趣”。
曾兵的研究方向?qū)儆谛盘?hào)處理范疇,與其他領(lǐng)域不同,信號(hào)處理自打問世以來,似乎就從未經(jīng)歷過“寂寥”,巨大的應(yīng)用價(jià)值,讓它一直站在前沿探索的風(fēng)口浪尖上。在進(jìn)入這一研究領(lǐng)域之后,首先需要面臨方向選擇,曾兵介紹說:“一個(gè)是做語言、語音,一個(gè)就做圖像,基本上是這兩個(gè)。我做過一段時(shí)間的語音信號(hào),但是覺得好像沒有圖像過癮,既可以拿出來看,又可以播放,所以雖然語音研究也非常重要,但當(dāng)時(shí)還是因?yàn)楦猛妗x擇了圖像視頻方面的處理研究。開始也做過廣義的圖像處理,后來比較專注在圖像和視頻信號(hào)的編碼這個(gè)方面。由于圖像視頻的數(shù)據(jù)量特別大,所以幾十年來,可以說是一個(gè)從未冷卻的研究焦點(diǎn)。到今天其實(shí)我自己還是挺喜歡做這方面研究的,我經(jīng)常跟學(xué)生聊,我說你們要想跟我做研究,除了不錯(cuò)的專業(yè)成績,更重要的就是看你能夠奮斗到什么程度、能夠投入多少時(shí)間和精力。我自己現(xiàn)在回過頭去總結(jié),感到人不管待在哪里,或是做什么領(lǐng)域,真的是堅(jiān)持20年沒有放棄,才會(huì)有收獲。從開始讀書,到留在學(xué)校搞科研,我們從來沒有一天敢懈怠。”
在香港的20年,曾兵的研究主要圍繞著圖像視頻的壓縮編碼展開,因?yàn)椤澳阆雮鬏敾蛘弑4?,必須要做壓縮,尤其是視頻信號(hào),從第一代的國際標(biāo)準(zhǔn)到幾年前最新的一版,經(jīng)歷了多次更迭?!痹诰幋a的多次更迭間,幾大亮點(diǎn)成果讓國際同行牢牢記住了曾兵的名字。
指導(dǎo)學(xué)生
20世紀(jì)90年代,先是一篇關(guān)于視頻編碼中快速運(yùn)動(dòng)估計(jì)的論文引起了廣泛關(guān)注,當(dāng)時(shí)被SCI引用超過650次。“視頻編碼翻譯里面有一個(gè)問題,每一幀和每一幀之間物體都有一個(gè)運(yùn)動(dòng),比如說人在動(dòng)、車在動(dòng)。那么拍視頻的時(shí)候,當(dāng)前幀和后面的那些幀,只要抓住人或車的運(yùn)動(dòng)信息,下一幀我就可以只編這一部分了,不動(dòng)的地方能夠節(jié)約很多的資源。”為了估計(jì)視頻中事物的運(yùn)動(dòng)信息,曾兵在國際同行中第一次提出了中心偏向的搜索模型,由此開發(fā)出一種模塊式的快速運(yùn)動(dòng)估計(jì)算法。這一算法的問世,成為視頻編碼處理領(lǐng)域的標(biāo)志性節(jié)點(diǎn),整個(gè)估計(jì)運(yùn)動(dòng)信息領(lǐng)域,都受到了新概念、新思路的影響,此后國際上基本所有相關(guān)工作都會(huì)與這個(gè)算法做比較。由于運(yùn)算又快、信息又很穩(wěn)健,即使多年后的今天,國內(nèi)外的同行也都對這項(xiàng)算法評價(jià)極高,這一奠基式工作也毫無爭議地確立了曾兵在領(lǐng)域內(nèi)的國際地位。
2008年,曾兵帶領(lǐng)課題組開發(fā)出了一種全新的、智能化的補(bǔ)缺技術(shù),大大提高了編碼效率。在同樣的編碼率下,編碼質(zhì)量比MPEG-4使用的補(bǔ)缺技術(shù)可以提高3~8dB,自此填補(bǔ)了MPEG-4標(biāo)準(zhǔn)中的一項(xiàng)國際空白,由此申請的專利成功地轉(zhuǎn)讓給了一家美國公司。
此后不久,他再接再厲提出了精細(xì)可分級的視頻編碼及傳輸中的多個(gè)算法、開發(fā)出了多碼流間的無縫切換技術(shù),并在國際上首次提出了帶方向性的二維變換框架。其中,關(guān)于方向性二維變換的論文,在國際著名學(xué)者、被稱為“離散余弦變換之父”的美國教授K.R.Rao推薦下,獲得了2011年度最佳期刊論文獎(jiǎng),這項(xiàng)含金量極高的榮譽(yù)再次引起了國際同行的集體矚目。
“這個(gè)工作其實(shí)也是針對圖像視頻編碼的,我們要做一個(gè)變換,編碼壓縮不在像素域上做,而是要進(jìn)到平域里面去做一個(gè)變換。那么,圍繞做這個(gè)問題,70年代中就提出了一個(gè)離散余弦變換,這個(gè)變換是非常有名的,此后三四十年人們都在使用。但是,2008年我們提出了一種新的變換,在大量的實(shí)驗(yàn)基礎(chǔ)上,對離散余弦變換進(jìn)行改進(jìn)。它的改進(jìn)原因其實(shí)很簡單,比如說圖像里面有一個(gè)水平方向的物體,如果我把這個(gè)物體移一下位,移成一個(gè)對角方向的話,以前那個(gè)變換基本上不考慮方向性,我們在這個(gè)變換里就把各個(gè)方向性考慮進(jìn)去了,不僅是垂直水平,還包括對角等各個(gè)方向性。所以,它一下子變換的效果真的就提升了。這篇文章被離散余弦變換的創(chuàng)始人看到了,他說這個(gè)東西很好,就來幫我們提名,經(jīng)過了大概三輪的評比,很順利地獲得了最佳論文獎(jiǎng)。”
旁人眼中的功成名就,不能成為曾兵堅(jiān)守的理由,在香港任教20年后,他想到了回歸——回到大陸、回到成都、回到母校那個(gè)孕育了激情與夢想的地方。主場優(yōu)勢將帶來更多的可能,這是他做出選擇的唯一理由。
實(shí)現(xiàn)夢想的第一步,是組建團(tuán)隊(duì)。在曾兵眼中,近親繁殖的團(tuán)隊(duì),是很難取得突破的:“學(xué)生再怎么琢磨,留在一個(gè)團(tuán)隊(duì)中也很難超過老師本人,他在固定的框架下會(huì)畏首畏尾,包括做研究的方式、想問題的方式都很可能被禁錮,所以,我的團(tuán)隊(duì)基本都是來自不同院校的拔尖人才?!?/p>
在打造創(chuàng)新型骨干團(tuán)隊(duì)的同時(shí),圍繞新一代圖像與視頻信號(hào)采集、壓縮處理、傳輸和顯示技術(shù)的研究開發(fā),曾兵對電子科技大學(xué)原有的圖像處理與信息安全、智能視覺信息處理與通信等研究團(tuán)隊(duì)進(jìn)行了充分了解,達(dá)成了相通性和互補(bǔ)性的統(tǒng)一,然后細(xì)致地描繪出了自己的研究藍(lán)圖。
首先就是采用壓縮感知的圖像與視頻信號(hào)采集和重建技術(shù)。壓縮感知可以說是近10年來信號(hào)處理領(lǐng)域炙手可熱的課題了,曾兵介紹道:“原理是任何圖像在一定程度上都具有稀疏特性,于是我們可以選用遠(yuǎn)低于Nyquist采樣率進(jìn)行信號(hào)采集,同時(shí)保證足夠好的重建質(zhì)量。在這一部分工作中,我們將通過設(shè)計(jì)最適應(yīng)的采樣矩陣、找尋最佳的變換等方法,開發(fā)一種多輪次的壓縮感知信號(hào)采集技術(shù)及其相關(guān)的重建算法,也希望能通過相應(yīng)研究,重建高清的三維圖像?!?/p>
學(xué)術(shù)講座
同時(shí),遲緩迭代的技術(shù)也引起了曾兵的關(guān)注。舉個(gè)例子,仔細(xì)觀察常用的圖像與視頻編碼的原理框圖時(shí),能見到許多必不可少的基本構(gòu)造塊,比如二維變換、量化器、運(yùn)動(dòng)估計(jì)與補(bǔ)償、可變長度熵編碼等,而這些基本構(gòu)造塊中所使用的技術(shù)在過去幾十年里幾乎都沒有任何變化,如果這些構(gòu)造塊中所使用的技術(shù)繼續(xù)用下去,將很難進(jìn)一步提高其編碼的性價(jià)比。因此,他將攻克智能化圖像與視頻信號(hào)壓縮技術(shù)放入了科研日程,以期從智能化的角度,重新關(guān)注圖像與視頻編碼中的一些基本構(gòu)造塊,包括智能化的變換、智能化的量化器、智能化的運(yùn)動(dòng)補(bǔ)償?shù)?,從根本上突破使已使用了幾十年的傳統(tǒng)圖像與視頻編碼術(shù),最大程度地提高編碼的性價(jià)比。
再比如,盡管今天的互聯(lián)網(wǎng)變革看似日新月異,但圖像或視頻數(shù)據(jù),即使是高度壓縮后還是占據(jù)大量空間,在互聯(lián)網(wǎng)上更有效地“流播”圖像和視頻數(shù)據(jù)一直是網(wǎng)絡(luò)運(yùn)營商重點(diǎn)關(guān)心的問題。由此,曾兵準(zhǔn)備帶領(lǐng)團(tuán)隊(duì)全力應(yīng)對這一高難度挑戰(zhàn),應(yīng)用近幾年初步發(fā)展起來的網(wǎng)絡(luò)編碼技術(shù),對下一代互聯(lián)網(wǎng)中圖像或視頻傳輸?shù)南嚓P(guān)問題提供更好的解決方案。
與此同時(shí),曾兵還注意到,現(xiàn)代網(wǎng)絡(luò)傳輸中從總服務(wù)器到用戶終點(diǎn)幾乎不會(huì)是點(diǎn)對點(diǎn)的連接,而是需要通過路由、中繼、本地服務(wù)器等許多中間節(jié)點(diǎn)的,針對這一拓?fù)浣Y(jié)構(gòu),過去10來年人們開發(fā)了網(wǎng)絡(luò)編碼技術(shù),試圖取代現(xiàn)有的“接收和發(fā)送”方式。如果以此為目的,一種簡單的技術(shù)是在一個(gè)中間節(jié)點(diǎn)對接收到的兩組二進(jìn)制信息流作“異或”運(yùn)算,在今天的網(wǎng)絡(luò)傳輸中,幾乎每一個(gè)中間節(jié)點(diǎn)都具備了較強(qiáng)的計(jì)算和儲(chǔ)存功能。于是可以對接收到的圖像和視頻數(shù)位流進(jìn)行部分解碼,然后研發(fā)出一種“高級”的新型網(wǎng)絡(luò)編碼技術(shù)。據(jù)估計(jì),這種新型網(wǎng)絡(luò)編碼技術(shù)和基于“異或”運(yùn)算的技術(shù)比較,可以節(jié)約高達(dá)50%的信息量傳輸,人們可以真正進(jìn)入網(wǎng)絡(luò)傳輸?shù)摹案咚俟贰薄?/p>
在已有的研究基礎(chǔ)上,他準(zhǔn)備再進(jìn)行深入整合,比如在圖像與視頻信號(hào)源編碼方面,人們已開發(fā)出了幾類適合于各種網(wǎng)絡(luò)上傳輸?shù)膱D像與視頻信號(hào)源編碼表示技術(shù),包括可伸縮編碼、多描述編碼和多碼率編碼。曾兵的前期工作已經(jīng)奠定了堅(jiān)實(shí)的基礎(chǔ),包括10余篇論文和幾個(gè)已申請授權(quán)的專利。未來,他的關(guān)注點(diǎn)基本圈定在盡可能全面地結(jié)合傳輸網(wǎng)絡(luò)的結(jié)構(gòu)、功能和特性來選擇最佳的信號(hào)源編碼技術(shù),同時(shí)研究在網(wǎng)絡(luò)有損場景下的有效補(bǔ)救方法。
當(dāng)圖像和視頻處理技術(shù)開始狂歡,當(dāng)電視、電影、互聯(lián)網(wǎng)等媒介利用目不暇接的視覺影像以咄咄逼人的氣勢闖入我們的生活,一個(gè)千真萬確的“大圖像”時(shí)代來臨了。如同哈佛大學(xué)教授丹尼爾·貝爾所言:“聲音和景象,尤其是后者,組織了美學(xué),統(tǒng)率了觀眾?!钡?,民眾感官上的繁榮并非科研工作者探索世界的主要目的,在曾兵眼中,實(shí)用價(jià)值需要來得更猛烈些。
專業(yè)研究在醫(yī)學(xué)上的應(yīng)用,首先牽引了曾兵的目光,“醫(yī)學(xué)上有一個(gè)胃窺鏡系統(tǒng),檢查腸胃直接從食管進(jìn)去或者從肛門插一個(gè)導(dǎo)線的管進(jìn)去,進(jìn)入人的胃部腸部照相,再把這個(gè)圖像、視頻拿出來。檢查過程其實(shí)人非常痛苦,所以這也是我們目前的一項(xiàng)重點(diǎn)工作”。
目前檢查有一種新型手段是用無線傳輸膠囊,最近幾年進(jìn)入了臨床。病人吞下這個(gè)藥片,在體內(nèi)留6個(gè)小時(shí)。藥片可以照相,可以無線傳輸圖像,每秒能照兩到三幀,整個(gè)檢查過程要四到六萬張照片。但這個(gè)藥片的問題在于最高的分辨率很低,而且在胃和腸道里膠囊的運(yùn)動(dòng)無法人工控制,缺失大量姿態(tài)角度的信息。雖然這些圖片在時(shí)間上是連續(xù)采集,但兩個(gè)連續(xù)的圖片之間,內(nèi)容上大多沒有相關(guān)性。曾兵介紹說:“我們主要瞄準(zhǔn)兩個(gè)方向,胃鏡我們瞄準(zhǔn)了其胃部的圖像,無線膠囊我們瞄準(zhǔn)的是腸道的。這個(gè)圖像拿出來以后進(jìn)行分類,剔除很多沒有用的圖,再做高分辨率的成像。”
此外,當(dāng)日新月異的科技變革吹皺了圖像與視頻處理領(lǐng)域的春水,曾兵的研究,當(dāng)然不止于從二維圖像到三維圖像的應(yīng)用研究,“可視”大數(shù)據(jù)逐漸吸引了他的目光。
團(tuán)隊(duì)合影
“現(xiàn)在我們的圖像還只是一個(gè)平面的二維圖片,加上時(shí)間以后,成為三維的。如果說我們把這個(gè)場景中物體離相機(jī)的距離信息加進(jìn)去的話,那就是四維的東西。然后,還可以加,光照射這個(gè)物體基本上有兩個(gè)角度,一個(gè)經(jīng)度角,一個(gè)緯度角,就成了六維的東西。紅橙黃綠青藍(lán)紫連續(xù)的光譜多保留一些點(diǎn),就是七維函數(shù),所以,這個(gè)七維函數(shù)你可以想象,它這個(gè)數(shù)據(jù)量是極其龐大的大數(shù)據(jù)。如果把這個(gè)大的圖像數(shù)據(jù)壓縮成以前的十分之一、百分之一,就真的可以從定性上判斷出一種趨勢,比如可以呈現(xiàn)交通在哪里堵塞,或者供政府做一些決策性的分析?!?/p>
與曾兵同行的,不光是自己的科研團(tuán)隊(duì),還包括了世界知名的企業(yè)。在香港時(shí),曾兵跟微軟合作進(jìn)行了很多專利研究,華為公司也曾邀請他參與一些顧問項(xiàng)目,回到成都之后,華為迅速將一個(gè)專利開發(fā)項(xiàng)目交給了曾兵的科研團(tuán)隊(duì)。毫不夸張地說,這是目前在多媒體領(lǐng)域國內(nèi)高校承擔(dān)的最大的項(xiàng)目,沒有之一。
曾兵介紹說:“工作內(nèi)容主要還是圍繞著下一代的視頻編碼國際標(biāo)準(zhǔn)做一些前瞻性的研究,積累一些核心技術(shù)。目前國際視頻編碼標(biāo)準(zhǔn)包括兩代,一個(gè)叫H.264,另一個(gè)叫H.265,華為都已經(jīng)介入了,但是由于核心的專利技術(shù)不夠多,所以還是被高通、三星控制著。所以,華為希望能夠主導(dǎo)下一代新的標(biāo)準(zhǔn),我們預(yù)計(jì)今后兩年開展工作,一定要幫我們的民族品牌搶占主導(dǎo)地位?!?/p>
就像俄羅斯詩人馬雅可夫斯基所說的那樣——“我們感激燈塔,因?yàn)樗鼮橐估镫y以出航的人,用火光照亮前路?!痹臒羲P(guān)乎夢想、關(guān)乎機(jī)遇,也關(guān)乎反哺祖國的赤子之心,而他的堅(jiān)守,也將為新一輪科技革新指明行路。