本刊記者 范國軒
靜心做科研 追逐數(shù)理的風景
——記北京大學數(shù)學科學學院特聘研究員蔡云峰
本刊記者 范國軒
在美國大蒂頓國家公園
若仔細算來,我國“算學”的概念由來以久。《九章算術》中的方程術、正負術,劉徽的割圓術,以及《數(shù)書九章》中的大衍求一術等,古人較早地將這些算法隔頁而立,任憑它們在歲月的洪流中翻滾、沖蕩。
與中國古代“算法”“算術”的興起和含義有所不同,現(xiàn)代計算數(shù)學是在1946年世界第一臺電子計算機問世之后,建立在馮·諾依曼和他的同事起草并向美國海軍部遞交的一份報告《高階線性方程組的解》之上。正是這份報告,標志了計算數(shù)學或者叫數(shù)值分析作為一門獨立的學科正式誕生。
“計算數(shù)學屬于一個比較傳統(tǒng)、基礎的方向,同時也是很重要的發(fā)展方向?!北本┐髮W數(shù)學科學學院特聘研究員蔡云峰的觀點是,“初入計算數(shù)學這道門,有一定的數(shù)學功底就能夠讀懂一些,但若要深入其中就會發(fā)現(xiàn)它的博大精深,需要多方面的基礎作為研究保障。”
歷經(jīng)半個世紀的打磨,伴隨著現(xiàn)代科技發(fā)展迭起的數(shù)據(jù)噴薄現(xiàn)象,計算數(shù)學作為行之有效的研究問題的方法論,在工業(yè)、農(nóng)業(yè)、交通運輸業(yè)以及醫(yī)療衛(wèi)生、文化教育等行業(yè)有著廣泛且實用的價值前景。
“在大數(shù)據(jù)時代,傳統(tǒng)的將數(shù)據(jù)轉(zhuǎn)化為向量或矩陣的方式限制了人們處理數(shù)據(jù)的能力,人們亟需更多處理數(shù)據(jù)的工具。當前,越來越多的學者在以相反的方式來處理數(shù)據(jù)——將數(shù)據(jù)張量化,進而利用張量分解工具來處理數(shù)據(jù)。”據(jù)蔡云峰介紹,在過去的20年里,張量分解被成功應用到各個領域,多種基于優(yōu)化的方法被提出,多個軟件被開發(fā)。當然在發(fā)展過程中,基于優(yōu)化的方法也遇到了不容忽視的各類問題,例如沒有好的初解,方法可能會收斂緩慢,甚至是收斂到退化解。
代數(shù)方法作為一種證明方法,是把證明過程轉(zhuǎn)換為代數(shù)式之間的推導和計算。它可以完全克服優(yōu)化類方法所遇到的上述問題,并且可以深入挖掘張量的更多特性。蔡云峰對于張量分解代數(shù)方法積累了豐富的研究經(jīng)驗,在矩陣聯(lián)合塊對角化(簡稱JBD,是三階張量的一種分解)的研究中,他針對JBD/盲JBD問題在盲源信號分離、獨立成分分析中的應用,結合傳統(tǒng)求解方法(即要么將盲JBD問題當作聯(lián)合對角化問題來求解,利用重排矩陣恢復塊對角矩陣結構;要么基于C*代數(shù),求解盲JBD問題的正交解),提出了新的代數(shù)方法。
新方法解決了傳統(tǒng)方法中缺乏理論保證和問題范圍受限的難點?;谒⒗碚摱鴮С龅腜EAR算法,不但簡單、易于編程,還在實際數(shù)值模擬中表現(xiàn)出高效、穩(wěn)定等優(yōu)點?;诰仃嚨哪撤N可交換性,蔡云峰開創(chuàng)性、嚴格地給出了盲JBD問題解的存在性、唯一性的充分必要條件。在該條件的基礎上對JBD問題進行擾動分析,得出全新的、富有啟發(fā)性的結論,對實際應用中的噪聲高抗性研究意義重大。
“知之者不如好知者,好知者不如樂知者?!睉{借著對數(shù)學與生俱來的興趣,蔡云峰于2004年被保送至北京大學數(shù)學科學學院攻讀博士學位,徐樹方教授成為他的授業(yè)導師。徐教授曾這樣評價他,“善于發(fā)現(xiàn)問題,能沉下心來鉆進去?!笔芤嬗诖?,加上素來勤快的習慣,蔡云峰積極思考導師拋出的問題,累積大量閱讀經(jīng)驗,很快便是適應了研究內(nèi)容、研究方式的轉(zhuǎn)變。
然而眼看著身邊的同學、朋友陸續(xù)地工作,這讓還身處學校的蔡云峰有些著急?!拔矣X得是不是自己也應該選擇和多數(shù)同學一樣,干脆就找一份工作算了”。導師的勸導讓蔡云峰有了動搖,而真正讓他放棄這個念頭的,還是如他自己說的那樣,“打小就喜歡數(shù)學,憑著這份喜歡走到今天,感覺到肩頭更有了種責任和義務。”
這番小插曲過后,蔡云峰的科研道路頗為順暢。2009年博士畢業(yè)后,他進入中國科學院數(shù)學所開展博士后研究,后赴美國加州大學戴維思分校繼續(xù)深造。當時他的主攻研究方向是電子結構計算中的病態(tài)特征值問題的高效算法。
在傳統(tǒng)方法(planewave、有限差分、有限元等)中,離散方程得到的特征值問題往往規(guī)模大,數(shù)值求解困難。特征值問題的求解成為了利用第一原理進行電子結構計算的一大瓶頸。介于這樣的境況,蔡云峰所在的研發(fā)團隊利用單位有限元方法(partition of unity finite element method—PUFEM)對方程進行離散,極大降低了需要求解問題的規(guī)模。同時,他們研究了求解此類問題的梯度類方法,發(fā)現(xiàn)其中的關鍵問題是預處理的選擇與實現(xiàn)。對此一種局部加速最速下降方法應運而生?!霸谶@種方法中,預處理矩陣是動態(tài)的,不定的,大大加速了算法收斂。但是與此同時,也帶來了困難——預處理方程的求解會很耗時。于是,我們采用了一種混合預處理策略,最大程度上節(jié)省了運算量。在我們的數(shù)值模擬當中,以往我們單次模擬的時間往往需要一周,而現(xiàn)在我們只需要兩小時?!?/p>
2012年8月,在北大“百人計劃”人才引進的召喚下,蔡云峰入職北京大學數(shù)學科學學院,任特聘研究員。即便人言國外的月亮如何圓,在他眼里似乎總少了份明亮。
選擇北京大學的原因很簡單。蔡云峰說,北京大學本身是中國最為優(yōu)質(zhì)學術資源平臺的代表,自己從這里走出去,如今有機會回母校任職,他感到很驕傲。
職業(yè)生涯翻開嶄新的一頁,蔡云峰刻苦鉆研的腳步從未停歇。立足矩陣聯(lián)合塊對角化問題,在原有基礎上拓寬、推廣,將張量分解的理論、算法與應用作為新一輪的挑戰(zhàn)。通過蔡云峰的解讀,記者了解到張量分解現(xiàn)階段最著名的方法分為3種:CP分解、高階奇異值分解(HOSVD)及BTD。其中,BTD可以可看作為CP分解和HOSVD的一種自然推廣,是兩者的綜合,也成為目前涵蓋范圍最廣的分解方法。
觀看NBA比賽
針對BTD,蔡云峰帶領學生團隊展開深入探討,從BTD及其變種——耦合的BTD、盲BTD、特殊張量的特殊BTD,到BTD的存在性、唯一性及擾動理論,再到實現(xiàn)分解的計算方法、軟件開發(fā)的應用?!把芯緽TD的方案其實與我們研究盲JBD問題的基本框架是一致的,但是由于處理對象更加復雜,在研究過程中,每個步驟所需要考慮的因素、處理的細節(jié)也更多。特別是計算方法在高階張量規(guī)模很大時,算法的具體實現(xiàn)將是巨大的挑戰(zhàn)?!贝竽懖孪?,小心論證;理論與實驗相結合,以期取得好的研究成果,這是蔡云峰對項目推進的希望,也是他科研多年的一貫作風。
所謂“如切如磋,如琢如磨”,在蔡云峰看來,搞研究、做學問,往往需要的是細致耐心,踏實誠懇以及絕不滿足的進取精神。所以,他每天堅持工作12小時,全身心地投入到治學當中。蔡云峰坦言,有時甚至會因為思考一個問題忘記吃中飯,直到晚上餓得胃疼才想起來。而且每天工作結束后,他都會捫心自問“今天我做了哪些工作,取得了哪些進展?”他希望能夠在這樣的總結中自省,亦在自省中自勉。
這樣一種嚴謹自律的治學態(tài)度同樣體現(xiàn)在他的教學之中。在交談中他強調(diào),學生是中國的希望,對于學生的學習,結果固然重要,但求學過程中的態(tài)度也需著重培養(yǎng)。因此,在他的課堂上,首先要杜絕一切抄襲、投機取巧的行為,“第一堂課,我就會和學生點明獨立完成課業(yè)是最基本的要求,這是態(tài)度問題也是素養(yǎng)問題?!蓖瑫r,每堂課前,他都會花時間,精心設計本節(jié)課的教學目標,思考學生可能存在的難點,在課堂上重點突破,希望自己的每一節(jié)都能使學生有所收獲。5年時間,兩名博士生,兩名碩士生,這是他為祖國注入新鮮血液交出的一份答卷。
他熱愛這份工作,并盡心竭力地在領域內(nèi)開疆擴土。靜心追逐,細水長流,在計算數(shù)學的學術道路上,蔡云峰漸行漸遠。