文/王俊杰 浙大寧波理工學(xué)院
當(dāng)前,以深度神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)為基礎(chǔ)的人工智能技術(shù)依舊是一個高速發(fā)展的熱門領(lǐng)域,與此同時,其他學(xué)科領(lǐng)域也在積極探索有效利用人工智能技術(shù)的方式。建筑學(xué)科也不例外,實際上在計算機(jī)圖像處理領(lǐng)域中以卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN) 為基礎(chǔ)的各種神經(jīng)網(wǎng)絡(luò)已經(jīng)開始被應(yīng)用于建筑設(shè)計,最典型的比如用生成對抗網(wǎng)絡(luò)(Generative Adversarial Networks,GAN)來生成建筑平面,甚至已經(jīng)有商業(yè)化的軟件產(chǎn)品被開發(fā)出來。本文以近兩年內(nèi)計算機(jī)輔助設(shè)計領(lǐng)域主要國際會議上發(fā)表的相關(guān)研究為基礎(chǔ),從五個方面對深度神經(jīng)網(wǎng)絡(luò)在建筑設(shè)計領(lǐng)域的應(yīng)用作了簡要而有啟發(fā)性的介紹。
基地及周邊環(huán)境的分析,旨在為設(shè)計提供依據(jù),實質(zhì)上是一種基于現(xiàn)有資料和數(shù)據(jù)的推理過程,而這種推理是神經(jīng)網(wǎng)絡(luò)的強(qiáng)項。計算機(jī)快速處理大量數(shù)據(jù)的能力遠(yuǎn)非人力所能企及,更重要的是神經(jīng)網(wǎng)絡(luò)通過學(xué)習(xí)現(xiàn)有的數(shù)據(jù)可以發(fā)掘出建筑師通常憑經(jīng)驗或者直覺難以發(fā)現(xiàn)的規(guī)律或者潛在的聯(lián)系,這也是深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)最為吸引人的特性之一。比如有研究者把城市中各個地塊的使用性質(zhì)歸納為五種類型(住宅、商業(yè)、公共服務(wù)、工業(yè)、綠地廣場)及其不同比例的混合,用大量的現(xiàn)狀數(shù)據(jù)訓(xùn)練了神經(jīng)網(wǎng)絡(luò),當(dāng)拿到一塊待建的空地時,該神經(jīng)網(wǎng)絡(luò)就能夠根據(jù)周邊用地的使用性質(zhì)推薦該地塊建筑的使用功能組合[1]。更加深入一些的,還可以利用神經(jīng)網(wǎng)絡(luò)為建筑師推薦建筑物的主要人流入口,這在商業(yè)綜合體、博物館、影劇院等大型的文化或者商業(yè)項目設(shè)計中非常有價值。另外,在對基地環(huán)境進(jìn)行分析時建筑師用到的最大量的直觀資料是基地的衛(wèi)星圖和街景照片,這樣識別圖像的卷積神經(jīng)網(wǎng)絡(luò)(CNN)就大有用武之地。比如可以用神經(jīng)網(wǎng)絡(luò)識別衛(wèi)星圖并提取建筑體量生成建筑師喜歡的圖底關(guān)系圖(圖1),對生成的黑白圖像簡單處理一下就可以得出該區(qū)域較為準(zhǔn)確的覆蓋率,不失為一種高效的城市環(huán)境分析手段[2]。另外還可以訓(xùn)練CNN對街景照片中的天空、綠化和建筑物進(jìn)行識別從而分析綠化指數(shù)、SVF(Sky View Factor)等指標(biāo)[3]。
用于合成圖像的生成對抗網(wǎng)絡(luò)(GAN)最直截了當(dāng)?shù)膽?yīng)用就是作為建筑總平面布局的生成器。通過學(xué)習(xí),神經(jīng)網(wǎng)絡(luò)能夠掌握輸入圖像和輸出圖像的內(nèi)在聯(lián)系,如果把某類型建筑的用地范圍作為輸入圖像,把實際的總圖布局作為輸出圖像來訓(xùn)練神經(jīng)網(wǎng)絡(luò),那么我們就可以得到一個該類型建筑的總圖生成器,下次遇到新的用地就可以用它來直接生成總圖布局。圖2 是對一個小學(xué)總平面生成網(wǎng)絡(luò)的測試,左邊是輸入圖像(黑色為用地范圍,藍(lán)色為周邊道路),中間是電腦生成的總圖布局(黃色為操場,紫色為風(fēng)雨操場,紅色為教學(xué)樓,青色為連廊),右側(cè)為該用地的實際總圖布局[4]。從圖中看出電腦通過學(xué)習(xí)之后瞬間生成的總圖還是基本抓住了要領(lǐng)的(當(dāng)然這只是生成的眾多總圖中的一個)。同樣的,城市街區(qū)布局也可以用GAN 來生成,將城市街區(qū)信息進(jìn)行簡化,抽取道路、河流、綠地等場地條件作為輸入信息,而街區(qū)內(nèi)的建筑布局作為輸出信息[5],圖3 中展示的生成圖像幾乎達(dá)到了以假亂真的程度(左、中、右分別為輸入條件、生成結(jié)果和真實情況)。
圖1 計算機(jī)生成圖底關(guān)系
圖2 計算機(jī)生成小學(xué)總圖
圖3 計算機(jī)生成城市肌理
圖4 計算機(jī)生成戶型
圖5 立面風(fēng)格遷移
圖6 三維風(fēng)格遷移
圖7 平面風(fēng)格遷移
圖8 利用環(huán)境參數(shù)自動生成建筑體量
圖9 圖結(jié)構(gòu)屬性
圖10 神經(jīng)網(wǎng)絡(luò)架構(gòu)
用GAN 生成建筑平面的探索比較多地集中在住宅戶型上,主要是住宅平面尤其是高層單元式住宅的平面布局邏輯較為確定,另外各個“找房平臺”上有大量戶型平面圖可以利用來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。圖4 是用GAN 生成“貝殼找房”風(fēng)格戶型平面的測試,圖中左邊是神經(jīng)網(wǎng)絡(luò)生成的戶型平面,右邊是真實的戶型,輸入條件是戶型的外輪廓[6]??梢钥闯錾窠?jīng)網(wǎng)絡(luò)生成的大格局與真實的完全一致,只是細(xì)節(jié)上有些模糊不清,考慮到這個網(wǎng)絡(luò)是用112 個真實的戶型平面訓(xùn)練而成的,能到達(dá)這樣的效果顯示了神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的學(xué)習(xí)能力,可以預(yù)見如果訓(xùn)練樣本擴(kuò)大100 倍甚至1000 倍,神經(jīng)網(wǎng)絡(luò)可以瞬間生成出大量的較高質(zhì)量的戶型平面供建筑師參考。事實上國內(nèi)已經(jīng)有公司開發(fā)出以深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)為核心的設(shè)計生成軟件,供給商品房開發(fā)商使用,軟件生成方案的優(yōu)品率可達(dá)80%。
計算機(jī)輔助設(shè)計和參數(shù)化為建筑設(shè)計帶來了大量炫酷的立面造型,隨著對CNN 的利用,建筑師在立面造型上又增添了夢幻般的手段。最典型的就是風(fēng)格遷移(Style Transfer)神經(jīng)網(wǎng)絡(luò)的應(yīng)用(圖5),左上角為輸入的內(nèi)容圖片,左下角為風(fēng)格圖片,右邊是合成的效果[7]。簡單地說,就是CNN 從內(nèi)容圖片中提取高層次的語義信息(比如這個例子里建筑立面構(gòu)成和各種開口的分布),而從風(fēng)格圖片中提取顏色、質(zhì)感等低層次信息,然后用反向CNN 重新合成圖片。當(dāng)然現(xiàn)在看來這種立面生成主要是表達(dá)性的,更多是作為設(shè)計的參考或者啟發(fā)。圖6 是另外一個例子,研究者希望對洛杉磯的地標(biāo)建筑——美國銀行大樓立面進(jìn)行風(fēng)格轉(zhuǎn)換,首先用CNN 網(wǎng)絡(luò)識別航拍圖片(內(nèi)容圖片)中的目標(biāo)建筑,然后根據(jù)風(fēng)格圖片對其立面進(jìn)行處理,而內(nèi)容圖片的其他部分則不受影響[8]。甚至還有把風(fēng)格遷移用在平面上的嘗試,圖7 是把巴洛克式平面作為風(fēng)格遷移到現(xiàn)代建筑平面上的效果[9]。
圖11 平面合成
綠色生態(tài)建筑的設(shè)計理念已經(jīng)得到建筑師廣泛的認(rèn)同,但在方案設(shè)計最初的階段建筑熱環(huán)境、氣流環(huán)境等模型分析難以實質(zhì)性地介入用于指導(dǎo)設(shè)計,成為行業(yè)的一個痛點(diǎn)。其中一個主要原因是計算機(jī)流體力學(xué)(CFD)等傳統(tǒng)的模擬手段雖然可以得到比較準(zhǔn)確的結(jié)果但比較耗時間,而在設(shè)計創(chuàng)意階段方案的需求則正好相反。在方案本身就比較粗略的情況下,建筑師對模擬結(jié)果的準(zhǔn)確度要求不太高但需要模擬結(jié)果能夠?qū)崟r反饋?,F(xiàn)在深度神經(jīng)網(wǎng)絡(luò)的應(yīng)用則有望解決這個問題,研究人員利用大量現(xiàn)有的CFD 模擬結(jié)果訓(xùn)練了GAN 網(wǎng)絡(luò),這樣在設(shè)計過程中,只要輸入建筑總圖布局立刻便可以得到相應(yīng)的風(fēng)速熱力模擬圖[10]。還有研究進(jìn)一步地把訓(xùn)練好的GAN 網(wǎng)絡(luò)與參數(shù)化生成的算法模塊結(jié)合起來,對生成的街區(qū)建筑體量進(jìn)行實時的建筑微氣候分析并反饋給體量生成模塊[11],這樣就可以真正實現(xiàn)結(jié)合環(huán)境效果模擬的建筑體量生成(圖8)。
參數(shù)化設(shè)計軟件grasshopper 里galapagos運(yùn)算器的出現(xiàn),使得遺傳算法被大量運(yùn)用于建筑找形,事先設(shè)定好評價標(biāo)準(zhǔn)之后,程序可以從隨機(jī)的形式開始不斷地進(jìn)化(迭代),生成新的形式并最終找到最優(yōu)的解。但這里的問題是,建筑設(shè)計并非純理性的過程,許多高層次的判斷標(biāo)準(zhǔn),比如審美取向、建筑師的個人偏好等難以表達(dá)成量化的評價標(biāo)準(zhǔn)?,F(xiàn)在,研究人員正在嘗試用深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)解決這個困難,將建筑師的審美偏好結(jié)合到神經(jīng)網(wǎng)絡(luò)的訓(xùn)練中。對于每個訓(xùn)練循環(huán),系統(tǒng)用遺傳算法模塊生成一定數(shù)量的形式(比如體塊不同組合方式),然后要求設(shè)計者選擇最佳的一個或者幾個相對較好的結(jié)果。然后,網(wǎng)絡(luò)將根據(jù)設(shè)計師的選擇進(jìn)行學(xué)習(xí),并調(diào)整遺傳算法模塊的生成參數(shù)開始下一輪循環(huán)。試驗表明經(jīng)過為數(shù)不多的訓(xùn)練循環(huán),神經(jīng)網(wǎng)絡(luò)就能比較好地掌握用戶的審美取向,從而使得生成的形式向建筑師個人的偏好靠攏[12]。對于深度神經(jīng)網(wǎng)絡(luò)在建筑設(shè)計中的應(yīng)用,這無疑是一個很有前途的方向。首先,判斷標(biāo)準(zhǔn)不是事先設(shè)定的,而是在一種人機(jī)互動的過程中逐漸形成的,而這種人機(jī)互動與傳統(tǒng)意義上的計算機(jī)輔助設(shè)計相比無疑是進(jìn)一步了;其次,這種思路實際上提供了量化設(shè)計中抽象規(guī)則的一種方法。神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)建筑師選擇的過程中不斷地調(diào)整成千上萬的權(quán)重數(shù)值,最終達(dá)到擬合設(shè)計偏好的目的。雖然在我們看來,這一堆權(quán)重數(shù)值沒有任何意義,但我們卻有辦法對這個“黑匣子”進(jìn)行各種處理和操作。試想如果有兩個神經(jīng)網(wǎng)絡(luò)擬合了兩個不同建筑師的偏好,那我們就可以把這兩個網(wǎng)絡(luò)的權(quán)重以一定的比例混合起來賦予一個新的網(wǎng)絡(luò),不難想象這個新的網(wǎng)絡(luò)將在一定程度上是這兩個建筑師偏好的綜合。
類似的,有研究試圖通過神經(jīng)網(wǎng)絡(luò)提取現(xiàn)有建筑平面的潛在特征并合成新的平面[13]。具體步驟如下,先將建筑平面圖表達(dá)為附帶屬性的圖結(jié)構(gòu)(圖9),屬性除了最基本的房間功能、面積和連接關(guān)系之外,還可以增加建筑者認(rèn)為重要的其他信息,在這個研究里則增加了人在平面中可能的活動的情況。然后,用大量建筑平面的圖結(jié)構(gòu)來訓(xùn)練神經(jīng)網(wǎng)絡(luò)。圖10 是神經(jīng)網(wǎng)絡(luò)架構(gòu)的示意圖,最醒目的是最中間紅色的神經(jīng)元組成的隱含層或者隱含向量①。這個隱含向量的左邊部分是編碼器,事實上就是編碼器把輸入的以圖結(jié)構(gòu)表達(dá)的建筑平面“濃縮”成這個隱含向量,也就是說建筑平面被編碼成了一個隱含向量。而右邊是解碼器,作用是根據(jù)這個隱含向量重新生成平面。訓(xùn)練這個神經(jīng)網(wǎng)絡(luò)的目標(biāo)是使輸出的平面與輸入的一致。一旦訓(xùn)練完成,編碼器和解碼器就可以獨(dú)立工作,來進(jìn)行平面合成。首先用編碼器把兩個(或者多個)不同的平面編碼成隱含向量,然后對兩個隱含向量進(jìn)行數(shù)學(xué)運(yùn)算(比如簡單相加)計算出一個新的隱含向量,接著用解碼器根據(jù)這個新的隱含向量生成平面,而新平面具有兩張輸入平面的特征(圖11)。這仿佛是,我們借助神經(jīng)網(wǎng)絡(luò)進(jìn)入了建筑平面圖背后的“隱含空間”,在這個高次元的空間里,我們能夠輕而易舉地把現(xiàn)實中難以操作的各種特性組合起來,然后生成新的平面。
這一輪的人工智能熱潮還在持續(xù)中,而相關(guān)技術(shù)在建筑設(shè)計中如何應(yīng)用的探索更是剛剛開始,現(xiàn)在要給出一個較為確定的結(jié)論似乎還為時尚早。但是,即使僅憑本文所提及的為數(shù)不多的探索,也不難看出人工智能在建筑設(shè)計中的應(yīng)用潛力;其中利用深度神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)建筑師主觀偏好、提取建筑空間潛在特性、量化抽象設(shè)計標(biāo)準(zhǔn)的嘗試更是非常有啟發(fā)性,人工智能有望成為推動建筑學(xué)科發(fā)展的一個全新動力。
注釋:
①向量就是按一定順序排列的一組數(shù)值,整個隱含層里每個神經(jīng)元都有一個輸出數(shù)值,所以稱其為隱含向量。
圖片來源:
圖1:參考文獻(xiàn)[2]
圖2:參考文獻(xiàn)[4]
圖3:參考文獻(xiàn)[5]
圖4:參考文獻(xiàn)[6]
圖5:參考文獻(xiàn)[7]
圖6:參考文獻(xiàn)[8]
圖7:參考文獻(xiàn)[9]
圖8:參考文獻(xiàn)[11]
圖9—圖11:參考文獻(xiàn)[13]