呂新華,賴世嬌,葛沿靈,范晨璟,郝 晟
(1.南通市海安市自然資源和規(guī)劃局,江蘇 南通 226600;2.南京林業(yè)大學,江蘇 南京 210037;3.南京云億科技有限公司,江蘇 南京 210019)
近年來,新興技術(shù)快速發(fā)展為建筑規(guī)劃設(shè)計帶來創(chuàng)新變革。傳統(tǒng)建筑規(guī)劃依賴人的主觀經(jīng)驗判斷,手繪圖紙周期長、效率低,受客觀因素影響方案不優(yōu)。隨著城鎮(zhèn)化進程加速,建筑規(guī)劃工作量增大,需科學方法提高效率和精度。21世紀,計算機和信息技術(shù)發(fā)展帶動數(shù)字化建筑設(shè)計興起,人工智能廣泛應用并推動建筑規(guī)劃數(shù)字化[1]。同時,數(shù)字城市的快速發(fā)展對設(shè)計提出了更高要求,需準確分析和模擬城市空間布局,實現(xiàn)未來發(fā)展合理預測。因此,機器學習輔助建筑設(shè)計、預測城市建筑布局成為一個重要研究方向。
生成對抗性神經(jīng)網(wǎng)絡(GAN)是一種模擬人的智能學習過程的計算機技術(shù),它于2014年由古德費洛首次提出,并在圖像和視覺處理等領(lǐng)域得到廣泛研究和應用。GAN的核心思想即通過訓練使其能夠基于給定數(shù)據(jù)集生成真實的圖像,其模型由生成器和判別器組成。生成器負責從隨機噪點生成圖像,并試圖欺騙判別器,使其無法區(qū)分生成圖像與真實圖像;而判別器則試圖準確判別兩者的區(qū)別。通過不斷的對抗訓練,生成器和判別器能力會相互提高并達到一種平衡狀態(tài),使生成器得到數(shù)據(jù)樣本分布[2]。
隨著人工智能領(lǐng)域的發(fā)展,各種GAN的衍生模型涌現(xiàn),并在多領(lǐng)域應用。比如:條件生成對抗網(wǎng)絡(CGAN)使生成圖像更具指導性;深度卷積生成對抗網(wǎng)絡(DCGAN)提高了穩(wěn)定性和性能[3]。
設(shè)計自動化相關(guān)研究不斷發(fā)展。從1930年深度學習應用到2014年首次提出GAN框架,從基于簡單數(shù)據(jù)生成網(wǎng)絡的拓展模型,再到運用卷積網(wǎng)絡優(yōu)化圖像精度,推動圖形與文本結(jié)合,實現(xiàn)結(jié)構(gòu)化圖形輸出[3]。
在GAN提出后,其衍生模型逐漸在自動化設(shè)計領(lǐng)域得到應用。例如,王坤峰等[2]介紹GAN背景、原理、模型及應用。Wang等[4]研究了基于GAN的多個訓練模型,實現(xiàn)建筑風格變化及建筑布局生成。過往研究多涉及較小規(guī)模,近幾年開始關(guān)注大面積建筑布局生成。劉躍中等[5]基于新加坡裕廊工業(yè)區(qū)數(shù)據(jù)訓練GAN模型生成建筑布局圖像。楊柳[6]通過pix2pix模型實現(xiàn)青年公寓戶型設(shè)計。
這些應用顯示GAN的優(yōu)勢如下:無須手動定義特征和規(guī)律,自動學習圖像數(shù)據(jù);控制生成圖像質(zhì)量以滿足不同需求;交互提供反饋和建議。
設(shè)計思維是在具體事物設(shè)想與改造計劃中運用的思維方式,在規(guī)劃設(shè)計實踐中,設(shè)計師通過評估方案總體形態(tài),確定結(jié)構(gòu)與細節(jié)協(xié)調(diào),學習傳承設(shè)計知識,提供多種方案供管理者選擇[7]。GAN在模型中生成和判斷訓練,類似人類設(shè)計師“學以致用”。生成器相當于學生,“經(jīng)驗思維”創(chuàng)造高質(zhì)量作品;判別器相當于專家,“系統(tǒng)思維”評估設(shè)計成果。二者對抗并優(yōu)化,學生提升設(shè)計水平,專家增加評價難度,直到判別器無法區(qū)分生成器產(chǎn)物是否為專家所作。在此背景下,GAN生成的方案能滿足規(guī)劃設(shè)計要求。
這一訓練過程算法原理及訓練方法具體如下:生成器(G)與判別器(D)產(chǎn)生博弈框架。其中,數(shù)據(jù)輸入判別器D,為更準確識別生成圖片,對D(x)不斷趨近于1,即要盡可能地大。同理,由隨機變量輸入生成器,即(D,G)=Exr~Pr(.)logD(x)+Ez~Pg(.)log{1-D[G(z)]}。為使生成器生成的數(shù)據(jù)通過判別器的判斷,對D[G(z)]不斷趨近于1,Ez~Pg(.)log{1-D[G(z)]}要盡可能地小,生成器服從真實數(shù)據(jù)樣本分布。最后,在互相對抗優(yōu)化過程使生成器與判別器的功能不斷加強,并使其生成數(shù)據(jù)和真實數(shù)據(jù)判別結(jié)果一致。
進行基于GAN的建筑自動生成訓練模型需要采集大量數(shù)據(jù)作為訓練樣本,因此,數(shù)據(jù)集制作是必備環(huán)節(jié)。自動生成數(shù)據(jù)集可能導致精度不佳,影響效果。因此,本文選擇手動采集繪制數(shù)據(jù)集。
本文選擇Labelimg作為數(shù)據(jù)集標注工具,其優(yōu)點是界面較簡單,操作便捷,無需代碼,可輸出多種格式。但Labelimg是矩形標注工具,處理多邊形需輔助使用Labelme,其支持自定義標注。
訓練步驟為選取江浙滬三地為樣本數(shù)據(jù)來源,分別截取1∶5 000和1∶10 000兩套圖片。標注過程中,使用Labelme勾畫道路和河流輪廓,同時進行類別標注,使用Labelimg及l(fā)abelme標注建筑輪廓。通過上述流程標注2 000張圖片,得到地塊標注集和建筑標注集作為訓練樣本。
通過比較不同GAN的設(shè)計效果,發(fā)現(xiàn)CycleGAN有圖像清晰和模型穩(wěn)定的優(yōu)勢,能夠輸出優(yōu)質(zhì)設(shè)計圖且支持交互編輯,因此選作開發(fā)平臺。訓練集選取不同尺度和地區(qū)的規(guī)劃案例以確保電腦學習已有成果后能完成特定任務(見表1)。同時,設(shè)計多方案生成功能,調(diào)整參數(shù)輸出多方案供選,表2展示了訓練方法。
表1 不同GAN運用在規(guī)劃設(shè)計中的優(yōu)劣勢
表2 訓練方法設(shè)定
使用大數(shù)據(jù)標注軟件手動標注了2 000張圖紙作為訓練樣本,并在CycleGAN中進行訓練。隨著訓練次數(shù)增加,生成結(jié)果的功能布局趨于合理,渲染圖像逐漸真實,細節(jié)增多,對于像素肌理問題可通過高斯模糊處理減少。同時,本文發(fā)現(xiàn)大比例尺下生成圖片質(zhì)量更優(yōu),建筑密度較大的居住地塊圖片質(zhì)量相對較差。
對建筑布局合理性評估后發(fā)現(xiàn),大多生成建筑呈現(xiàn)行列式布置,相對于真實建筑布局更加規(guī)整,建筑密度較高,而周邊式、自由式和混合式布置較少。作者邀請6名規(guī)劃專業(yè)學生參與圖靈測試,分辨20張真實與生成圖片,測試表明,基于GAN的建筑布局生成能達到普通規(guī)劃學生水平(見圖1)。
圖1 圖靈測試結(jié)果
本文選取常州大學新村二區(qū)居住用地作為案例地塊(見圖2),通過GAN生成了3套建筑布局方案(見圖3)。綜合考慮,方案2建筑形體布局規(guī)整,接近實際情況,基于此規(guī)劃了最終的方案如圖4所示。
圖2 兩種比例地塊概況
圖3 3種建筑布局方案
圖4 最終規(guī)劃設(shè)計
總體而言,基于GAN的建筑布局自動生成在大比例尺下質(zhì)量較好,同時側(cè)重于選擇規(guī)整地塊以接近實際住宅用地規(guī)劃。
數(shù)字化城市建設(shè)推動建筑設(shè)計從“量”到“質(zhì)”轉(zhuǎn)變這一趨勢在未來10年將更明顯?;贕AN的建筑自動生成研究為數(shù)字化建筑設(shè)計提供新思路。通過CycleGAN訓練城市規(guī)劃預處理模型可用于總規(guī)、詳規(guī)并生成優(yōu)質(zhì)圖紙。
GAN在規(guī)劃設(shè)計應用方面的前景和優(yōu)勢主要包括激發(fā)設(shè)計靈感、模擬設(shè)計案例、提高工作效率,本文案例研究展示了GAN規(guī)劃布局的可行性。但GAN也存在可解釋性不足、缺乏矢量數(shù)據(jù)格式支持、訓練集獲取困難、約束性較弱等局限性。總之,GAN具有前沿性,期待其未來發(fā)展能為智慧城市規(guī)劃建設(shè)貢獻更多力量。