丁俐娟,鄒廣天,郭 強,張 斯
(哈爾濱工業(yè)大學建筑學院,黑龍江哈爾濱150006)
本文將可拓數(shù)據(jù)挖掘的理論與方法引入到可拓建筑策劃領域,嘗試構(gòu)建可拓建筑策劃數(shù)據(jù)挖掘的理論與方法.可拓建筑策劃數(shù)據(jù)挖掘是建筑策劃理論與方法研究領域的一個新課題.本文初步探討可拓建筑策劃數(shù)據(jù)挖掘的幾個重要理論問題,包括定義、特點、對象、結(jié)果、類型,希望有助于可拓建筑策劃數(shù)據(jù)挖掘理論研究的深入展開.
可拓數(shù)據(jù)挖掘是可拓學與數(shù)據(jù)挖掘相結(jié)合的產(chǎn)物,它研究用可拓學的理論和方法,去挖掘數(shù)據(jù)庫或知識庫中與解決矛盾問題的變換有關(guān)的知識[1-5].可拓數(shù)據(jù)挖掘?qū)⒖赏丶碚摵涂赏剡壿嫅玫綌?shù)據(jù)挖掘中,可拓集理論對應數(shù)據(jù)庫與數(shù)據(jù)倉庫,基元對應數(shù)據(jù),從而將可拓理論與數(shù)據(jù)挖掘領域相結(jié)合,形成挖掘可拓知識的基本理論.
本文試提出這樣一個關(guān)于可拓建筑策劃數(shù)據(jù)挖掘的定義,即:可拓建筑策劃數(shù)據(jù)挖掘是面向可拓建筑策劃的可拓數(shù)據(jù)挖掘.它研究用可拓學、數(shù)據(jù)挖掘的理論和方法,從可拓建筑策劃數(shù)據(jù)庫中挖掘與解決矛盾、實現(xiàn)創(chuàng)新的變換有關(guān)的知識的過程.
可拓建筑策劃數(shù)據(jù)挖掘是可拓建筑策劃領域與可拓數(shù)據(jù)挖掘領域相交叉產(chǎn)生的新的理論與方法.它首次將可拓數(shù)據(jù)挖掘引入到建筑策劃領域,能夠挖掘出建筑策劃所需要的與變換有關(guān)的可拓知識,科學有效地解決建筑策劃中的矛盾問題與創(chuàng)新問題.其工具為可拓數(shù)據(jù)挖掘方法,其服務對象是可拓建筑策劃.也就是說,它是利用可拓數(shù)據(jù)挖掘的理論及方法,挖掘與變換有關(guān)的建筑策劃知識,從而為可拓建筑策劃提供知識支持.
數(shù)據(jù)挖掘的重要基礎是數(shù)據(jù)庫,挖掘結(jié)果是大量數(shù)據(jù)背后的知識.同樣,可拓數(shù)據(jù)挖掘的重要基礎之一也是數(shù)據(jù)庫.但是,其挖掘結(jié)果不同于一般的數(shù)據(jù)挖掘,它的挖掘結(jié)果是與變換有關(guān)的知識,是動態(tài)的、變化的知識.
可拓建筑策劃數(shù)據(jù)挖掘的核心在于構(gòu)建可拓建筑策劃數(shù)據(jù)庫,挖掘與可拓建筑策劃變換有關(guān)的知識.其中包括可拓建筑策劃的可拓分類知識、聚類知識和傳導知識.也可以將其分別稱為“可拓建筑策劃分類知識”、“可拓建筑策劃聚類知識”、“可拓建筑策劃傳導知識”.
可拓建筑策劃數(shù)據(jù)挖掘是可拓建筑策劃與可拓數(shù)據(jù)挖掘相結(jié)合的產(chǎn)物,不僅具有了兩個學科的優(yōu)點,還有其自身的特點.
可拓數(shù)據(jù)挖掘?qū)討B(tài)數(shù)據(jù)的挖掘,是集歷史數(shù)據(jù)Dold、當前數(shù)據(jù)Dcurrent與未來數(shù)據(jù)Dnew于一體的動態(tài)過程.
在可拓建筑策劃挖掘的過程(見圖1)中,Dnew也在不斷地增加,可拓數(shù)據(jù)挖掘的過程中也在不斷進行挖掘評價,用后續(xù)的數(shù)據(jù)對挖掘的結(jié)果進行評價,可以不斷修正挖掘結(jié)果或者重新挖掘[6-7].
圖1 可拓建筑策劃動態(tài)數(shù)據(jù)挖掘流程示意圖Fig.1 Dynamic data mining diagram by extension architecture programming
在建筑領域,存在很多動態(tài)數(shù)據(jù).例如,當對某博物館建筑的使用情況進行實態(tài)調(diào)查時,由于參觀者需購票或免費取票才能進入博物館,所以可以調(diào)查其入場券的票量.通過票量可以獲得一天內(nèi)、一個月內(nèi)及一年內(nèi)博物館的人流量,也可以獲得某個時刻前后的人流量.另外,通過每年的人流量變化統(tǒng)計,可以預測之后的人流變化,為博物館日后的管理及建設提供信息,如人流量的逐年增大,需考慮對博物館進行擴建或考慮博物館開放時間的改變.
可拓建筑策劃數(shù)據(jù)挖掘面向的是可拓建筑策劃,采用的是可拓數(shù)據(jù)挖掘技術(shù),因此整個解決矛盾問題過程(見圖2)是可拓化的.首先,可拓基元表達方法解決了建筑策劃中數(shù)據(jù)的表達問題,使得構(gòu)建建筑策劃數(shù)據(jù)庫成為可能,構(gòu)成了建筑策劃與計算機系統(tǒng)對接的基礎.可拓學用物元、事元、關(guān)系元形象地描述客觀世界,從而幫助我們表述可拓建筑策劃問題.可拓學的4種思維模式幫助我們分析可拓建筑策劃問題,提取矛盾問題的核問題.然后,以此為基礎進行可拓數(shù)據(jù)挖掘,挖掘出與變換有關(guān)的知識,為可拓變換提供知識支持.接下來根據(jù)挖掘的知識進行可拓變換,從而獲得解決矛盾問題的方法.
圖2 解決可拓建筑策劃問題流程示意圖Fig.2 Problem-solvimg diagram by extension architectural programming
可拓建筑策劃數(shù)據(jù)挖掘的對象之一是可拓建筑策劃數(shù)據(jù)庫,其結(jié)果為與變換有關(guān)的可拓知識,主要有“可拓建筑策劃分類知識”、“可拓建筑策劃聚類知識”、“可拓建筑策劃傳導知識”.
可拓建筑策劃數(shù)據(jù)庫是可拓數(shù)據(jù)挖掘的重要對象,數(shù)據(jù)庫分為可拓建筑策劃基礎數(shù)據(jù)庫、可拓建筑策劃專業(yè)知識庫及其他數(shù)據(jù)庫.
3.1.1 可拓建筑策劃基礎數(shù)據(jù)庫
可拓建筑策劃基礎數(shù)據(jù)主要來源有3個方面,第1部分是現(xiàn)有的建筑策劃及設計案例、相關(guān)書籍、資料集成等專業(yè)資料,還有與建筑策劃相關(guān)的城市規(guī)劃資料、氣候地理資料、相關(guān)法律法規(guī)等.形式包括數(shù)字、文字、圖像及多媒體.第2部分是實態(tài)調(diào)查,主要包括對經(jīng)濟特征、社會環(huán)境、人口構(gòu)成、使用方式、與空間對應的物理量與心理量的調(diào)查,主要以調(diào)查數(shù)據(jù)為主.第3部分是其他數(shù)據(jù),這部分數(shù)據(jù)與前兩種數(shù)據(jù)的獲取方式不同,屬于可擴充的部分.
另外,數(shù)據(jù)庫從內(nèi)容上分,可以分為外部條件數(shù)據(jù)庫、內(nèi)部條件數(shù)據(jù)庫、空間構(gòu)想數(shù)據(jù)庫和設計任務數(shù)據(jù)庫.
3.1.2 可拓建筑策劃專業(yè)知識庫
可拓建筑策劃專業(yè)知識庫按照內(nèi)容分為場地策劃知識庫、空間策劃知識庫、形象策劃知識庫及技術(shù)策劃知識庫.當針對具體的矛盾問題進行可拓知識挖掘時,按照可拓數(shù)據(jù)挖掘?qū)I(yè)知識庫的操作流程,又可將專業(yè)知識庫分為可拓建筑策劃知識庫、可拓建筑策劃變換庫、可拓建筑策劃規(guī)則庫、可拓建筑策劃策略庫.從知識類型上分,可拓建筑策劃專業(yè)知識庫主要包括發(fā)散型知識、相關(guān)型知識、蘊含型知識和可擴型知識.這4種知識統(tǒng)稱為拓展型知識.
3.1.3 其他數(shù)據(jù)庫
可拓建筑策劃數(shù)據(jù)挖掘的理論與方法屬于發(fā)展階段,暫時研究其對基礎數(shù)據(jù)庫和專業(yè)知識庫的挖掘,在以后的發(fā)展過程中還會涉及對其他與建筑策劃有關(guān)的數(shù)據(jù)庫的挖掘.
3.2.1 可拓建筑策劃分類知識
可拓建筑策劃分類知識即用可拓分類挖掘方法從可拓建筑策劃數(shù)據(jù)庫中挖掘變化導致分類結(jié)論變化的知識.有兩種知識類型:與質(zhì)變有關(guān)的知識和與量變有關(guān)的知識.在實施某一可拓變換后,哪些策劃要素發(fā)生了質(zhì)變,簡稱為質(zhì)變知識;在實施某一可拓變換后,哪些策劃要素發(fā)生了量變,簡稱為量變知識.
3.2.2 可拓建筑策劃聚類知識
聚類與分類不同,分類是在已知類別的情況下,對數(shù)據(jù)進行分類,而聚類是在類別不明的前提下形成歸類.可以挖掘到與可拓變換有關(guān)的聚類知識,即在可拓建筑策劃中,將能夠達到某種目的的可拓變換聚為一類.不同的可拓變換根據(jù)策劃目標的不同會聚為不同的類,從而為可拓建筑策劃提供符合策劃目標的聚類知識.
3.2.3 可拓建筑策劃傳導知識
可拓建筑策劃傳導知識主要包括:傳導對象和傳導特征的知識.可拓變換所產(chǎn)生的作用,對于不同的策劃要素會產(chǎn)生不同的傳導效應.通過挖掘可拓變換對不同策劃要素產(chǎn)生的作用,了解變換的傳導效果,為未來的決策提供依據(jù);傳導效果可以用傳導度更加直觀地表達.
可拓建筑策劃數(shù)據(jù)挖掘類型有針對策劃外部條件的可拓知識挖掘和針對策劃內(nèi)部條件的可拓知識挖掘.外部條件主要是指建筑所在的地域條件、社會條件及建筑本身的外部形象[8-12].針對策劃外部條件的可拓知識挖掘主要包括對城市策劃層面的挖掘,對場地策劃的挖掘及對建筑外部形象策劃的挖掘.挖掘出的可拓知識指導建筑師在策劃時全面地把握項目在城市規(guī)劃中的地位、場地設計的目標及外部形象的設想.策劃的內(nèi)部條件是與建筑自身最直接的功能有關(guān)的條件,主要指建筑的功能與空間策劃、與使用者有關(guān)的空間調(diào)查[13-14].因此,針對策劃內(nèi)部條件的可拓知識挖掘主要包括對建筑使用者心理量的挖掘,對建筑功能策劃的挖掘,對建筑技術(shù)策劃的挖掘等,獲取與建筑內(nèi)部條件有關(guān)的可拓知識.本文以內(nèi)部條件中的使用者調(diào)查為例,介紹可拓建筑策劃數(shù)據(jù)挖掘能夠挖掘的有關(guān)知識.
建筑策劃中運用SD法將使用者的心理反應進行量化,變成數(shù)據(jù)[15],就可以運用可拓建筑策劃數(shù)據(jù)挖掘的可拓聚類方法進行數(shù)據(jù)挖掘,得到可拓聚類知識.
可拓建筑策劃數(shù)據(jù)挖掘的基礎數(shù)據(jù)庫中保存有大量與使用者有關(guān)的調(diào)研數(shù)據(jù).這部分數(shù)據(jù)主要通過人工調(diào)查獲得,調(diào)查主要以問卷的形式進行.
例如,當對某一地區(qū)的博物館項目進行策劃,需要對博物館的使用人群進行調(diào)查.可以從可拓建筑策劃基礎數(shù)據(jù)庫中調(diào)取同等規(guī)模的博物館的調(diào)查結(jié)果,用可拓聚類的方法挖掘可拓聚類知識,得到可拓建筑策劃聚類知識.
首先,確定博物館的主要幾種重要設計要素,分別是:建筑色彩;建筑的空間尺度、平面布局(導向)、人際距離設計;建筑的外部造型、形態(tài)、形式;建筑內(nèi)外部光線.調(diào)取同等類型博物館對上述因素進行調(diào)查的問卷數(shù)據(jù).問卷中的調(diào)查項目主要圍繞4種影響因素,其中,建筑色彩包括N1項調(diào)查數(shù)據(jù),建筑的空間尺度設計包括N2項,建筑外部造型包括N3項,建筑內(nèi)外部光線主要包括N4項,各項的具體數(shù)值由調(diào)查者自定.
設共發(fā)放問卷100份,有效問卷97份.然后,將問卷中的評定項目轉(zhuǎn)化成數(shù)據(jù)形式,賦值是映射在[0.0,1.0]上,使得每個變量都有相同的權(quán)重.被調(diào)查者可以在幾個等級及等級之間的區(qū)間進行打分.
4個主要調(diào)查因素的屬性值可以通過計算所得的算術(shù)平均數(shù)來計算.例,“建筑色彩”=各項數(shù)值之和/N1.按照這種算法可以得到4個屬性值.
經(jīng)過數(shù)據(jù)的預處理得到樣本數(shù)據(jù),在基礎數(shù)據(jù)庫中,與使用者有關(guān)的調(diào)研數(shù)據(jù)以表格的形式保存在計算機中,將以上的數(shù)據(jù)試圖分為3類,分別代表“好、一般、不好”.通過聚類挖掘方法,可以得到這些數(shù)據(jù)在3種類的分布.力圖回答“博物館色彩是否令使用者感到舒適?”“室內(nèi)外光線是否宜人?”“空間尺度是否合理?”等類似的問題.
將表格中的數(shù)據(jù)運用聚類挖掘方法進行數(shù)據(jù)挖掘,在進行聚類之前,需要增加代表3個等級的樣本數(shù)據(jù).
運用聚類算法對這100個樣本(其中3個標準樣本和97個經(jīng)過數(shù)據(jù)變換的樣本),進行聚類挖掘.得到聚類結(jié)果見表1.
表1 聚類結(jié)果數(shù)據(jù)Tab.1 The results of clustering data
其中,等級為“好”的樣本所占比例為48/97=50%,等級為“一般”的樣本所占比例為37/97=38%,等級為“不好”的樣本所占比例為15/97=15%.3個簇的得分與標準樣本相比,分數(shù)都有所提高,由于樣本數(shù)量的不同,需要加上權(quán)重后再比較:“建筑色彩”得分為0.629;“建筑空間尺度”得分為0.644;建筑外部造型的得分為0.604;建筑內(nèi)外部光線的得分為0.630.獲取關(guān)于使用者調(diào)查的策劃信息元g:
本文規(guī)定分值>0.50,即可視為得分為中等偏上,說明這一要素的設計還是可以滿足大部分使用者的心理需求的.由4個分值可以看出,所調(diào)研的此樣本博物館建筑空間尺度是得分最高的,相比較其他設計要素而言設計得較好,更符合使用者需求.
通過上述方法將眾多建筑實例的調(diào)查表格,尤其是與使用者心理需求有關(guān)的調(diào)查結(jié)果量化,然后進行聚類挖掘,就可以獲得關(guān)于使用者調(diào)查的信息元.當建筑師在進行可拓建筑策劃時,可以根據(jù)策劃在使用者需求上要達到的目標,挖掘出更能符合策劃要求的案例,例如挖掘出在“建筑色彩”方面分數(shù)>0.5的建筑案例及其色彩做法,可以通過數(shù)據(jù)挖掘獲得哪些案例是進行可拓策劃時可以參考的案例,在進行可拓分析時可以將這些案例的設計手法作為可拓分析的依據(jù).
本文初步構(gòu)建了可拓建筑策劃數(shù)據(jù)挖掘的理論框架,論證了可拓數(shù)據(jù)挖掘在可拓建筑領域運用的可能性,并進行了初步運用.可拓數(shù)據(jù)挖掘能夠為可拓建筑策劃提供可拓知識,完善可拓建筑策劃理論及方法.由于篇幅有限,尚有部分內(nèi)容要在今后的研究中展開.可拓建筑策劃數(shù)據(jù)挖掘在未來的發(fā)展中會與計算機技術(shù)相結(jié)合,從而實現(xiàn)其人工智能.
[1]楊春燕,李小妹,陳文偉,等.可拓數(shù)據(jù)挖掘方法及其計算機實現(xiàn)[M].廣東:廣東高等教育出版社,2010.
[2]楊春燕,蔡文.可拓學[M].北京:科技出版社,2014:14-17.
[3]蔡文,楊春燕,何斌.可拓邏輯初步[M]北京:科技出版社,2003.
[4]楊春燕,李衛(wèi)華,李小妹.矛盾問題智能化處理的理論與方法研究進展[J].廣東工業(yè)大學學報,2011,28(1):86-93.Yang C Y,Li W H,Li X M.Advances in research about theory and method of intelligent processing on contradictory problems[J].Journal of Guangdong University of Technology,2011,28(1):86-93.
[5]李志明,楊春燕.解決矛盾問題的逆向策略生成方法[J].廣東工業(yè)大學學報,2013,30(4):1-5.Li Z M,Yang C Y.Reversed strategy generating method of solving contradictory problems[J].Journal of Guang-dong University of Technology,2013,30(4):1-5.
[6]汪偉,鄒璇,詹雪.論數(shù)據(jù)挖掘中的數(shù)據(jù)預處理技術(shù)[J].煤炭技術(shù).2013,32(5):152-153.Wang W,Zou X,Zhan X.Discussion on data preprocessing technology in data mining[J].Coal Technology.2013,32(5):152-153.
[7]Jiawei Han(加),Micheline Kamber.數(shù)據(jù)挖掘:概念與技術(shù)[M].范明,孟小峰,譯.北京:機械工業(yè)出版社,2012.
[8]莊惟敏.建筑策劃導論[M].北京:中國水利水電出版社,2000.
[9]鄒廣天.建筑計劃學[M].中國建筑工業(yè)出版社.2010.
[10][英]弗蘭克·索爾茲伯里.建筑的策劃[M].馮萍,譯.北京:中國水利水電出版社,2005.
[11][美]羅伯特·G·赫什伯格.建筑策劃與前期管理[M].汪芳,李天驕,譯.北京:中國建筑工業(yè)出版社,2005.
[12]William M P,Steven A.Problem seeking:an architectural programming primer[M].New York:John Wiley&Sons Inc,2001.
[13]徐強.建筑策劃信息系統(tǒng)熵變模型構(gòu)建研究[J].情報科學.2011,29(12):1820-1824.Xu Q.Research on the entropy change model construction for the construction plan information system[J].Information Science.2011,29(12):1820-1824.
[14]蘇實.從建筑策劃的空間預測與評價到空間構(gòu)想的系統(tǒng)方法研究[D].北京:清華大學建筑學院,2011.
[15]連菲.可拓建筑策劃的基本理論與應用方法研究[D].哈爾濱:哈爾濱工業(yè)大學建筑學院,2010.