李潤(rùn)梅 梁秋鴻
人工交通系統(tǒng)是利用人工社會(huì)的基本理論與方法,通過抽取交通環(huán)境中單個(gè)個(gè)體或局部交通行為的基本屬性或動(dòng)態(tài)規(guī)律,基于Agent 建模技術(shù),通過交通系統(tǒng)個(gè)體或局部Agent 之間相互作用,“涌現(xiàn)(Emergence)”出復(fù)雜的交通現(xiàn)象,這是一個(gè)“自下而上”、基于“簡(jiǎn)單一致原則”人工“培育”出來的交通系統(tǒng)[1?3].人工交通系統(tǒng)可把“仿真”結(jié)果作為現(xiàn)實(shí)的一個(gè)替代版本,而把實(shí)際系統(tǒng)也作為可能出現(xiàn)的現(xiàn)實(shí)中的一種,與仿真結(jié)果等價(jià)[4?6].
霍蘭指出:“涌現(xiàn)現(xiàn)象是以相互作用為中心的,它比單個(gè)行為的簡(jiǎn)單累加要復(fù)雜得多”[7].對(duì)代理、環(huán)境及規(guī)則上描述的細(xì)微差別,在涌現(xiàn)過程中,就可能出現(xiàn)“差之毫厘,謬以千里”的結(jié)果,從而仿真結(jié)果失去了對(duì)現(xiàn)實(shí)的指導(dǎo)意義,甚至給出完全錯(cuò)誤的指導(dǎo)方案.正如社會(huì)學(xué)家Helmreich 所批評(píng)的一樣:人工社會(huì)的模型反映的是其創(chuàng)造者的潛意識(shí)中的文化假設(shè)和偏見[8].
如何避免這一問題? 在人工交通的建模及平行系統(tǒng)的研究中,需要引入嚴(yán)密的量化評(píng)估體系,建立系統(tǒng)“可信”或“可用”的數(shù)學(xué)描述,并從多維度、多粒度的數(shù)據(jù)層面進(jìn)行量化評(píng)估,從理論上保證人工交通系統(tǒng)與現(xiàn)實(shí)交通系統(tǒng)在統(tǒng)計(jì)特性上、在動(dòng)態(tài)演化規(guī)律上、在行為特性上的一致性.本文針對(duì)人工交通系統(tǒng),基于人工交通系統(tǒng)基本體系結(jié)構(gòu),將二型模糊集合方法引入人工交通系統(tǒng)可信度評(píng)估中,建立了一種適用于人工交通系統(tǒng)的可信度評(píng)估理論體系與具體評(píng)估方法.并利用一個(gè)“人工公交交通系統(tǒng)”模型,進(jìn)行了可信度評(píng)估的數(shù)據(jù)驗(yàn)證.
本文結(jié)構(gòu)安排如下.第1 節(jié)介紹了可信度研究的意義,對(duì)可信度研究方法和成果進(jìn)行了綜述,并提出了本文的可信度評(píng)估框架.第2 節(jié)為可信度評(píng)估使用的核心算法介紹.第3 節(jié)仿真驗(yàn)證.最后給出結(jié)論.
可信度定義:對(duì)于一個(gè)事物或現(xiàn)象為真的相信程度.可信度的量化值一般在[0,1]之間,值越大,表示該事物越“真”[9].評(píng)估復(fù)雜仿真系統(tǒng)可信度的過程稱為復(fù)雜仿真系統(tǒng)的可信度評(píng)估.通過開展復(fù)雜仿真系統(tǒng)的可信度評(píng)估研究和應(yīng)用,可以提高綜合仿真系統(tǒng)的仿真結(jié)果的正確性,降低其應(yīng)用的風(fēng)險(xiǎn)保證仿真系統(tǒng)的質(zhì)量.可信度評(píng)估在交通仿真、網(wǎng)絡(luò)管理、信息管理、遠(yuǎn)程通訊以及導(dǎo)彈系統(tǒng)等各個(gè)領(lǐng)域都有廣泛的應(yīng)用[10?13].
文獻(xiàn)[12]針對(duì)微觀交通仿真模型開發(fā)者和使用者的不同需求,研究了交通仿真模型可信度評(píng)價(jià)內(nèi)容及其與仿真模型校正、校核、驗(yàn)證和確認(rèn)的關(guān)系;分析了三種可用于微觀交通仿真模型可信度評(píng)價(jià)的方法:層次分析法、相似度法以及模糊綜合評(píng)判.文獻(xiàn)[14]使用模糊三角函數(shù)與層次分析法及網(wǎng)絡(luò)層次分析法綜合評(píng)價(jià)列車控制仿真系統(tǒng)的可信度,獲取定量的可信度結(jié)果.文獻(xiàn)[15]在對(duì)當(dāng)前城市交通導(dǎo)航系統(tǒng)的分析中發(fā)現(xiàn),許多共享交互的弱點(diǎn)會(huì)損害系統(tǒng)的可信度.論文提出了改進(jìn)的交互機(jī)制,以提高導(dǎo)航系統(tǒng)的可信度.在比較用戶的研究中評(píng)估了所提議的機(jī)制,并給出了確認(rèn)其可信度的積極影響的結(jié)果.
從應(yīng)用上分類,可信度評(píng)估方法主要有仿真結(jié)果評(píng)估與VV&A (Verification,validation and accreditation)兩種模式[16?18].基于仿真結(jié)果驗(yàn)證的方法主要是應(yīng)用定性或定量評(píng)估方法,并結(jié)合統(tǒng)計(jì)學(xué)的相關(guān)知識(shí),通過仿真結(jié)果與實(shí)際或預(yù)想結(jié)果的比較,得出仿真可信度評(píng)價(jià)[16],是交通仿真系統(tǒng)中主要使用的可信度評(píng)估模式.人工交通概念提出以來,關(guān)于其建模方法及應(yīng)用的研究成果較多,但可可信度評(píng)估的研究相對(duì)較少[19].Li 等[20]在前期研究中,建立了基于二型模糊集合方法的人工交通系統(tǒng)可信度評(píng)估體系.
因?yàn)橐话悻F(xiàn)代綜合評(píng)估方法存在:1)因評(píng)價(jià)專家主觀上的隨機(jī)性和不一致性導(dǎo)致問題描述的混亂;2)隸屬度函數(shù)及權(quán)重難以精確確定;3)簡(jiǎn)單的評(píng)價(jià)結(jié)果無法精確地反映評(píng)價(jià)結(jié)果與評(píng)價(jià)對(duì)象內(nèi)在因素的多維關(guān)系等問題[21?22].同時(shí)考慮到人工交通系統(tǒng)不依賴精確數(shù)學(xué)模型、不確定性因素多、輸入輸出數(shù)據(jù)隨機(jī)性強(qiáng)等特點(diǎn),本文應(yīng)用二型模糊集理論,利用其較強(qiáng)的處理不確定性及隨機(jī)性的能力來對(duì)人工交通系統(tǒng)的可信度做具體的評(píng)估研究.建立了以區(qū)間二型模糊集合理論為核心數(shù)據(jù)處理算法的評(píng)估方法,如圖1 所示.評(píng)估方法的核心由三部分構(gòu)成:數(shù)據(jù)處理、區(qū)間二型模糊集、Jaccard 算法.
該方法應(yīng)用可信度概念,描述將人工交通系統(tǒng)視為交通系統(tǒng)的現(xiàn)實(shí)版本的真實(shí)程度,通過評(píng)估人工交通系統(tǒng)和實(shí)際交通系統(tǒng)輸出數(shù)據(jù)的統(tǒng)計(jì)一致性程度,來評(píng)估人工交通系統(tǒng)的可信度.即在一致輸入條件下,輸出的統(tǒng)計(jì)特性一致.具體思路描述如下:
1)將來自于實(shí)際交通場(chǎng)景的大量數(shù)據(jù)進(jìn)行前期處理,考慮到交通系統(tǒng)的非嚴(yán)格重復(fù)的周期性、隨機(jī)性和不確定性,基于置信區(qū)間概念,將其處理為區(qū)間化數(shù)據(jù):同理,將相應(yīng)的人工交通系統(tǒng)的輸出數(shù)據(jù)也做同樣的處理.
2)區(qū)間化數(shù)據(jù)表達(dá)符合對(duì)開放復(fù)雜系統(tǒng)的輸出數(shù)據(jù)不確定性和波動(dòng)性的描述,在剔除了噪聲數(shù)據(jù)的同時(shí),也完成了二型模糊集建模的輸入數(shù)據(jù)準(zhǔn)備.
3)應(yīng)用區(qū)間二型模糊集合算法,將處理后的區(qū)間輸入進(jìn)行深度加工,得到更準(zhǔn)確刻畫系統(tǒng)特性的兩個(gè)交通系統(tǒng)(實(shí)際交通系統(tǒng)和人工交通系統(tǒng))的數(shù)據(jù)集合.
4)基于Jaccard 算法對(duì)二型模糊集輸出數(shù)據(jù)集合進(jìn)行一致性比較,通過一致性結(jié)果數(shù)據(jù),評(píng)價(jià)人工交通系統(tǒng)的可信度.
上述評(píng)價(jià)方法,有效地實(shí)現(xiàn)了基于Agent 建模的復(fù)雜系統(tǒng)評(píng)估問題.該方法以系統(tǒng)數(shù)據(jù)為驅(qū)動(dòng),不依賴于數(shù)學(xué)模型,同時(shí)通過數(shù)據(jù)的波動(dòng)性描述系統(tǒng)的不確定性特征:應(yīng)用了二型模糊集處理帶有噪聲及不確定性數(shù)據(jù)的優(yōu)越性能,保證二次數(shù)據(jù)的精準(zhǔn)性.
Zadeh[23]在1975 年提出了二型模糊集合的概念,二型模糊集合是傳統(tǒng)模糊集合(稱為一型模糊集合)的拓展.二型模糊集合由于隸屬度本身是不確定的,可以對(duì)不確定的數(shù)據(jù)進(jìn)行確定描述,在處理帶有噪聲及不確定性數(shù)據(jù)方面具有優(yōu)越的性能[24],這使它用于處理不確定性強(qiáng)、隨機(jī)性強(qiáng)的交通流數(shù)據(jù)成為可能.2017 年,二型模糊集合理論得到了進(jìn)一步的修正[25].
定義1.設(shè)C(I)是由單位區(qū)間I的全體非空閉子集構(gòu)成的一個(gè)集合.論域X上的一個(gè)二型模糊集合ω定義為
圖1 基于二型模糊集合理論的人工交通系統(tǒng)評(píng)估過程Fig.1 Artificial traffic system assessment process based on type-2 fuzzy set theory
其中,x為主變量,u為次變量,z為第3 變量,Lx為主隸屬度,由一個(gè)多值映射定義而得,表示為
即?x ∈X,存在Lx ∈C(2I),使得
定義2.二型模糊集合ω的支集為在X ×I中使次隸屬度大于0 的全體元素構(gòu)成的集合,記為Supp(ω),即
若為一個(gè)連續(xù)函數(shù),則由連續(xù)函數(shù)的性質(zhì),可記CoS(ω)為支集Supp(ω)的閉包(Closure of support),表示為
如果對(duì)?x ∈X,?u ∈Lx,都有則稱ω為一個(gè)區(qū)間二型模糊集合.
城市交通環(huán)境因其開放性、不確定性和隨機(jī)性較強(qiáng),導(dǎo)致交通數(shù)據(jù)具有不確定性和隨機(jī)性特征,但同時(shí),城市交通環(huán)境作為一個(gè)大慣性系統(tǒng),其數(shù)據(jù)的非嚴(yán)格重復(fù)性又使其具有較好的統(tǒng)計(jì)特征.
圖2 以24 小時(shí)交通流量數(shù)據(jù)為例,刻畫了多天交通流量的分布及區(qū)間化描述.在某一給定時(shí)刻,區(qū)間的最大和最小值表明了該時(shí)刻交通流量可能的變化范圍.
交通流量的區(qū)間化描述方式不僅能夠給出交通流量豐富的分布信息,并可以用構(gòu)造內(nèi)嵌一型模糊集合,以作為二型模糊集的源數(shù)據(jù).
本文引入置信區(qū)間的概念,應(yīng)用中心極限定理,將交通流數(shù)據(jù)由點(diǎn)值數(shù)據(jù)轉(zhuǎn)化為區(qū)間描述[26].
置信區(qū)間是指由樣本統(tǒng)計(jì)量所構(gòu)造的總體參數(shù)的估計(jì)區(qū)間:
設(shè)θ是總體的一個(gè)參數(shù),該參數(shù)空間為Θ,x1,x2,···,xn是來自該總體的樣本,n為樣本量.對(duì)于給定的一個(gè)α(0<α<1),若有兩個(gè)統(tǒng)計(jì)量:對(duì)任意的θ ∈Θ,有稱隨機(jī)區(qū)間為θ的置信水平為1?α的置信區(qū)間.
構(gòu)造未知參數(shù)θ的置信區(qū)間最常用的方法是軸樞量法.考慮到對(duì)于非正態(tài)分布的隨機(jī)序列總體,一般難以求出其總體的軸樞量,因此利用中心極限定理將其近似分布轉(zhuǎn)化為正態(tài)分布,從而求得參數(shù)的置信區(qū)間估計(jì)[27].
勒維–林德伯格定理如下:
設(shè)x1,x2,···,xn為相互獨(dú)立同分布的隨機(jī)序列,且E(xi)=μ,D(xi)=σ2>0,i=1,2,3,···,則{xi}服從正態(tài)分布,即
針對(duì)這樣一個(gè)正態(tài)分布,可按照式(7)構(gòu)造軸樞量
經(jīng)過不等式變形,方差σ2已知條件下,期望μ的置信區(qū)間為
Jaccard 算法是由Jaccard 在1908 年提出的,用于對(duì)兩個(gè)集合的相似度進(jìn)行比較[28].其中被廣泛使用的參數(shù)為Jaccard 相似系數(shù)(Jaccard similarity coefficient),用于比較有限樣本集之間的相似性與差異性,Jaccard 相似系數(shù)越大,樣本相似度越高.
圖2 24 小時(shí)交通流量的區(qū)間化描述Fig.2 The interval description of 24 hours traffic flow
從20 世紀(jì)初到現(xiàn)在,Jaccard 算法已經(jīng)在生物學(xué)、經(jīng)濟(jì)和社會(huì)研究領(lǐng)域中被廣泛運(yùn)用并取得了較好的效果.Bell 等[29]在評(píng)估植物圖像分割的子集匹配時(shí)采用了Jaccard 算法,對(duì)分割圖像和地面實(shí)際圖像這兩個(gè)像素集合進(jìn)行相似度的計(jì)算.Rinartha等[30]在文章搜索中運(yùn)用Jaccard 相似度對(duì)關(guān)鍵詞的處理時(shí)間和搜索文章的結(jié)果精確性進(jìn)行了比較分析.結(jié)果發(fā)現(xiàn)Jaccard 相似性查詢建議將產(chǎn)生更加準(zhǔn)確的搜索結(jié)果.研究表明,Jaccard 相似度的平均絕對(duì)誤差(Mean absolute error,MAE)相較于皮爾遜相關(guān)系數(shù)法、對(duì)數(shù)似然值相似度和余弦相似度等誤差較低,且算法簡(jiǎn)單,運(yùn)算速度快.在通常情況下,Jaccard 系數(shù)值越大,樣本相似度越高,本文采用Wu 等[31]提出的針對(duì)二型模糊集合Jaccard 算法,如式(9)所示.
本文選擇北京海淀區(qū)某道路為典型建模場(chǎng)景進(jìn)行可信度實(shí)驗(yàn)研究,該路段雙向2 車道,包含三個(gè)公交車站、兩個(gè)定時(shí)控制的信號(hào)燈路口和3 條公交線路,全長(zhǎng)約為1.4 公里.
研究者以2015 年3 月至4 月中旬的每周二、周三、周四共計(jì)六周18 天,在每一天的上午8 點(diǎn)到下午8 點(diǎn)進(jìn)行數(shù)據(jù)調(diào)研,以調(diào)研數(shù)據(jù)作為人工交通系統(tǒng)的數(shù)據(jù)來源.包括雙方向車流量、車輛類型、多點(diǎn)車輛速度等.因?yàn)樵谠搱?chǎng)景中,有比較繁忙的公交線路,公交線路的參與者又受到周邊環(huán)境的影響,具有復(fù)雜系統(tǒng)典型性數(shù)據(jù)特征.因此本文特別對(duì)參與公共交通運(yùn)輸?shù)臄?shù)據(jù):包括上下車乘客數(shù)、公交車到、發(fā)站時(shí)間等也進(jìn)行了數(shù)據(jù)調(diào)研,完成了該典型交通場(chǎng)景的人工交通系統(tǒng)建模的數(shù)據(jù)準(zhǔn)備.并選取隨機(jī)性較強(qiáng)、對(duì)公共交通調(diào)度規(guī)劃具有重要影響的乘客上車人數(shù)作為人工交通系統(tǒng)可信度評(píng)估參數(shù),進(jìn)行可信度驗(yàn)證.該路段上三個(gè)公交車站在調(diào)研時(shí)段的乘客等車調(diào)研數(shù)據(jù)如表1 所示(實(shí)際系統(tǒng)).限于篇幅,關(guān)于人工交通建模的研究?jī)?nèi)容將在另文進(jìn)行闡述.
搭建的人工交通系統(tǒng)運(yùn)行界面如圖3 所示.根據(jù)實(shí)際調(diào)研數(shù)據(jù),在人工交通系統(tǒng)中設(shè)置該路段初始計(jì)劃乘車人數(shù)為50 人,系統(tǒng)將這50 個(gè)人隨機(jī)分布在路段的不同地方,然后各自判斷自己離哪個(gè)公交車站更近,從而選擇自己的前進(jìn)方向.多次運(yùn)行人工交通系統(tǒng),得到三個(gè)車站等車乘客人數(shù)的仿真數(shù)據(jù),其均值也列入表1 (仿真系統(tǒng)).
圖3 典型人工公共交通系統(tǒng)模型Fig.3 Typical artificial transit traffic system model
為了對(duì)數(shù)據(jù)進(jìn)行統(tǒng)一處理,把每個(gè)參數(shù)的輸入數(shù)據(jù)除以一個(gè)比例因子進(jìn)行“歸十化”到區(qū)間[0,1].對(duì)“歸十化”得到的數(shù)據(jù)進(jìn)行一型模糊化處理,由式(8)將交通流數(shù)據(jù)由點(diǎn)數(shù)據(jù)轉(zhuǎn)化為區(qū)間數(shù)據(jù),表2 展示了區(qū)間化數(shù)據(jù)結(jié)果.基于此數(shù)據(jù)基礎(chǔ),即可構(gòu)造內(nèi)嵌的一型隸屬度模糊集.設(shè)每一個(gè)區(qū)間左端點(diǎn)為b,右端點(diǎn)為c,左右端點(diǎn)的中間值為a,本仿真中,用區(qū)間數(shù)據(jù)構(gòu)造三角型隸屬度函數(shù),則
因此,每一個(gè)區(qū)間都對(duì)應(yīng)著一個(gè)一型模糊集.運(yùn)用式(10)進(jìn)行集合并運(yùn)算:
其中,μA(x)和μB(x)為一型模糊集合A和B的隸屬度函數(shù),μC(x)為集合并運(yùn)算得到的新集合C的隸屬度函數(shù),即二型模糊集合CoS.本文將某5分鐘的前兩個(gè)時(shí)段和本時(shí)段及后一個(gè)時(shí)段共四個(gè)時(shí)段進(jìn)行了并運(yùn)算,得CoS如圖4 所示.
對(duì)實(shí)際交通系統(tǒng)和人工交通系統(tǒng),研究時(shí)間軸為每一天的上午8 點(diǎn)到下午8 點(diǎn),共12 個(gè)小時(shí).因?yàn)榘凑? 分鐘進(jìn)行數(shù)據(jù)統(tǒng)計(jì),所以得到144 個(gè)CoS,限于篇幅,僅列出一個(gè)5 分鐘數(shù)據(jù)采樣時(shí)段,兩個(gè)系統(tǒng)的二型模糊集合圖例,結(jié)果如圖5 所示.
表1 三個(gè)公交車站上車人數(shù)的實(shí)際調(diào)研數(shù)據(jù)和人工交通系統(tǒng)運(yùn)行數(shù)據(jù)Table 1 The actual data and simulation data of people get on the three bus stops
表2 三個(gè)公交車站上車人數(shù)模糊化以后的實(shí)際數(shù)據(jù)和仿真數(shù)據(jù)Table 2 The actual data and simulation data after fuzzified of people get on the three bus stops
圖4 區(qū)間算法一型模糊集合并運(yùn)算Fig.4 An example of the union of type-1 fuzzy sets
經(jīng)過解模糊化處理,可以得到兩個(gè)系統(tǒng)分別由144 個(gè)重心組成的上限重心和下限重心值構(gòu)造出來的144 個(gè)集合,根據(jù)式(9)可計(jì)算出兩個(gè)系統(tǒng)三個(gè)站點(diǎn)各144 個(gè)集合的相似度值,記為Jsm(x)(x=1,2,3).
圖5 三個(gè)候車站實(shí)際候車乘客數(shù)據(jù)和對(duì)應(yīng)的人工交通系統(tǒng)候車乘客人數(shù)數(shù)據(jù)的二型模糊集合Fig.5 Two-type fuzzy set of three stations actual data and corresponding simulation data
由式(9)可計(jì)算得到人工公共交通系統(tǒng)可信度評(píng)估結(jié)果:
第1 站的評(píng)估結(jié)果為Jsm(1)=1
第2 站的評(píng)估結(jié)果為Jsm(2)=1
第3 站的評(píng)估結(jié)果為Jsm(3)=0.6331
整個(gè)系統(tǒng)的評(píng)估結(jié)果為
針對(duì)這一結(jié)果,本文使用克朗巴哈系數(shù)(Cronbachs alpha)進(jìn)行評(píng)價(jià),通常Cronbach 系數(shù)的值在0 和1 之間.如果系數(shù)不超過0.6,一般認(rèn)為內(nèi)部一致可信度不足:達(dá)到0.7~0.8 時(shí)表示量表具有相當(dāng)?shù)目尚哦?達(dá)到0.8~0.9 時(shí)說明量表可信度非常好,如表3 所示[32].本文所建立的人工交通系統(tǒng),以車站候車人數(shù)為計(jì)算指標(biāo),得到的可信度為0.88,表明人工交通系統(tǒng)很可信.
表3 可信度值與Cronbach 系數(shù)的關(guān)系Table 3 The relationship between the value of credibility and Cronbach coefficient
本文進(jìn)行了人工交通系統(tǒng)模型可信度評(píng)估的研究:針對(duì)交通數(shù)據(jù)的不確定性和隨機(jī)性特性,在可可信度評(píng)估中引入?yún)^(qū)間二型模糊集理論,利用基于統(tǒng)計(jì)的數(shù)據(jù)一致性分析思想,構(gòu)建了基于區(qū)間二型模糊集方法的人工系統(tǒng)可信度評(píng)估方法.本文核心思想是對(duì)實(shí)際系統(tǒng)和人工系統(tǒng)的輸出數(shù)據(jù)進(jìn)行了二重處理,一重處理通過置信區(qū)間獲取數(shù)據(jù)的統(tǒng)計(jì)特征,同時(shí)區(qū)間化得到二重處理的輸入數(shù)據(jù):二重處理通過二型模糊集方法處理不確定性數(shù)據(jù)、隨機(jī)性數(shù)據(jù)以及噪聲數(shù)據(jù)的能力,獲得更細(xì)致刻畫系統(tǒng)特性的輸出數(shù)據(jù)集,通過兩個(gè)數(shù)據(jù)集的相似性程度評(píng)估系統(tǒng)的可信度.
本文使用人工交通系統(tǒng)中候車乘客人數(shù)這一類易受周邊環(huán)境影響的數(shù)據(jù)進(jìn)行了計(jì)算驗(yàn)證,結(jié)果表明了基于區(qū)間二型模糊集合的可信度評(píng)估方法的有效性和合理性.
本文的研究過程中還存在著如下一些問題:1)在建模過程中沒有完全提取交通系統(tǒng)的所有參數(shù)及特性;2)在案例研究中,也只針對(duì)公交運(yùn)行過程中乘客上車人數(shù)數(shù)據(jù)進(jìn)行評(píng)估,相對(duì)單一.后續(xù)的研究工作要繼續(xù)完善人工交通系統(tǒng)模型,獲得更多類型的數(shù)據(jù),通過更多案例研究實(shí)現(xiàn)系統(tǒng)的可信度評(píng)估.同時(shí),也將研究如何通過可信度評(píng)估過程及結(jié)果對(duì)人工交通系統(tǒng)建模過程提出優(yōu)化建議.