摘 要:雖然自動(dòng)駕駛技術(shù)在線路規(guī)劃和駕駛控制方面取得較大進(jìn)展,但遇到倫理困境時(shí),當(dāng)前自動(dòng)駕駛汽車(chē)仍然很難作出確定、合理的決策,導(dǎo)致人們對(duì)自動(dòng)駕駛汽車(chē)安全駕駛產(chǎn)生懷疑和擔(dān)憂。所以有必要研究自動(dòng)駕駛倫理決策模型和機(jī)制,使得自動(dòng)駕駛汽車(chē)在倫理困境下能夠作出合理決策。針對(duì)以上問(wèn)題,設(shè)計(jì)了基于stacking融合機(jī)制的倫理決策模型,對(duì)機(jī)器學(xué)習(xí)和深度學(xué)習(xí)進(jìn)行深度融合。一方面將基于特征依賴關(guān)系的樸素貝葉斯模型(ACNB)、加權(quán)平均一階貝葉斯模型(WADOE)和自適應(yīng)模糊模型(AFD)作為stacking融合機(jī)制上基學(xué)習(xí)器。依據(jù)先前準(zhǔn)確率,設(shè)定各自模型權(quán)重,再運(yùn)用加權(quán)平均法,計(jì)算決策結(jié)果。然后將該決策結(jié)果作為元學(xué)習(xí)器訓(xùn)練集,對(duì)元學(xué)習(xí)器進(jìn)行訓(xùn)練,構(gòu)建stacking融合模型。最后,運(yùn)用驗(yàn)證集分別對(duì)深度學(xué)習(xí)模型和stacking融合模型進(jìn)行驗(yàn)證,依據(jù)驗(yàn)證中平均損失率和準(zhǔn)確率以及測(cè)試中正確率,評(píng)價(jià)和比較深度學(xué)習(xí)模型和stacking融合機(jī)制決策效果。結(jié)果表明,深度學(xué)習(xí)模型平均損失率最小為0.64,最大平均準(zhǔn)確率為0.7,最高正確率為0.61。stacking融合機(jī)制平均損失率最小為0.35,最大平均準(zhǔn)確率為0.90,最高正確率為0.75,說(shuō)明stacking融合機(jī)制相對(duì)于深度學(xué)習(xí)模型,決策結(jié)果準(zhǔn)確率和正確率方面有了較大改進(jìn)。
關(guān)鍵詞: 自動(dòng)駕駛汽車(chē); 倫理決策; stacking融合機(jī)制; 深度學(xué)習(xí)
中圖分類號(hào): U471.15 文獻(xiàn)標(biāo)志碼: A 文章編號(hào): 1001-3695(2025)02-019-0462-07
doi: 10.19734/j.issn.1001-3695.2024.07.0280
Self-driving ethical decision-making model based on
stacking fusion mechanism
Liu Guoman1’, Sheng Jing1, Luo Yufeng2
(1.Jiangxi Province Key Laboratory of Precision Drive amp; Equipment, Nanchang Institute of Technology, Nanchang 330099, China; 2.School of Electrical and Automation Engineering, East China Jiaotong University, Nanchang 330013, China)
Abstract:Although autonomous vehicles(AV) have made great progress in line planning and driving controlling, it is still difficult to make certain and reasonable decision-making in ethical dilemmas, which causes people’s doubts and worry about AV’s safety. Therefore, it is necessary to design a self-driving ethical decision-making model and mechanism to make reaso-nable decision-makings in ethical dilemmas for AV. For them, this paper provided an ethical decision-making model based on stacking fusion mechanism, in which machine learning and deep learning were deeply integrated. Firstly, naive Bayes model based on attribute correlation(ACNB), weighted average first-order Bayes model(WADOE) and adaptive fuzzy model(AFD) were constructed into basis learners of stacking fusion mechanism. According to the accuracy in previous verification, their weights were set in decision-making, and the decision-making results in all dilemmas should be calculated by weighted average method. Then the decision-making data by the basis learner was regarded as training set for the meta-learner in the stacking fusion mechanism to construct stacking fusion decision-making model. Lastly, all dilemmas in verification set were used to verify deep learning model and stacking fusion mechanism respectively. The effect of stacking fusion mechanism was evaluated and compared based on the average loss rate and accuracy in the verification and the correction rate in the testing. The results show that the average loss rate is more 0.64, the maximum average accuracy is 0.7, and the highest correction rate is 0.61 for the deep learning model. However, the lowest average loss rate is 0.35, the maximum average accuracy is 0.9, and the highest correction rate is 0.75 for stacking fusion mechanism, which indicates the stacking fusion mechanism is greatly improved compared with the deep learning model.
Key words:autonomous vehicles; ethical decision-making; stacking fusion mechanism; deep learning
0 引言
隨著人工智能算法和控制技術(shù)發(fā)展,自動(dòng)駕駛技術(shù)不僅解放人類雙手,減少了操作失誤或不當(dāng)造成交通事故,還提高了交通運(yùn)行效率,減少空氣污染等[1,2]。但自動(dòng)駕駛汽車(chē)上感知、控制和執(zhí)行模塊都可能存在失效或執(zhí)行延時(shí)等問(wèn)題,很難完全避免自動(dòng)駕駛汽車(chē)與行人或物發(fā)生碰撞。自動(dòng)駕駛汽車(chē)可能遇到“電車(chē)?yán)Ь场彼频膫惱砝Ь?,需要自?dòng)駕駛汽車(chē)盡量作出合理、透明的決策,才能促進(jìn)人類對(duì)自動(dòng)駕駛汽車(chē)的信任和認(rèn)可。為此,國(guó)內(nèi)外學(xué)者和相關(guān)研究機(jī)構(gòu)對(duì)自動(dòng)駕駛汽車(chē)倫理決策中所遵守的道德原則和決策相關(guān)理論進(jìn)行探索和研究。如一些學(xué)者提出了將功利主義原則運(yùn)用于自動(dòng)駕駛汽車(chē)倫理決策上,確保傷害結(jié)果最小化和效益最大化[3]。自動(dòng)駕駛汽車(chē)若按照功利主義原則,僅考慮決策行為結(jié)果和效用,忽略法律、道德和價(jià)值觀等因素影響,往往使得安全保護(hù)措施好或遵守交通規(guī)則的行人,成為碰撞對(duì)象,這不合理且不科學(xué)。于是一些學(xué)者將義務(wù)論運(yùn)用于自動(dòng)駕駛汽車(chē)倫理決策上,要求自動(dòng)駕駛汽車(chē)必須遵照某種道德原則或正當(dāng)性去決策[4]。但該原則忽視了行為結(jié)果,使得決策行為很難被人類所接受。同時(shí),又有專家或?qū)W者提出了美德論運(yùn)用于人工智能倫理決策中,通過(guò)強(qiáng)化學(xué)習(xí),確保人工智能體決策的道德性和高尚性[5,6]。雖然按照該種道德原則所作出的結(jié)果,很容易被人類所接受,但透明性較差,人類很難解釋和預(yù)測(cè)決策的原因和動(dòng)機(jī)。因此自動(dòng)駕駛汽車(chē)倫理決策中遵守一種道德原則很難滿足人類多樣化道德需求。于是Contissa等人[7]設(shè)計(jì)了用戶選擇的“道德旋鈕”架構(gòu),旋鈕兩端分別對(duì)應(yīng)利他主義和利己主義,旋鈕中央對(duì)應(yīng)完全中立主義。通過(guò)這種決策架構(gòu)設(shè)計(jì),將自動(dòng)駕駛汽車(chē)決策權(quán)由設(shè)計(jì)者及制造者轉(zhuǎn)移給用戶選擇。但該架構(gòu)可能會(huì)導(dǎo)致用戶為了維護(hù)自身利益,忽視他人或集體利益,導(dǎo)致“囚徒困境”出現(xiàn)。同時(shí),Geisslinger等人研究了多種道德規(guī)則相結(jié)合的風(fēng)險(xiǎn)倫理(ethics of risk),將貝葉斯規(guī)則、最大最小規(guī)則和公平規(guī)則融入到倫理決策中,既要考慮碰撞結(jié)果,又要兼顧相關(guān)主體權(quán)益,確保行為合理性和公平性[8,9]。但各個(gè)道德原則所作出決策結(jié)果不一致或存在沖突時(shí),自動(dòng)駕駛汽車(chē)該如何協(xié)調(diào),還需要進(jìn)一步研究和探索。另外,一些專家針對(duì)倫理困境決策問(wèn)題,提出了一些決策機(jī)制和理論,如Wang等人[10]提出了自動(dòng)駕駛汽車(chē)倫理困境決策平臺(tái)(LO-MPC),依據(jù)種類和車(chē)輛性能限制,自動(dòng)駕駛汽車(chē)將優(yōu)先保護(hù)人類且不超越汽車(chē)性能限制的決策行為。但決策中,僅考慮人類保護(hù)和汽車(chē)本身性能,未考慮道德、法律以及價(jià)值觀等其他因素,使得決策結(jié)果難以滿足人類需求和道德準(zhǔn)則。Wu等人[11]依據(jù)人類道德行為和高尚品德,通過(guò)強(qiáng)化學(xué)習(xí),使得智能機(jī)器作出符合人類道德和社會(huì)要求的決策行為。但決策泛化能力較弱,面對(duì)現(xiàn)實(shí)中復(fù)雜多變倫理困境,很難處理新出現(xiàn)的倫理困境。另外,文獻(xiàn)[12]提出了一種可執(zhí)行倫理決策機(jī)制,主要將目標(biāo)偏差和操作花費(fèi)代價(jià)作為影響因子,構(gòu)建線性決策模型。若用戶注重目標(biāo)達(dá)成,增加目標(biāo)偏差在決策中權(quán)重。相反,若用戶比較重視駕駛中感覺(jué)和舒適度,則增加操作花費(fèi)代價(jià)權(quán)重。但權(quán)重是依據(jù)用戶目的和意愿設(shè)定,使得自動(dòng)駕駛汽車(chē)決策結(jié)果存在主觀性和不確定性。Li等人[13]采用T-S模糊神經(jīng)網(wǎng)絡(luò)構(gòu)建自動(dòng)駕駛汽車(chē)決策模型DDM,將道德和法律因素融入了信號(hào)燈引起沖突的駕駛決策模型,利用主成分分析法,確定倫理決策中主要因素,建立模糊神經(jīng)網(wǎng)絡(luò)決策模型。但這種模糊神經(jīng)網(wǎng)絡(luò)模型,不能明確說(shuō)明輸入與輸出之間對(duì)應(yīng)關(guān)系,影響了自動(dòng)駕駛汽車(chē)決策的透明性和可解釋性。
總之,當(dāng)前自動(dòng)駕駛汽車(chē)倫理決策道德原則和機(jī)制中,由于考慮因素單一或較少、沒(méi)有統(tǒng)一原則和泛化能力較弱等問(wèn)題,影響了自動(dòng)駕駛汽車(chē)倫理決策的合理性、確定性和普適性。所以有必要研究多種模型和算法融合機(jī)制,一方面依據(jù)線性和非線性決策模型確保決策結(jié)果的透明性和確定性;另一方面運(yùn)用深度學(xué)習(xí)算法,自動(dòng)提取特征信息,確保決策結(jié)果的客觀性和普適性,提高決策泛化能力。
1 算法理論
1.1 stacking集成算法
stacking集成算法是一種異源集成算法,主要運(yùn)用不同算法對(duì)原始數(shù)據(jù)進(jìn)行處理和學(xué)習(xí)。當(dāng)前主要存在單層stacking、多層stacking和其他技術(shù)與stacking相結(jié)合方式三類。
1)單層stacking算法
單層stacking是指運(yùn)用原始訓(xùn)練數(shù)據(jù)對(duì)多個(gè)基學(xué)習(xí)器進(jìn)行訓(xùn)練,依據(jù)基學(xué)習(xí)器計(jì)算結(jié)果融合,作為元學(xué)習(xí)器訓(xùn)練集,對(duì)元學(xué)習(xí)器進(jìn)行訓(xùn)練,生成元學(xué)習(xí)器模型[14,15],單層stacking結(jié)構(gòu)如圖1所示。
2)多層stacking算法
多層stacking算法結(jié)構(gòu)中,存在多個(gè)元學(xué)習(xí)器分支,通過(guò)對(duì)基學(xué)習(xí)器上預(yù)測(cè)數(shù)據(jù)進(jìn)行訓(xùn)練,生成元學(xué)習(xí)器分支模型。最后將各個(gè)元學(xué)習(xí)器分支所計(jì)算的結(jié)果和預(yù)測(cè)數(shù)據(jù),再作為上面元學(xué)習(xí)器訓(xùn)練集,生成元學(xué)習(xí)器模型[16,17],雙層stacking結(jié)構(gòu)如圖2所示。
3)其他技術(shù)與stacking結(jié)合
可以考慮將上面單層或多層stacking方法與其他技術(shù)相結(jié)合,如:無(wú)監(jiān)督學(xué)習(xí)方法等,降低分類決策維度和復(fù)雜度[18,19]。
1.2 ACNB
ACNB是基于特征依賴關(guān)系的樸素貝葉斯算法,傳統(tǒng)樸素貝葉斯算法(NB)必須滿足特征相互獨(dú)立假設(shè)前提下,才可以運(yùn)用單個(gè)特征條件下先驗(yàn)概率求解后驗(yàn)概率,做好分類和決策。對(duì)于自動(dòng)駕駛汽車(chē)倫理決策來(lái)說(shuō),往往特征之間存在依賴關(guān)系,如傷害和數(shù)量之間,為了避免更多人受到傷害,通常選擇避免碰撞更多行人。若忽略特征間關(guān)系,可能會(huì)影響決策結(jié)果的正確性和合理性。因此運(yùn)用ACNB算法,可以考慮部分特征因素之間關(guān)系。當(dāng)倫理困境中存在兩種或兩種以上因素,都有利于作出同樣決策結(jié)果,則計(jì)算聯(lián)合特征概率時(shí),考慮加入特征間最大相關(guān)系數(shù)[20],如式(1)所示。
p(x1,x2,…,xn|Cj)=max(corr(xl,xk))∏ p(xi|Cj)(1)
其中:p表示分布概率;x表示特征屬性;C表示決策結(jié)果類型;corr(xl,xk)表示兩特征屬性xl和xk間相關(guān)系數(shù), 主要以訓(xùn)練集中倫理困境作為統(tǒng)計(jì)對(duì)象,利用式(2)求解出特征間相關(guān)系數(shù)。
corr(xl,xk)=p(xl,xk|ci)p(xl|ci)p(xk|ci)(2)
求解轉(zhuǎn)向和直行特征間相關(guān)系數(shù)矩陣如表1、2所示,ACNB算法處理過(guò)程如算法1所示。
算法1 ACNB算法
輸入:待測(cè)對(duì)象。
輸出:決策結(jié)果。
a) 待測(cè)對(duì)象特征分析和檢測(cè),進(jìn)行特征量化;
b) 依據(jù)特征向量,判斷兩種以上特征間是否存在相關(guān)性,若是,搜索最大特征相關(guān)系數(shù)max(corr(xl,xk));
c) 根據(jù)式(1),計(jì)算該對(duì)象屬于各個(gè)決策結(jié)果的后驗(yàn)概率;
d) 依據(jù)式(3)求解最大后驗(yàn)概率,確定決策結(jié)果。
CNB=arg maxCj∈C P(Cj)∏ P(xi|Cj)(3)
1.3 WADOE
WADOE,稱為基于特征加權(quán)平均一階貝葉斯模型,后驗(yàn)概率計(jì)算如式(4)所示。
P(c|x)∞1n∑ni=1wiP(c,xi)∏nj=1, j≠iP(xj|c,xi)(4)
其中:wi表示第i特征因素在模型中權(quán)重系數(shù),通常利用特征因素與決策結(jié)果之間互信息變量求解[21],如式(5)所示。
wi=I(xi,c)∑ni=1I(xi,c)(5)
求解各特征因素的權(quán)重系數(shù)如表3所示,WADOE算法處理過(guò)程如算法2所示。
算法2 WADOE算法
輸入: 訓(xùn)練集數(shù)據(jù)。
輸出:WADOE模型。
a) 計(jì)算特征因素xi 和決策結(jié)果Cj之間先驗(yàn)概率 p(xi|Cj)。
b) 運(yùn)用式(5)求解各個(gè)特征因素在決策模型中權(quán)重。
c) 構(gòu)建WADOE模型,求解后驗(yàn)概率,作出決策。
1.4 自適應(yīng)模糊算法
該算法主要運(yùn)用模糊算法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行處理,依據(jù)模糊隸屬度,對(duì)待測(cè)對(duì)象作出決策,并根據(jù)決策結(jié)果,更新和優(yōu)化標(biāo)準(zhǔn)樣本空間,其中模糊隸屬函數(shù)如定義1所示。
定義1 在某一論域X是有限非空集合,則對(duì)象x上模糊集A可以用隸屬函數(shù)來(lái)表示,見(jiàn)式(6)。
A:X→[0,1],x→A(x)(6)
其中:A(x)表示對(duì)象x隸屬于模糊集合A程度,其值在[0,1],模糊集合數(shù)學(xué)表示方式,可參見(jiàn)式(7)。
A={(x,A(x))|x∈X},where A(x)∈[0,1](7)
對(duì)于隸屬A(x),通常采用模糊統(tǒng)計(jì)試驗(yàn)方式確定,運(yùn)用確定性手段研究不確定性問(wèn)題[22]。采用多次試驗(yàn)方式判斷對(duì)象x屬于隨機(jī)集合概率,即為隸屬度,如式(8)所示。
A(x)=x∈A的次數(shù)n(8)
當(dāng)n值越大,則x屬于模糊集合A值就越穩(wěn)定,該穩(wěn)定值即為對(duì)象x對(duì)集合A隸屬度。自適應(yīng)模糊算法,相對(duì)傳統(tǒng)模糊算法來(lái)說(shuō),標(biāo)準(zhǔn)樣本空間是變化,模糊算法處理過(guò)程如算法3所示。
算法3 自適應(yīng)模糊算法
輸入:訓(xùn)練集樣本。
輸出:標(biāo)準(zhǔn)樣本空間和模糊隸屬函數(shù)。
a) 計(jì)算歐氏距離。
計(jì)算待測(cè)訓(xùn)練對(duì)象u=(u1,u2,…,um)與標(biāo)準(zhǔn)樣本空間ai=(i1,i2,…,im)之間歐氏距離d(u,ai)和標(biāo)準(zhǔn)樣本空間之間歐氏距離d(a1,a2)。
b) 標(biāo)準(zhǔn)樣本空間更新和優(yōu)化。
當(dāng)d(u,a1)lt;d(a1,a2) 和 d(u,a2)lt;d(a1,a2) 且d(u,a1)gt;d(u,a2) 時(shí),將待測(cè)訓(xùn)練對(duì)象u加入到a2標(biāo)準(zhǔn)樣本空間中,重新計(jì)算a2樣本空間均值向量:2k=1ki+1∑ki+1j=1a2jk,k=1,2,…,m且ki=ki+1;否則,d(u,a1)lt;d(a1,a2) 和d(u,a2)lt;d(a1,a2) 且d(u,a1)lt;d(u,a2)時(shí),將該待測(cè)對(duì)象u加入到a1標(biāo)準(zhǔn)樣本空間中,重新計(jì)算a1樣本空間均值向量
1k=1ki+1∑ki+1j=1a1jk
k=1,2,…,m
且ki=ki+1。然后運(yùn)用優(yōu)化的標(biāo)準(zhǔn)樣本空間,對(duì)訓(xùn)練集中下一個(gè)待測(cè)對(duì)象進(jìn)行訓(xùn)練和處理,轉(zhuǎn)向步驟a)操作。
c) 建立模糊隸屬函數(shù)。
訓(xùn)練完訓(xùn)練集數(shù)據(jù)后,建立最終標(biāo)準(zhǔn)樣本空間,構(gòu)建模糊隸屬函數(shù):
Ai(u)=1-di(u,ai)D
i=1,2,…,k
其中:D=d(u,a1)+d(u,a2)+…+d(u,ai),對(duì)測(cè)試樣本進(jìn)行模糊隸屬度計(jì)算,依據(jù)模糊隸屬度,確定待測(cè)對(duì)象的決策結(jié)果。
1.5 卷積神經(jīng)網(wǎng)絡(luò)
卷積神經(jīng)網(wǎng)絡(luò)(CNN)主要通過(guò)層與層之間轉(zhuǎn)換,進(jìn)行前向和反向雙向傳播,實(shí)現(xiàn)端到端分類識(shí)別和判斷[23,24]。主要運(yùn)用卷積核對(duì)待測(cè)對(duì)象上特征進(jìn)行卷積運(yùn)算,自動(dòng)提取特征信息,卷積運(yùn)算如式(9)所示。
yl=∑cl-1i=1wli,c*xl-1i+bli(9)
其中:xl-1i為l-1層第i個(gè)通道輸出信號(hào);c表示卷積神經(jīng)網(wǎng)絡(luò)通道號(hào);c(l-1)第l-1層第c個(gè)通道;wli,c為第l層第i輸出通道第c個(gè)網(wǎng)絡(luò)通道上權(quán)重矩陣;bli為第l層第i通道上偏置項(xiàng)。其次,為了實(shí)現(xiàn)對(duì)特征降維和壓縮,通常采用最大池化法和平均池化法對(duì)樣本數(shù)據(jù)進(jìn)行池化操作,提取樣本局部特征和全局特征[25,26],如式(10)(11)所示。
yl(u,v)=max(v-1)S+1lt;klt;vS{Xl(u,v)}(10)
yl(u,v)=1S∑vSSxl(u,k)(11)
其中:S為池化卷積核大小,一般設(shè)為n×n對(duì)稱矩陣。l(u,v)指第l層第u通道第v個(gè)神經(jīng)元l(u,k)表示第l層上第u通道第k神經(jīng)元。最后,加上全連接層,對(duì)提取特征信息進(jìn)行聚合展開(kāi),將其轉(zhuǎn)換為一維特征向量,見(jiàn)式(12),運(yùn)算結(jié)果為分類決策層提供依據(jù)。
δj=h(wjpj+bj)(12)
2 stacking融合機(jī)制設(shè)計(jì)
2.1 算法選擇
自動(dòng)駕駛汽車(chē)倫理決策,主要根據(jù)倫理困境中車(chē)道上或車(chē)內(nèi)的受害者相對(duì)特征差異作出決策,特征值是非連續(xù)離散值,比較適合采用非線性算法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行處理,因此本文選擇了ACNB和WADOE兩種非線性算法處理訓(xùn)練集數(shù)據(jù),構(gòu)建ACNB和WADOE模型。同時(shí),考慮倫理困境決策結(jié)果的不確定性和模糊性,又選擇自適應(yīng)模糊算法對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行處理,生成了自適應(yīng)模糊模型,三種模型共同作為stakcing融合機(jī)制上基學(xué)習(xí)器。然后依據(jù)三種非線性模型驗(yàn)證中平均準(zhǔn)確率,設(shè)置各自模型在決策中的權(quán)重。然后采用加權(quán)平均法,計(jì)算原始訓(xùn)練集中倫理困境決策結(jié)果,作為stacking融合機(jī)制上元學(xué)習(xí)器訓(xùn)練集??紤]各種不同類型和結(jié)構(gòu)的神經(jīng)網(wǎng)絡(luò)模型的特點(diǎn)和決策效果,stacking融合機(jī)制上元學(xué)習(xí)器采用了多尺度混合注意力機(jī)制的深度學(xué)習(xí)算法。
2.2 stacking融合模型構(gòu)建
為了建立stacking融合模型,選擇463個(gè)倫理困境圖片作為訓(xùn)練集,首先分別運(yùn)用ACNB、WADOE和自適應(yīng)模糊算法對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行處理,計(jì)算出決策結(jié)果。然后,依據(jù)這些模型先前決策結(jié)果準(zhǔn)確率和測(cè)試效果,設(shè)定模型權(quán)重,三者決策結(jié)果準(zhǔn)確率如表4所示。最后通過(guò)加權(quán)平均法,計(jì)算最終決策結(jié)果,再作為stacking融合機(jī)制上元學(xué)習(xí)器上訓(xùn)練集,對(duì)深度學(xué)習(xí)模型進(jìn)行訓(xùn)練和優(yōu)化,構(gòu)建stacking融合決策模型,如圖3所示。依據(jù)表4,三者非線性模型在決策中所占權(quán)重分別設(shè)為0.33,0.34和0.33。
由于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)在處理圖像時(shí),權(quán)重矩陣參數(shù)太多,很容易造成過(guò)擬合現(xiàn)象。卷積神經(jīng)網(wǎng)絡(luò)通過(guò)局部關(guān)聯(lián)和參數(shù)共享,可以用較少參數(shù),訓(xùn)練較好模型,避免過(guò)擬合發(fā)生[27]。另外,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)主要針對(duì)具有序列特性數(shù)據(jù),能夠挖掘數(shù)據(jù)中時(shí)序信息以及語(yǔ)義信息,比較適合處理語(yǔ)音識(shí)別、語(yǔ)言模型、機(jī)器翻譯以及時(shí)序分析等NLP問(wèn)題[28],并不適合圖像數(shù)據(jù)處理。因此stacking融合機(jī)制上元學(xué)習(xí)器采用卷積神經(jīng)網(wǎng)絡(luò)。但傳統(tǒng)CNN只能從單一維度提取倫理困境上的特征信息,影響特征提取的完整性和全面性。因此比較適合采用多尺度卷積神經(jīng)網(wǎng)絡(luò),從多個(gè)維度提取特征信息[29,30]。另外,自動(dòng)駕駛汽車(chē)倫理困境決策主要根據(jù)車(chē)道上行人或乘客的特征信息比較進(jìn)行量化,需要重點(diǎn)關(guān)注車(chē)道或車(chē)內(nèi)重要區(qū)域和種類、數(shù)量、傷害等主要特征因素。卷積神經(jīng)網(wǎng)絡(luò)有必要加入注意力機(jī)制,因此stacking融合機(jī)制上元學(xué)習(xí)器采用成多尺度混合注意力機(jī)制卷積神經(jīng)網(wǎng)絡(luò),如圖4所示。
該深度學(xué)習(xí)模型,設(shè)計(jì)四個(gè)層次結(jié)構(gòu),每層采用不同卷積核數(shù),分別為128、64、32、16,從高低維度提取特征信息。其中,第一層卷積分支采用兩個(gè)卷積層串聯(lián)和最大卷積核數(shù),獲取倫理困境中高維度特征信息。第二層卷積分支是在兩個(gè)卷積層之后各自加入最大池化層(MAX)操作,提取出訓(xùn)練集中關(guān)鍵特征和重要區(qū)域,并且卷積分支層上加入了混合注意力機(jī)制。對(duì)于混合注意力機(jī)制,是將通道注意力和空間注意力相結(jié)合,先后對(duì)訓(xùn)練對(duì)象上關(guān)鍵特征和重要區(qū)域進(jìn)行空間變換和通道壓縮激勵(lì)[31],工作原理如圖5所示。
若只考慮訓(xùn)練對(duì)象上局部區(qū)域和關(guān)鍵特征,忽略整體因素,可能影響分類決策效果。于是第三層卷積分支層上加入平均池化層(GAP),對(duì)對(duì)象上整體特征進(jìn)行提取。最后一層卷積分支采用了卷積核數(shù)最少,從低維度上提取特征信息。另外,為了提高深度學(xué)習(xí)網(wǎng)絡(luò)性能,每個(gè)卷積分支層都加入標(biāo)準(zhǔn)歸一化處理(BN)。最后連接到全連接層FC,將特征信息轉(zhuǎn)換成一維特征向量,進(jìn)行特征融合和運(yùn)算,送入分類決策層softmax進(jìn)行分類和決策,確定最終決策結(jié)果,直行還是轉(zhuǎn)向。
2.3 實(shí)例決策過(guò)程
以圖6所示倫理困境作為實(shí)例,描述stacking融合機(jī)制決策過(guò)程。
對(duì)于圖上倫理困境實(shí)例,若自動(dòng)駕駛汽車(chē)選擇直行,直行車(chē)道上2位女士、1位嬰兒、1位小孩和1只貓將會(huì)碰撞死亡,且該行人和貓都遵守交通規(guī)則。相反,自動(dòng)駕駛汽車(chē)選擇轉(zhuǎn)向,將使得轉(zhuǎn)向車(chē)道上不遵守交通規(guī)則2位經(jīng)理、1位醫(yī)生、1位運(yùn)動(dòng)員和1位孕婦死亡。直行車(chē)道上行人或物相對(duì)于轉(zhuǎn)向車(chē)道上行人來(lái)說(shuō),特征差異在于年齡小,遵守交通規(guī)則,行人相對(duì)較少。依據(jù)特征量化規(guī)則,1表示直行車(chē)道人或物相對(duì)轉(zhuǎn)向車(chē)道,具有優(yōu)先得到保護(hù)特征因素;0表示直行車(chē)道人或物與轉(zhuǎn)向車(chē)道特征相似或相同;-1表示直行車(chē)道上人或物相對(duì)轉(zhuǎn)向車(chē)道,具有不利于得到保護(hù)的特征因素。所以該倫理困境特征向量為:[數(shù)量,年齡,規(guī)則,種類,傷害,自身利益]=[0,1,1,-1,0,0]。
1)ACNB模型計(jì)算
首先運(yùn)用先前建立ACNB模型,對(duì)該倫理困境實(shí)例進(jìn)行決策和計(jì)算。由于直行車(chē)道上行人或物具有年齡相對(duì)較小和遵守交通規(guī)則的特征因素,所以計(jì)算后驗(yàn)概率時(shí),應(yīng)將年齡和交通規(guī)則之間相關(guān)系數(shù)加入后驗(yàn)概率計(jì)算公式,依據(jù)表1可知,這兩者特征之間相關(guān)系數(shù)為1.27。對(duì)于各個(gè)獨(dú)立特征屬性下先驗(yàn)概率,主要根據(jù)Moral Machine平臺(tái)所公開(kāi)調(diào)查數(shù)據(jù)分析和統(tǒng)計(jì),計(jì)算出各個(gè)特征屬性下選擇直行和轉(zhuǎn)向的先驗(yàn)概率,統(tǒng)計(jì)結(jié)果如表5所示。
自動(dòng)駕駛汽車(chē)選擇轉(zhuǎn)向C1概率為
p(c1|x1,x2,x3)=corr(x1,x2)p(x1=1,x2=1,x3=-1|c1)p(c1)p(x1,x2,x3)=
corr(x1,x2)p(x1=1|c1)p(x2=1|c1)p(x3=-1|c1)p(c1)p(x1,x2,x3)=
1.27×0.617×0.636×0.121×0.504p(x1,x2,x3)=0.0304p(x1,x2,x3)
另外,對(duì)于選擇直行C2概率,由于不存在兩種特征屬性都有利于直行,默認(rèn)特征屬性之間相互獨(dú)立,自動(dòng)駕駛汽車(chē)選擇直行C2概率為
p(c2|x1,x2,x3)=p(x1=1,x2=1,x3=-1|c2)p(c2)p(x1,x2,x3)=
p(x1=1|c1)p(x2=1|c1)p(x3=-1|c1)p(c1)p(x1,x2,x3)=
0.879×0.383×0.364×0.496p(x1,x2,x3)=0.0608p(x1,x2,x3)
由于日常生活中p(x1,x2,x3)聯(lián)合特征概率不便計(jì)算,使得計(jì)算后驗(yàn)概率存在困難。所以采用歸一法,對(duì)計(jì)算結(jié)果作出進(jìn)一步處理。
p(C1)=p(c1|x1,x2,x3)p(c1|x1,x2,x3)+p(c2|x1,x2,x3)=
0.03040.0304+0.0608=0.333
P(C2)=1-0.333=0.667
由于P(C1)lt;P(C2),該倫理困境下,自動(dòng)駕駛汽選擇直行,保護(hù)轉(zhuǎn)向車(chē)道上更多行人。
2)WADOE模型計(jì)算
依據(jù)表3、5上各個(gè)特征因素權(quán)重和獨(dú)立特征屬性先驗(yàn)概率,運(yùn)用式(4)分別求解圖6倫理困境實(shí)例上直行和轉(zhuǎn)向后驗(yàn)概率。自動(dòng)駕駛汽車(chē)選擇轉(zhuǎn)向C1近似概率為
P(c1|x)∞1n∑ni=1wiP(c1,xi)nj=1, j≠iP(xj|c1,xi)=
1/3[w1P(c1,x1=1)P(x3=-1|c1,x1=1)P(x2=1|c1,x1=1)+
w2P(c1,x2=1)P(x3=-1|c1,x2=1)P(x1=1|c1,x2=1)+
w3P(c1,x3=-1)P(x1=1|c1,x3=-1)P(x2=1|c1,x3=-1)]=
1/3[0.0597×0.617×0.636×0.121+0.2259×0.617×0.121×
0.636+0.2725×0.636×0.121×0.617]=0.0088
無(wú)人駕駛汽車(chē)選擇直行C2近似概率為
P(c2|x)∞1n∑ni=1wiP(c2,xi)nj=1, j≠iP(xj|c2,xi)=
1/3[w1P(c2,x1=1)P(x3=-1|c2,x1=1)P(x2=1|c2,x1=1)+
w2P(c2,x2=1)P(x3=-1|c2,x2=1)P(x2=1|c2,x1=1)+
w3P(c2,x3=-1)P(x1=1|c2,x3=-1)P(x2=1|c2,x3=-1)]=
1/3[0.0597×0.879×0.383×0.364+0.2259×0.383×0.879×
0.364+0.2725×0.364×0.383×0.879]=0.0228
將計(jì)算結(jié)果進(jìn)行歸一化處理:
P(C1)=p(c1|x)p(c1|x)+p(c2|x)=0.00880.0088+0.0228=0.278
P(C2)=1-0.278=0.722
由于P(C1)lt;P(C2),該倫理困境下,自動(dòng)駕駛汽車(chē)仍然選擇直行。
3)自適應(yīng)模糊模型計(jì)算
依據(jù)自適應(yīng)模糊算法對(duì)訓(xùn)練集中所有倫理困境進(jìn)行處理和訓(xùn)練后,最終生成轉(zhuǎn)向和直行標(biāo)準(zhǔn)樣本空間及均值向量,轉(zhuǎn)向標(biāo)準(zhǔn)樣本空間均值向量為a1=(0.37,0.018,0.982,0.278,0,-0.125),直行標(biāo)準(zhǔn)樣本空間均值向量為a2 =(0.5,0,0,0,0,-0.001)。對(duì)圖6倫理困境實(shí)例進(jìn)行模糊隸屬度計(jì)算,依據(jù)模糊隸屬度作出決策和分類,模糊隸屬函數(shù)式(13)。
Ai(u)=1-d(u,ai)D
D=d(u,a1)+d(u,a2)(13)
其中:待測(cè)對(duì)象u與轉(zhuǎn)向和直行標(biāo)準(zhǔn)樣本空間a1和a2歐氏距離:
d(u,a1)=
(0-0.37)2+(1-0.018)2+(1-0.982)2+(-1-0.278)2+(0-0)2+(0+0.125)2=
1.658
d(u,a2)=
(0-0.5)2+(1-0)2+(1-0)2+(-1-0)2+(0-0)2+(0+0.001)2=
1.5
該倫理困境下,選擇轉(zhuǎn)向C1模糊隸屬度:
A1(u)=1-d(u,a1)D=1-1.6581.658+1.5=0.475
該倫理困境下選擇直行C2模糊隸屬度為A2(u)=1-0.475=0.525,A1(u)lt;A2(u),自適應(yīng)模糊模型仍然選擇直行。
4)計(jì)算融合結(jié)果
依據(jù)三種模型計(jì)算概率、模糊隸屬度以及各自權(quán)重,運(yùn)用加權(quán)平均法計(jì)算融合結(jié)果,如式(14)所示。
p(ci)=∑nj=0wjpj(ci)(14)
其中:Ci表示決策結(jié)果類型;wj表示模型權(quán)重;pj(ci)表示各自模型決策結(jié)果分布概率和模糊隸屬度。
選擇轉(zhuǎn)向C1概率為
p(c1)=∑nj=0wjpj(c1)=
0.33×0.333+0.34×0.278+0.33×0.475=0.361
選擇直行C2概率為
p(c2)=∑nj=0wjpj(c2)=
0.33×0.667+0.34×0.722+0.33×0.525=0.639
同樣P(C1)lt;P(C2),該倫理困境下,三種模型融合計(jì)算結(jié)果仍然直行。對(duì)于訓(xùn)練集其他倫理困境也可以采用同樣方法逐一計(jì)算結(jié)果,作出決策數(shù)據(jù)。然后將訓(xùn)練集中所有決策數(shù)據(jù)作為元學(xué)習(xí)器上多尺度混合注意力機(jī)制的深度學(xué)習(xí)模型的訓(xùn)練集,對(duì)深度學(xué)習(xí)模型進(jìn)行迭代訓(xùn)練和優(yōu)化,生成深度學(xué)習(xí)模型,構(gòu)建stacking融合模型。
3 驗(yàn)證和測(cè)試
為了驗(yàn)證stacking融合機(jī)制決策效果,分別運(yùn)用訓(xùn)練集和測(cè)試集中倫理困境圖片對(duì)深度學(xué)習(xí)模型和stacking融合機(jī)制進(jìn)行測(cè)試和比較。依據(jù)驗(yàn)證中平均損失率、準(zhǔn)確率和測(cè)試結(jié)果正確率,評(píng)估stacking融合機(jī)制的決策效果。
首先,運(yùn)用訓(xùn)練集數(shù)據(jù)對(duì)深度學(xué)習(xí)模型和stacking融合機(jī)制分別進(jìn)行5輪測(cè)試,每批處理數(shù)量為50,共100批。深度學(xué)習(xí)訓(xùn)練模型驗(yàn)證過(guò)程中平均損失率變化趨勢(shì)如圖7所示,分別用不同顏色區(qū)分5輪測(cè)試結(jié)果。
該圖可知,最小平均損失率約為0.64,平均損失率并沒(méi)有隨著迭代次數(shù)增加而減小,生成的深度學(xué)習(xí)模型的收斂性和穩(wěn)定性較差。其次,5次驗(yàn)證過(guò)程中平均準(zhǔn)確率變化趨勢(shì)如圖8所示。
從圖8可知,深度學(xué)習(xí)模型平均準(zhǔn)確率在0.35~0.7,且準(zhǔn)確率并沒(méi)有隨著迭代次數(shù)增加而提高,訓(xùn)練效果不太理想。
反之,運(yùn)用同樣訓(xùn)練集數(shù)據(jù)對(duì)stacking融合機(jī)制進(jìn)行訓(xùn)練時(shí),隨著迭代次數(shù)不斷增加,驗(yàn)證中平均損失率整體上呈遞減趨勢(shì),最低平均損失率為0.35,測(cè)試結(jié)果也用不同顏色進(jìn)行區(qū)分,如圖9所示。
其次,stacking融合機(jī)制平均準(zhǔn)確率隨著迭代次數(shù)增加而呈上升趨勢(shì),最大平均準(zhǔn)確率接近于90%,說(shuō)明了stacking融合機(jī)制相對(duì)于傳統(tǒng)深度學(xué)習(xí)模型,平均準(zhǔn)確率有了明顯提高,如圖10所示。
為了進(jìn)一步驗(yàn)證stacking融合機(jī)制決策效果,又運(yùn)用測(cè)試集中倫理困境分別對(duì)深度學(xué)習(xí)模型和stacking融合機(jī)制進(jìn)行測(cè)試,共進(jìn)行5輪測(cè)試,測(cè)試結(jié)果正確率變化趨勢(shì)如圖11所示。
深度學(xué)習(xí)模型測(cè)試結(jié)果正確率較低,最高為0.61,最低為0.4;stacking融合機(jī)制測(cè)試結(jié)果正確率最高為0.75,最低也達(dá)到了0.48,結(jié)果表明,stacking融合機(jī)制倫理決策效果更好。
4 結(jié)束語(yǔ)
自動(dòng)駕駛汽車(chē)遇到倫理困境時(shí),運(yùn)用單一決策模型和算法還不能作出確定、合理的決策結(jié)果,影響了人們對(duì)自動(dòng)駕駛汽車(chē)安全駕駛的信任和認(rèn)可。通過(guò)研究基于stacking融合機(jī)制的自動(dòng)駕駛倫理決策模型,一方面通過(guò)決策行為模型化,確保自動(dòng)駕駛倫理決策的確定性和透明性;另一方面通過(guò)非線性和深度學(xué)習(xí)模型融合,避免單一算法和模型所作出決策結(jié)果存在的問(wèn)題,保證了決策結(jié)果的確定性和合理性,提高自動(dòng)駕駛汽車(chē)決策泛化能力。經(jīng)過(guò)測(cè)試和驗(yàn)證,得出以下結(jié)論和展望。
a)多種模型融合相對(duì)于單一模型,在決策結(jié)果的確定性、合理性和泛化性等方面存在優(yōu)勢(shì)。如stacking融合模型相對(duì)于線性和非線性模型,在合理性和泛化能力等方面具有優(yōu)勢(shì);相對(duì)于傳統(tǒng)深度學(xué)習(xí)模型,在決策結(jié)果透明性和確定性等方面具有優(yōu)勢(shì)。
b)雖然stacking融合機(jī)制相對(duì)傳統(tǒng)深度學(xué)習(xí)模型,決策結(jié)果準(zhǔn)確率和正確率方面有了提升,但決策結(jié)果正確率還不算理想,最高正確率僅為75%,甚至低于ACNB、WADOE正確率。但考慮到測(cè)試集決策結(jié)果也是根據(jù)人類調(diào)查結(jié)果確定,合理性存在偏差。另外,當(dāng)前所收集訓(xùn)練集數(shù)據(jù)也有限,也會(huì)影響到深度學(xué)習(xí)模型和stacking融合機(jī)制訓(xùn)練效果,降低了其決策結(jié)果正確率。
參考文獻(xiàn):
[1]Lee K, Kum D. Collision avoidance/mitigation system: motion planning of autonomous vehicle via predictive occupancy map[J]. IEEE Access, 2019, 7: 52846-52857.
[2]Chen Jiajia, Zhao Pan, Liang Huawei. Motion planning for autonomous vehicle based on radial basis function neural network in unstructured environment[J]. Sensors, 2014, 14(9): 17548-17566.
[3]古天龍, 李龍. 倫理智能體及其設(shè)計(jì):現(xiàn)狀和展望[J]. 計(jì)算機(jī)學(xué)報(bào), 2021, 44(3): 632-652. (Gu Tianlong, Li Long. Artificial mo-ral agents and their design methodology: retrospect and prospect[J]. Chinese Journal of Computers,2021,44(3):632-652.)
[4]阮凱. 機(jī)器倫理何以可能:現(xiàn)有方案及其改良[J]. 自然辨證法研究, 2018, 34(11): 53-59. (Ruan Kai. How can machine ethics be possible: existing schemes and improvement[J]. Studies in Dialectics of Nature, 2018, 44(3): 632-652.)
[5]蘇令銀. 能將倫理準(zhǔn)則嵌入人工智能機(jī)器嗎?[J]. 理論探索, 2018(3): 38-46. (Su Lingyin. Can ethical principles be embedded in AI machines[J]. Theoretical Exploration, 2018(3): 38-46.)
[6]許宏鑫,吳志周,梁韻逸. 基于強(qiáng)化學(xué)習(xí)的自動(dòng)駕駛汽車(chē)路徑規(guī)劃方法研究綜述[J]. 計(jì)算機(jī)應(yīng)用研究, 2023, 40(11): 3211-3217. (Xu Hongxin, Wu Zhizhou, Liang Yunyi. Review of research on path planning methods for autonomous vehicles based on reinforcement learning[J]. Application Research of Computers, 2023, 40(11): 3211-3217.)
[7]Contissa G, Lagioia F, Sartor G. The ethical knob: ethically customi-sable automated vehicles and the law[J]. Artificial Intelligence and Law, 2017, 25(6293): 365-378.
[8]Geisslinger M, Poszler F, Betz J, et.al. Autonomous driving ethics: from trolley problem to ethics of risk[J]. Philosophy amp; Techno-logy, 2021, 4: 78-89.
[9]Evans K, De Moura N, Chauvier S, et al. Ethical decision making in autonomous vehicles: the ethics project[J]. Science and Enginee-ring Ethics, 2020, 26: 3285-3312.
[10]Wang Hong, Huang Yanjun, Khajepour A, et al. Ethical decision-making platform in autonomous vehicles with lexicographic optimization based model predictive controller[J]. IEEE Trans on Vehicular Technology, 2020, 69(8): 8164-8175.
[11]Wu Yuehua, Lin Shoude. A low-cost ethics shaping approach for designing reinforcement learning agents[EB/OL]. (2018-09-10). https://arxiv.org/abs/1712.04172.
[12]Gerdes J C, Thornton S M. Implementable ethics for autonomous vehicles[M]// Maurer M, Gerdes J, Lenz B, et al. Autonomous dri-ving. Berlin: Springer, 2015: 87-102.
[13]Li Sixian, Zhang Junyou, Wang Shufeng, et al. Ethical and legal dilemma of autonomous vehicles: study on driving decision-making mode under the emergency situations of redlight running behaviors[J]. Electronic,2018, 10(7): 264-282.
[14]Mencia E L, Janssen F. Learning rules for multi-label classification: a stacking and a separate and conquer approach[J]. Machine Learning, 2016,105(1):1-50.
[15]Wang Ruobing. Stacked generalization approach to improve prediction of molecular atomization energies[J]. Eprint, 2018, 45(2): 1-15.
[16]張笑銘, 王志君, 梁利平. 一種適用于卷積神經(jīng)網(wǎng)絡(luò)的Stacking算法[J]. 計(jì)算機(jī)工程, 2018, 44(4): 243-247. (Zhang Xiao-ming, Wang Zhijun, Liang Liping. A stacking algorithm for convolution neural network[J]. Computer Engineering, 2018, 44(4): 243-247.)
[17]馬良玉. 基于Stacking多模型融合的風(fēng)電機(jī)組齒輪箱油池溫度異常預(yù)警[J]. 中國(guó)電機(jī)工程學(xué)報(bào), 2023, 43(S1): 242-252. (Ma Liangyu. Anomaly warning of wind turbine gearbox oil pool temperature based on Stacking fusion of multiple models[J]. Proceedings of the CSEE, 2023, 43(S1): 242-252.)
[18]Tan Zhenqi, Zhang Jing, He Yu, et al. Short-term load forecasting based on integration of SVR and stacking[J]. IEEE Access, 2020, 8: 227719-227728.
[19]Dong Yingchao, Zhang Hongli, Wang Cong, et al. Wind power forecasting based on stacking ensemble model, decomposition and intelligent optimization algorithm[J]. Neurocomputing, 2021, 462: 169-184.
[20]Liu Guoman, Luo Yufeng, Sheng Jing. Research on application of naive Bayes algorithm based on attribute correlation to unmanned dri-ving ethical dilemma[J]. Mathematical Problems in Engineering, 2022, 2022: article ID 4163419.
[21]Zheng Fei, Webb G I. Averaged one-dependence estimators[M]// Sammut C, Webb G I. Encyclopedia of Machine Learning. Boston: Springer, 2017: 63-64.
[22]Hu B Q. Basis of fuzzy theory[M]. Wuhan: Wuhan University Press, 2010.
[23]Lex K, Ilya S, Geoffrey E H. Image net classification with deep con-volutional neural networks[J]. Communications of the ACM, 2017, 60(6): 84-90.
[24]周飛燕, 金林鵬, 董軍. 卷積神經(jīng)網(wǎng)絡(luò)研究綜述[J]. 計(jì)算機(jī)學(xué)報(bào), 2017, 40(6): 1229-1252. (Zhou Feiyan, Jin Linpeng, Dong Jun. Review of convolutional neural network[J]. Chinese Journal of Computers, 2017, 40(6): 1229-1252.)
[25]司念文, 張文林, 屈丹, 等. 卷積神經(jīng)網(wǎng)絡(luò)表征可視化研究綜述[J]. 自動(dòng)化學(xué)報(bào), 2022, 48(8): 1890-192. (Si Nianwen,Zhang Wenlin, Qu Dan, et al. Representation visualization of convolutional neural networks: a survey[J]. Acta Automatica Sinica, 2022, 48(8): 1890-1920.)
[26]Zhang Yabo, Ding Wenrui, Liu Chunlei. Summary of convolutional neural network compression technology[C]// Proc of IEEE International Conference on Unmanned Systems. Piscataway, NJ: IEEE Press, 2019: 480-483.
[27]Howard A G, Zhu Menglong, Chen Bo, et al. MobileNets: efficient convolutional neural networks for mobile vision applications [EB/OL]. (2017-04-17). https://arxiv.org/abs/1704.04861.
[28]代勇. 關(guān)于文本分類和問(wèn)答的深度學(xué)習(xí)算法研究[D]. 成都: 電子科技大學(xué), 2021. (Dai Yong. Research on deep learning algorithms for text classification and question answering[D]. Chengdu: University of Electronic Science and Technology, 2021.)
[29]卞景藝, 劉秀麗, 徐小力, 等. 基于多尺度深度卷積神經(jīng)網(wǎng)絡(luò)的故障診斷方法[J]. 振動(dòng)與沖擊, 2021, 40(18): 204-211. (Bian Jingyi, Liu Xiuli, Xu Xiaoli, et al. Fault diagnosis method based on a multi-scale deep convolutional neural network[J]. Journal of Vibration and Shock, 2021, 40(18): 204-211.)
[30]譚震, 郭新蕾, 李甲振, 等. 基于多尺度卷積神經(jīng)網(wǎng)絡(luò)的管道泄露檢測(cè)模型研究[J]. 水利學(xué)報(bào), 2021, 54(2): 220-232. (Tan Zhen, Guo Xinlei, Li Jiazhen, et al. Multi-scale convolutional neural network model for pipeline leak detection[J]. Journal of Hydraulic Engineering, 2021,54(2):220-232.)
[31]游忠輝. 卷積神經(jīng)網(wǎng)絡(luò)的加速與壓縮方法研究[D]. 北京: 北京大學(xué),2020.(You Zhonghui. Research on convolutional neural network acceleration and compression methods[D]. Beijing: Peking University, 2020.)