一個(gè)生物體內(nèi)所有蛋白質(zhì)的相互作用被稱(chēng)為蛋白質(zhì)相互作用網(wǎng)絡(luò)(PPIN),簡(jiǎn)稱(chēng)蛋白質(zhì)網(wǎng)絡(luò)。其中,在相同時(shí)間和空間內(nèi)由若干個(gè)蛋白質(zhì)通過(guò)相互作用共同組成的一種多分子結(jié)構(gòu)稱(chēng)為蛋白質(zhì)復(fù)合物(PC),簡(jiǎn)稱(chēng)復(fù)合物。在蛋白質(zhì)網(wǎng)絡(luò)中精準(zhǔn)地識(shí)別復(fù)合物是計(jì)算生物學(xué)中的一個(gè)重要問(wèn)題,然而由于蛋白質(zhì)之間的相互作用具有動(dòng)態(tài)性,蛋白質(zhì)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)會(huì)隨著時(shí)間、生物環(huán)境、蛋白質(zhì)的存在和降解等因素的變化而變化,這極大地增加了復(fù)合物識(shí)別的難度。此外,蛋白質(zhì)相互作用數(shù)據(jù)中不可避免存在的假陽(yáng)性和假陰性也給復(fù)合物識(shí)別算法設(shè)計(jì)帶來(lái)了額外的挑戰(zhàn)。李敏等通過(guò)整合時(shí)間進(jìn)程基因表達(dá)數(shù)據(jù)和亞細(xì)胞位置信息構(gòu)建了時(shí)空活性蛋白質(zhì)相互作用網(wǎng)絡(luò)(ST-APIN),采用聚類(lèi)算法MCL在ST-APIN上進(jìn)行復(fù)合物識(shí)別,提升了識(shí)別的敏感性和特異性,找到了更多具有生物學(xué)意義的復(fù)合物。有研究引入網(wǎng)絡(luò)嵌入技術(shù)來(lái)捕獲動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)的結(jié)構(gòu)特性,提出了一種半監(jiān)督網(wǎng)絡(luò)嵌入模型(SSNEM)來(lái)檢測(cè)網(wǎng)絡(luò)中存在的稠密連接子圖,即蛋白質(zhì)復(fù)合物。另有研究則提出了一系列基于深度學(xué)習(xí)技術(shù)的方法來(lái)識(shí)別蛋白質(zhì)復(fù)合物,雷秀娟等提出了基于拓?fù)鋭?shì)加權(quán)的蛋白質(zhì)復(fù)合物挖掘方法。然而現(xiàn)有的方法仍然缺乏對(duì)于動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)中信息表征的能力,復(fù)合物的檢測(cè)精度還存在不足。為此,文中充分考慮動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)的時(shí)間動(dòng)態(tài)信息和空間動(dòng)態(tài)信息,將復(fù)合物識(shí)別建模為動(dòng)態(tài)圖中的節(jié)點(diǎn)分類(lèi)問(wèn)題,提出了一種基于時(shí)空?qǐng)D卷積的復(fù)合物識(shí)別算法,并在多個(gè)公開(kāi)的生物數(shù)據(jù)集上進(jìn)行了全面的仿真實(shí)驗(yàn)。
為了精確地識(shí)別出真正有生物意義的復(fù)合物,對(duì)動(dòng)態(tài)蛋白質(zhì)進(jìn)行建模。下面先給出網(wǎng)絡(luò)構(gòu)建中用到的一些相關(guān)術(shù)語(yǔ):
定義1 動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)(DPN)它是一個(gè)時(shí)間上具有相關(guān)性的多個(gè)靜態(tài)蛋白質(zhì)網(wǎng)絡(luò)的序列,可表示為:=(,,...,G)。其中G=(V,E,A)表示第個(gè)時(shí)刻的蛋白質(zhì)網(wǎng)絡(luò)的快照∈{1,2,...,}。
在定義1中,V表示中的蛋白質(zhì)集合;E表示中存在的蛋白質(zhì)相互作用關(guān)系集合;A表示的鄰接矩陣。如果兩個(gè)蛋白質(zhì)(v)和(v)之間存在相互作用,則(A)=1,否則(A)=0。
④出院隨訪:患者出院以后應(yīng)定期進(jìn)行隨訪,積極了解患者的各種相關(guān)計(jì)劃執(zhí)行狀況和相關(guān)效果,要針對(duì)性對(duì)患者的護(hù)理方案進(jìn)行調(diào)整并作出修整,最大程度上提高患者護(hù)理工作說(shuō)起這個(gè)效果。如果在護(hù)理過(guò)程當(dāng)中遭遇困難,需要發(fā)揮患者家屬的相關(guān)作用,提升患者家庭護(hù)理的有效性。
二是科技基礎(chǔ)設(shè)施建設(shè)滯后,不能充分滿(mǎn)足區(qū)域創(chuàng)新需求。近年來(lái),東營(yíng)市科技基礎(chǔ)設(shè)施建設(shè)雖然取得了長(zhǎng)足進(jìn)步,建成一批國(guó)家大學(xué)科技園和國(guó)家級(jí)、省級(jí)的示范生產(chǎn)力促進(jìn)中心、創(chuàng)業(yè)服務(wù)中心,但普遍存在建設(shè)水平不高的問(wèn)題,能夠?yàn)榭萍计髽I(yè)、研發(fā)機(jī)構(gòu)和科技人員提供的有效服務(wù)較少。
其中,()和()分別指蛋白質(zhì)和的鄰居集合。
定義3 邊強(qiáng)度(_e)指在時(shí)刻的中蛋白質(zhì)和蛋白質(zhì)之間相互作用關(guān)系強(qiáng)弱的度量,可表示為:
其中,(·)是蛋白質(zhì)節(jié)點(diǎn)的度;n是中的蛋白質(zhì)總數(shù)。
本工程根據(jù)BIM模型建立動(dòng)態(tài)的施工平面布置模型,將本工程劃分為地下結(jié)構(gòu)工程、主體結(jié)構(gòu)工程及裝飾裝修工程三個(gè)施工階段,根據(jù)不同階段的進(jìn)度及資源需求,分別規(guī)劃施工平面布置圖,在動(dòng)態(tài)模型里可進(jìn)行各種生產(chǎn)要素管理。
算法1 動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)構(gòu)建算法
1.2.3 時(shí)間圖卷積算子設(shè)計(jì) 蛋白質(zhì)網(wǎng)絡(luò)具有隨時(shí)間變化而動(dòng)態(tài)變化的特性,因此,有效地提取出蛋白質(zhì)節(jié)點(diǎn)之間的時(shí)序信息是識(shí)別蛋白質(zhì)復(fù)合物的關(guān)鍵環(huán)節(jié)之一。對(duì)于任意給定的第個(gè)時(shí)刻的動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò),GCN可以通過(guò)圖譜卷積來(lái)提取網(wǎng)絡(luò)上的時(shí)間特征,實(shí)現(xiàn)對(duì)時(shí)序信息的聚合。文中提出基于希爾伯特-黃(HHT)變換來(lái)重新定義圖譜卷積。設(shè)是第個(gè)時(shí)刻蛋白質(zhì)節(jié)點(diǎn)的輸入特征,基于的能量邊際譜和時(shí)頻圖定義出如下的時(shí)間圖卷積算子提取中節(jié)點(diǎn)之間的時(shí)間特征:
第一個(gè)關(guān)鍵點(diǎn)就是把傳統(tǒng)的電視媒體與當(dāng)下流行的網(wǎng)絡(luò)媒體兩者之間進(jìn)行有效結(jié)合,也就是在網(wǎng)絡(luò)媒體之中也要根據(jù)實(shí)際情況為電視直播節(jié)目建立起一個(gè)合適的平臺(tái),這對(duì)于從事電視新聞采編相關(guān)工作的工作人員來(lái)說(shuō),工作的困難程度進(jìn)一步增強(qiáng),與此同時(shí),要進(jìn)一步確保新聞信息是真實(shí)準(zhǔn)確的,在素材被采集完畢以后正式進(jìn)行節(jié)目制作工作過(guò)程中的一些操作也十分煩瑣,但是通過(guò)網(wǎng)絡(luò)媒體進(jìn)行直播進(jìn)一步保證了新聞信息的實(shí)時(shí)性,使電視節(jié)目隨著人們生活方式的改變而與時(shí)俱進(jìn),并且在此基礎(chǔ)之上還能夠保證人民群眾獲得到信息的真實(shí)程度。
Step4.輸出=時(shí)刻的網(wǎng)絡(luò)快照;
在水泥水化放熱過(guò)程中,放熱速度與放熱最高峰時(shí)釋放出來(lái)的熱量,會(huì)對(duì)水泥水化反應(yīng)過(guò)程的進(jìn)度產(chǎn)生重要的影響[2]。一般來(lái)講,溫度升高會(huì)促進(jìn)水泥的水化反應(yīng),而水化反應(yīng)的加快會(huì)進(jìn)一步放出熱量,這樣會(huì)導(dǎo)致混凝土的內(nèi)外溫差大,最終因?yàn)闊崦浝淇s而產(chǎn)生裂縫。裂縫對(duì)混凝土強(qiáng)度和密實(shí)度的影響很大,并最終影響到工程的整體結(jié)構(gòu)安全和使用功能。所以,控制水泥的水化速度至關(guān)重要。
輸入:包含個(gè)蛋白質(zhì)的PPI數(shù)據(jù)
由仿真結(jié)果圖2,可知與節(jié)點(diǎn)的初始部署相比,在算法迭代運(yùn)行200次以后,節(jié)點(diǎn)分布更加均勻,網(wǎng)絡(luò)覆蓋率都有顯著地提高,網(wǎng)絡(luò)覆蓋質(zhì)量有了很大的提高并且網(wǎng)絡(luò)覆蓋率都是隨著算法迭代次數(shù)的增加而增大。初始部署時(shí),節(jié)點(diǎn)的覆蓋率為72.64%,在算法運(yùn)行200次以后,僅考慮網(wǎng)絡(luò)覆蓋率的單目標(biāo)覆蓋優(yōu)化算法能夠提高網(wǎng)絡(luò)覆蓋率到98.53%,而考慮安全連通度以及網(wǎng)絡(luò)覆蓋率的粒子群多目標(biāo)優(yōu)化算法和改進(jìn)的粒子群多目標(biāo)優(yōu)化算法能夠提高網(wǎng)絡(luò)覆蓋率分別到95.94和97.69%。
輸出:動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)
其中,Ω 是時(shí)頻圖的拉普拉斯矩陣;g=diag(),是由Ω 的特征向量所對(duì)應(yīng)的特征值構(gòu)成的對(duì)角矩陣。將上式擴(kuò)展至GCN中,則GCN的第+1層輸出為:
1.2.4 空間圖卷積算子設(shè)計(jì) GCN的空間卷積層通過(guò)聚合函數(shù)從鄰居節(jié)點(diǎn)聚合特征來(lái)更新當(dāng)前節(jié)點(diǎn)的特征。以圖2所示的中心節(jié)點(diǎn)為目標(biāo)節(jié)點(diǎn),在聚合過(guò)程中,中心節(jié)點(diǎn)首先對(duì)其階鄰居(紅色節(jié)點(diǎn))進(jìn)行隨機(jī)采樣,得到相關(guān)節(jié)點(diǎn)集合。然后將聚合函數(shù)作用在相關(guān)節(jié)點(diǎn)的特征表達(dá)上,并用聚合結(jié)果作為中心節(jié)點(diǎn)的特征表達(dá)。
文中在聚合目標(biāo)節(jié)點(diǎn)的鄰居信息時(shí),不是考慮目標(biāo)節(jié)點(diǎn)的所有鄰居,而是通過(guò)隨機(jī)采樣獲得它的階鄰居。然后基于注意力機(jī)制來(lái)確定階鄰居節(jié)點(diǎn)對(duì)目標(biāo)節(jié)點(diǎn)的重要性,提取出目標(biāo)節(jié)點(diǎn)的局部結(jié)構(gòu)信息。為此,定義出如下的空間圖卷積算子:
其中,(·)是一個(gè)LeakReLu激活函數(shù);Ψ 是一個(gè)可學(xué)習(xí)的參數(shù)向量。Softmax函數(shù)確保節(jié)點(diǎn)的所有鄰居的注意權(quán)值之和為1。該式通過(guò)端到端的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)隱式地捕獲a的權(quán)重,使更重要的節(jié)點(diǎn)獲得更大的權(quán)重,提高了捕獲隱藏的空間相關(guān)性的表達(dá)能力。
1.2.5 模型訓(xùn)練 模型的優(yōu)劣直接關(guān)系到從網(wǎng)絡(luò)中學(xué)習(xí)到的蛋白質(zhì)特征是否準(zhǔn)確,對(duì)于后續(xù)復(fù)合物的識(shí)別性能具有重大影響。本文使用目前性能表現(xiàn)最好的自適應(yīng)矩估計(jì)(Adam)算法對(duì)蛋白質(zhì)網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行批訓(xùn)練,采用指數(shù)衰減策略來(lái)動(dòng)態(tài)地調(diào)節(jié)學(xué)習(xí)率,采用如下的交叉熵函數(shù)作為損失函數(shù):
算法2 CR-STGC的訓(xùn)練
試驗(yàn)配方中表活劑為非離子表面活性劑,聚合物為聚丙烯酰胺。前期開(kāi)展的室內(nèi)實(shí)驗(yàn)主要包括聚合物流變性實(shí)驗(yàn)、聚合物及表面活性劑吸附實(shí)驗(yàn)和注入體系的相對(duì)滲透率實(shí)驗(yàn),對(duì)應(yīng)的實(shí)驗(yàn)結(jié)果見(jiàn)圖2~5。
輸入:動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò);學(xué)習(xí)率;訓(xùn)練輪次Epoch;交叉熵?fù)p失函數(shù);生物實(shí)驗(yàn)測(cè)定的蛋白質(zhì)復(fù)合物;輸出:更新后的模型所有參數(shù)。
艾滋病是一種具有極高危害性的傳染性疾病,主要通過(guò)性途徑、血液傳播,是可控可防的[1-3]。15~24歲人群大多處于在校學(xué)習(xí)階段[4],當(dāng)前國(guó)內(nèi)加大對(duì)大專(zhuān)、本科院校的“禁毒防艾”宣傳,本研究探究健康教育對(duì)高職院校學(xué)生艾滋病知識(shí)水平及防艾生活技能的影響,為提高高職院校學(xué)生防艾能力提供理論依據(jù),報(bào)道如下。
Step1.構(gòu)建數(shù)據(jù)集:采用折交叉驗(yàn)證法對(duì)一共個(gè)時(shí)刻的動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)進(jìn)行劃分,其中,將-個(gè)時(shí)刻動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)作為訓(xùn)練集(),={,,...,} ;(?) 個(gè)時(shí)刻的動(dòng)態(tài) 蛋白質(zhì)網(wǎng)絡(luò)作為測(cè)試集(' ),'={,,...,};
定義6 蛋白質(zhì)復(fù)合物()時(shí)刻的動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)特征圖上的蛋白質(zhì)復(fù)合物可用一個(gè)指示矩陣Im(∈R)表示:
1.2.2 模型架構(gòu) 在第2節(jié)構(gòu)建得到的動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)的基礎(chǔ)上,文中基于圖卷積神經(jīng)網(wǎng)絡(luò)來(lái)學(xué)習(xí)網(wǎng)絡(luò)中蛋白質(zhì)的特征,進(jìn)而采用譜聚類(lèi)來(lái)識(shí)別蛋白質(zhì)復(fù)合物,識(shí)別模型如圖1所示。GCN由輸入層、若干隱藏層和輸出層組成(圖1),GCN的層間傳播規(guī)則可描述為:
從中隨機(jī)選擇一批樣本作為輸入,利用Adam算法來(lái)最小化和預(yù)測(cè)結(jié)果'之間的交叉熵?fù)p失,直到訓(xùn)練完所有樣本;利用指數(shù)衰減策略調(diào)整;Until 滿(mǎn)足精度要求為止。
(2)水穩(wěn)定性。當(dāng)瀝青路面中存在水時(shí),在溫濕循環(huán)及重復(fù)車(chē)輛荷載作用下,使得集料與膠結(jié)料之間的黏結(jié)力降低,瀝青膠結(jié)料本身黏聚力下降[2],在重復(fù)車(chē)輛荷載作用下,導(dǎo)致路面結(jié)構(gòu)性破壞和使用功能降低,并誘發(fā)其他病害。因此,本文通過(guò)浸水馬歇爾試驗(yàn)評(píng)價(jià)TPS排水瀝青混合料的水穩(wěn)定性,TPS排水瀝青混合料水穩(wěn)定性試驗(yàn)結(jié)果如表5所示。
1.2.6 基于譜聚類(lèi)的復(fù)合物識(shí)別 文中在上文獲得的動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)特征圖的基礎(chǔ)上,定義了模塊函數(shù)對(duì)特征圖進(jìn)行譜劃分,提出了基于譜聚類(lèi)的復(fù)合物識(shí)別算法,可有效檢測(cè)出動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)中存在的復(fù)合物。
Step2.模型的訓(xùn)練:
其中,(CP)是時(shí)刻蛋白質(zhì)復(fù)合物CP中連邊的數(shù)目;E是中邊的總數(shù)目;(CP,V)是時(shí)刻CP和中所有結(jié)點(diǎn)的連邊數(shù)目。值越大,則中復(fù)合物的劃分越好。根據(jù)定義6和定義7可知,上的復(fù)合物識(shí)別問(wèn)題可以建模成連續(xù)時(shí)間內(nèi)求的最大值問(wèn)題。為了對(duì)進(jìn)行優(yōu)化求解,文中首先使用一種時(shí)間平滑框架來(lái)表示蛋白質(zhì)復(fù)合物的演變規(guī)律:
其中,CP是當(dāng)前時(shí)刻獲得的復(fù)合物;CP是當(dāng)前時(shí)刻的復(fù)合物與前一時(shí)刻的復(fù)合物的相似性;是時(shí)間調(diào)節(jié)因子。然后,文中基于式(14)的時(shí)間平滑框架來(lái)優(yōu)化,可將識(shí)別蛋白質(zhì)復(fù)合物的代價(jià)表示為:
根據(jù)文獻(xiàn)[21]可知,的最大化問(wèn)題可以表示為:
算法3 基于譜聚類(lèi)的蛋白質(zhì)復(fù)合物識(shí)別
2.3 不同年齡的三維CT結(jié)果 低年齡組藏族患兒脫位高度顯著高于漢族患兒(P<0.05)。高年齡組患兒髖臼指數(shù)及脫位高度兩民族比較差異有統(tǒng)計(jì)學(xué)意義(P<0.05),見(jiàn)表3。 藏族組,年齡≥36個(gè)月的患兒髖臼指數(shù)、脫位高度、頸干角與<36個(gè)月患兒相比,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。漢族組,年齡≥36個(gè)月患兒的頸干角、脫位高度與<36個(gè)月患兒相比,差異有統(tǒng)計(jì)學(xué)意義(P<0.05)。見(jiàn)表4。
Step5.=+1;重復(fù)Step3-4,當(dāng)=時(shí)算法結(jié)束。
Step1.對(duì)于每一個(gè)時(shí)刻,計(jì)算矩陣Γ的個(gè)特征值對(duì)應(yīng)的特征向量={,,...,u};
國(guó)際分工視角下產(chǎn)業(yè)升級(jí)內(nèi)涵界定與演進(jìn)研究..................................................................................................................劉會(huì)政 陳 奕 楊 楠(34)
Step2.以[,,...,u]構(gòu)造矩陣Im,對(duì)于任意給定的參數(shù)(2 ≤≤),重復(fù)執(zhí)行:(a)生成Im的首個(gè)列的矩陣U;(b)采用譜聚類(lèi)算法聚類(lèi)U的行向量;
Step3.重復(fù)執(zhí)行Step2中的(a)和(b),當(dāng)C達(dá)到最大值時(shí),輸出值所對(duì)應(yīng)的各個(gè)蛋白質(zhì)復(fù)合物;
Step4.算法結(jié)束,返回。
Thereare certaindifficultiesinengineeringpracticetoimplementtheaboveimprovementmeasurements,soonlythesimulation results of those methods are presented in this paper,and an improved motor and hydraulic pump are in the design.Further experimental verification is the next main work.
采用Anaconda 的最新版本作為集成開(kāi)發(fā)環(huán)境,PyTorch作為深度學(xué)習(xí)框架,用Python語(yǔ)言編碼實(shí)現(xiàn)了CR-STGC模型。為了驗(yàn)證該模型的有效性,我們采用同樣的開(kāi)發(fā)環(huán)境、同樣的語(yǔ)言編碼和同樣的硬件環(huán)境實(shí)現(xiàn)了幾個(gè)目前較為典型的復(fù)合物識(shí)別算法(ST-APIN、
SSNEM、VGAE、NOCD、GE-CFI、DPCMNE和MPC-TPW),并將它們?cè)诙鄠€(gè)公開(kāi)的生物數(shù)據(jù)集上進(jìn)行了對(duì)比實(shí)驗(yàn),采用查全率、查準(zhǔn)率、Fmeasure值、魯棒性和時(shí)間等多個(gè)指標(biāo)來(lái)評(píng)價(jià)不同算法的性能表現(xiàn)。其中,表1和表2分別給出了不同識(shí)別算法在DIP數(shù)據(jù)集和MIPS數(shù)據(jù)集上的識(shí)別結(jié)果。
真實(shí)環(huán)境下獲取生物數(shù)據(jù)的來(lái)源、手段和條件經(jīng)常存在著差異,因此可獲得的蛋白質(zhì)相互作用數(shù)據(jù)很大程度上都會(huì)包含假陽(yáng)性和假陰性,這給復(fù)合物識(shí)別算法的性能提出了額外的挑戰(zhàn),為了測(cè)試所提算法的可靠性,有必要進(jìn)一步分析和比較不同算法在包含了虛假數(shù)據(jù)的生物數(shù)據(jù)集中識(shí)別復(fù)合物的性能。為此,以MIPS數(shù)據(jù)集為實(shí)驗(yàn)對(duì)象,圖3和圖4給出了不同識(shí)別算法在MIPS數(shù)據(jù)集上的魯棒性表現(xiàn)。其中,圖3是在構(gòu)建出初始蛋白質(zhì)網(wǎng)絡(luò)的基礎(chǔ)上,隨機(jī)地人為增加網(wǎng)絡(luò)中邊的比例,從而構(gòu)建出多個(gè)具有不同程度假陽(yáng)性的蛋白質(zhì)網(wǎng)絡(luò),隨后得出的測(cè)試結(jié)果。圖4是在構(gòu)建得到初始網(wǎng)絡(luò)的基礎(chǔ)上,隨機(jī)地人為刪除網(wǎng)絡(luò)中邊的比例,得到多個(gè)具有不同程度假陰性的蛋白質(zhì)網(wǎng)絡(luò),隨后得出的測(cè)試結(jié)果。
各種算法在2種數(shù)據(jù)集上的特異性、敏感性和Fmeasure值都較高(表1、2),CR-STGC算法的識(shí)別性能在兩種數(shù)據(jù)集上都要優(yōu)于其他各種算法。仔細(xì)分析其原因:(1)蛋白質(zhì)具有隨著生物體內(nèi)、外部環(huán)境變化而變化的動(dòng)態(tài)特性,通過(guò)定義邊強(qiáng)度、節(jié)點(diǎn)強(qiáng)度和邊存在概率等指標(biāo)來(lái)對(duì)不同時(shí)刻下的蛋白質(zhì)網(wǎng)絡(luò)進(jìn)行動(dòng)態(tài)建模,準(zhǔn)確地?cái)M合了動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)發(fā)展變化的趨勢(shì),為蛋白質(zhì)復(fù)合物的識(shí)別提供了可靠基礎(chǔ);(2)提出復(fù)合物識(shí)別模型,新穎地設(shè)計(jì)了時(shí)間圖卷積算子和空間圖卷積算子來(lái)對(duì)網(wǎng)絡(luò)中蛋白質(zhì)的特征進(jìn)行學(xué)習(xí),準(zhǔn)確地獲得了蛋白質(zhì)數(shù)據(jù)之間的時(shí)間相關(guān)性和空間相關(guān)性,為下一步通過(guò)譜聚類(lèi)來(lái)識(shí)別蛋白質(zhì)復(fù)合物創(chuàng)造了條件;(3)將動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)中的復(fù)合物識(shí)別問(wèn)題看作時(shí)間平滑框架下的圖聚類(lèi)問(wèn)題,并定義了模塊函數(shù)來(lái)對(duì)聚類(lèi)結(jié)果進(jìn)行優(yōu)化,從而保證了識(shí)別結(jié)果的準(zhǔn)確性。
結(jié)合城市總體規(guī)劃及各區(qū)綠色建筑重點(diǎn)發(fā)展?jié)摿Ψ植紙D,明確廣州各區(qū)綠色建筑空間分布潛力高的區(qū)域。以黃埔區(qū)為例,黃埔區(qū)“十三五”期間需累計(jì)完成新建綠色建筑總面積為1310萬(wàn)m2,占全市綠色建筑發(fā)展目標(biāo)比重為16%,其中二星及以上綠色建筑總面積為200萬(wàn)m2。主要集中分布于黃埔臨港經(jīng)濟(jì)區(qū)、廣州開(kāi)發(fā)區(qū)、中新廣州知識(shí)城(圖8)。
此外,隨著網(wǎng)絡(luò)中假陽(yáng)性的增強(qiáng),所有的識(shí)別算法的F-measure 值都明顯下降(圖3),但總體來(lái)看,CRSTGC算法的識(shí)別性能始終更好。當(dāng)網(wǎng)絡(luò)中邊的增加比例超過(guò)30%后,大多數(shù)識(shí)別算法的性能趨于穩(wěn)定,表明這些算法都有不錯(cuò)的抗噪能力,能夠較好地應(yīng)對(duì)網(wǎng)絡(luò)中存在的假陽(yáng)性,過(guò)濾掉虛假?gòu)?fù)合物。接下來(lái)仍然以MIPS數(shù)據(jù)集為實(shí)驗(yàn)對(duì)象,在構(gòu)建得到初始網(wǎng)絡(luò)的基礎(chǔ)上,隨機(jī)地人為刪除網(wǎng)絡(luò)中邊的比例,得到多個(gè)具有不同程度假陰性的蛋白質(zhì)網(wǎng)絡(luò)。重復(fù)之前的復(fù)合物識(shí)別性能測(cè)試,隨著網(wǎng)絡(luò)中假陰性的增強(qiáng),所有識(shí)別算法的性能都在急劇下降(圖4),這主要是因?yàn)榫W(wǎng)絡(luò)中刪除的邊數(shù)越多,可能破壞的蛋白質(zhì)之間的真實(shí)相互作用也越多,從而導(dǎo)致復(fù)合物的丟失,文中的各種算法都能很好地模擬和應(yīng)對(duì)這一點(diǎn)。但綜合來(lái)看,CR-STGC算法的F-measure值始終要優(yōu)于其他的算法,即使在假陰性數(shù)據(jù)增加到50%,CR-STGC算法的F-measure值仍然可以維持在0.7左右,這都充分體現(xiàn)了CR-STGC算法的可靠性。
蛋白質(zhì)網(wǎng)絡(luò)是一種典型的超大規(guī)模復(fù)雜網(wǎng)絡(luò),在這樣的網(wǎng)絡(luò)環(huán)境下是否能夠既準(zhǔn)確又快速地找到有生物學(xué)意義的復(fù)合物是評(píng)價(jià)復(fù)合物識(shí)別算法是否具有實(shí)際價(jià)值的主要指標(biāo)之一。我們以算法的效率為評(píng)價(jià)指標(biāo),分別在DIP數(shù)據(jù)集和MIPS數(shù)據(jù)集上測(cè)試了不同算法識(shí)別復(fù)合物的效率(圖5)。
DPCMNE算法在2種數(shù)據(jù)集上的識(shí)別時(shí)間最長(zhǎng),GE-CFI算法次之,ST-APIN算法的運(yùn)行時(shí)間最短,而CR-STGC 算法的識(shí)別時(shí)間位居第5 位。相比于DPCMNE、GE-CFI、VGAE和NOCD等4種識(shí)別算法,CR-STGC算法在2種數(shù)據(jù)集上的識(shí)別效率分別平均提高了約34.5%、28.7%、25.4%和17.6%,但比SSNEM、MPC-TPW和ST-APIN等識(shí)別算法的效率要略低。這主要是因?yàn)镃R-STGC算法的運(yùn)行時(shí)間還包含了動(dòng)態(tài)蛋白質(zhì)網(wǎng)絡(luò)的構(gòu)建開(kāi)銷(xiāo),此外在識(shí)別復(fù)合物過(guò)程中,CR-STGC算法綜合考慮了網(wǎng)絡(luò)的時(shí)序信息和結(jié)構(gòu)信息來(lái)提取網(wǎng)絡(luò)特征,并通過(guò)譜聚類(lèi)來(lái)完成復(fù)合物的識(shí)別,以犧牲部分時(shí)間代價(jià)來(lái)?yè)Q取識(shí)別精度的提升??傮w來(lái)看,CR-STGC算法的運(yùn)行效率仍然是可以接受的,實(shí)現(xiàn)了識(shí)別質(zhì)量和識(shí)別效率的折中,完全可以應(yīng)用到大規(guī)模蛋白質(zhì)網(wǎng)絡(luò)的復(fù)合物識(shí)別問(wèn)題中去。
南方醫(yī)科大學(xué)學(xué)報(bào)2022年7期