楊小健 許瀟瓏 李榮雨
(南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇 南京 211816)
基于ASRM可靠性評(píng)估的多途徑SCADA遠(yuǎn)程報(bào)警監(jiān)控模型
楊小健 許瀟瓏 李榮雨
(南京工業(yè)大學(xué)電子與信息工程學(xué)院,江蘇 南京 211816)
為了實(shí)現(xiàn)多樣化遠(yuǎn)程報(bào)警和獨(dú)立功能擴(kuò)展,提出了以SCADA為軟件平臺(tái)的自動(dòng)化遠(yuǎn)程報(bào)警監(jiān)控模型(RAMM)。從設(shè)備連接、誤報(bào)消除以及人員可靠性等多個(gè)方面,提高RAMM模型的可靠性和安全性;使用基于架構(gòu)的可靠性模型(ASRM),對(duì)基于RAMM模型開發(fā)的遠(yuǎn)程報(bào)警監(jiān)控系統(tǒng)(RAS)進(jìn)行了可靠性驗(yàn)證。實(shí)際應(yīng)用案例表明,RAMM模型提供了短信、電話、郵件、局域網(wǎng)等多種遠(yuǎn)程報(bào)警方式,通過對(duì)報(bào)警信息的統(tǒng)一管理,實(shí)現(xiàn)了遠(yuǎn)程監(jiān)控和無人現(xiàn)場(chǎng)值守的功能,具有良好的應(yīng)用前景。
遠(yuǎn)程報(bào)警 監(jiān)控 軟件可靠性 ASRM模型 遠(yuǎn)程自動(dòng)化 SCADA
在自動(dòng)化控制應(yīng)用越來越普遍的情況下,很多領(lǐng)域都采用SCADA遠(yuǎn)程報(bào)警監(jiān)控系統(tǒng)作為遠(yuǎn)程自動(dòng)化解決方案。目前,國內(nèi)SCADA遠(yuǎn)程報(bào)警監(jiān)控系統(tǒng)尚不能保證軟件系統(tǒng)的可靠性。隨著計(jì)算機(jī)技術(shù)的成熟,硬件作為實(shí)現(xiàn)整個(gè)系統(tǒng)功能所必須的部分,其成本在迅速降低且可靠性具有保證,而軟件作為實(shí)現(xiàn)整個(gè)系統(tǒng)核心功能部分,其可靠性卻不能得到很好的保證,軟件故障比硬件故障所造成的損失更大[1]。同時(shí),大部分遠(yuǎn)程報(bào)警監(jiān)控模型都是只采用短消息或者電話單一報(bào)警的途徑遠(yuǎn)程報(bào)警[2-6],極大地限制了遠(yuǎn)程監(jiān)控報(bào)警系統(tǒng)的使用。
根據(jù)遠(yuǎn)程監(jiān)控報(bào)警系統(tǒng)的研究現(xiàn)狀,本文以擁有自主知識(shí)產(chǎn)權(quán)的SCADA軟件為平臺(tái),提出了具有可靠性保證和多樣化報(bào)警方式的遠(yuǎn)程報(bào)警監(jiān)控模型(remote alarm monitoring model,RAMM),并且依此開發(fā)實(shí)現(xiàn)了遠(yuǎn)程報(bào)警監(jiān)控系統(tǒng)(remote alarm system, RAS)。RAMM模型不僅在復(fù)雜軟件開發(fā)層次上簡(jiǎn)化了開發(fā)流程,完成模塊化開發(fā),而且實(shí)現(xiàn)了報(bào)警方式多樣化(短信報(bào)警、電話報(bào)警、郵件報(bào)警、局域網(wǎng)報(bào)警、現(xiàn)場(chǎng)語音報(bào)警),具備了統(tǒng)一配置管理的報(bào)警信息、遠(yuǎn)程監(jiān)控甚至無人值守的目標(biāo)工程功能。同時(shí),根據(jù)IEEE協(xié)會(huì)制定的有關(guān)軟件可靠性的相關(guān)規(guī)范[7-8]和軟件可靠性評(píng)價(jià)模型相關(guān)的研究[9-14],使用了基于架構(gòu)的軟件可靠性(architecture-based software reliability model, ASRM)模型[15-20]對(duì)RAS系統(tǒng)軟件可靠性進(jìn)行了評(píng)估,并給出了實(shí)際使用案例。
SCADA遠(yuǎn)程報(bào)警監(jiān)控模型是為了豐富SCADA在遠(yuǎn)程監(jiān)控報(bào)警上應(yīng)用而設(shè)計(jì)的,由SCADA獲取數(shù)據(jù)、提供組態(tài)環(huán)境,RAMM模型負(fù)責(zé)監(jiān)控、遠(yuǎn)程報(bào)警與遠(yuǎn)程反饋。RAMM遠(yuǎn)程報(bào)警監(jiān)控模型架設(shè)在原有SCADA平臺(tái)上,對(duì)原有平臺(tái)進(jìn)行功能擴(kuò)展,在邏輯上實(shí)現(xiàn)了遠(yuǎn)程報(bào)警與組態(tài)數(shù)據(jù)獲取這兩種功能的分離。
一般來說,在原有系統(tǒng)上進(jìn)行功能擴(kuò)展與功能隔離,從很多方面都會(huì)提高原有系統(tǒng)的復(fù)雜性,這是毋庸置疑的。功能擴(kuò)展系統(tǒng)具備良好的可靠性,盡可能地對(duì)原有系統(tǒng)不產(chǎn)生影響并降低耦合性,在整體模型上進(jìn)行分析和抽象是非常必要的[21-22]。SCADA組態(tài)系統(tǒng)核心的過程就是對(duì)數(shù)據(jù)進(jìn)行獲取、監(jiān)測(cè)、處理、控制和反饋,會(huì)產(chǎn)生相對(duì)應(yīng)的數(shù)據(jù)信息、控制信息、反饋信息、設(shè)備數(shù)據(jù)信息等,而要實(shí)現(xiàn)功能分離,就必須對(duì)這些信息區(qū)別對(duì)待。監(jiān)控信息和相關(guān)配置信息等是RAMM模型需要的,由此可以明確RAMM模型對(duì)主系統(tǒng)數(shù)據(jù)信息的需求。
1.1 RAMM模型體系結(jié)構(gòu)設(shè)計(jì)
為了降低系統(tǒng)間的耦合性,RAMM模型只需取原系統(tǒng)的監(jiān)控?cái)?shù)據(jù)信息以及相關(guān)的配置信息,并以此為基礎(chǔ)進(jìn)行功能擴(kuò)展應(yīng)用。
RAMM模型設(shè)計(jì)是SCADA系統(tǒng)的應(yīng)用擴(kuò)展,所以在權(quán)限操作和操作員管理方面需要和原系統(tǒng)保持一致。RAMM模型的架構(gòu)設(shè)計(jì)如圖1所示。
從圖1可看出,RAMM模型需要主系統(tǒng)應(yīng)用層的數(shù)據(jù),即RAMM模型是原系統(tǒng)在應(yīng)用層面上的擴(kuò)展。
圖1 RAMM層次體系結(jié)構(gòu)
RAMM體系結(jié)構(gòu)分成4層,分別是數(shù)據(jù)接口層、數(shù)據(jù)層、業(yè)務(wù)交互層和應(yīng)用層。數(shù)據(jù)接口層是將原SCADA系統(tǒng)的必需數(shù)據(jù)獲取到RAMM模型之中;數(shù)據(jù)層是對(duì)RAMM模型的數(shù)據(jù)進(jìn)行記錄存儲(chǔ)和再現(xiàn);業(yè)務(wù)交互層實(shí)現(xiàn)RAMM模型相關(guān)業(yè)務(wù)交互;應(yīng)用層是由RAMM模型提供的具體功能。通過實(shí)時(shí)數(shù)據(jù)庫能夠獲取實(shí)時(shí)信息,通過歷史數(shù)據(jù)庫則所夠方便地查詢歷史報(bào)警信息。
1.2 RAMM模型功能模型
RAMM模型對(duì)原SCADA系統(tǒng)實(shí)現(xiàn)功能擴(kuò)展,具體實(shí)現(xiàn)了遠(yuǎn)程報(bào)警與反饋等相關(guān)的功能。RAMM功能模型如圖2所示。
圖2 RAMM功能模型
由圖2可以看出,RAMM模型的核心功能是實(shí)時(shí)報(bào)警功能,即根據(jù)報(bào)警配置實(shí)時(shí)地對(duì)報(bào)警進(jìn)行相應(yīng)處理。其他功能則基本上是輔助實(shí)時(shí)報(bào)警功能而產(chǎn)生的。實(shí)時(shí)報(bào)警功能是否可靠很大程度上決定了RAMM模型的可靠性。
系統(tǒng)在設(shè)計(jì)開發(fā)的過程中應(yīng)盡量避免系統(tǒng)引入錯(cuò)誤,同時(shí)在系統(tǒng)出現(xiàn)故障時(shí)能夠自行檢測(cè)與診斷,使系統(tǒng)具有良好的可修復(fù)性。這就要求系統(tǒng)應(yīng)當(dāng)具有良好的容錯(cuò)性和可靠性。
2.1 預(yù)防性監(jiān)測(cè)
預(yù)防性監(jiān)測(cè)的基本功能是檢測(cè)設(shè)備或者軟件模塊的運(yùn)行狀態(tài)并保證其可用性。預(yù)防性監(jiān)測(cè)是對(duì)系統(tǒng)進(jìn)行最少次數(shù)的維修或更換系統(tǒng)的全部部件甚至整個(gè)系統(tǒng)的維修行為[1]。RAMM模型是一種遠(yuǎn)程報(bào)警監(jiān)控模型,監(jiān)控是RAMM模型的一個(gè)重要部分,在監(jiān)控過程中監(jiān)測(cè)報(bào)警設(shè)備是否出現(xiàn)故障是非常必要的。預(yù)防性監(jiān)測(cè)的目的就是避免報(bào)警設(shè)備在空閑期間出現(xiàn)故障,并且能夠進(jìn)行預(yù)防性更換和維修。
RAMM模型短信遠(yuǎn)程預(yù)防性監(jiān)測(cè)示意圖如圖3所示。首先,遠(yuǎn)程操作員向短信設(shè)備發(fā)送RAMM模型的操作碼,短信設(shè)備識(shí)別請(qǐng)求碼后進(jìn)行相關(guān)處理,短信設(shè)備發(fā)送查詢信息;并在接收到反饋信息后將信息轉(zhuǎn)發(fā)給操作員,實(shí)現(xiàn)遠(yuǎn)程監(jiān)測(cè)。這樣的預(yù)防性監(jiān)測(cè)可以讓操作員了解短信設(shè)備的SIM卡余額、短信剩余數(shù)等信息。同時(shí),操作員可以主動(dòng)請(qǐng)求查詢信息。RAMM模型每月定時(shí)向操作員手機(jī)發(fā)送短信,實(shí)現(xiàn)預(yù)防性監(jiān)測(cè),避免出現(xiàn)因短信設(shè)備欠費(fèi)等原因造成系統(tǒng)無法提供服務(wù)。
圖3 短信遠(yuǎn)程預(yù)防性監(jiān)測(cè)示意圖
2.2 提高電話與短信報(bào)警可靠性
在遠(yuǎn)程報(bào)警中,遠(yuǎn)程報(bào)警設(shè)備起到了至關(guān)重要的作用,電話設(shè)備和短信設(shè)備分別實(shí)現(xiàn)了RAMM模型中電話語音與短信報(bào)警通知的功能,是連接人與系統(tǒng)遠(yuǎn)程通信的紐帶,是實(shí)現(xiàn)RAMM模型遠(yuǎn)程報(bào)警功能的關(guān)鍵。
電話語音設(shè)備與短信設(shè)備處理信息都有延時(shí),且具有單個(gè)請(qǐng)求處理時(shí)間較長的特點(diǎn),如電話語音設(shè)備經(jīng)歷電話撥打、接通和掛斷幾個(gè)過程,會(huì)持續(xù)比較長的時(shí)間。因此,當(dāng)一個(gè)系統(tǒng)產(chǎn)生大量報(bào)警時(shí),電話語音設(shè)備與短信設(shè)備將承載很大的負(fù)載,出現(xiàn)短信發(fā)送失敗、電話漏撥等問題。如在系統(tǒng)斷電切換至UPS供電的情況下,會(huì)產(chǎn)生大量的報(bào)警,這樣的情況將造成大量的報(bào)警通知信息積存在電話設(shè)備與短信設(shè)備端,產(chǎn)生漏發(fā)和漏撥的問題。
對(duì)此,RAMM模型使用緩沖技術(shù)來解決這樣的短時(shí)間內(nèi)出現(xiàn)高負(fù)荷的問題。緩沖技術(shù)就是在短時(shí)間內(nèi)出現(xiàn)大量負(fù)載的時(shí)候,使用隊(duì)列緩沖實(shí)現(xiàn)信息有次序的處理,以防止出現(xiàn)漏發(fā)漏撥的情況,提高整體系統(tǒng)的QOS服務(wù)質(zhì)量。
使用隊(duì)列緩沖技術(shù)處理短信信息的原理圖如圖4所示。由于使用了隊(duì)列,在出現(xiàn)大量報(bào)警時(shí)信息不會(huì)阻塞在硬件設(shè)備端,而是堆積在信息隊(duì)列中,避免了硬件設(shè)備出現(xiàn)漏發(fā)信息等問題。
圖4 隊(duì)列緩沖技術(shù)處理短信原理圖
然而在短時(shí)間內(nèi)出現(xiàn)大量報(bào)警時(shí),這種方法不具備很好的報(bào)警實(shí)時(shí)性處理能力。由于未來產(chǎn)生的報(bào)警數(shù)量未知,因此,可以通過直接監(jiān)控隊(duì)列長度來實(shí)現(xiàn)。當(dāng)隊(duì)列長度大于某個(gè)閾值時(shí),RAMM模型將操作員聯(lián)系號(hào)碼作為依據(jù)合并報(bào)警信息,從而達(dá)到縮短隊(duì)列長度和處理時(shí)間的目的。
電話語音報(bào)警是通過事先錄好的每個(gè)報(bào)警點(diǎn)的語音信息,在出現(xiàn)報(bào)警時(shí)撥打電話進(jìn)行播報(bào)。電話語音報(bào)警相對(duì)于短信報(bào)警來說,延時(shí)性更高,單個(gè)請(qǐng)求持續(xù)時(shí)間更長,還存在被叫無法接通、被叫提前掛機(jī)等狀況,使得電話語音報(bào)警更加復(fù)雜。
在處理電話語音報(bào)警過程中,以操作員建立散列表,原理如圖5所示。散列表中存放產(chǎn)生報(bào)警需要播放的語音信息,定時(shí)對(duì)散列表進(jìn)行檢查。若某個(gè)操作員列表中存在語音信息,則進(jìn)行撥號(hào)。如果接通,將其列表中的語音信息全部播放給被叫操作員,記錄后消除列表中的語音信息;若沒有接通,列表中的語音信息不操作,等下一次輪詢時(shí)進(jìn)行電話撥打。
圖5 使用散列表處理電話語音報(bào)警原理圖
這種方式不僅可以避免在短時(shí)間內(nèi)多次撥打同一操作員號(hào)碼,而且可以快捷處理短時(shí)間內(nèi)產(chǎn)生的大量報(bào)警信息,提高了電話語音報(bào)警的實(shí)時(shí)性。
2.3 短報(bào)的處理
短報(bào),就是報(bào)警持續(xù)時(shí)間非常短暫然后又恢復(fù)的報(bào)警。由于設(shè)備供電電壓不穩(wěn)、通信鏈路不完全可靠等原因會(huì)造成報(bào)警以后立馬恢復(fù),一般的報(bào)警時(shí)間持續(xù)1~5 s,然后報(bào)警恢復(fù)。這樣的情況會(huì)造成RAMM模型在短時(shí)間內(nèi)產(chǎn)生比較多的報(bào)警信息和報(bào)警恢復(fù)信息,從而降低用戶對(duì)RAMM模型的軟件體驗(yàn),同時(shí)也浪費(fèi)了短信和電話語音資源。
由于不能預(yù)見報(bào)警信息是否是短報(bào),因此解決短報(bào)的問題可以用報(bào)警檢測(cè)延時(shí)來解決,即在檢測(cè)到每個(gè)報(bào)警之后,并不馬上進(jìn)行報(bào)警,而是等待幾秒,然后再?zèng)Q定是否報(bào)警。這樣的做法是犧牲部分的報(bào)警實(shí)時(shí)性來消除短報(bào),但與電話撥打與短信發(fā)送的時(shí)間相比,花費(fèi)這些時(shí)間是值得的。同時(shí),為了提高RAMM模型的用戶體驗(yàn),將消除短報(bào)設(shè)為選項(xiàng)配置,將功能的選擇權(quán)交給用戶,以滿足用戶的各種需求。
2.4 降低人為故障
在大多數(shù)情況下,人和機(jī)器共同組成一個(gè)系統(tǒng);同時(shí)由軟件和硬件構(gòu)成的系統(tǒng)可能會(huì)由于軟件不能執(zhí)行外部指令而失敗[23]。在眾多系統(tǒng)故障報(bào)告中,有相當(dāng)比例的事故起因是“人為錯(cuò)誤”或“人員可靠性”。故障分為系統(tǒng)故障和人為故障兩類[24]。對(duì)人為故障,應(yīng)持謹(jǐn)慎態(tài)度,避免將所有的責(zé)任都?jí)涸诓僮鲉T身上,可以采用人員培訓(xùn)、良好的用戶體驗(yàn)和系統(tǒng)容錯(cuò)等方式來解決,提高可靠性。RAMM模型采取了若干方式來降低人為故障。
① 屏蔽會(huì)引起歧義的設(shè)計(jì),對(duì)用戶進(jìn)行指引。RAMM模型設(shè)計(jì)應(yīng)盡量避免引起用戶的誤解和誤操作,對(duì)可能發(fā)生歧義的設(shè)計(jì)加上說明和指引,降低人員故障。
② 權(quán)限統(tǒng)一。RAMM模型與組態(tài)系統(tǒng)中所有操作員以及加密鎖的權(quán)限是統(tǒng)一的,這不僅可以提高系統(tǒng)的安全性,還可以避免沒有權(quán)限的操作員對(duì)RAMM模型的誤操作,提高系統(tǒng)的安全性。
③ 良好的人機(jī)界面和豐富的說明文檔。人性化的提示和詳盡的說明文檔可以避免操作員誤操作。
2.5 擔(dān)保組件
RAMM模型采用重加載技術(shù)和擔(dān)保組件,使RAMM模型在運(yùn)行出現(xiàn)故障時(shí)能夠?qū)崿F(xiàn)重加載。與硬件擔(dān)保模型[1]不同,擔(dān)保組件實(shí)現(xiàn)重加載功能。擔(dān)保組件的設(shè)計(jì)目的就是在系統(tǒng)核心功能出現(xiàn)失效的時(shí)候能夠進(jìn)行修復(fù)。擔(dān)保組件并不提供冗余功能,從根本上看算是一個(gè)微型的監(jiān)控維修組件,從而達(dá)到軟件可修復(fù)系統(tǒng)[1]的目的。圖6是擔(dān)保組件重加載設(shè)備驅(qū)動(dòng)原理圖。
圖6 擔(dān)保組件重加載設(shè)備驅(qū)動(dòng)原理圖
如設(shè)備驅(qū)動(dòng)在連接設(shè)備時(shí)出現(xiàn)故障,設(shè)備驅(qū)動(dòng)在故障診斷無法修復(fù)時(shí),返回狀態(tài)碼,并告知擔(dān)保組件;此時(shí)擔(dān)保組件關(guān)閉驅(qū)動(dòng),讀取設(shè)備1的配置參數(shù),初始化驅(qū)動(dòng)重連。在多次重新連接失敗后,擔(dān)保組件選擇連接冗余設(shè)備2,讀取配置參數(shù)后讓驅(qū)動(dòng)初始化重加載設(shè)備2。
采用ASRM模型對(duì)軟件可靠性分析需要滿足基本模型假設(shè):① 組件之間的可靠性是相互獨(dú)立的;② 組件間的控制轉(zhuǎn)移是Markov過程;③ 組件之間的連接邏輯完全可靠。為了計(jì)算整個(gè)系統(tǒng)的可靠性,組件的可靠性可以根據(jù)測(cè)試等途徑得到[25]。文獻(xiàn)[23]給出了冗余組件等可靠性的計(jì)算方式。ASRM模型主要用于計(jì)算基于組件的軟件架構(gòu)模型。
3.1 擔(dān)保組件與可靠性
RAMM模型使用擔(dān)保組件是為了在線監(jiān)測(cè)核心組件并在組件失效時(shí)提供重加載,提高核心組件的可靠性。冗余組件與擔(dān)保組件示意圖如圖7所示。
圖7 冗余組件(左)與擔(dān)保組件(右)示意圖
對(duì)于冗余組件(主動(dòng)冗余),其轉(zhuǎn)移概率為P=P1R+(1-R)RRP1=[R+(1-R)RR]P1,總可靠性度量為RC=R+(1-R)RR;而擔(dān)保組件的轉(zhuǎn)移概率為P=[R+(1-R)Rw]P1,總可靠性為RC=R+(1-R)Rw。雖然擔(dān)保組件與冗余組件的可靠性表示是相同的,但在效率方面,擔(dān)保組件占用的內(nèi)存空間和存儲(chǔ)空間比冗余組件要小,節(jié)省了程序的運(yùn)行空間,減少了代碼量,提升了軟件可維護(hù)性。
3.2 使用ASRM可靠性評(píng)估
ASRM模型能夠?qū)④浖绦蚣軜?gòu)流程圖(architecture flow graph,AFG)通過一定方式轉(zhuǎn)化成狀態(tài)轉(zhuǎn)移圖,然后使用Markov鏈模型對(duì)整個(gè)系統(tǒng)可靠性進(jìn)行計(jì)算。
ASRM模型建模步驟如下。
① 根據(jù)RAMM模型的架構(gòu)設(shè)計(jì)圖,設(shè)計(jì)出相應(yīng)的程序架構(gòu)流程圖。
② 根據(jù)架構(gòu)流程圖,將每一部分轉(zhuǎn)化成狀態(tài)轉(zhuǎn)移圖并計(jì)算每一部分的可靠性。
③ 將每一部分的狀態(tài)轉(zhuǎn)移圖集成為完整的系統(tǒng)狀態(tài)轉(zhuǎn)移圖。
④ 根據(jù)整個(gè)狀態(tài)轉(zhuǎn)移圖的狀態(tài)轉(zhuǎn)移矩陣,計(jì)算可靠性。
根據(jù)圖2中RAMM模型修改的架構(gòu)流程圖如圖8所示。
圖8中,C1為動(dòng)態(tài)監(jiān)測(cè),聯(lián)動(dòng)操作,C2為登錄權(quán)限管理,C3為GUI,C4為操作員配置DB,C5為值班表配置DB,C6為歷史報(bào)警查詢,C7為歷史報(bào)警DB,C8為本機(jī)參數(shù)查詢,C9為局域網(wǎng)監(jiān)控,C10為報(bào)警記錄,C11為報(bào)警數(shù)據(jù)加載,C12為遠(yuǎn)程IP監(jiān)控,C13為實(shí)時(shí)報(bào)警,C14為報(bào)警記錄DB,C15為設(shè)備測(cè)試,C16為變量配置DB,C17為日志記錄,CR為冗余組記,CW為擔(dān)保組件。
RAMM模型的狀態(tài)轉(zhuǎn)移圖如圖9所示。
圖8 RAMM架構(gòu)流程圖
圖9 RAMM模型狀態(tài)轉(zhuǎn)移圖
圖9所對(duì)應(yīng)的各轉(zhuǎn)移概率如下:P1,2=1,P2,4=0.1,P2,3=0.7,P2,5=0.2,P3,11=0.5,P3,10=0.1,P3,12=0.1,P3,6=0.1,P3,8=0.1,P3,9=0.1,P6,17=0.8,P6,7=0.2,P7,6=1,P5,2=1,P8,17=1,P9,17=1,P10,14=1,P10,17=0.6,P11,13=0.8,P11,16=0.2,P12,17=1,P13,10=0.15,P13,15=0.1,P14,10=1,P13,17=0.75,P15,17=1,P16,11=1。組件綜合可靠性:
RS5=R5+ (1 -R5)RR5= 0.999 7
RS16=R16+ (1 -R16)RR16= 0.999 7
RS13=R13+ (1 -R13)RR13= 0.999 9
通過轉(zhuǎn)移矩陣M可以計(jì)算系統(tǒng)可靠性:
N= 17
|I-M| =0.195 6
|En1| = 0.182
則整個(gè)系統(tǒng)的可靠性R為:
R=T(1,S17)×R17= 0.921 2
由此可以看出,整個(gè)系統(tǒng)的可靠性基于每個(gè)組件的可靠性,因此,提高每個(gè)組件的可靠性是非常必要的;同時(shí),應(yīng)當(dāng)優(yōu)先提高核心組件的可靠性,因?yàn)橐粋€(gè)系統(tǒng)的核心功能往往具有較高的轉(zhuǎn)移概率,且系統(tǒng)應(yīng)當(dāng)保證核心功能的正常執(zhí)行。從結(jié)果來看,整個(gè)系統(tǒng)的可靠性比較令人滿意。
基于RAMM模型自主開發(fā)的RAS系統(tǒng)目前已經(jīng)得到實(shí)際應(yīng)用,應(yīng)用案例如圖10所示。以某省商業(yè)銀行機(jī)房環(huán)境監(jiān)控應(yīng)用為例,該監(jiān)控系統(tǒng)主要完成商業(yè)銀行機(jī)房環(huán)境的監(jiān)控,多串口卡連接在系統(tǒng)主機(jī)上,通過SCADA主系統(tǒng)來完成D86、電量儀、UPS以及智能空調(diào)等設(shè)備的數(shù)據(jù)采集和控制。系統(tǒng)利用Modbus-TCP驅(qū)動(dòng)程序,實(shí)時(shí)顯示全市各地ATM取款機(jī)的通信數(shù)據(jù)。
圖10 應(yīng)用案例結(jié)構(gòu)圖
RAS遠(yuǎn)程報(bào)警監(jiān)控模型會(huì)將所有的報(bào)警信息集中起來供工作人員配置查看,同時(shí)將產(chǎn)生的報(bào)警及時(shí)通過短信、電話等方式告知工作人員,方便工作人員及時(shí)處理,以減少不必要的經(jīng)濟(jì)損失。應(yīng)用項(xiàng)目中RAS系統(tǒng)運(yùn)行狀況統(tǒng)計(jì)如表1所示。
表1 項(xiàng)目中RAS系統(tǒng)運(yùn)行狀況統(tǒng)計(jì)
由表1可以看到,RAS系統(tǒng)能夠提供可靠的服務(wù)。在整個(gè)運(yùn)行過程中,RAS系統(tǒng)通過重加載等途徑自我修復(fù)后仍能夠繼續(xù)提供服務(wù),比率為:
β= 40/43×100% = 93.0%
其中,部分運(yùn)行時(shí)故障包括用戶界面的錯(cuò)誤,以及用戶對(duì)產(chǎn)生的故障提出的系統(tǒng)改進(jìn)要求等。實(shí)際案例說明,RAMM模型具有較好的可修復(fù)性和可靠性。
RAMM遠(yuǎn)程報(bào)警監(jiān)控模型能夠提供電話、現(xiàn)場(chǎng)語音、郵件、短信等多樣化的報(bào)警方式;同時(shí)從多個(gè)方面提高RAMM模型的可靠性,這不僅考慮到了系統(tǒng)各個(gè)方面,同時(shí)也考慮到了人的因素。RAMM模型不僅能夠提供可靠的服務(wù),而且具有用戶友好特性。ASRM模型具有直觀、相對(duì)簡(jiǎn)單的特點(diǎn)。通過使用ASRM模型對(duì)RAMM模型進(jìn)行可靠性評(píng)價(jià),量化了RAMM模型可靠性性能。在實(shí)際應(yīng)用中,基于RAMM模型的RAS系統(tǒng)已經(jīng)應(yīng)用于多處銀行監(jiān)測(cè)、電視臺(tái)監(jiān)測(cè)以及工業(yè)生產(chǎn)監(jiān)測(cè)中,具有良好的應(yīng)用前景。
[1] Elsayed E A.Reliability engineering[M].2nd Edition.USA:John Wiley,Inc,2012.
[2] Ozdemir E,Karacor M.Mobile phone based SCADA for industrial automation[J].ISA Transactions,2006,45(1):67-75.
[3] Edwards C J,Davidson E M,McArthur S S J,et al.Flexible model-based alarm processing for protection performance assessment and incident identification[J].Power Systems,IEEE Transactions on,2013,28(3):2584-2591.
[4] 孫增雷,黃俊年,孫敏,等.基于GSM的遠(yuǎn)程報(bào)警監(jiān)控模型的研制[J].武漢理工大學(xué)學(xué)報(bào),2008,17(2):122-124.
[5] 曾一凡,洋梅,金花順.基于短消息的遠(yuǎn)程報(bào)警監(jiān)控模型的設(shè)計(jì)與實(shí)現(xiàn)[J].沈陽大學(xué)學(xué)報(bào),2005,23(6):120-123.
[6] Zhang G M.Research on and design of remote control and alarm by GSM/SMS[J].Journal of Sichuan Normal University:Natural Science Edition,2004,27(1):102-106.
[7] Zhang Y J,Wang Z Z.Cumulative damage model and parameter estimate about a kind of time-sharing redundant system[J].Acta Phys.Sin.,2009,58(9):6074-6079.
[8] George H,Jan K,Frantisek P.Research into practice-reality and gaps:6th international conference on the quality of software architectures[M].Springer Science & Business Media,2010.
[9] Igure V M,Laughter S A,Williams R D.Security issues in SCADA networks[J].Computers & Security,2006,25(7):498-506.
[10] Ward M P.An architectural framework for describing supervisory control and data acquisition (SCADA)systems[D].Monterey,California:Naval Postgraduate School,2004.
[11]Gaushell D J,Darlington H T.Supervisory control and data acquisition[J].Proceedings of the IEEE,1987,75(12):1645-1658.
[12] Xie Z,Manimaran G,Vittal V,et al.An information architecture for future power systems and its reliability analysis[J].Power Systems,IEEE Transactions on,2002,17(3):857-863.
[13] 耿技,聶鵬,秦志光.軟件可靠性模型現(xiàn)狀與研究[J].電子科技大學(xué)學(xué)報(bào),2013,42(4):555-570.
[14] Ebeling C E.An introduction to reliability and maintainability engineering[M].USA:Waveland Press,Inc.,2005.
[15] Gokhale S S,Lyu M R T.A simulation approach to structure-based software reliability analysis[J].Software Engineering,IEEE Transactions on,2005,31(8):643-656.
[16] Cheung R C.A user-oriented software reliability model[J].IEEE Transactions on Software Engineering,1980,6(2):118-126.
[17] Wang W L ,Ye W ,Chen M H .An architecture-based software reliability model[C]//Proceedings Pacific Rim International Symposium on Dependable Computing,1999:143-150.
[18] Gokhale S. Architecture-based software reliability analysis:overview and limitations[J].Dependable and Secure Computing, IEEE Transactions on,2007,4(1):35-40.
[19] Koziolek H,Schlich B,Bilich C.A large-scale Industrial case study on architecture-based software reliability analysis[C]//Software Reliability Engineering (ISSRE),2010 IEEE 21st International Symposium on,2010:279-288.
[20] Gokhale S S.Wong W E,Horgan J R, et al. An analytical approach to architecture-based software performance and reliability prediction[J].Perf.Eval.,2004,58( 4):391-412.
[21] Frederick P,Brooks J R.The mythical man-month:essays on software engineering anniversary edition[M].2nd Edition.USA:Addison-Wesley Professional Press,2008.
[22] Frederick P,Brooks J R.The design of design:essays from a computer scientist[M].USA:Addison-Wesley Professional Press,2010.
[23] Way K V,Rajendra P M,Frank A,et al.Optimal reliability design[M].UK:Cambridge Unversity Press & Science Press Ltd.,2011.
[24] Boring R L.Human reliability analysis in cognitive engineering and system design[C]//Frontiers of Engineering:Reports on Leading-Edge Engineering from the Symposium,2009.
[25] 王世安.基于敏捷開發(fā)的構(gòu)件化軟件可靠性研究[J].微電子學(xué)與計(jì)算機(jī),2011,28(3):119-122.
Multi-method SCADA Remote Alarm Monitoring Model Based on ASRM Reliability Assessment
In order to achieve diversified remote alarm and independent function expansion, the automatic remote alarm monitoring model (RAMM) with SCADA as the software platform is proposed. The reliability and security of RAMM is improved from device connections, elimination of false alarms and consideration of personnel reliability; and the reliability verification of the remote alarm system (RAS)developed based on RAMM is conducted by using architecture-based software reliability model (ASRM). The practical applications indicate that through the unified management of alarm information, RAMM provides multiple remote alarm modes, including SMS, telephone, email, and LAN, to achieve remote monitoring and unmanned site on duty functions, possesses excellent applicable prospects.
Remote alarm Monitoring Software reliability Architecture-based software reliability model Remote automation SCADA
江蘇省高校自然科學(xué)基金資助項(xiàng)目(編號(hào):12KJB510007 )。
楊小健(1963-),男,2008年畢業(yè)于南京工業(yè)大學(xué)生物化工控制專業(yè),獲博士學(xué)位,教授;主要從事工業(yè)控制自動(dòng)化、復(fù)雜過程先進(jìn)控制、流程模擬與優(yōu)化的研究。
TH86;TP311+.1
A
10.16086/j.cnki.issn1000-0380.201509003
修改稿收到日期:2014-12-29。