張官祥,常中原,蔣小輝,陳自然,涂 勇
(1. 中國長江電力股份有限公司向家壩電廠,四川 宜賓644612;2. 三峽大學科技學院,湖北 宜昌443000)
水輪發(fā)電機組調(diào)速器是確保水輪發(fā)電機組在不同功率下轉(zhuǎn)速穩(wěn)定,使水輪發(fā)電機組的功率保持預定功率值的關(guān)鍵部件。某水電廠水輪機調(diào)速器電氣控制部分采用奧地利貝加萊B&R公司2005系列的硬件配置和功能完全一樣的獨立的2套PCC控制器組成的控制系統(tǒng),從而實現(xiàn)“主機/熱備”功能??刂破鰽和控制器B,通過以太網(wǎng)實現(xiàn)2套PCC控制器的狀態(tài)和數(shù)據(jù)傳送一致,將數(shù)據(jù)和故障信息通過以太網(wǎng)上送至電器柜觸摸屏;2套控制器中的任意一套控制器與相應(yīng)的機械液壓系統(tǒng)相配合,均能獨立實現(xiàn)全部控制功能和保證達到全部調(diào)節(jié)性能要求;當A套或B套控制器任意一套出現(xiàn)故障時,可發(fā)出故障信號至電氣柜觸摸屏和監(jiān)控系統(tǒng),并自動無擾動地切換至另一套正常的PCC控制器工作,故障的控制器可在線更換模塊進行檢修。但是,雙套控制器同時出現(xiàn)故障時嚴重影響機組的安全穩(wěn)定運行。
某水電廠機組在運行過程中出現(xiàn)調(diào)速器A套控制器突發(fā)故障并觸發(fā)停機報警,自動切至機手動方式運行,調(diào)速器電氣柜觸摸屏顯示A套控制器通信異常。檢查發(fā)現(xiàn),A套控制器出現(xiàn)故障已停止運行,電氣柜觸摸屏上A套相關(guān)數(shù)據(jù)不更新,電氣柜觸摸屏事件記錄顯示1 s后調(diào)速器自動切換至B套控制器,并處于自動、開度模式運行,B套控制器數(shù)據(jù)采集正常。
鑒于機組處于并網(wǎng)運行,為了真正的掌握和確認故障原因,進一步確定處理故障采取的措施,防止事故擴大化,首先對故障現(xiàn)象進行故障模擬和事故預想,初步假設(shè)以下幾個方面原因,并逐步開展了相關(guān)檢查和試驗項目:
(1)模擬DM455模塊故障。在正常運行的單套PCC控制器試驗平臺上,拔出DM455模塊后再插入,發(fā)現(xiàn)DM455模塊上的RUN燈一直處于閃爍狀態(tài);CPU模塊停止運行、RUN燈熄滅、READY燈一直保持常亮狀態(tài)、ERROR燈處于常亮狀態(tài)。經(jīng)重啟PCC控制器后,上述故障現(xiàn)象消失,CPU和DM455模塊運行正常。經(jīng)聯(lián)機程序在線查看故障日志,發(fā)現(xiàn)故障日志的描述為當模塊運行時移除了模塊。經(jīng)上述模擬驗證和分析可以得出結(jié)論,是由于DM455模塊故障導致CPU停止運行。
(2)模擬CPU模塊故障。在正常運行的單套PCC控制器的試驗平臺上,拔出CPU模塊后再插入,發(fā)現(xiàn)CPU模塊RUN燈熄滅,READY燈一直保持常亮狀態(tài),ERROR燈處于常亮狀態(tài)。同時也發(fā)現(xiàn)所在機架上的所有模塊的RUN燈一直閃爍。經(jīng)聯(lián)機程序在線查看故障日志,發(fā)現(xiàn)故障日志的描述為當模塊運行時移除了模塊。經(jīng)上述模擬驗證和分析可以得出結(jié)論,CPU模塊本體故障將會導致本機架上的其他模塊均故障報警。
根據(jù)上述故障模擬試驗及驗證結(jié)果,初步打算采取以下措施處理此次異常事件:
(1)在線聯(lián)機導出故障日志。在線連接故障控制器程序,導出故障日志并根據(jù)故障日志判斷故障原因,尋找其最優(yōu)解決方案。
(2)故障控制器斷電重啟。斷電前做好參數(shù)備份工作,斷開故障控制器的交直流電源后觀察CPU模塊是否正常運行,觀察DM455模塊的故障是否消失。如果能夠達到預期的效果,保持原樣并持續(xù)運行觀察。
(3)更換DM455模塊。經(jīng)控制器斷電重啟后,如果DM455故障尚未消失,則初步判斷為DM455內(nèi)部檢測出現(xiàn)故障,需更換DM455模塊。
(4)更換CPU模塊。經(jīng)控制器斷電重啟后,觀察控制器CPU模塊的運行情況。如果CPU模塊不能正常運行,DM455模塊故障未能消失則判斷為CPU模塊故障導致DM455故障,需更換CPU模塊。
對機組調(diào)速器電氣柜故障記錄和監(jiān)控系統(tǒng)事件記錄進行分析,為了防止事故進一步惡化,監(jiān)控系統(tǒng)畫面中退出機組過速保護停機軟連片、調(diào)速系統(tǒng)停機軟連片、一類機械事故停機軟連片。機組停機后采取防保護信息誤動措施:退出LCU柜電氣過速保護連片、退出LCU柜機械過速保護連片。初步檢查并查詢監(jiān)控系統(tǒng)歷史事件、數(shù)據(jù)曲線及調(diào)速器觸摸屏相關(guān)數(shù)據(jù)曲線,具體檢查和分析過程如下:
2.2.1 調(diào)速器電氣柜設(shè)備檢查
經(jīng)檢查發(fā)現(xiàn),調(diào)速器電氣柜內(nèi)A套控制器CPU模塊的“ERROR”指示燈點亮,“RUN”燈熄滅,“READY”燈常亮;A套控制器的DM455模塊“RUN”燈一直閃爍。B套控制器及其PCC其他模塊未發(fā)現(xiàn)異常情況,均運行正常。
2.2.2 電氣柜觸摸屏事件記錄分析
查看調(diào)速器電氣柜觸摸屏發(fā)現(xiàn),主頁上顯示A機通信“異常”,A套數(shù)據(jù)一覽表及其他頁面數(shù)據(jù)不刷新,B套數(shù)據(jù)采集正常,能夠?qū)崟r更新。
查看故障記錄發(fā)現(xiàn),故障發(fā)生時B機的切換閥投入和從機主用信號復歸,同時B機切至開度模式運行,未顯示A套故障信息,只有B套故障事件記錄信息。
2.2.3 LCU觸摸屏事件記錄分析
查看監(jiān)控系統(tǒng)事件記錄發(fā)現(xiàn),調(diào)速器A套控制器處于主用狀態(tài)、操作方式為自動、運行模式為功率模式時,當發(fā)現(xiàn)A套控制器發(fā)生故障后,A套控制器存在由自動狀態(tài)切至機手動狀態(tài)的過程。
查看機組LCU觸摸屏事件記錄發(fā)現(xiàn),當調(diào)速器報停機報警故障時調(diào)速器自動切至B機在線,并把調(diào)速器控制模式由功率模式切換為開度模式;調(diào)速器主用狀態(tài)發(fā)生變化,由A機在線主用變?yōu)锽機在線主用。
2.2.4 監(jiān)控系統(tǒng)事件記錄分析
調(diào)用監(jiān)控系統(tǒng)事件記錄,經(jīng)分析得出結(jié)果如下:
(1)10月 5日,09:50:40,調(diào)速器 A 套控制器發(fā)生故障,所有開關(guān)量輸出信號置零,由于調(diào)速器電氣柜停機報警信號和機手動控制方式信號采用常閉接點上送至監(jiān)控系統(tǒng),所以原所有動作的輸出信號復歸,即停機報警信號和機手動控制方式信號動作。監(jiān)控系統(tǒng)由于收到調(diào)速器上送的機手動控制方式反饋信號,向調(diào)速器下發(fā)切開度控制方式命令,同時復歸調(diào)速器模擬量給定方式信號。監(jiān)控系統(tǒng)所報調(diào)速器故障報警信息正常。
(2)10月 5日,09:50:41,機組調(diào)速器 B 套控制器因檢測到A套控制器故障,主動切為B機在線主用狀態(tài),并且操作方式切換為自動方式,B套控制器的開關(guān)量輸出信號狀態(tài)刷新調(diào)速器電氣柜的輸出信號;當調(diào)速器接收到監(jiān)控系統(tǒng)發(fā)的切開度模式命令后調(diào)速器切至開度模式運行,同時監(jiān)控系統(tǒng)有功閉環(huán)模式退出運行,機組處于有功開環(huán)模式,調(diào)速器處于開度調(diào)節(jié)模式。監(jiān)控系統(tǒng)和調(diào)速器功率模式切換邏輯正常,信號報警正常。
2.2.5 檢查結(jié)論
上述分析得出,當機組處于并網(wǎng)狀態(tài)時,A套控制器已經(jīng)處于故障狀態(tài),導致A套控制器所檢測的切換閥狀態(tài)復歸,B套控制器程序檢測到A機不在線后自動切為B機在線主用狀態(tài)。因此調(diào)速器的運行模式由功率模式切開度模式運行,屬于正??刂七壿嫛=?jīng)綜合分析,初步判斷其故障原因為A套控制器運行時未檢測到DM455模塊引起CPU模塊停止運行,調(diào)速器控制邏輯動作正確,故障報警信息正確無誤,模式切換結(jié)果正常。
上述故障經(jīng)斷電重啟PCC控制器并在線更換DM455模塊,A套控制器運行正常,切換正常。隨后裝置運行一段時間,觀察裝置數(shù)據(jù)采樣情況,頻率、功率、開度、主配中位等模擬量采集正常,再次檢查程序版本、定值及相關(guān)參數(shù)設(shè)置后恢復機組為備用態(tài)。在機組開機時做補充驗證試驗,模式切換正常,主備用切換邏輯正常。具體處理過程如下:
(1)在線聯(lián)機查看故障日志。與A套控制器在線聯(lián)機,查看A套PCC故障日志,發(fā)現(xiàn)有1個故障和2個警告,PCC對時因程序內(nèi)部尚未對時存在顯示不一致,但是觸發(fā)時間與觸摸屏故障事件記錄的時間完全吻合。PCC故障日志中的故障error代碼為9206,故障描述為“PLC reboot triggered by hardware watchdog”,由于PLC硬件看門狗觸發(fā)PLC重啟;警告warning代碼為9210和27063。初步判斷故障原因為PLC程序內(nèi)部數(shù)據(jù)溢出導致硬件看門狗動作。
(2)A套控制器斷電熱重啟。經(jīng)過參數(shù)備份和故障日志導出后,斷開A套控制器的交直流電源空開,經(jīng)過1 min后重新上電啟動,發(fā)現(xiàn)A套CPU模塊運行正常,RUN燈點亮,ERROR燈熄滅,DM455模塊運行正常,故障消失。待CPU完全運行正常后,電氣柜柜門上的“一般故障”燈點亮,觸摸屏故障記錄只顯示A套水頭故障,手動無法故障復歸。此時查看其他畫面的數(shù)據(jù)時發(fā)現(xiàn)A套所有觸摸屏設(shè)置數(shù)據(jù)為零,B套數(shù)據(jù)顯示正常。第二次斷電重啟A套控制器后,發(fā)現(xiàn)現(xiàn)象依然存在。綜合上述現(xiàn)象初步判斷為在A套CPU故障狀態(tài)下,斷電重啟時A套控制器運行參數(shù)已被故障清零。
(3)A套控制器冷重啟。連接調(diào)速器A套控制器程序,在線聯(lián)機冷啟A套控制器后,發(fā)現(xiàn)觸摸屏數(shù)據(jù)恢復為程序初始值,故障消失,手自動切換正常。經(jīng)斷開A套控制器電源重啟后未出現(xiàn)A套控制器數(shù)據(jù)清零的現(xiàn)象。
(4)更換DM455模塊。分析高頻計數(shù)模塊測頻程序執(zhí)行異常導致程序內(nèi)部數(shù)據(jù)溢出的可能性較大,為了確保機組調(diào)速器A套控制器正常運行,以免再次出現(xiàn)同類故障,更換新的DM455模塊。斷開A套控制器電源,更換新的DM455模塊,更換后合上A套控制器電源,A套控制器運行正常,DM455模塊運行正常。原有的DM455模塊需在試驗室繼續(xù)驗證和檢測。
(5)核對A套控制器運行參數(shù)設(shè)置。為了防止調(diào)速器中位等重要參數(shù)變化導致機組不穩(wěn)定運行,按照備份的最新調(diào)速器A套控制器運行參數(shù)進行檢查并恢復A套控制器當前運行參數(shù)設(shè)置。
(6)斷電再次重啟。上述工作完成后,為了進一步檢驗調(diào)速器運行情況和控制器參數(shù)變化,再次斷開A套控制器電源重啟A套CPU,發(fā)現(xiàn)A套控制器運行正常,數(shù)據(jù)顯示正常。
(7)切換試驗。為了驗證A套控制器是否正常運行,驗證控制邏輯是否正常,先后在停機態(tài)和空載時進行了A/B機主備切換試驗、手自動切換試驗,試驗結(jié)果正常。
采取上述處理措施以后,機組調(diào)速器通信異常情況得以解決,調(diào)速器停機報警故障已消除,調(diào)速器A/B套控制器CPU運行正常,A套和B套控制器通信正常,數(shù)據(jù)顯示正常,A/B機切換正常,手自動切換正常。此后申請電網(wǎng)及時將機組恢復備用狀態(tài),大大降低了經(jīng)濟損失,保證了設(shè)備安全穩(wěn)定運行。
經(jīng)在線聯(lián)機,查看A套PLC故障日志,結(jié)合設(shè)備檢查以及事件記錄分析得出,A套CPU停止運行原因是由于PLC程序內(nèi)部檢測溢出,導致PLC硬件看門狗動作,從而使A套CPU故障停止運行,CPU模塊ERROR燈點亮,READY燈常亮,進而引起DM455模塊故障。由此可推斷出,機組水輪機調(diào)速系統(tǒng)控制器通信異常是由于A套控制器的CPU模塊停止運行導致的。
為了進一步驗證機組調(diào)速器A套通信異常故障處理時出現(xiàn)的各種異常情況,為今后處理異常情況做試驗數(shù)據(jù)準備,進行故障模擬和試驗驗證。試驗項目:①模擬DM455模塊故障;②模擬CPU模塊故障;③模擬AM374模塊故障;④CPU故障狀態(tài)下斷電重啟;⑤CPU故障狀態(tài)下程序冷啟;⑥CPU故障報警邏輯優(yōu)化。經(jīng)過多次試驗驗證后得出結(jié)果:
(1)當DM455模塊帶電拔插引起故障時,將會引起CPU模塊停止運行,使CPU模塊ERROR燈點亮,READY燈常亮,DM455模塊RUN燈一直處于閃爍狀態(tài)。
(2)當CPU模塊移除機架引起故障時,將會導致機架所有模塊RUN燈一直處于閃爍狀態(tài)。
(3)當AM374模塊帶電拔插引起故障時,將會導致CPU模塊停止運行,CPU模塊ERROR燈點亮,READY燈常亮,同時將引起DM455模塊故障,其RUN燈一直處于閃爍狀態(tài)。
(4)在CPU故障狀態(tài)下,若斷電重啟會使CPU數(shù)據(jù)清零,不刷新存儲卡數(shù)據(jù)。
(5)在CPU故障狀態(tài)下,若程序冷啟會使CPU保留原來數(shù)據(jù),不修改存儲卡數(shù)據(jù)。
(6)通過軟件配置可以實現(xiàn)PLC模塊硬件故障不會導致CPU停止運行。
目前調(diào)速器硬件配置采用冗余配置,當任意一塊PCC模塊出現(xiàn)硬件故障時,將會導致CPU報故障停止運行,調(diào)速器控制器根據(jù)預定的控制邏輯自動切至備用機運行,并報停機報警故障。當2套PCC控制器同時出現(xiàn)故障時,延時一定時間后將會觸發(fā)二類機械事故停機流程。在任意模塊出現(xiàn)故障時,通過在程序內(nèi)設(shè)計控制邏輯,可以實現(xiàn)CPU不停止運行。如果在調(diào)速器故障控制邏輯完善且機組安全穩(wěn)定運行要求高的情況下,為了避免控制器模塊硬件故障直接導致CPU停止運行,且保證可以實現(xiàn)切換A/B機功能,可以優(yōu)化程序,同時引用程序內(nèi)部定義的PLC模塊正常檢測點,對PLC模塊故障進行檢測判斷,并納入到調(diào)速器嚴重故障判據(jù),實現(xiàn)模塊故障切機并報警功能。
①加強分析和總結(jié)設(shè)備的運行規(guī)律,對長期處于運行狀態(tài)的設(shè)備以及運行超使用周期的設(shè)備對其狀態(tài)和故障率進行預評估,充分掌握其出現(xiàn)故障的概率,在設(shè)備損壞之前或出現(xiàn)損壞時能夠有效地控制事故擴大。②加強對重要部件的檢查和維護工作,定期對關(guān)鍵元器件進行修理和維護,尤其要重視對重要試驗項目和重要控制回路的檢修保養(yǎng)工作。③加大對升級產(chǎn)品性能和特性的掌握力度,對設(shè)備系統(tǒng)改造提出更加成熟的方案,保證設(shè)備系統(tǒng)升級后能夠穩(wěn)定運行。
自從設(shè)備投產(chǎn)以來,設(shè)備運行情況良好,尚未出現(xiàn)重大事故。但隨著機組運行年限的增加,設(shè)備管理工作需重視以下問題并加以處理:①電氣元器件老化問題。原有電氣元器件由于線路長期發(fā)熱、絕緣老化、金屬氧化等原因,造成電阻增大,接觸不良,運行不穩(wěn)定,隨時可能損壞或出現(xiàn)故障,存在較大安全隱患。②備品備件更新?lián)Q代和配件兼容性的問題。原配件已停止生產(chǎn),升級產(chǎn)品與原系統(tǒng)的硬件和軟件均需全部升級匹配。一旦設(shè)備出現(xiàn)故障時備品備件庫存數(shù)量不足,只能維修或請求外援,進口產(chǎn)品采購周期長、外方專家不能短期內(nèi)到達以提高技術(shù)支持,且技術(shù)服務(wù)成本高、協(xié)調(diào)難度大,備品備件管理和系統(tǒng)升級換代勢在必行。
調(diào)速系統(tǒng)作為發(fā)電機組運行的核心部分之一,與水電廠安全運行密切相關(guān)。調(diào)速器通信是調(diào)速器雙套控制器之間的可靠保障,是數(shù)據(jù)交換和監(jiān)視的渠道。而停機報警對于水輪機調(diào)速器來說相當重要,如果出現(xiàn)調(diào)速器通信異常將會丟失采集的數(shù)據(jù),必將對調(diào)速器控制造成影響,若雙套控制器停機報警故障時必將會導致事故停機。而調(diào)速器停機報警和通信異常時更加應(yīng)引起重視,及早查明原因,及時處理故障,保障設(shè)備的可靠運行。本文通過對水輪機調(diào)速系統(tǒng)控制器通信異常和停機報警信號的實例進行分析,詳細說明其查找故障的過程和分析方法,同時結(jié)合試驗室仿真模擬試驗為今后類似事件的處理提供經(jīng)驗支撐和參考。