王詩凱,何 佳,姚佳維
(上海工具廠有限公司,上海 200093)
西門子840D 系列數(shù)控系統(tǒng)其HMI 人機(jī)對(duì)話界面主要通過后臺(tái)NCU 和PCU 兩個(gè)系統(tǒng)控制。其中NCU 以Linux 系統(tǒng)為基礎(chǔ),PCU 則以Windows 系統(tǒng)為基礎(chǔ),考慮其維護(hù)和OEM 二次開發(fā)的兼容性及兩大操作系統(tǒng)在民用、商用、工業(yè)等領(lǐng)域的占比。目前就工廠所引進(jìn)的各類數(shù)控機(jī)床及外廠服務(wù)中所見,基本以搭載PCU 為主。
西門子840D 系列數(shù)控系統(tǒng)中搭載的PCU,即PC 單元,可以理解為一臺(tái)功能強(qiáng)大的工業(yè)計(jì)算機(jī)。它有自己獨(dú)立的CPU、內(nèi)存、電源,可以搭載硬盤,包含USB、RJ45 標(biāo)準(zhǔn)網(wǎng)絡(luò)、串口、DVI視頻等接口。OP 單元是這臺(tái)計(jì)算機(jī)的顯示器。PCU 主要用于人機(jī)可視化交互,如操作、程序編輯、診斷等前臺(tái)程序的運(yùn)行,近幾年P(guān)CU 更新較快,依賴其運(yùn)行的Windows 系統(tǒng)也已從早期的Windows NT 發(fā)展到Windows XP 及當(dāng)今的Windows 7,最新的型號(hào)是PCU 50.5 是基于Windows 7 系統(tǒng)開發(fā)及運(yùn)行的。
工廠中一臺(tái)新引進(jìn)搭載840D 數(shù)控系統(tǒng)的中高端進(jìn)口專用機(jī)床,在經(jīng)過外方和內(nèi)部調(diào)試驗(yàn)收后開始正常使用約半年后,從偶爾發(fā)生系統(tǒng)啟動(dòng)緩慢,逐漸發(fā)展到在其HMI 面板中操作各類控制指令會(huì)出現(xiàn)屏幕卡滯和機(jī)床實(shí)際運(yùn)行與其不同步現(xiàn)象,對(duì)機(jī)床的正常運(yùn)行和人員對(duì)產(chǎn)品的正常校車安全性產(chǎn)生極大的隱患。對(duì)可能的故障進(jìn)行排查并分析。
(1)機(jī)床定置位于工廠內(nèi)較為開闊的區(qū)域,沒有具備獨(dú)立的空調(diào)制冷或除濕機(jī)除濕,恰巧初次發(fā)生故障節(jié)點(diǎn)為6 月中旬,天氣潮濕悶熱。考慮其運(yùn)行環(huán)境后,先對(duì)電氣柜內(nèi)自帶空調(diào)進(jìn)行制冷檢測(cè),通過溫度計(jì)及濾網(wǎng)檢測(cè)發(fā)現(xiàn)制冷情況良好,排除過熱因素。其次,早晚首次開機(jī)前人工觀察各電氣接口處是否存在水汽及接口氧化情況,結(jié)果均正常,排除水汽致使接口氧化引起接觸不良,影響PCU 系統(tǒng)控制端問題。
(2)電壓波動(dòng)的可能性,通過一周內(nèi)連續(xù)多次使用多用表對(duì)機(jī)床380 V 電源及電氣柜內(nèi)部用于供給PLC 的24 V 開關(guān)電源進(jìn)行測(cè)壓,結(jié)果也均在范圍內(nèi),排除電壓波動(dòng)引起PLC 控制異常反應(yīng)到PCU 系統(tǒng)控制端問題。
(3)通過巡查發(fā)現(xiàn)該機(jī)床操作員會(huì)使用機(jī)床HMI 面板中所帶USB 接口連接手機(jī),經(jīng)詢問僅利用其接口充電(后期對(duì)操作員警告并通知所在工段長,數(shù)控設(shè)備USB 接口不得隨意使用),排除PCU 系統(tǒng)病毒感染的風(fēng)險(xiǎn)。
(4)由于故障現(xiàn)象主要為系統(tǒng)運(yùn)行卡滯和緩慢,從PCU 系統(tǒng)的硬件上考慮,其系統(tǒng)均安裝在硬盤中而不是CF 卡中,懷疑硬盤可能存在壞道或數(shù)據(jù)線接線不良引起。拆開HMI 后面板露出PCU 系統(tǒng)設(shè)備,再經(jīng)過拆解后發(fā)現(xiàn)其搭載為Intel SSD 固態(tài)硬盤而非傳統(tǒng)的機(jī)械硬盤,磁盤壞道的可能性幾乎為零。對(duì)SATA 數(shù)據(jù)接口檢測(cè),接口緊實(shí)正常無氧化,數(shù)據(jù)線無明顯外傷和形變(圖1)。
圖1 PCU 模塊與硬盤
(5)在確認(rèn)正常使用設(shè)備及設(shè)備運(yùn)行環(huán)境能滿足其基本需求的情況下,只能聯(lián)系外方技術(shù)員通過PCU 系統(tǒng)中TeamViewer 遠(yuǎn)程監(jiān)控840D 系統(tǒng)及OEM 軟件的運(yùn)行參數(shù),在監(jiān)控過程中由于只對(duì)840D 系統(tǒng)及OEM 軟件的運(yùn)行參數(shù)監(jiān)控而忽視了其都運(yùn)行在Windows 7 系統(tǒng)上,所以在多次連線監(jiān)控過程中都未發(fā)現(xiàn)異樣。由于需要為TeamViewer 遠(yuǎn)程軟件聯(lián)網(wǎng)配置IP 地址,故從外方獲取高級(jí)管員賬戶和密碼,以便登入PCU 中Windows 7 系統(tǒng),為后續(xù)發(fā)現(xiàn)問題提供了線索(圖2)。
圖2 使用高級(jí)管員賬戶和密碼登入Windows 7 系統(tǒng)
使用高級(jí)管員賬戶和密碼即可登入PCU 中Windows 7 系統(tǒng)。在為TeamViewer 遠(yuǎn)程監(jiān)控配置聯(lián)網(wǎng)IP 過程中偶然看到C盤分區(qū)僅為20 GB,且?guī)缀跻淹耆加?,只余約600 MB 左右可用空間。根據(jù)多年的日常維修經(jīng)驗(yàn),基本斷定C 盤分區(qū)可用空間不足,是造成系統(tǒng)卡滯運(yùn)行緩慢但不藍(lán)屏或跳黑的原因。
在發(fā)現(xiàn)故障點(diǎn)后,針對(duì)C 盤分區(qū)空間不足問題,可采用兩套方案:①軟方案:利用系統(tǒng)自帶工具進(jìn)行磁盤清理釋放空間,并檢查系統(tǒng)還原功能是否開啟及KB2555428 補(bǔ)丁是否安裝。該補(bǔ)丁用于解決Windows 7 和Windows 7 SP1 中存在的一個(gè)啟動(dòng)緩慢的問題。微軟證實(shí),如果用戶在計(jì)算機(jī)中創(chuàng)建了太多的系統(tǒng)還原點(diǎn),在啟動(dòng)系統(tǒng)時(shí)速度會(huì)非常慢。每個(gè)還原點(diǎn)都會(huì)創(chuàng)建一個(gè)Windows 快照,而Volsnap.sys 在系統(tǒng)啟動(dòng)進(jìn)程中必須要進(jìn)行驗(yàn)證。當(dāng)創(chuàng)建了太多的還原點(diǎn),ReadyBoot 功能的引導(dǎo)就可能會(huì)超過512 KB 的限制,從而導(dǎo)致啟動(dòng)I/O 操作無法預(yù)緩存,因此啟動(dòng)過程就會(huì)非常慢;②硬方案:利用系統(tǒng)自帶工具或第三方軟件進(jìn)行系統(tǒng)備份及調(diào)整分區(qū)大小,從根本上解決C 盤可用空間不足的窘境。
由于Windows 7 系統(tǒng)一般安裝后只占用磁盤空間6~8 GB,外加840D 數(shù)控系統(tǒng)和廠商OEM 軟件,理論上估計(jì)總占用空間應(yīng)該不會(huì)超過15 GB。通過Windows 系統(tǒng)自帶磁盤管理工具,對(duì)C 盤中的臨時(shí)文件、緩存、垃圾文件和早期的還原點(diǎn)清理后釋放出約3 GB 的空間。在檢查系統(tǒng)歷史更新中發(fā)現(xiàn)KB2555428 補(bǔ)丁并未更新,考慮其是作為840D 數(shù)控系統(tǒng)運(yùn)作平臺(tái)的專用PC,且系統(tǒng)為英文版,擔(dān)心隨意更新會(huì)對(duì)840D 數(shù)控系統(tǒng)和廠商OEM 軟件運(yùn)作有影響。故放棄手動(dòng)安裝更新補(bǔ)丁,改為關(guān)閉系統(tǒng)還原保護(hù),禁止其繼續(xù)創(chuàng)建還原點(diǎn)文件。經(jīng)過現(xiàn)場測(cè)試,整個(gè)PCU 系統(tǒng)運(yùn)作順暢很多,但在經(jīng)過1 個(gè)多月的運(yùn)行后又發(fā)生原始故障現(xiàn)象。再次登錄Windows 7 系統(tǒng)后查看發(fā)現(xiàn)C 盤可用空間又被占滿,但這次通過磁盤清理后只釋放出1 GB 左右空間,無故占用磁盤空間問題不在Windows 7 系統(tǒng)本身,可能是840D數(shù)控系統(tǒng)或廠家OEM 軟件,只能嘗試采取硬方案。
4.2.1 方案的實(shí)施原因
采取硬方案直接通過調(diào)整分區(qū)容量的方式,擴(kuò)大C 盤分區(qū)容量。軟方案已經(jīng)證明了擴(kuò)大C 盤可用空間對(duì)PCU 系統(tǒng)運(yùn)行順暢是有效的,其次之前外方技術(shù)員已對(duì)840D 數(shù)控系統(tǒng)和OEM軟件的運(yùn)行進(jìn)行過多次監(jiān)控,并未發(fā)現(xiàn)異常。所以再次聯(lián)系外方技術(shù)員告知目前情況的同時(shí),由于其再次監(jiān)控排查及更新OEM 軟件等還需時(shí)間,不如擴(kuò)大C 盤分區(qū)容量直接有效。
4.2.2 方案的實(shí)施步驟及細(xì)節(jié)
在確定擴(kuò)大C 盤分區(qū)容量后,優(yōu)先考慮西門子Service Center 功能對(duì)全盤進(jìn)行備份,而后采用Windows 7 系統(tǒng)自帶磁盤管理工具可對(duì)分區(qū)大小進(jìn)行調(diào)整,但考慮其為英文界面且初次使用,不如中文版操作直觀,且D 盤分區(qū)還保存部分OEM 軟件數(shù)據(jù),故把握性不大,放棄該方法。
最后決定使用較為常用方法:①將HMI 背板拆開;②取下SSD 固態(tài)硬盤(圖1);③連接USB 轉(zhuǎn)SATA 數(shù)據(jù)線和外置電源模塊(圖3);④與電腦連接,識(shí)別為USB 硬盤模式;⑤在該電腦上安裝GHOST 軟件;⑥使用GHOST 對(duì)SSD 固態(tài)硬盤全分區(qū)備份;⑦使用GHOST 對(duì)全分區(qū)進(jìn)行鏡像還原并同步調(diào)整分區(qū)大?。虎鄶嚯姴鹁€裝回SSD 固態(tài)硬盤;⑨開機(jī)檢驗(yàn)。
圖3 USB 轉(zhuǎn)SATA 數(shù)據(jù)線和外置電源模塊
4.2.3 利用GHOST 全分區(qū)備份還原及調(diào)整分區(qū)大小
Ghost 主畫面操作分為復(fù)制、備份可分為硬盤(Disk)和磁盤分區(qū)(Partition)兩種。其中:Disk——表示硬盤功能選項(xiàng)、Partition——表示磁盤分 區(qū) 功 能 選 項(xiàng)、Check——表示檢查功能選項(xiàng)。本次采用硬盤全分區(qū)備份功能故選用Disk鍵后展開:To Disk(硬盤復(fù)制)、To Image(硬盤備份)、From Image(備份還原)(圖4)。
圖4 Ghost 主畫面
(1)全分區(qū)備份:選擇To Image(硬盤備份)鍵→選擇來源硬盤Source drive 的位置→選擇備份檔案儲(chǔ)存的位置→按“OK”后,出現(xiàn)確認(rèn)選擇“YES”即開使執(zhí)行備份。備份完成后會(huì)在所保存目錄形成以一個(gè)gho 為首多個(gè)連續(xù)ghs 后綴名的鏡像文件(圖5),并可通過GhostExp(gho、ghs 文件查看器)軟件查看備份內(nèi)容是否正確(圖6)??梢娫撚脖P存在3 個(gè)分區(qū),SystemRese 為引導(dǎo)分區(qū)(Windows 7 特有)、System 為系統(tǒng)分區(qū)(C 盤)、Data 為數(shù)據(jù)分區(qū)(D 盤),可展開查看內(nèi)部具體文件。
圖5 備份后形成的鏡像文件
圖6 通過GhostExp 軟件查看備份內(nèi)容
(2)全分區(qū)還原及同步調(diào)整分區(qū)大?。哼x擇From Image(備份還原)鍵→選擇要還原的硬盤Destination drive→在硬盤還原(復(fù)制)窗口,可依據(jù)使用要求設(shè)定分區(qū)大?。ㄒ妶D7)→按“OK”后,出現(xiàn)確認(rèn)選擇“YES”即開使執(zhí)行還原。圖7 中已將C 盤從原始(OldSize)20 GB 重新調(diào)整(NewSize)為60 GB,從DateSize(磁盤數(shù)據(jù))選項(xiàng)卡中可以看到C 盤已存儲(chǔ)數(shù)據(jù)容量約18 GB,D 盤為220 MB 故調(diào)整對(duì)D 盤無影響。由于GHOST 自帶分區(qū)功能,故可以不用第三方軟件進(jìn)行提前分區(qū)調(diào)整。
圖7 硬盤還原(復(fù)制)窗口
4.2.4 方案的實(shí)施效果及后期跟蹤情況
通過DiskGenius 進(jìn)行重新分區(qū)后再用GHOST 對(duì)各分區(qū)鏡像還原,相當(dāng)于系統(tǒng)和各軟件無損重裝,完整保留了全部數(shù)據(jù)。機(jī)床通電,PCU 系統(tǒng)運(yùn)行正常,在將C 盤分區(qū)從原20 GB 擴(kuò)展到60 GB 后,運(yùn)行速度也回到了新機(jī)時(shí)的順暢。同時(shí)也將此情況通知外方技術(shù)員,并把備份的鏡像文件發(fā)送給對(duì)方,讓其能更直接的查詢?cè)颉?/p>
后期在經(jīng)過1 年多的運(yùn)行和巡查中,發(fā)現(xiàn)C 盤分區(qū)可用容量的確在不斷縮小,不過可用容量縮小到27.4 GB 時(shí)就不再縮小,系統(tǒng)運(yùn)行也無任何變化。在詢問外方技術(shù)員的過程中,也沒有得到明確的答復(fù)和更新包。只能通過實(shí)踐判斷,可能是廠方OEM 軟件在運(yùn)行中的確需要產(chǎn)生大量的緩存或臨時(shí)文件。
不過最終通過利用GHOST 鏡像備份還原的方式,解決了由于C 盤分區(qū)可用空間不足而引起PCU 系統(tǒng)卡滯緩慢的特定故障。該設(shè)備已順暢運(yùn)行2 年時(shí)間,基本判定該方案實(shí)施成功。
在此次故障解決過程中,前期的機(jī)電和PLC 檢查均由工廠保養(yǎng)組完成,包括840D 系統(tǒng)和OEM 軟件也由外方技術(shù)員檢查。維修人員只在配置網(wǎng)絡(luò)IP 地址幫助其全程診斷時(shí)偶然發(fā)現(xiàn)異常,結(jié)合自身日常工作中的經(jīng)驗(yàn),并大膽進(jìn)行故障診斷與維修。隨著技術(shù)的發(fā)展,數(shù)控系統(tǒng)的軟硬件配置也越發(fā)先進(jìn),但數(shù)控系統(tǒng)維修不僅要從機(jī)電PLC 等傳統(tǒng)專業(yè)手段上入手診斷,也要大膽運(yùn)用日常工作中積累的知識(shí)經(jīng)驗(yàn),觸類旁通的發(fā)現(xiàn)問題、排除故障。