杜小東
(作者單位:和田地區(qū)廣播電視臺)
標(biāo)清硬盤播出系統(tǒng)的維護及故障判斷處理
杜小東
(作者單位:和田地區(qū)廣播電視臺)
和田電視臺于2013年完成了新硬盤播出系統(tǒng)的改造任務(wù),新系統(tǒng)承擔(dān)6套標(biāo)清播出頻道的播出任務(wù)。由播出服務(wù)器系統(tǒng)、總控及播出切換系統(tǒng)、上載/控制系統(tǒng)、播出內(nèi)容管理系統(tǒng)、播出周邊系統(tǒng)等設(shè)備組成。主要硬件系統(tǒng)有:播出上載視頻服務(wù)器系統(tǒng)、相關(guān)播出控制的計算機系統(tǒng)、播出管理計算機系統(tǒng)、視音頻系統(tǒng)、播出切換系統(tǒng)及各類應(yīng)用服務(wù)器等。主要應(yīng)用軟件有:播控軟件、應(yīng)急上載軟件、技審平臺軟件、FTPServer軟件、系統(tǒng)監(jiān)控軟件、播出內(nèi)容管理軟件等。系統(tǒng)運行三年來,比較安全、平穩(wěn)。下面根據(jù)本臺硬盤播出系統(tǒng)的安全措施分析及維護實踐中遇到的故障處理進行淺析。
硬盤播出系統(tǒng);和田電視臺;故障判斷
確認(rèn)數(shù)據(jù)庫維護計劃是否執(zhí)行:主要是看備份文件是否定期備份和刪除。數(shù)據(jù)庫硬盤存儲空間:查看數(shù)據(jù)庫文件占用硬盤空間大小,一般80%為警戒線,超過80%就必須第一時間清理。如果發(fā)現(xiàn)數(shù)據(jù)文件過大(日志文件),就要做分離操作。掌握數(shù)據(jù)庫服務(wù)器運行時資源占用情況:主要查看CPU和內(nèi)存的使用情況,如果內(nèi)存占用率過高,可重啟服務(wù)器釋放內(nèi)存。各播出、上載、字幕及編單等工作站重啟:重新初始化播出工作站狀態(tài),消除系統(tǒng)隱患。刪除7天前的節(jié)目單list。刪除1個月前的系統(tǒng)log日志。各播出工作站保存本地配置:一旦網(wǎng)絡(luò)或數(shù)據(jù)庫出現(xiàn)故障,可以本地啟動工作站。檢查播控系統(tǒng)各種日志是否存入日志歸檔數(shù)據(jù)庫??偪鼐仃嚬芾頇C:由于是Windows系統(tǒng),要定期對其運行狀態(tài)進行檢查,重啟系統(tǒng)。
每6個月全系統(tǒng)重啟或重啟核心應(yīng)用服務(wù)器,使Windows操作系統(tǒng)釋放內(nèi)存和重新初始化系統(tǒng)狀態(tài),消除系統(tǒng)長期運行產(chǎn)生的冗余,避免這些產(chǎn)生死機或運行變慢。每次維護須做維護日期標(biāo)志懸掛在指定位置。
故障處理原則:當(dāng)出現(xiàn)故障時,必須以最短的時間將信號切換到備播系統(tǒng)或者應(yīng)急播出系統(tǒng),之后進行故障的排查、處理、匯報。判斷方法:利用各監(jiān)視器和監(jiān)聽系統(tǒng),迅速判斷出故障的大致部位,并采取有效地應(yīng)急措施,以最快的速度查找出問題所在點,立即處理,盡快恢復(fù)播出。報告原則:出現(xiàn)播出故障無論是節(jié)目還是技術(shù)故障均應(yīng)急播出、迅速判斷、排查處理后及時報告科、部領(lǐng)導(dǎo);如果一時無法解決播出故障,在應(yīng)急播出后及時電話報告科、部領(lǐng)導(dǎo),以求技術(shù)支持。
2.1 系統(tǒng)通道故障的應(yīng)急處理
故障現(xiàn)象1:當(dāng)主輸出監(jiān)視器畫面的主信號均出現(xiàn)異常,且PST、PGM異常,但是備播線路正常,且備路PST和PGM都正常。措施:立即將該頻道控制臺上的應(yīng)急開關(guān)解除鎖定,切換到備路鍵(主切換器PGM切換為EXT),使用備路應(yīng)急播出。原因:切換臺故障。
故障現(xiàn)象2:主輸出監(jiān)視器的畫面異常,而備輸出監(jiān)視器畫面正常。措施:立即使用切換器切換備路信號,或用跳線將信號跳過主視頻分配器輸出。原因:主輸出視頻分配器故障。
故障現(xiàn)象3:主硬盤輸出監(jiān)視異常(主、備監(jiān)視器,主備視分監(jiān)視器,PST、PGM以及應(yīng)急監(jiān)視器均出現(xiàn)異常)而備硬盤輸出監(jiān)視正常。措施:在切換臺切備硬盤播出。原因:主硬盤故障,或其輸出視頻分配器故障。
故障現(xiàn)象4:臺標(biāo)時鐘發(fā)生器發(fā)生異常。措施:使用切換臺內(nèi)鍵上臺標(biāo),啟用字幕機作臺標(biāo)播出。原因:臺標(biāo)機故障或其輸出兩個視頻分配器故障。
故障現(xiàn)象5:轉(zhuǎn)播總控外來信號,出現(xiàn)信號不正常時或出現(xiàn)非法內(nèi)容。措施:切換其他正常的總控外來信號播出并及時向領(lǐng)導(dǎo)匯報。原因:信號源問題或分配器問題或信號源遭受非法攻擊。
故障現(xiàn)象6:各總控外來信號均不正?;虺霈F(xiàn)非法內(nèi)容。措施:切墊片,并與導(dǎo)播、總控、總值班聯(lián)系,酌情處理。原因:信號源問題或總控問題。
故障現(xiàn)象7:轉(zhuǎn)播開始時或播出中,主、備硬盤輸出信號突然同時靜幀或黑場。措施:切矩陣播出。原因:該頻道上載終端或播控軟件問題。
故障現(xiàn)象8:硬盤播出廣告或素材組過程中切換下一節(jié)目時主、備硬盤突然出現(xiàn)靜幀。措施:在播控終端的工具欄操作按鈕下拉菜單中點擊“播放”一般能解決問題(注:如此時用“TAKE”功能鍵時會跳過下一條素材造成漏播)。原因:多半是因為前一條素材長度太短(如小于6秒)造成服務(wù)器沒有準(zhǔn)備好下一節(jié)目引起。
故障現(xiàn)象9:播出中字幕機死機或者切換臺上對應(yīng)的鍵源按鍵變紅。措施:重啟字幕機。原因:字幕機故障。
故障現(xiàn)象10:播出中發(fā)現(xiàn)切換臺所有按鍵失效。措施:立即將該頻道控制臺上的應(yīng)急開關(guān)面板解除鎖定,按下備路鍵(主切換器上的PGM切到EXT),使用備路播出,或使用機房的切換器進行切換;按一下切換面板內(nèi)的復(fù)位開關(guān),若仍不能解決則將該切換臺主機內(nèi)的復(fù)位開關(guān)復(fù)位一下,或重新導(dǎo)入配置,待切換臺恢復(fù)正常后,切回主路播出。原因:該切換臺故障。
故障現(xiàn)象11:主視頻服務(wù)器工作不正常。措施:切備視頻服務(wù)器進行播出。原因:視頻服務(wù)器故障或素材問題導(dǎo)致視頻服務(wù)器故障。
故障現(xiàn)象12:素材在制定時間內(nèi)沒有傳輸?shù)讲コ?。措施:檢查策略服務(wù)和同步軟件是否正常,如果緊急,則手動發(fā)起傳輸。原因:策略服務(wù)或同步軟件問題。
故障現(xiàn)象13:OMNEON視頻服務(wù)器或OMNEON存儲硬盤亮紅燈。措施:撥打廠商400電話或聯(lián)系廠商工程師。原因:硬盤故障。
故障現(xiàn)象14:所有工作站無法訪問數(shù)據(jù)庫。措施:手動切備數(shù)據(jù)庫并重啟主數(shù)據(jù)庫。原因:數(shù)據(jù)庫故障。
2.2 同步系統(tǒng)故障
故障現(xiàn)象1:播出中出現(xiàn)時鐘、臺標(biāo)、字幕漂移或無法上鍵。措施:查詢同步系統(tǒng)圖,分析出同步信號的來源,并對上一級同步卡進行更換原因:上一級同步卡故障,或同步線問題。
故障現(xiàn)象2:切換某一信號源時臺標(biāo)或字幕無法正常加上。措施:立即下鍵并檢查該路信號源的同步信號連線情況,是外來信號的與總控聯(lián)系,檢查幀同步機是否已開。原因:信號未同步,或總控的幀同步機沒開。
故障現(xiàn)象3:切換某一信號源時臺標(biāo)或字幕顏色不正常,但位置穩(wěn)定。措施:調(diào)整該路信號源的副載波相位和行相位。原因:該信號源副載波相位和行相位不準(zhǔn)。
2.3 控制系統(tǒng)故障
故障現(xiàn)象1:主控制機死機或無法控制播出。措施:立即使用備控制機接管播出。原因:主控制機問題或主控軟件問題或者是該機的供電問題。
故障現(xiàn)象2:視頻服務(wù)器無法控制。措施:重置此視頻服務(wù)器,如果問題依舊則嘗試備機接管。原因:控制接口或軟件或視頻服務(wù)器出現(xiàn)故障。
故障現(xiàn)象3:主控電腦中,“切換臺故障”紅色告警。措施:立即把主切換臺的PGM檔切換到EXT檔,使用備切換器。原因:切換臺不受控,控制故障。
故障現(xiàn)象4:某一設(shè)備或幾個設(shè)備同時不受控時(播控終端出紅色告警)。措施:先倒換到備播控終端試試,不行再切出能控制的墊片播出(錄像機可手動啟動),如主切換臺不受控則使用“2 選1”應(yīng)急開關(guān)倒換到備路播出,手動控制播出,更換控制線或倒換器。原因:控制線或倒換器沒有同步工作。
故障現(xiàn)象5:播控軟件中主硬盤或備硬盤狀態(tài)錯誤。措施:在播出程序的設(shè)備運行狀態(tài)窗口選擇硬盤圖標(biāo),點擊“R”進行“重置服務(wù)器”。原因:視頻服務(wù)器狀態(tài)檢測故障。
2.4 播控工作站故障
故障現(xiàn)象1:主播控工作站對其下游設(shè)備,包括視頻服務(wù)器、VTR、切換臺及切換器等其中的某些或全部的控制失效;或者主播控工作站死機。措施:如果備播控工作站沒有進行對播出任務(wù)的自動接管,必須采用手動控制的方式在備播控工作站執(zhí)行接管操作,保證播出正常進行;然后,排查主播控工作站的具體故障原因,包括422倒換器的工作狀態(tài)、主播控工作站Moxa卡的工作狀態(tài)、主播控工作站控制軟件的工作狀態(tài)以及主播控工作站的供電問題等;待設(shè)備恢復(fù)正常后,再次改由主播控工作站接管。
故障現(xiàn)象2:主、備播控工作站對視頻服務(wù)器HDD、VTR、切換臺及切換器等設(shè)備的控制同時失效;或者出現(xiàn)主、備播控工作站死機。措施:采用手動操作,控制切換臺、VTR和墊片信號進行應(yīng)急播出,并按照下面的順序進行故障排查,一是檢查4倒換器是否出現(xiàn)正常,檢查電源是否松動、倒換卡是否損壞、控制線連接是否斷開;二是檢查主、備播控工作站Moxa卡的狀態(tài)是否異常。
2.5 數(shù)據(jù)庫服務(wù)器故障
故障現(xiàn)象1:播出主數(shù)據(jù)庫服務(wù)器癱瘓。措施:通過Autostart將數(shù)據(jù)庫切換至備數(shù)據(jù)庫服務(wù)器,并對各個工作站進行重連數(shù)據(jù)庫操作,以保證正常播出;同時重啟所有軟件,然后恢復(fù)癱瘓的數(shù)據(jù)庫服務(wù)器。
故障現(xiàn)象2:播出主備數(shù)據(jù)庫服務(wù)器同時癱瘓。措施:此時,播控軟件自動從保存在本地的配置文件讀取設(shè)備控制信息,可以利用LINE和墊片信號進行應(yīng)急播出;然后恢復(fù)癱瘓的數(shù)據(jù)庫,并將各工作站重新指向恢復(fù)的數(shù)據(jù)庫。
故障現(xiàn)象3:主數(shù)據(jù)庫服務(wù)器無法啟動;或者操作系統(tǒng)報錯,如磁盤空間已滿、內(nèi)存不足等。措施:此時備數(shù)據(jù)庫服務(wù)器應(yīng)該已經(jīng)自動接管了數(shù)據(jù)服務(wù)業(yè)務(wù);在播控工作站上執(zhí)行“重連數(shù)據(jù)庫”操作,恢復(fù)正常播出;對于其他受影響的工作站可重啟軟件并重連數(shù)據(jù)庫;恢復(fù)主數(shù)據(jù)庫服務(wù)器;最后,手動控制主數(shù)據(jù)庫服務(wù)器上線和備數(shù)據(jù)庫服務(wù)器下線,使數(shù)據(jù)庫備份機制恢復(fù)正常。
2.6 以太網(wǎng)絡(luò)故障
故障現(xiàn)象1:播控系統(tǒng)中所有工作站、視頻服務(wù)器和數(shù)據(jù)庫服務(wù)器的網(wǎng)絡(luò)連接同時出現(xiàn)異常。無法進行素材同步、遷移和回遷等操作。措施:此時播控軟件可以從保存在本地的配置文件讀取設(shè)備控制信息,可以利用LINE和墊片信號進行應(yīng)急播出;然后,檢查以太網(wǎng)交換機,如果交換機出現(xiàn)故障,必須立即維修或更換。待交換機故障排除后,恢復(fù)正常播出。
故障現(xiàn)象2:播控系統(tǒng)中的個別工作站無法連接數(shù)據(jù)庫服務(wù)器,無法從播出數(shù)據(jù)庫讀取素材信息和控制信息。措施:檢查該工作站任務(wù)欄中網(wǎng)絡(luò)圖標(biāo)、網(wǎng)線連接和網(wǎng)卡狀態(tài)是否正常,如果主播控工作站無法連接播出數(shù)據(jù)庫,采用手動方式由備播控工作站進行接管,保證正常播出。
故障現(xiàn)象3:以太網(wǎng)交換機端口故障,當(dāng)鏈接設(shè)備的以太交換機端口發(fā)生故障時,該故障端口鏈接的工作站將表現(xiàn)為網(wǎng)絡(luò)連接斷開,不能正常登錄域,無法使用。措施:應(yīng)關(guān)閉故障端口鏈接的工作站,將該工作站鏈接到以太交換機的正常端口,重新啟動該工作站投入正常使用即可。
故障現(xiàn)象4:當(dāng)鏈接設(shè)備的以太交換機發(fā)生故障時,該故障設(shè)備鏈接的工作站將表現(xiàn)為網(wǎng)絡(luò)連接斷開,不能正常登錄域,無法使用。措施:交換機為3臺H3C交換機,使用堆疊結(jié)構(gòu)。任意一臺出現(xiàn)故障,全網(wǎng)均可能出現(xiàn)故障。此時請聯(lián)系公司售后部門,進一步解決問題。
故障現(xiàn)象5:當(dāng)多臺或所有交換機發(fā)生故障時,以及無法給交換機供電時,則為整個網(wǎng)絡(luò)發(fā)生故障,網(wǎng)絡(luò)中的大部分設(shè)備無法相互通信。
措施:1)請不要關(guān)閉播控工作站上的播控軟件,播控軟件按節(jié)目單正常播出;2)修改節(jié)目單時,只能添加線路類型信號節(jié)目;3)使用矩陣控制工作站中的矩陣控制軟件修改矩陣路由;4)字幕機請使用本地方式進行字幕的制作和播出;5)系統(tǒng)業(yè)務(wù)穩(wěn)定后,之后請聯(lián)系售后部門,進一步解決問題。
2.7 字幕機工作站故障
故障現(xiàn)象1:正常開啟的字幕機無法接收到播出節(jié)目單。措施:檢查字幕機數(shù)據(jù)庫的消息服務(wù)是否開啟
情況1:播出過程中出現(xiàn)主、備硬盤信號同時靜幀。措施:在播控終端處點開“操作”菜單,按“HDD1同步播放”“HDD2同步播放”,如無效則切墊片。原因:素材在上載時出了問題。
情況2:硬盤播出過程中發(fā)現(xiàn)主備硬盤的畫面或伴音均不正常。措施:切墊片或用信號線路播出。原因:該素材在上載過程中出了問題。
情況3:播出過程中發(fā)現(xiàn)素材內(nèi)容與要求不符。措施:切墊片或使用外來信號播出。原因:節(jié)目上載錯誤。
視頻服務(wù)器的故障有硬盤故障、網(wǎng)絡(luò)故障、I/O模塊故障、文件系統(tǒng)故障及電源故障。若服務(wù)器前面板狀態(tài)指示燈都正常,則表明服務(wù)器工作正常,此時不需特殊操作。若發(fā)現(xiàn)服務(wù)器工作不正常時,可結(jié)合狀態(tài)指示燈及系統(tǒng)管理軟件來判斷具體故障原因,并針對不同故障執(zhí)行不同的處理方法。
4.1 硬盤故障
硬盤故障是服務(wù)器存在的主要故障,查看RAID狀態(tài)指示燈,呈淺藍(lán)常亮的話,RAID正常。若狀態(tài)指示燈呈黃色閃爍,則說明系統(tǒng)內(nèi)有故障硬盤。登錄SystemManager軟件,進入DiskUtilities頁面,查看物理硬盤及RaidSet的狀態(tài),故障硬盤的狀態(tài)應(yīng)該是Dead或者Failed,進入故障硬盤屬性頁面,查看硬盤所在位置,點擊RemoveDrives按鈕,等待30秒后,將故障硬盤取出,插入一塊新的硬盤,系統(tǒng)將自動進行RAID重建。要注意收集故障硬盤的信息,如故障時間、故障描述、硬盤序列號、硬盤唯一標(biāo)識及故障時段的系統(tǒng)日志等。
4.2 處理器模塊故障
處理器模塊是服務(wù)器核心模塊,而且沒有熱備份。處理器模塊的工作異常,就意味著整臺服務(wù)器的工作狀態(tài)會出錯。處理器模塊上有兩個網(wǎng)絡(luò)端口,一個負(fù)責(zé)文件傳輸,一個負(fù)責(zé)編、解碼的控制;有兩個同步信號端口,為服務(wù)器內(nèi)部編、解碼提供同步信號。而處理器模塊的故障一般包含以下幾個方面。
4.2.1 網(wǎng)絡(luò)故障
網(wǎng)絡(luò)故障的判斷過程中,若以太網(wǎng)狀態(tài)指示燈呈藍(lán)色閃爍則表示網(wǎng)絡(luò)存在故障問題,這時外部設(shè)備不能正常訪問服務(wù)器。網(wǎng)絡(luò)故障的原因可能是系統(tǒng)內(nèi)交換機和連接的線纜故障造成的,這時更換網(wǎng)線及交換機端口即可解決。
4.2.2 同步信號故障
對同步信號故障,其狀態(tài)指示燈呈深藍(lán)色,則表示沒有同步信號接入。此時可認(rèn)為是同步信號故障。同步信號丟失會導(dǎo)致服務(wù)器編、解碼信號間斷性閃黑。這時更換同步信號源,若問題得以解決,那么說明是外部同步信號源的問題。若是處理器模塊內(nèi)部發(fā)生故障,那么只能返廠維修。
4.3 I/O模塊故障
查看I/O模塊狀態(tài)指示燈,若是關(guān)閉狀態(tài),則表示模塊故障。這時登錄SystemManager軟件,進入模塊屬性頁,點擊“Winkon”按鈕打開模塊狀態(tài)燈,找到具體模塊,停止模塊上所有播放通道的工作,點擊Reboot重啟。若故障還不能得到解決,那么返廠維修。
4.4 電源故障
結(jié)合服務(wù)器背板各個電源模塊的指示燈判斷電源模塊是否故障,發(fā)現(xiàn)電源模塊故障時,拔除電源線后,直接更換電源模塊即可。
硬盤播出系統(tǒng)的維護和應(yīng)急處理,是一個較為系統(tǒng)的工程,涉及到整個系統(tǒng)的方方面面,一旦某個環(huán)節(jié)出現(xiàn)問題,就可能導(dǎo)致播出事故甚至是停播,這在電視臺的安全播出中是絕對不允許的。所以我們一定要高度重視硬盤播出系統(tǒng)的日常維護,要熟悉整個系統(tǒng)的設(shè)計布局,一旦出現(xiàn)問題要及時找出問題的節(jié)點,在保證安全播出的情況下,盡快解決問題。此外,要有完善的應(yīng)急預(yù)案,通過日常維修,把可能會出現(xiàn)問題的環(huán)節(jié)提前處理,使安全播出的風(fēng)險降到最低。