胡啟明
當程控交換機正常開通使用后,處于維護運行階段時,經常因程序運行錯誤而發生故障,這就需要維護人員及時處理這類故障,確保通信暢通。所謂處理故障,也可以理解為將軟件控制程序置于正常工作狀態的過程。當程控交換機軟件程序出現錯誤或混亂時,作為維護人員沒有時間也沒有必要去研究其軟件程序本身的工作原理,只要盡快進行故障排除并及時搶通電話即可。而使用重新啟動的方法快速排除程序故障已經成為維護人員的一種“靈丹妙藥”。這有點類似于我們在操作電腦時,當由于電腦程序錯誤而出現“死”機現象時,無論在鍵盤鍵入什么指令電腦都無反映,此時,最快的恢復方法莫過于對電腦進行“熱”啟動或“冷”啟動。同樣,程控交換機由于處理其程序故障的需要,也可以使用重新啟動的方法。
對于不同制式不同型號的程控交換機來說,其程序重新啟動的操作方式與命令參數可能有所不同,但重新啟動的功能與種類大致相同,無非是利用命令重新啟動軟件程序或者是操作硬件紐重新啟動。下面以MD110程控交換機為例,說明如何進行程控交換機的重新啟動方法。
1 利用命令操作RF系列命令組的方法重新啟動交換機
在MD110程控交換機系統產生軟件故障時,如應用軟件程序進行不下去(主要表現為電話打不出去或打不進來)或進入循環狀態后,我們可以使用RF系列重新啟動命令,進行軟件程序故障處理。這樣,不論原來的應用程序走到什么地方,也不管這時的程序是由中央軟件控制還是由區域軟件控制,只要使用了RF系列重新啟動命令組,則控制程控交換機工作的軟件程序一律要轉到開始位置并從頭開始運行。如果該軟件故障是由于某些臨時性的因素(例如一個短暫的干擾脈沖或某些短暫性的奇偶校驗碼等等)造成的,那么當程序重新運行到原來的故障點時,由于此時引起原故障的因素已不復存在,軟件程序便能正常進行下去,系統便又恢復正常。當然,在實際工作中,軟件程序運行故障的原因是多種多樣的,其故障過程的產生和故障現象也是很復雜的,但使用RF系列命令組快速排除故障已經成為維護人員的一種非常有效實用的方法。
RF系列重新啟動命令組在交換機的維護工作中經常用到,下面談談它的分類與使用。
(1) RF系列命令組的分類
MD110型程控電話交換機系統中的RF系列命令組主要分為4個等級。第一級RFPUI為軟件程序單元的重新啟動;第二級RFBOI為某個電路板的重新啟動;第三級RFLII為線路接口模塊LIM重新啟動;第四級RFEXI為交換機系統全局重新啟動。
在維護交換機的實際工作中,假如產生了某種軟件故障(如程序出錯、數據出錯)等問題,系統程序便難以繼續進行工作,通常會有用戶申告或是交換機的告警系統自動顯示告警信息記錄。維護人員根據告警信息的性質含義和對故障處理方法的提示,可以靈活地應用RF系列命令組,及時排除故障。
一般情況下,使用第一級和第二級重新啟動命令,即程序不論運行到什么程序段,都一律要從起始點開始運行,如果所遇到的軟件故障是暫性的,則在多數情況下故障都可以很快得到排除,問題馬上獲得解決。
使用RF系列重新啟動命令的原則是從低級向高級發展。能用低級重新啟動命令排除的故障就不要用上一級的重新啟動命令,因為,越是高一級的重新啟動命令它對系統的通信阻斷作用也要相對大一些。當低級重新啟動命令使用后,不能解決問題,故障依然存在時,應逐級使用上一級重新啟動命令,直到故障最后排除。
例如:114查號臺的總機用戶反映呼叫燈總閃爍,但實際并無用戶呼叫;交換機的告警記錄中有287號告警反復出現。經過查詢287號告警的含義是占用PCM鏈路失敗的次數已經超過預先定義的擁塞值,而管理PCM鏈路功能的程序單元UNIT是GSP,因此處理這種故障的方法是只要重新啟動一下程序單元GSP即可。具體操作如下:
RFPUI:LIM=7(即告警信息所提示的LIM序號),UNIT=GSP;〈CR〉
結果:故障排除。
綜上所述,MD110交換機的RF重新啟動命令可以大體上分別針對程序單元、電路板、線路接口模塊LIM和交換機全局4個方面的對象進行作用。當然,不同類型的程控交換機在軟件設計和命令格式上是不同的,它們所設計的交換機系統的重新啟動命令在安排上也必然會有差異,但是其基本結構和分類層次上應該是大同小異的。
(2) RF系列命令組的危險性
通常,使用RF系列命令組也會對交換機系統產生如下一些危害:
軟件程序單元的重新啟動命令RFPUI和電路板的重新啟動命令RFBOI的執行時間為3min左右,對已經進入通話狀態的所有用戶不產生任何影響,只對正處于呼叫過程的用戶產生阻斷后果,其歷時約為3s左右。
線路接口模塊LIM重新啟動命令RFLII的執行時間為4min左右,它對該LIM已經進入通話狀態的所有用戶不產生任何影響,只對正處于呼叫過程的用戶產生阻斷后果,其歷時約為3s左右。
交換機系統全局重新啟動RFEXI命令的執行時間為5min左右,它對正在進行呼叫的用戶和已經處于通話狀態的用戶都將產生阻斷后果,阻斷時間約5s左右。
(3) 程控交換機中RF重新啟動命令組所能解決的故障類型
重新啟動命令所能解決的故障類型大致上可以歸納為以下3個方面:一是由于交換機出現某些干擾后軟件運行故障;二是在交換機系統進入維護應用階段,由于維護操作人員維護水平存在問題或由于用戶的某些誤操作造成的故障;三是環境因素對交換機的影響。下面列舉一些重新啟動命令所能解決的故障現象,供參考。
① 由于交換機出現某些干擾后軟件程序運行產生的故障。
② 人工輸入了某些錯誤的命令或錯誤的數據后引起的設備故障。
③ 出現不合理的過高的中央處理機負荷。
④ 出現過高的環境溫度或過高的相對濕度。
⑤ 有關用戶服務功能的錯誤操作。
⑥ 尋址誤差故障。例如欲尋的地址編號大于實際上的地址編號范圍。
⑦ 軟件信號數碼出錯。
⑧ 外界干擾信號或I/O設備的“讀”或“寫”功能發生問題而導致數據出錯。
⑨ 數據在總線上傳送時產生錯誤而未被系統校驗出來。
⑩ 緩沖寄存器發生擁塞現象。
PABX容量不夠。
過高的話務負荷或暫時的高話務量。
通過人機對話打入的功能塊、軟件信號、地址區等,而實際上并無此內容。
空閑狀態沒有檢測到電流。
接收沒有占用的證實信號或接收沒有清除的證實信號等。
(4) 如何正確使用RF重新啟動命令組
為了保證交換機系統的通信安全,防止誤操作對交換機系統的影響,盡量減輕RF重啟命令對通信造成的阻斷影響,在重新啟動命令組的使用級別上應加以限制。處理重大故障應由本單位的主管工程師或技術骨干組織實施。同時要求能作好以下幾方面工作:
① 加強對程控電話交換機用戶正確使用電話(尤其是具有新服務功能的電話)必要常識的宣傳,減少人為故障產生。
② 加強對交換機維護人員的技術培訓工作。
③ 要使維護人員能及時掌握用戶設備及全網局間中繼設備的變化或數據的變化,并對有關數據作出及時、相應的修改。
④ 切實作好系統的軟件維護工作,如堅持作好后援信息的轉儲工作等。
⑤ 使用重新啟動命令時一定要慎重,最好在話務量較低的時間(例如在中午或深夜)進行。
2 按動硬件按紐物理重新啟動程控交換機
在處理MD110程控交換機故障時,在使用命令操作RF系列命令組重新啟動交換機的方法不能解決問題的情況下,可以考慮使用按動硬件按紐物理重新啟動程控交換機。方法如下:
在話務量較低的夜間,將裝有IOU板的LIM中的LPU板上的黑色按紐按兩下(按一下,只啟動IOU板),使該LIM的中央處理機重新初始化,程控交換機全局重新啟動并重新裝載全部數據,它會影響全局通信。
使用按動硬件按紐物理重新啟動程控交換機,它將所有的控制程序與全部備用數據又重新裝載了,那么它將同時清除掉數據存儲器內的原有信息。這種由于后援信息再裝入所產生的對通信影響的不良后果將比上述使用RF系列命令組重新啟動交換機的方法后果更嚴重,其影響通信的時間視存儲介質(如磁帶機、硬盤等)的類型及后援信息內容的多少而定。一般每個LIM需5min左右,影響整個交換機系統通信的時間為所配置的LIM總數乘以5左右,即N×5,N為交換機系統配置的LIM總數。
正因為交換機系統全局重新啟動并重新裝載所有后援信息的過程對通信的質量影響較大,所以,也可以把它執行的次數作為衡量程控電話交換機系統設計質量優劣與產品工藝好壞或維護水平高低的一種標準。
根據我們的工作實踐來看,在程控交換機容量小于1000門時,如國產的HJD-80型程控交換機、HJD-256型程控交換機、TGJ-439型程控交換機等等,因其命令集內容少,同時,全局重新初始化并裝載數據的時間較短,一般對用戶通信影響不大,所以可以經常用按動主機板CPU上的硬件按紐物理重新啟動程控交換機的方法來排除故障;但當程控交換機容量大于1000門時,如MD110程控交換機、AXE-10程控交換機等,因將所有的控制程序與全部備用數據重新啟動再重新裝載的時間較長,影響通信的時間較長,所以一般不使用按動硬件按紐物理重新啟動程控交換機的方法,應盡量使用命令操作的方法重新啟動程控交換機。