最新消息指出,2003年8月14日發(fā)生的美國(guó)及加拿大部分地區(qū)史上最大停電事故是由軟件錯(cuò)誤所導(dǎo)致。 著名安全機(jī)構(gòu)SecurityFocus的數(shù)據(jù)表明,位于美國(guó)俄亥俄州的第一能源(FirstEnergy)公司下屬的電力監(jiān)測(cè)與控制管理系統(tǒng)“XA/21”出現(xiàn)軟件錯(cuò)誤,是北美大停電的罪魁禍?zhǔn)住<覍?duì)這套廣泛分布的系統(tǒng)的進(jìn)行了持續(xù)數(shù)周的極為細(xì)致的代碼檢查,以便找出導(dǎo)致錯(cuò)誤的程序所在。根據(jù)第一能源公司發(fā)言人提供的數(shù)據(jù),由于系統(tǒng)中重要的預(yù)警部分出現(xiàn)嚴(yán)重故障,負(fù)責(zé)預(yù)警服務(wù)的主服務(wù)器與備份服務(wù)器接連失控,使得錯(cuò)誤沒有得到及時(shí)通報(bào)和處理,最終多個(gè)重要設(shè)備出現(xiàn)故障導(dǎo)致大規(guī)模停電。
預(yù)警系統(tǒng)崩潰后沒有接收到更多的警報(bào)更沒法向外傳播,操作員并不知道預(yù)警系統(tǒng)已經(jīng)失效,他們發(fā)現(xiàn)了部分異常情況,但因?yàn)闆]有看到預(yù)警系統(tǒng)的警報(bào),而不知道情況有多么嚴(yán)重,以致一個(gè)小時(shí)后才得到控制站的指示。但此時(shí)沒完沒了的故障干擾已經(jīng)讓操作員反應(yīng)不過來,無法控制整個(gè)局面。正常情況下,出現(xiàn)錯(cuò)誤的網(wǎng)絡(luò)會(huì)立即與其他網(wǎng)絡(luò)分隔開來,這樣一來錯(cuò)誤就會(huì)被固定在一個(gè)地方,但是同樣由于預(yù)警系統(tǒng)失靈,操作員沒有做出應(yīng)有的反應(yīng),最終使得錯(cuò)誤蔓延,一發(fā)而不可收拾。
第一能源公司目前打算將采取競(jìng)標(biāo)的方式來更換系統(tǒng)。未避免事故重現(xiàn),NERC(North American Electric Reliability Council,北美電力可靠性委員會(huì))提出了指導(dǎo)意見,責(zé)令第一能源公司在升級(jí)系統(tǒng)前為XA/21系統(tǒng)安裝所有補(bǔ)丁程序。