作者:克里斯-萊夫勒(Chris Loeffler)
伊頓公司刀片UPS及數據中心應用領域產品經理
執行摘要
UPS(不間斷電源系統)在確保IT可靠性方面扮演著至關重要的角色。因此,它們自身的可靠性也同樣是一個關鍵的考量因素。一旦UPS發生故障,則執行關鍵任務的電力負載可能會有風險。
那么,對于優化UPS可用性,企業要采取哪些措施?根據本白皮書的內容,對此問題的常見回答并非是最佳選擇。歸根結底,UPS的可靠性更多地有賴于電源系統的整體設計,而并非UPS本身的設計(如UPS是否采用在線互動式或雙轉換技術)。而最終,提高UPS可用性的辦法無疑就是將包括UPS和整個電源保護方案在內的整體修復時間縮至最短,將冗余擴至最大。
此外,在本白皮書中,我們也將顛覆“零部件越多則故障可能性越高”這一傳統的觀念,闡述何以模塊化UPS設計能夠提供出眾可靠性的原因。
平均無故障時間(MTBF)之惑
一直以來,MTBF(平均無故障時間)是UPS生產商用來測量和說明UPS可靠性的關鍵度量標準。不過,用MTBF來預測UPS的可用性實際上卻難具說服力。
為了說明這一點,我們來舉一個例子,假設一臺UPS的MTBF是200,000小時,非專業人士可能簡單地以為該設備可以無故障運行200,000小時(約為23年)。但是,事實上UPS生產商不可能也不會對產品進行為期23年的無故障運行測試。相反,他們只是根據UPS組件的預計使用壽命先行計算出一個MTBF值。然后,在其出貨量增長到具有統計學意義時,會根據這批設備實際的性能數據替換到某些初步的預估值。盡管這些修正后的數據可能存在誤導性。比如,假如2,500臺UPS在5年的研究期內運行良好,那么得到的MTBF值可能會相當高。但是,如果這些系統中有一個組件的使用壽命只有6年,那么在5年研究期過后的一年,它們中的90%可能會發生故障。
而且,MTBF的測量至今還沒有一個通用的標準。多年來,許多的政府機構不斷要求生產商根據最新版的MIL-HDBK-217F手冊提供計算數據,但是許多的商業客戶卻采用Telcordia (Bellcore) SR-332標準流程。近期,經技術行業總結發現,這些測量方法雖然頗有用處,卻并非是制造商評定產品可靠性的唯一方法。也因此,如今的生產商逐漸將注意力放在了可靠性設計(DFR)上。過往標準主要關注單個電氣組件及其與產品設計中采用的電路之間的關系,而DFR則側重于產品在各種條件下的預定或預期用途。
不過,最終還是沒有對測量供電負載的UPS運行情況給出一個標準方案。也因而,將一家生產商的UPS與另一家的UPS就MTBF數值進行比較時仍很難實現。
用可用性來測量關鍵電源后備系統更加具有實質意義。鑒于UPS在數據中心所占據的重要作用,能否快速更換舊零件或故障零件就顯得至關重要?捎眯员硎镜氖荕TBF與另一度量單位MTTR(平均故障修復時間)相互之間的關系。MTTR(平均故障修復時間)是指從發現故障、給予響應到完全修復所需的耗時。
可用性的數值一般由多個數字9構成的百分比數表示,表明特定系統在一年使用期限內正常運行的時間比例。舉例說明,一臺UPS的MTBF是500,000小時,MTTR是4小時,那么,它的可用性為0.999992或者99.9992%(500,000 ÷ 500,004)。這也就是說,該臺UPS每年的預期宕機時間是4.2分鐘。
然而,單獨來講,盡管可用性比MTBF更能說明UPS的可靠性,但是在一些重要方面仍存在不足。具體來說,可用性無法說明例行保養的耗時。如果一個系統每年都必須安排進行檢查、重新校準或常規維護,它實際的運行可用性會比上面公式得出的數值來的低。
- 1
- 2
- 3
- 4
- 5
- 6
- 7
- 8
- 總8頁
http:www.mangadaku.com/news/2011-5/2011518111837.html

