㈠ 監控機房設備維護需要哪些設備!
安全評估重在事前控制
「對機房設施層面的安全評估,應該既要全面又要有重點,大體來講,可以分為四個子系統,分別進行評估。」沈衛東說。
第一,電源子系統,電源子系統裡面經常出現問題的部件有電池組、配電系統和UPS。尤其是電池組,電池組的壽命與溫度環境各方面都有關系,不確定性很強。「我見到的比較大的案例,有一個石化工程,就是因為不定期檢驗電池,而電池所在的房間又特別熱,電池的實際壽命很快消耗沒了。在某一次供電局線路調試,對整個區域停止供電一分鍾,而就在這一分鍾內,由於電池組無法工作,造成控制室斷電,進而是整個生產線停止,導致了幾千萬的損失。」沈衛東說。所以,電池組的運行維護和定期評估很重要,要明確電池組的壽命還有多久。此外,電池組對財產也有威脅,電池組著火引起火災的情況時有發生,電池組還會造成對人員的傷害,曾經就發生過電池組事故導致操作人員雙目失明的嚴重事故。第二個是配電系統,配電系統在配電過程中對導線的要求,對空氣開關的要求都很高,如果設計不合理,再加上運行維護不合理,很容易引起火災,或者引起斷電宕機。再就是UPS,UPS有可能引起火災,也有可能引起斷電,都需要我們加以重視。「我覺得在評估過程中,電源子系統應該重點進行評估和監測。」沈衛東說。
第二,空調子系統,空調子系統包括空調機和氣流組織兩個方面。「對於中大型的機房,表面看起來空調停止之後對伺服器影響不大,實際上並非如此,我們在全國專門調研過幾個機房,而且做了實驗,發現空調斷電之後,整個房間的溫度迅速上升。」沈衛東說,「北京我們做的一個實驗是在一個八十多平米的機房,把空調關掉,設備繼續運轉,四十分鍾以後室內溫度就達到34度,然後陸續有伺服器開始發出警報並陸續自動關閉。」另外,空調機還可能引起漏水,如果空調運行不合理,這種情況很容易發生。對於氣流組織主要是冷風的分配,這是針對目前越來越多的機架式設備來說的,機架式設備多了以後,空調機產生的冷風很難均勻送到每個機架,而一旦某些機架得不到冷風就會產生局部熱點,局部熱點是比較常見的現象,就是因為氣流組織不合理引起的。
第三,監控子系統,監控子系統需要重點評估的是四個方面——溫度的監控、漏水的監控、電源的監控和安防的監控。前面提到的產生水災、火災的問題,實際上在產生之前都會有一些徵兆,如果監控系統是正常運行的,這些問題是能夠在早期發現的。比如火災從開始冒煙到火著起來需要幾分鍾的時間,水災從漏第一滴水到漏滿整個地板,需要兩三天的時間,所以如果監控系統運轉正常,及早發現的話,還是可以減小或者避免損失的。「但是,通常我們見到的情況是,在很多企業機房監控系統只是個擺設,很多用戶在監控系統運行一兩個月之後,發現機房一直沒有出現過問題,溫度顯示總是在22度左右不變,運行管理人員就產生了麻痹思想,認為沒用什麼可監控的,就把監控系統關閉掉了,從我們接觸的案例來看,這種情況經常會出現。」沈衛東說。
第四,機櫃微環境,現在的IT設備都放在機櫃裡面或者說在機櫃微環境裡面,機櫃微環境是一個很小的空間,但是這個很小的空間里會出現很多問題,比如局部熱點、配電的問題、布線管理的問題等等。有一些企業,機房剛建成之後,可能很多IT設備還沒有上,機房內IT設備相對較少,最初的時候機櫃可能比較規范,後來隨著設備不斷增加,在這個過程中可能會出現胡亂布線等眾多情況,導致機房設備越多越亂,直至最後不可收拾。在這個階段應該重點評估機櫃在設備擴展以後是不是仍然符合規范。
「還有一個很重要的方面就是對制度進行評估,制度包括預防性維護巡檢制度和應急預案。預防性維護巡檢制度在設備的評估裡面已經充分涉及到,我主要強調一下應急預案。我建議用戶定期進行一些應急演習,因為應急預案形成之後如果沒人去重視,一旦真正發生問題,加上管理員非常緊張,往往不知道如何去應對,造成更大的損失。所以定期進行消防演習、漏水演習和斷電演習,去評估應急預案的流程是否合理,人員是否准備充分也是非常重要的。」沈衛東強調說。
1、UPS監控
連接方式:報警控制器通過數據線和UPS干接點相連,由UPS供電簡訊及撥打電話報警:當UPS發生以下問題時,會發簡訊息及撥打電話報警:①市電異常,UPS轉電池工作;②UPS 低電量工作,電池將耗盡;③UPS 通訊丟失或切斷負載電源;④UPS 設備需要更換新電池;⑤UPS 設備開始轉到旁路工作;⑥UPS 出現不明故障
簡訊控制:發送一條簡訊指令,可關閉或打開UPS(可選功能,不推薦使用)
狀態查詢:管理員發簡訊可以查詢UPS 的當前狀態
2、溫濕度監控
配備溫濕度感測器;當溫度值超出設定范圍時,發簡訊及撥打電話報警
狀態查詢:管理員發簡訊可以查詢機房的溫度濕度
3、空調監控
配備空調啟動器;斷電來電以後自動啟動空調,如果異常會發送簡訊電話報警
配備空調啟動切換器;定時切換空調,支持高溫同開,低溫同關,故障保護同時發送簡訊及撥打電話報警
4、市電監控
自帶斷電功能,將控制器接入市電,市電斷電來電即可通過簡訊方式通知管理員
配備斷電模塊;適合斷電時間較長的場合,斷電模塊接入市電,將控制器接入UPS。市電斷電即簡訊及撥打電話報警
配備電壓檢測模塊;電壓異常即簡訊及撥打電話報警,狀態查詢:管理員發簡訊可以查詢機房的電壓值
5、漏水監控
配備漏水檢測模塊;當機房有水泄漏時,發簡訊及撥打電話報警
6、煙霧監控
配備煙霧感測器;當煙霧濃度超出一定范圍時,發簡訊及撥打電話報警
7、非法入侵監控
配備門磁感測器;當門窗被非法打開時,發簡訊電話報警 配備紅外探測器:當有人非法時間進入時,發簡訊及撥打電話報警無工作人員職守時間自動開啟,有工作人員職守時間自動關閉。