1. 如何有效管理機房設備
一、機房日常運維管理
1、運維人員每天在8:30到達機房進行設備巡檢,每天17:30下班後再次進行設備巡檢,並在《設備日巡檢記錄表》中進行記錄。如發現異常情況,需立即上報機房主管人員,並聯系相關產品服務商獲取技術支持。
2、對任何異常情況及其處理操作應在事件單中被記錄,為日後的問題管理提供依據。
3、機房運維人員每天上、下午均應合理安排時間在機房查看設備運行狀態,包括內存、硬碟、CPU等系統資源狀態,如出現資源運行異常,應查看相關系統設備運行進程並轉入事件管理流程進行處理。
4、保持機房整潔、衛生。所有設備擺放整齊有序,不得將任何廢棄物品留在機房內。不得存放與工作無關的物品,機房的物品不得私自帶走。
二、機房網路安全管理
1、新購置的設備,在安裝、使用前應當認真經過安檢。使用之前採取防止病毒感染措施,試運行正常後,再投入正式運行。
2、機房設備嚴禁連接互聯網。
3、對於網路設備和伺服器,要制定不同的用戶賬號,賦予不同的用戶操作許可權,並予以登記、備案。禁用guest賬戶,刪除伺服器中的多餘的、過期的以及共享的賬戶。必須定期統計相關信息和操作狀況,並向上級領導。
4、設置登錄伺服器的操作超時鎖定,超過10分鍾不操作即鎖定,需要重新認證後登錄。
5、系統中所涉及的涉密伺服器、終端、以及應用程序的本地登錄和遠程登錄必須進行用戶身份鑒別,並與安全審計相關聯,保證系統內安全事件的可查性。
6、禁止任何部門和個人嚴禁進行滲透測試,嚴禁攻擊其它聯網主機,嚴禁散布病毒。
7、嚴格執行計算機操作規程和各項管理制度,加強對管理人員和工作人員的防病毒教育。
8、網路伺服器應當安裝防火牆系統,加強網路安全管理。
9、病毒檢測和網路安全檢測必須指定專門的技術和管理人員負責;負責人員必須定期對網路安全和病毒檢測進行檢查。定期採用國家相關主管部門批准使用的檢測工具對系統進行安全性檢測,檢測工具和版本應及時更新。對於發現的系統軟體和應用軟體的安全隱患,必須及時從系統軟體開發商和應用軟體開發商獲取相關的補救措施,如安裝補丁軟體、制定新的安全策略、升級病毒庫等。
三、機房硬體設備安全管理
1、機房運維人員必須熟知機房內設備的基本安全操作和規則,特別是對伺服器、交換機進行熟悉操作,做到及時維護。
2、應定期檢查、整理設備連接線路,定期檢查硬體運作狀態(如設備指示燈、儀表),定期調閱硬體運作自檢報告,從而及時了解設備運作狀態。
3、禁止隨意搬動設備、隨意在設備上進行安裝、拆卸硬體、或隨意更換設備連線、禁止隨意進行硬體復位。
4、禁止在伺服器上進行實驗性質的配置操作,如需要對伺服器進行配置,應在其他可進行試驗的機器上調試通過並確認可行後,才能對伺服器進行准確的配置。
5、對會影響到全局的硬體設備的更改、調試等操作應預先發布通知,並且應有充分的時間、方案、人員准備,才能進行硬體設備的更改。
6、對重大設備配置的更改,必須首先形成方案文件,經過討論確認可行後,由具備資格的技術人員進行更改和調整,並應做好詳細的更改和操作記錄。對設備的更改、升級、配置等操作之前,應對更改、升級、配置所帶來的負面後果做好充分的准備,必要時需要先准備好後備配件和應急措施。
7、不允許任何人在伺服器、交換設備等核心設備上進行與工作范圍無關的任何操作。未經上級允許,不得對核心伺服器和設備進行調整配置。
8、硬體設備出現故障時,應填寫好《硬體設備維修故障登記表》,詳細填寫故障狀況及故障原因,並報修,故障處理結束後,因填寫處理情況及結果,交由上級驗收、簽字後,存檔備查。
9、存儲過涉密信息的硬體和固件應到具有涉密信息系統數據恢復資質的單位進行維修。
10、不再使用或無法使用的設備應按照國家保密工作部門的相關規定及時進行報廢處理,並記錄最終去向。
四、機房軟體安全使用管理
1、設立計算機軟體管理台帳,對每套計算機軟體進行登記,並納入資產管理。
2、妥善保存計算機軟體介質、說明書、使用許可證(或合同)等資料。
3、根據操作說明,正確使用各類應用軟體。
4、須安裝非專用軟體,須經上報並檢測、辦理安裝使用備案手續。
5、軟體必須由專人來保管,禁止任何人員將機房軟體私自拷貝、隨意向外傳播。
6、任何在用軟體的升級均需主管人員書面批准。
五、機房資料、文檔和數據安全管理
1、資料、文檔、數據等必須有效組織、整理和歸檔備案。
2、硬碟、軟盤、光碟、磁帶、帶存儲功能的設備等涉密信息存儲介質應按照所存儲信息的最高密級標明密級。
3、禁止任何人員將機房內的資料、文檔、數據、配置參數等信息擅自以任何形式提供給其他無關人員。
4、對於牽涉到網路安全、數據安全的重要信息、密碼、資料、文檔等必須妥善存放。外來工作人員的確需要翻閱文檔、資料或者查詢相關和數據的,應由機房相關負責人代為查閱,並只能向其提供與其當前工作內容相關的數據或資料。
5、重要資料、文檔、數據應採取對應的技術手段進行加密、存儲和備份。對於加密的數據保證其還原行,防止遺失重要和數據。
6、嚴禁使用計算機、終端機、網際網路為無關人員查詢、調閱涉密數據;存有秘密信息的磁碟、光碟,嚴禁外借、復制;不得向無關人員提供網路入口及口令。
7、調動工作時,必須將自己經管的涉密文件、資料和使用的保密筆記本上交,並遞交在調離後一定期限內不失密泄密的保證書。
8、發現失、泄密現象,要及時上報。
9、不再使用或無法使用的涉密信息存儲介質在進行報廢處理時,應進行信息消除或載體銷毀處理,所採用的技術、設備和措施應符合國家保密工作部門的有關規定。
六、機房保安管理
1、中心機房應採取有效的門控措施,並裝備「三鐵一器」。
2、出入機房應注意鎖好防盜門。對於有客人進出機房,機房相關的工作人員應負責客人的安全防範工作。最後離開機房的人員必須自覺檢查和關閉所有機房門窗、鎖定防盜裝置。應主動拒絕陌生人進出機房。
3、工作人員離開工作區域前,要保證伺服器、交換機等設備控制台的密碼處於鎖定狀態。
4、運維人員要嚴格執行人員出入登記制度,不得邀請無關人員到機房參觀,外單位系統、線路維護人員要進入機房需提前與管理人員聯系,批准後方可由管理人員陪同進入,並填寫《人員出入登記表》。
5、外來人員進入必須有專門的工作人員全面負責其行為安全。
6、未經主管領導批准,禁止將機房相關的鑰匙、保安密碼等物品和信息外借或透漏給其他人員,同時有責任對保安信息保密。對於遺失鑰匙、泄漏保安信息的情況即時上報,並積極主動採取措施保證機房安全。
7、機房人員對機房保安制度上的漏洞和不完善的地方有責任及時提出改善建議。
8、絕不允許與機房工作無關的人員直接或間接操縱機房任何設備。
9、出現機房盜竊、破門、火警、水浸、110報警等嚴重事件時,機房工作人員有義務以最快的速度和最短的時間到達現場,協助處理相關的事件。
七、機房用電安全管理
1、機房人員應學習常規的用電安全操作和知識,了解機房內部的供電、用電設施的操作規程。
2、機房人員應經常學習、掌握機房用電應急處理步驟、措施和要領。機房應安排有專業資質的人員定期檢查供電、用電設備、UPS設備。
3、機房人員應定好UPS放電計劃,對UPS的放電時長做出准確的評估,並做出更換或修復UPS計劃報告相關人事。
4、運維人員定期檢查UPS各項運行參數、負載、電池容量是否正常,如有異常,應及時調整處理,並做好記錄。
5、嚴禁隨意對設備斷電、更改設備供電線路,嚴禁隨意串接、並接、搭接各種供電線路、嚴禁把電源排插散落在地。發現用電安全隱患,應即時採取措施解決,不能解決的必須及時向相關負責人員提出解決。機房內的電源開關、電源插座要明確標出控制的設備。
6、在使用功率超過特定瓦數的用電設備前,必須得到上級主管批准,並在保證線路的保險的基礎上使用。
7、在發生市電報警要盡快趕往機房查看,並通告相關人員。事件處理完後,應及時復位市電報警設備。
8、在外部供電系統停電時,機房工作人員應全力配合完成停電應急工作。當需要發電機發電時,應計算好機房用電功率合理選擇發電機型號發電,嚴禁發電超負載供電。
9、定期(不長於三個月)對供電設施進行檢測與檢修,保障供電正常。
八、機房空調管理
1、為保證設備良好的工作環境,應保持合適的機房溫度和濕度,機房溫度應保持在22℃--26℃,機房濕度應低於70%。
2、空調運行時,巡檢人員按時檢查各項運行參數、狀態是否正常,如有異常,應及時調整處理,並做好記錄。
3、定期進行空調機的清理,防止因散熱不良造成空調的工作異常。
4、配備備用電風扇,以防止空調出現故障時機房溫度的快速上升。定期進行備用電風扇可用性檢查。
5、每年春秋換季期對空調系統進行全面的檢查保養,確保機組的正常運行。
6、每天巡檢一次,確保空調系統正常運行,如發現故障應及時上報。夏季要提高巡檢頻率,每天兩次,上下午各一次。
7、機房維護人員應懂得進行一些必要的空調降溫手段,以便在出現溫度升高的狀況下能通過輔助手段降低溫度上升的速度。
九、機房消防安全管理
1、機房工作人員應熟悉機房內部消防安全操作和規則,了解消防設備操作原理、掌握消防應急處理步驟、措施和要領。
2、消防設備應放在顯眼易取之處,任何人不能隨意更改消防系統工作狀態、設備位置。需要變更消防系統工作狀態和設備位置的,必須取得主管領導批准。工作人員更應保護消防設備不被破壞。
3、每日對火災重大風險點如蓄電池組進行巡檢,檢查內容包括電池是否漏水,有無發熱異常,電極觸點是否連接正常。
4、插座及蓄電池附近不得擺放紙箱、說明書等易燃物品。
5、應定期消防常識培訓、消防設備使用培訓。如發現消防安全隱患,應即時採取措施解決,不能解決的應及時向相關負責人員提出解決。
6、嚴禁在機房內吸煙和使用明火,如因線路或其他原因引起明火,應及時撥打119和通知相應負責人迅速解決問題。
7、定期檢查消防設備狀態,保證消防設備可用性。
十、機房應急響應
1、機房停電時,UPS設備將為機房設備提供電力支持,但UPS能夠提供的電力有限,因此需要根據實際情況進行處理,具體如下:
在停電時,有簡訊報警機制通知到機房維護人員,維護人員應馬上通知機房主管人員,並在一小時內趕回機房。
機房維護人員積極配合主管人員協調各供電電路運維方及時檢查處理市電迴路故障。
按照《基本業務服務設備列表》,只保留基本業務服務設備運行,對其餘設備進行關閉。
當UPS電力不足時,應及時關閉所有設備,避免突然斷電造成的系統設備故障。
2、當機房溫度升高時,為保護各設備,需要採取相應的應急處理措施,具體如下:
達到溫度閾值時,應有簡訊通知機制通知機房維護人員,維護人員一小時內到場,馬上啟用備用電風扇。
當機房溫度超過28℃時,維護人員應立即通知主管人員並積極協調空調維護商盡快處理。
在溫度超過35℃時,可以根據《基本業務服務設備列表》關閉非基本設備,只提供基本業務服務設備運行;
當機房溫度超過40℃時,應當關閉所有系統設備運行。
3、火災不像供電及空調故障那樣存在一段緩沖期去處理或減少影響,對無人值守機房來說一旦發生火災,勢必導致重大財產損失。對於機房火災應當是預防為主,因此必須重視每日的蓄電池組巡檢。當機房發生火災時,本著先救人,後救物的思想原則採取相應的應急處理措施,具體如下:
有報警機制通知到所屬地區消防部門,並通知到機房維護人員及主管人員。並根據預先制定的火災發生時聯系人目錄通知到位。
到場後立即斷開電源,防止由於電源引起的火情進一步擴大。
尋找安全的地點監控火情,並積極配合消防人員應對火災。
4、設備發生故障時,使用備用設備替換現有設備,並保證新設備配置和用戶密鑰與舊設備一致、保證新設備配置和數據與舊設備一致。
5、傳輸線路幹路發生故障時,請及時聯系網路供應商,對線路進行檢測維修。
6、發生不可預見的緊急請況時,及時向主管人員匯報,並與相關技術人員聯系,採取妥當的應急辦法進行應急處理。