在線客服

咨詢熱線

數據中心運維管理體系初探

作者:未知

  摘要:本文以A公司數據中心主機房運維管理為討論對象,通過對主機房所涉及的各類基礎設施、電子信息設備的具體運維內容、運維體系、流程管理體系、溝通管理體系的研究分析,論述了在數據中心主機房運維工作中應該關注的要點,以期對同類工作有所助益。
  關鍵詞:數據中心;主機房;機房運維;ITIL
  中圖分類號  TP308        文獻標識碼:A
  文章編號:1009-3044(2019)22-0019-02
  開放科學(資源服務)標識碼(OSID):
  A Preliminary Study on Operation and Maintenance Management System of Data Center
  YANG Gao-pan, WANG Qian
  (Baoji Cigarette Factory of China Tobacco Shaanxi Industrial Co.,Ltd., Baoji 721000 , China)
  Abstract:This paper studied Company A’s Date Base computer room, analyzed its hardware condition, and it’s Operation system of Content, System,Process,Communication,expound key points in Operation job of  IDC, expected to be helpful for such jobs.
  Key words: Data Center; Computer Room; operation and maintenance management; ITIL
  在我國社會經濟發展過程中,沒有信息化就沒有現代化,而數據中心作為信息化的基石,沒有數據中心就沒有信息化。數據中心建設好后該怎樣具體運維,怎樣讓數據中心穩定、可靠、安全、高效地運行,并在質量、成本、效率、安全等方面為業務系統提供堅強后盾,已成為運維部門關注的重點,本文以A公司數據中心主機房運維工作為討論對象,通過對主機房所涉及的各類基礎設施、電子信息設備的具體運維內容、運維體系、流程管理體系、溝通管理體系的研究分析,論述了在數據中心主機房運維工作中應該關注的要點,以期對同類工作有所助益。
  1 A公司數據中心主機房概要
  1.1 A公司概況
  A公司屬于輕工業生產制造企業,其產品線豐富、產品受用群體龐大,年工業總產值百億元,公司內部有眾多的業務領域,各業務領域均有相對應的信息系統予以支撐,用戶群數量較大、活躍度及并發量均較高,公司內各類流水線對信息系統的實時性和可靠性等均有較高要求,總之A公司的信息化及自動化程度均屬于所處行業的先進水平, A公司所有的信息系統歸納為四大類,分別發力于數據分析、業務管控、制造執行、基礎保障,基于A公司的信息化及自動化特點,其數據中心運維部門在公司內部的作用就至關重要,運維工作的質量和效率將直接影響到公司的生產經營目標,所以有必要在本文中將A公司數據中心運維過程的經驗和教訓進行分析研究,以期為今后類似的工作提供解決方案。
  1.2 A公司數據中心
  A公司的數據中心(Data Center)是一棟建筑物的一部分,主要由主機房、輔助區、支持區和行政管理區等功能區組成。主機房(Computer room)是主要用于數據處理、設備安裝和運行的建筑空間,A公司在主機房內配置了空調系統(精密空調系統、新風系統)、電力系統(供配電系統、UPS系統)、安防系統(防雷接地系統、消防系統、視頻監控系統、門禁系統)、綜合布線系統、智能網絡管理平臺、服務器主機群、服務器虛擬化系統、網絡安全類軟硬件系統(病毒網關、安全審計、入侵檢測、入侵防御、運維審計、日志管理等)、環境監控系統、虛擬化系統、存儲管理系統、備份系統等,對上述各類軟硬件系統運行與維護構成了A公司運維部門的基礎性業務工作。
  1.3 運維體系
  A公司的運維體系,一是基于本公司的戰略規劃、信息化發展規劃、運維發展規劃、人力資源規劃、軟硬件系統架構、數據中心特點等指導性文件,發布了規范化的數據中心運維體系標準文件。二是成立了一支專業化的運維團隊,團隊成員專業主要包含:企業管理與標準化、服務器、網絡、信息安全、軟件工程、安防、電氣、弱電、暖通等,團隊成員除在專業技術領域擅長外,同時兼備了制造企業所需要的管理能力。三是加大資金投入,A公司已經意識到信息化在生產制造過程中的積極意義,在設計研發、原料采購、倉儲運輸、訂單處理、生產制造、批發和零售等環節,大力引進云計算、大數據等信息化技術,用以推進傳統制造向數字化、智能化轉型。四是加大宣傳力度。A公司雖然只是一個商品制造企業,但是其在公司內部提倡全體職員進行互聯網思維,宣傳貫徹中國制造2025,突出“互聯網+”“智能化+”對于日常業務的引領與提升,已將信息化、智能化提升至公司戰略層面。五是加強運維部門人員的職業技能培訓,走人才引領的發展道路,A公司歷來重視信息化專業技術人員的培訓工作,建立了一套職業晉升體系,通過培訓與鑒定,可以充分激發運維人員的工作主觀能動性,團隊氛圍積極向上。
  2 運維基礎工作分析
  2.1 基礎設施的運維工作概況
  A公司數據中心主機房基礎設施的具體工作由三大類組成,即狀態監控、預防性檢查、常規作業,簡述其工作內容如下。
  空調系統的運維內容有:精密空調系統的環境溫濕度、出風溫度、回風溫度、加濕罐狀態、加濕罐陽極棒、壓縮機狀態、高低壓壓力、冷卻水壓力、濾網灰塵、室內機漏水檢查、室外風機運轉,新風系統的風壓和風速、上下水等。   電力系統的運維內容有:供配電系統的電流、電壓、功率因數、有功功率、無功功率、諧波、接地電阻、零序電流、導線及器件的發熱、防浪涌器件等,不間斷電源的輸入輸出電壓電流、頻率、負載率、溫度、電池充放電電壓、外觀、通風等。
  安防系統的狀態監控內容有:防雷接地系統的浪涌保護器、避雷器狀態、接地電阻等,消防系統的控制系統狀態、探頭污染、管道開關、氣體滅火器容器壓力、滅火器有效期等。
  視頻監控系統的狀態監控內容有:監控錄像記錄信息的完整和真實性、存儲狀態、云臺狀態、監控死角、照明情況等,門禁系統的自動報警功能、門禁與視頻監控聯動狀態、防觸電、防短路和開路、門磁、門禁授權等。
  綜合布線系統光纖、銅鏈路狀態、線纜標識與拓撲圖等。
  2.2 電子信息設備的運維工作概況
  主機房內的服務器群、網絡設備、網絡安全設備、存儲設備等的主要運維工作為三大類,即狀態監控、預防性檢查、常規作業,簡述其主要內容如下。
  服務器主機類:設備機身和各類板卡運行狀態、電源、CPU峰值、內存峰值、文件系統空間、IO讀寫、網絡端口、與存儲的鏈路性能、微碼版本、RAID信息等。
  網絡及安全設備類:端到端時延變化、鏈路端口、鏈路負載百分比、路由條目變化、軟件配置變動審計、設備日志審計、負載均衡、應用流量管理、上網行為、網頁防篡改、WEB防火墻、APT檢測、木馬檢測、無線AP、日志審計、網絡審計、運維審計、數據庫審計等。
  3 運維的流程管理體系
  A公司對于數據中心的運維工作,設計了總體的管控流程,包括每一個流程動作的觸發條件、工作規范、成果等,保證流程所涉及的每一個人都有規范統一的理解和標準的操作,同時可以實現對運維工作的量化管理與考核,規范化流程包含了:統一服務臺管理、事件管理、問題管理、變更管理、發布管理、配置管理、知識庫管理、系統管理、角色授權管理等。
  統一服務臺管理。運維部門設置統一的對外服務接口,用于處理用戶服務請求、知識庫維護、運維服務工單派發、進度跟蹤、服務回訪等,這樣設置有助于管理決策層人員做對整個運維部門的工作進行績效管理,進而對運維人力資源配置、資金支持等進行優化調整。
  事件管理。服務臺和工單指定人員能夠快速響應軟硬件故障或服務請求,按規范記錄事件,對事件的影響度和緊急度進行評估,進而對事件分級,能夠有效提高整體運維工作效率,提升用戶滿意度。
  問題管理。有主動管理和被動管理兩個維度,主動問題管理重點關注數據中心基礎設施和電子信息設備的運行質量及趨勢,分析并找出潛在隱患加以預防修復,防止其發生。被動管理關注突發事件的解決,及事后的排查分析,找到問題根源并徹底解決。在數據中心主機房運維過程中,運維人員大部分精力應放在主動管理方面,努力使數據中心的對外服務透明化。
  變更管理。在數據中心主機房內,始終堅持的原則是在最小風險范圍內,高效經濟的實施變更。A公司將變更分為三級,即常規變更、標準變更、重大變更,所有變更均進行請求登記,經過評估和授權后才付諸實施。
  發布管理。建立規范的發布過程,控制發布風險,提高發布成功率。首先確認發布的可追溯和安全,只有經過測試并授權批準的內容才能發布。第二考慮發布的時間和范圍規劃,與用戶確認試運行期間。第三對發布信息的備份進行妥善安置,并更新配置管理數據庫。
  配置管理。該管理的總目標是提供一個統一的、一致的過程來管理運維各流程所涉及的所有組成部分。該管理過程統計所有的數據中心資產,為其他管理流程提供準確統一的信息,是事件、變更、發布管理的基礎,配置項記錄的完整性和正確性得到維護和確認,所有的數據存儲在配置管理數據庫中。
  知識庫管理。運維過程中的所有事件均在統一服務臺管理中入庫,入庫的過程按照已劃分的角色、確定的流程進行,在經評估批準后發布。設置知識庫管理可以實現知識共享及轉化、避免知識流失、提高運維的響應效率,當知識庫積累到一定量時,可以進行大數據分析,進而發現潛在問題,預測分析,幫助擬定未來的工作重點、計劃及預算等。
  4 運維的溝通管理體系
  A公司為確保運維工作效率和管理質量,制定了包括會簽制度、例會制度、匯報制度、專項會議制度等在內容的溝通管理體系。
  會簽制度。在運維過程中,當出現涉及重大業務變更事件時,運維部門會組織召開由各業務部門負責人及業務骨干參加的協調會議,當雙方達成業務及技術的一致后,經批準授權交由技術人員實施。
  例會制度。定期組織運維部門例會,會上對運維工作過程中的技術與管理問題進行面對面溝通協調,確定解決方案和工作計劃。
  匯報制度。運維部門的管理人員有1至2個,但技術人員會有很多,所以技術人員的工作進展情況,必須定期向管理人員匯報,A公司建立該制度能使管理人員全面把控運維整體工作進展和質量,同時能提升技術人員在本單位的管理能力。
  5 結語
  現階段我國各個行業中數據中心的建設依然處于快速的發展階段,其中運維體系的規劃和設計在數據中心建設過程中占據著重要的角色,運維體系的搭建應同數據中心的規劃設計同時開展,這樣有助于數據中心在交付運營之后的運維工作可靠有效地開展,才能讓數據中心穩定、可靠、安全、高效地運行,并在質量、成本、效率、安全等方面為業務系統提供堅強后盾。
  參考文獻:
  [1] GB50174—2017,數據中心設計規范[S].
  [2] 陳永青,張正培.數據中心機房建設和運維中的色標輔助管理[J] .中國金融電腦,2018(6):42-48.
  [3] 費晰,胡璋,楊海. 關于提升衛星發射中心遠程數據機房運維保障水平的若干思路[J] .中國航天,2018(6):31-33.
  [4] 張亞軍,張金隆,陳江濤. 基于ITIL的H企業信息化運維服務的管理與研究[J].數字通信世界,2019(2):244-245.
  【通聯編輯:王力】
轉載注明來源:http://www.xvthda.live/8/view-15028408.htm

?
内蒙时时彩最新开奖结果