集團IT系統運維基礎建設監控經費管理制度.doc
下載文檔
上傳人:職z****i
編號:1131143
2024-09-08
16頁
521.80KB
1、集團IT系統運維基礎建設監控、經費管理制度編 制: 審 核: 批 準: 版 本 號: ESZAQDGF001 編 制: 審 核: 批 準: 版 本 號: 目 錄一、 導言41.1目的41.2范圍41.3版本信息41.4系統概述4二、 系統運維體系框架42.1運維團隊人員劃分42.2崗位人員分配6三、 基礎建設管理73.1系統架構73.2服務器資產管理73.3信息統計管理93.3.1信息資產記錄93.3.2帳號密碼管理9四、 部署94.1基本原則94.1存儲設備104.2數據庫部署104.3操作系統104.4公司軟件11五、 監控115.1基礎監控115.2docker監控115.3聽云監控112、六、 故障與排障126.1故障等級126.2報障流程136.3排障流程13突發事件應急策略136.3.2行為規范14七、 升級147.1硬件升級147.1.1硬件升級規范147.2軟件升級15軟件采購申請規定15軟件驗收15軟件使用15八、 經費管理168.1新增項目流程168.2新增人員流程16一、 導言1.1目的該文檔的目的是描述彩生活IT系統用戶使用說明,其主要內容包括:l 運行環境l 安裝與配置l 操作說明本文檔的預期的讀者是:l 運營人員、測試人員、研發人員等1.2范圍該文檔定義了系統提交產品的使用說明,主要描述了產品的操作流程,以及配置說明。 1.3版本信息下表展示【系統運維培訓手3、冊】版本更新記錄修改編號修改日期修改后版本修改內容012016.09.21V1.0基礎框架說明1.4系統概述系統運維培訓手冊旨在服務于彩生活IT運維部門,有效管理IT系統、滿足集團IT設備管控需求,提高集團IT運維智能化。二、 系統運維體系框架2.1運維團隊人員劃分崗位名稱崗位職責產品經理擬訂部門階段工作計劃,協調部門內部工作,實施部門員工管理與業績考核,提出部門員工配置與獎罰意見,指導并督促部門員工工作,保證正常工作進度。根據工作量合理安排部門人員分工,并進行督促指導、檢查與考核。協調運維工作中公司與業主之間的良好關系,提高服務滿意度。加強工作質量的管理力度,組織人員對負責路線進行事前控制和4、實時檢查,對檢查中發現的問題及時采取措施。協調處理系統運行中出現的系統、技術問題,采取有效負責處理方法,防止不良事故的發生。定期組織部門人員進行培訓、會議及學習,提高業務水平。完成公司領導交辦的其他工作任務。系統工程師1.負責服務器的搭建、維護等工作。2.各項服務器的日常管理、維護、保養、檢查及日志的監控與分析。3.負責集團各項應用系統運行部署、網絡設備調試、服務器管理等工作。4.負責各類應用系統的故障分析及錯誤排除。5.負責集團信息化硬件項目建設,包括需求調研、產品選型、實施、培訓和技術支持工作。網絡工程師1.負責中心機房網絡設備、環境、運作狀況的維護、保養、檢查;視頻、電話會議系統管理與維5、護。2.視頻監控系統管理與維護。3.防火墻、路由器、數據交換機、光端機、UPS的狀態監控,以及性能優化,配置修改,保證外網對公司官網的訪問以及公司內部網絡的正常;維護公司VPN線路,保證郵件等系統的正常訪問;sdh專線、光連路的監控、測試、故障申報與解決。4.公司Internet域名、二級郵件域名、DNS指向等互聯網業務申請、分理和維護。5.負責集團網絡工程的規劃、督導、項目實施及技術支持。技術支持1.負責協助部門領導完成IT相關項目計劃和實施。2.負責項目實施過程中崗位培訓、應用指導、項目日常管理。3.負責跟蹤項目進度,協調各部門成員之間的合作。4.及時向項目主管匯報項目的進展情況和實施、應6、用過程中出現的問題。5.客觀公正地對項目成員、操作人員的工作進行組織、監督和管理。6.項目總結以及項目文檔的編寫,為項目提供有針對性的解決方案,并采取各種實際措施,推動解決方案的落實。7.協助本地網絡、相關辦公設備維護及視頻、電話會議開通。8.完成部門領導安排的其他工作。運維客服1.郵件、RTX、OA等信息化系統技術支持工作。2.記錄集團內部申報的IT故障,并轉交相關責任人進行處理,對故障處理結果進行跟蹤及反饋。3.負責郵件、RTX、OA應用系統后臺維護管理工作,根據各單位需要進行辦公系統的開通、撤銷、組織架構調整等相關工作,并實時進行記錄。4.對郵件密保使用情況進行管理,對涉密人員進行密保綁7、定及特殊情況的處理,保障郵件系統安全運行。2.2崗位人員分配 三、 基礎建設管理3.1系統架構3.2服務器資產管理 3.2.1 服務器資產定義1.服務器資產資產主要包括員工正常應用所配備的服務器及配套軟件,為服務器環境所購置的網絡設備、配件,包括資產性支出固定資產部分及費用支出非固定資產部分。 3.2.2 服務器資產分類資產類別類別細分說 明主管部門硬件類終端設備主機、顯示器、研究院網絡設備路由器、交換機、防火墻、HUB、機柜等研究院服務器郵件、DM服務器,應用系統服務器等研究院耗材類配件硬盤、內存、網卡、顯卡,主板、CPU等研究院耗材鍵盤、鼠標、U盤、光驅、網線、電源線、插線板等研究院軟件類8、終端使用操作系統、辦公軟件、輔助軟件、云服務器及相應部專用軟件研究院服務器使用操作系統軟件與服務器應用軟件等研究院綜合使用網絡管理軟件與財務應用軟件等辦公輔助軟件研究院 3.2.3 硬件類資產管理IT資產硬件類屬于資產性支出的固定資產部分。在IT資產硬件類管理過程中,不同階段會出現資產的入庫驗收、管理、使用申請、借用、轉移、報廢等操作。以上所有操作都必須嚴格遵守相關操作規程方可執行。 1.硬件類入庫驗收規定 硬件類入庫驗收是指運維部門接收到采購申請單采購的服務器等IT硬件類資產后,辦理資產入庫前對相關資產進行的資產清點、外觀檢查等查點和核實的過程。 在資產入庫驗收時如發現所驗貨物與裝箱單等不符9、或設備外形出現嚴重變形,主管部門負責人有責任將驗收結果反饋給采購部門,由采購部門負責處理退貨或更換等事宜。 主管部門在取得相關IT資產并驗收完之后使用之前依其類別和科目予以分類粘貼資產編號標簽。 所有經過驗收后入庫的資產均由運維部門負責保管,如出現由于保管不利而造成的資產遺失、人為損壞等情況,運維部門將承擔主要責任。 運維部門在辦理完入庫驗收工作后,必須對所有入庫資產進行登記,填寫驗收、使用、更換、報廢登記表。 2. 硬件類資產使用申請規定 根據業務需要,在oa上填寫資產申請表申請。 3.硬件類資產的借用規定 除主管部門外,任何人都無權出借硬件類資產或安排出借硬件類資產事宜。 主管部門的硬件類10、資產登記臺帳應反映出借用部分,保證使用權和其它權限的清晰明確。 4.閑置硬件類資產的回收與發放規定 閑置類硬件資產回收后,主管部門將根據評估其性能等,并記錄閑置類資產臺帳中,根據以后的需求情況進行再次發放和調控,投入再使用。 5.硬件類資產報廢規范 本制度規定辦公IT硬件資產的報廢采用兩種方式,即主動報廢方式和被動報廢方式。 被動報廢方式是指當硬件類資產受到嚴重損傷且簡單維修無法恢復使用時,其價值明顯減少的情況下應提交申請報廢。此外這種報廢還包括已經滿折舊年限且無法維持正常工作的硬件類資產部分。被動報廢方式是通常意義上的報廢方式,相關報廢規定如下:1) 主管部門按照規定提交相關報廢申請,由財務11、部安排報廢,并由財務作相應的會計處理。 2) 報廢的發起人為主管部門,員工無權申請報廢。 3) 報廢時主管部門必須填寫報廢申請單,同時在報廢登記表中進行登記,反映已經報廢的那部分資產。 4) 報廢的編號不重新使用。 主動報廢方式是指硬件類資產由于使用時間的增長,作為辦公平臺所能提供的性能、效率、可靠性和穩定等已經很難滿足事務所辦公的最低端業務的需要時,由主管部門根據資產本身的性能指標分析并結合受益人的意見,提請對硬件類資產的報廢。 主動報廢方式是從辦公效率和新業務需求等角度去主動地做適當的淘汰。主要操作規范參照被動報廢方式的相關規范。 3.3信息統計管理3.3.1信息資產記錄(一) 硬件設備型12、號、數量、版本等信息統計記錄(二) 軟件產品型號、版本和補丁等信息統計記錄(三) 網絡結構、網絡路由、網絡IP地址統計記錄(四) 綜合布線系統結構圖的繪制(五) 其它附屬設備的統計記錄3.3.2帳號密碼管理(一) 服務器和數據庫的管理賬號密碼,由系統管理員和數據庫管理員設定并持有,實行定期修改制度,最長有效期不超過90天。 (二) 更換服務器與數據庫密碼時必須報行政封存,以防遺失密碼。 如發現密碼及口令有泄密跡象,管理員要立刻報告主管領導,嚴查泄露源頭,同時更換密碼。(三) 密碼需要按照以下規則設定,即由大寫字母,小寫字母,數字,和字符組成;最低位數為10位;不能與以往的密碼重復。(四) 建議13、借助密碼生成器按照密碼設定規則,生成密碼。四、 部署4.1基本原則利用虛擬容器技術的“一次裝載到處部署”的特性,實現統一特性的服務節點規模部署,而節點間彼此獨立。4.1存儲設備例如raid磁盤陣列,san存儲系統、磁盤陣列、等存儲設備。存儲設備部署,主要由系統運維工程師負責。 基本步驟如下 1.現場備件安裝 配合廠商(供應商)進行現場備件安裝。 2.補丁服務 消除軟件漏洞給系統帶來的安全隱患,并對安裝補丁所引起的系統連鎖反應進行合理的平衡。 3.升級服務 對系統進行軟件或硬件的升級,以改進、完善現有系統或消除現有系統的漏洞。 4.問題管理系統 對遇到的問題進行匯總和發布。形成技術文檔。 5.系14、統優化監控管理 對設備進行系統的優化監控,對存儲交換機設備狀態、端口狀態、傳輸速度監控、對監控備份服務進程、備份情況(起止時間、是否成功、出錯告警)監控、對監控記錄磁盤陣列、磁帶庫等存儲硬件故障提示和告警等監控,對存儲的性能(如高速 緩存、光纖通道等)進行監控。并及時解決故障問題、4.2數據庫部署1. 數據庫選型 對系統的配置及運作框架提出建議,以幫助您得到一個更堅強可靠的運作環境,降低系統潛在的風險,包括數據丟失、安全漏洞、系統崩潰、性能降低及資源緊張2. 數據庫軟件安裝。 進行數據庫環境部署,數據庫空間的規劃管理,設定自動備份機制等。完成部署文檔。3. 檢查數據庫系統是否需要應用最新的補丁15、集 進行數據庫補丁升級,完成服務器運行文檔。4.數據庫系統優化分析用戶的應用類型和用戶行為、監控數據庫性能、評價并修改數據庫的參數設置、評價并調整數據庫的數據分布、評價應用對硬件和系統的使用情況,并提出建議。提供完整的性能調整報告和解決方法4.3操作系統1.操作系統選型根據應用的運行環境,進行最優的系統選型。2. 部署操作系統,并連通網絡。完成部署文檔3. 檢查操作系統是否需要應用最新的補丁集,4.登記操作記錄表4.4公司軟件五、 監控5.1基礎監控從網絡的連通性、網絡的性能、網絡的監控管理三個方面實現對網絡系統的運維監控。1. 設備基礎性能檢測:cpu、內存使用情況監測;2. 設備日志查看;16、3. 設備snmp狀態;4. 測試Ping,tracert等工具的連通性;5. 網絡安全策略應用是否正常;6. Internet帶寬流量的實時監測;7. 網絡拓撲鏈路狀態監測;8. 異常網絡數據包流量;9. Dos、ddos等網絡攻擊情況監測;10. Internet線路的誤碼率、丟包率監測;5.2docker監控5.3聽云監控聽云Server是服務端應用性能解決方案。通過在服務端應用中植入探針,可以對應用代碼、關系型數據庫、NoSQL、外部服務、服務器進行監控,幫助用戶即時獲取相關性能數據并進行智能分析,在代碼層面上定位錯誤發生、性能下降的原因。聽云運行架構圖聽云監控流程1.向研究院領導提出17、申請 需將應用部署上聽云監測問題的專業公司,首先需向研究院領導提出申請,申請之前請準備好應用項目的相關信息,包括:應用名稱、開發語言、部署的 機房名稱或者服務器資產托管供應商、部署服務器、服務器相關配置、申請使用時間(期限)、應用類型等信息,形成.txt文檔上傳到附件。(使用case:42645)記錄2.領導審批 研究院領導會根據專業公司提供的應用項目信息進行審核。3.落實三部署工作 如果領導審批同意部署將進入部署工作。 4.登錄應用,使用應用、產生數據。5.測試成功產生數據后反饋給項目。6.運維人員監看數據變化,出報告,協助解決問題。六、 故障與排障6.1故障等級故障級別響應時間故障解決時間18、I級:屬于緊急問題;其具體現象為:系統崩潰導致業務停止、數據丟失。10分鐘,30分鐘內提交故障處理方案3小時以內II級:屬于嚴重問題;其具體現象為:出現部分部件失效、系統性能下降但能正常運行,不影響正常業務運作。10分鐘,30分鐘內提交故障處理方案6小時以內III級:屬于較嚴重問題;其具體現象為:出現系統報錯或警告,但業務系統能繼續運行且性能不受影響。10分鐘,30分鐘內提交故障處理方案12小時以內IV級:屬于普通問題;其具體現象為:系統技術功能、安裝或配置咨詢,或其他顯然不影響業務的預約服務。10分鐘,2小時內提交故障處理方案24小時以內6.2報障流程報障基本流程6.3排障流程突發事件應急策19、略1、值班人員平時應做好應急事件的監控工作,對于突發事件應認真分析、準確判定故障發生的數據域,負責跟蹤該事件直至其結束。對于不在運維中心的故障,應在第一時間內通知負責人去現場處理,密切關注事件流程及進展情況,并做好登記工作上報領導。2、正常情況下,要求值班人員在10分鐘內進行事件確認。如果屬于一般事件則按照事件流程進行分派處理,否則應迅速啟動應急預案,并嚴格按照應急預案所規定的步驟快速實施應急處置,及時匯報上級領導,掌握實時處理情況。3、在處理過程中,如需其他部門去現場增援處理,應及時向上級領導部門匯報,協調溝通,盡快聯系技術工程師或廠家技術支持趕赴現場援助處理。6.3.2行為規范1、遵守用戶20、的各項規章制度,嚴格按照用戶相應的規章制度辦事。2、與用戶運行維護體系其他部門和環節協同工作,密切配合,共同開展技術支持工作。3、出現疑難技術、業務問題和重大緊急情況時,及時向負責人報告。4、現場技術支持時要精神飽滿,接聽電話時要文明禮貌,語言清晰明了,語氣和善。5、遵守保密原則。對被支持單位的網絡、主機、系統軟件、應用軟件等的密碼、核心參數、業務數據等負有保密責任,不得隨意復制和傳播。七、 升級7.1硬件升級 7.1.1硬件升級規范 硬件類資產的改造升級可分為兩種:主動升級和被動升級。 被動升級規定: 適應于涉及面和代價較小的改造升級部分1) 當硬件類資產原有的配置經主管部門確定確實不能滿足21、現有的需求,但僅作少量投入就可以達到需求標準時,則受益人可以申請對相關的硬件類資產進行改造升級。2) 在進行硬件類資產改造升級過程中,增強其能力和延長其使用年限的部分應計入該硬件類資產的價值中。對于替換式升級則應計算其差價部分,如做增加式升級則直接計算增加部分的價值。如僅做維修以維持使用效果的費用應計為一般性費用支出。 主動升級規范:從公司服務器資產管理的整體角度出發,全面調節和配置公司服務器資產,達到改造升級和節省在投入的目的.1) 在主動升級過程中,運維部門的職責是提出主動改造升級的可行性方案,并提交相關申請,經必要的審批和確認后執行。 7.2軟件升級軟件采購申請規定 軟件采購申請由運維部門需求匯總后,統一提交采購申請審批流程。軟件驗收軟件到貨后,由運維部門進行驗收,并做好驗收記錄,驗收完成后由主管部門做好軟件庫存管理登記。軟件使用統一由運維部門人員進入安排安裝,維護。八、 經費管理8.1新增項目流程8.2新增人員流程