信息系統(tǒng)運(yùn)維方案
發(fā)布時(shí)間:2020-07-07 來(lái)源: 工作總結(jié) 點(diǎn)擊:
目 目
錄 1
運(yùn)維 服務(wù)內(nèi)容 ................................................................................................................................ 2
1.1
服務(wù)目標(biāo) ............................................................................................................................... 2
1.2
信息資產(chǎn)統(tǒng)計(jì)服務(wù) ............................................................................................................... 3
1.3
網(wǎng)絡(luò)、安全系統(tǒng)運(yùn)維服務(wù) ................................................................................................... 3
1.4
主機(jī)、存儲(chǔ)系統(tǒng)運(yùn)維服務(wù) ................................................................................................... 5
1.5
數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)維服務(wù) ........................................................................................................... 8
1.6
中間件運(yùn)維服務(wù) ................................................................................................................... 9
2
運(yùn)維服務(wù)流程 .............................................................................................................................. 10
3
服務(wù)管理制度規(guī)范 ...................................................................................................................... 12
3.1
服務(wù)時(shí)間 ............................................................................................................................. 12
3.2
行為規(guī)范 ............................................................................................................................. 12
3.3
現(xiàn)場(chǎng)服務(wù)支持規(guī)范 ............................................................................................................. 13
3.4
問(wèn)題記錄規(guī)范 ..................................................................................................................... 13
4
應(yīng)急服務(wù)響應(yīng)措施 ...................................................................................................................... 15
4.1
應(yīng)急基本流程 ..................................................................................................................... 15
4.2
預(yù)防措施 ............................................................................................................................. 15
4.3
突發(fā)事件應(yīng)急策略 ............................................................................................................. 16
1 服務(wù)內(nèi)容 1.1 服務(wù)目標(biāo) 運(yùn)行維護(hù)服務(wù)包括,信息系統(tǒng)相關(guān)的主機(jī)設(shè)備、操作系統(tǒng)、數(shù)據(jù)庫(kù)和存儲(chǔ)設(shè)備及其他信息系統(tǒng)的運(yùn)行維護(hù)與安全防范服務(wù),保證用戶現(xiàn)有的信息系統(tǒng)的正常運(yùn)行,降低整體管理成本,提高網(wǎng)絡(luò)信息系統(tǒng)的整體服務(wù)水平。同時(shí)根據(jù)日常維護(hù)的數(shù)據(jù)和記錄,提供用戶信息系統(tǒng)的整體建設(shè)規(guī)劃和建議,更好的為用戶的信息化發(fā)展提供有力的保障。
用戶信息系統(tǒng)的組成主要可分為兩類:硬件設(shè)備和軟件系統(tǒng)。硬件設(shè)備包括網(wǎng)絡(luò)設(shè)備、安全設(shè)備、主機(jī)設(shè)備、存儲(chǔ)設(shè)備等;軟件設(shè)備可分為操作系統(tǒng)軟件、典型應(yīng)用軟件(如:數(shù)據(jù)庫(kù)軟件、中間件軟件等)、業(yè)務(wù)應(yīng)用軟件等。
通過(guò)運(yùn)行維護(hù)服務(wù)的有效管理來(lái)提升用戶信息系統(tǒng)的服務(wù)效率,協(xié)調(diào)各業(yè)務(wù)應(yīng)用系統(tǒng)的內(nèi)部運(yùn)作,改善網(wǎng)絡(luò)信息系統(tǒng)部門與業(yè)務(wù)部門的溝通,提高服務(wù)質(zhì)量。結(jié)合用戶現(xiàn)有的環(huán)境、組織結(jié)構(gòu)、IT 資源和管理流程的特點(diǎn),從流程、人員和技術(shù)三方面來(lái)規(guī)劃用戶的網(wǎng)絡(luò)信息系統(tǒng)的結(jié)構(gòu)。將用戶的運(yùn)行目標(biāo)、業(yè)務(wù)需求與IT 服務(wù)的相協(xié)調(diào)一致。
信息系統(tǒng)服務(wù)的目標(biāo)是,對(duì)用戶現(xiàn)有的信息系統(tǒng)基礎(chǔ)資源進(jìn)行監(jiān)控和管理,及時(shí)掌握網(wǎng)絡(luò)信息系統(tǒng)資源現(xiàn)狀和配置信息,反映信息系統(tǒng)資源的可用性情況和健康狀況,創(chuàng)建一個(gè)可知可控的 IT 環(huán)境,從而保證用戶信息系統(tǒng)的各類業(yè)務(wù)應(yīng)用系統(tǒng)的可靠、高效、持續(xù)、安全運(yùn)行。
服務(wù)項(xiàng)目范圍覆蓋的信息系統(tǒng)資源以下方面的關(guān)鍵狀態(tài)及參數(shù)指標(biāo):
? 運(yùn)行狀態(tài)、故障情況 ? 配置信息 ? 可用性情況及健康狀況性能指標(biāo) ? 統(tǒng)計(jì)運(yùn)維數(shù)椐、提供信息系統(tǒng)管理和工作報(bào)告、歸納總結(jié)并提供用戶想了解的數(shù)椐報(bào)告
1.2 信息資產(chǎn)統(tǒng)計(jì)服務(wù) 此項(xiàng)服務(wù)為基本服務(wù),包含在運(yùn)行維護(hù)服務(wù)中,幫助我們對(duì)用戶現(xiàn)有的信息資產(chǎn)情況進(jìn)行了解,更好的提供系統(tǒng)的運(yùn)行維護(hù)服務(wù)。
服務(wù)內(nèi)容包括:
? 硬件設(shè)備型號(hào)、數(shù)量、版本等信息統(tǒng)計(jì)記錄 ? 軟件產(chǎn)品型號(hào)、版本和補(bǔ)丁等信息統(tǒng)計(jì)記錄 ? 網(wǎng)絡(luò)結(jié)構(gòu)、網(wǎng)絡(luò)路由、網(wǎng)絡(luò) IP 地址統(tǒng)計(jì)記錄 ? 綜合布線系統(tǒng)結(jié)構(gòu)圖的繪制 ? 其它附屬設(shè)備的統(tǒng)計(jì)記錄 硬件設(shè)備清單如下表統(tǒng)計(jì):
1.3 網(wǎng)絡(luò) 、安全 系統(tǒng)運(yùn)維服務(wù) 從網(wǎng)絡(luò)的連通性、網(wǎng)絡(luò)的性能、網(wǎng)絡(luò)的監(jiān)控管理三個(gè)方面實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)系統(tǒng)的運(yùn)維管理。網(wǎng)絡(luò)、安全系統(tǒng)基本服務(wù)內(nèi)容:
序號(hào) 服務(wù)模塊 內(nèi)容描述 提供方 1 現(xiàn)場(chǎng)備件安裝
配合用戶進(jìn)行,按備件到達(dá)現(xiàn)場(chǎng)時(shí)間工程師到達(dá)現(xiàn)場(chǎng)
2 現(xiàn)場(chǎng)軟件升級(jí)
首先分析軟件升級(jí)的必要性和風(fēng)險(xiǎn),配合用戶進(jìn)行軟件升級(jí)
3 現(xiàn)場(chǎng)故障診斷
按服務(wù)級(jí)別:7× 24 小時(shí)
5× 8 小時(shí)
4 電話遠(yuǎn)程技術(shù)支持 7× 24 小時(shí)
5 問(wèn)題管理系統(tǒng) 對(duì)遇到的問(wèn)題進(jìn)行匯總和發(fā)布
網(wǎng)絡(luò)核心交換機(jī)巡視典型作業(yè)計(jì)劃書
系統(tǒng)管理單位:
維保單位:
設(shè)備名:
設(shè)備型號(hào):
管理 IP:
檢查內(nèi)容
參考標(biāo)準(zhǔn)
檢查結(jié)果
檢查結(jié)論
巡視方法描述
巡檢周期
硬件運(yùn)行狀態(tài) 電源運(yùn)行狀態(tài)
□正常
□異常
風(fēng)扇運(yùn)行狀態(tài)
□正常
□異常
模塊運(yùn)行狀態(tài)
□正常
□異常
系統(tǒng) VLAN
狀態(tài)
□正常
□異常
運(yùn)行狀態(tài)檢查 配置
狀態(tài)
□正常
□異常
OSPF
狀態(tài)
□正常
□異常
日志檢查 日志
狀態(tài)
□正常
□異常
其他檢查內(nèi)容
□正常
□異常
□正常
□異常
□正常
□異常
(1) 用戶現(xiàn)場(chǎng)技術(shù)人員值守 根據(jù)用戶的需求提供長(zhǎng)期的用戶現(xiàn)場(chǎng)技術(shù)人員值守服務(wù),保證網(wǎng)絡(luò)的實(shí)時(shí)連通和可用,保障接入交換機(jī)、匯聚交換機(jī)和核心交換機(jī)的正常運(yùn)轉(zhuǎn),F(xiàn)場(chǎng)值守的技術(shù)人員每天記錄網(wǎng)絡(luò)交換機(jī)的端口是否可以正常使用,網(wǎng)絡(luò)的轉(zhuǎn)發(fā)和路由是否正常進(jìn)行,交換機(jī)的性能檢測(cè),進(jìn)行整體網(wǎng)絡(luò)性能評(píng)估,針對(duì)網(wǎng)絡(luò)的利用率進(jìn)行優(yōu)化并提出網(wǎng)絡(luò)擴(kuò)容和優(yōu)化的建議。
現(xiàn)場(chǎng)值守人員還進(jìn)行安全設(shè)備的日常運(yùn)行狀態(tài)的監(jiān)控,對(duì)各種安全設(shè)備的日志檢查,對(duì)重點(diǎn)事件進(jìn)行記錄,對(duì)安全事件的產(chǎn)生原因進(jìn)行判斷和解決,及時(shí)發(fā)現(xiàn)問(wèn)題,防患于未然。
同時(shí)能夠?qū)υO(shè)備的運(yùn)行數(shù)據(jù)進(jìn)行記錄,形成報(bào)表進(jìn)行統(tǒng)計(jì)分析,便于進(jìn)行網(wǎng)絡(luò)系統(tǒng)的分析和故障的提前預(yù)知。具體記錄的數(shù)據(jù)包括:
? 配置數(shù)據(jù) ? 性能數(shù)據(jù) ? 故障數(shù)據(jù) (2) 現(xiàn)場(chǎng) 巡檢服務(wù) 現(xiàn)場(chǎng)巡檢服務(wù)是對(duì)客戶的設(shè)備及網(wǎng)絡(luò)進(jìn)行全面檢查的服務(wù)項(xiàng)目,通過(guò)該服務(wù)可使客戶獲得設(shè)備運(yùn)行的第一手資料,最大可能地發(fā)現(xiàn)存在的隱患,保障設(shè)備穩(wěn)定運(yùn)行。同時(shí),將有針對(duì)性地提出預(yù)警及解決建議,使客戶能夠提早預(yù)防,最大限度降低運(yùn)營(yíng)風(fēng)險(xiǎn)。
巡檢包括的內(nèi)容如下:
編號(hào) 巡檢內(nèi)容 1 硬件運(yùn)行狀態(tài)檢查項(xiàng)目
單板狀態(tài)檢查 電源模塊狀態(tài)檢查 風(fēng)扇狀態(tài)檢查 整機(jī)指示燈狀態(tài)檢查 機(jī)框防塵網(wǎng)檢查 機(jī)房溫度、濕度檢查 設(shè)備地線檢查
2 軟件運(yùn)行情況檢查項(xiàng)目 設(shè)備運(yùn)行情況檢查 網(wǎng)絡(luò)報(bào)文分析 設(shè)備對(duì)接運(yùn)行狀況檢查 路由運(yùn)行情況檢查
3 網(wǎng)絡(luò)整體運(yùn)行情況調(diào)查 網(wǎng)絡(luò)運(yùn)行問(wèn)題調(diào)查 網(wǎng)絡(luò)變更情況調(diào)查 網(wǎng)絡(luò)歷史故障調(diào)查 (3) 網(wǎng)絡(luò)運(yùn)行分析與管理服務(wù) 網(wǎng)絡(luò)運(yùn)行分析與管理服務(wù)是指工程師通過(guò)對(duì)網(wǎng)絡(luò)運(yùn)行狀況、網(wǎng)絡(luò)問(wèn)題進(jìn)行周期性檢查、分析后,為客戶提出指導(dǎo)性建議的一種綜合性高級(jí)服務(wù),其內(nèi)容包括:
服務(wù)內(nèi)容 服務(wù)優(yōu)點(diǎn) 向客戶提供網(wǎng)絡(luò)專家電話號(hào)碼。
保證重大問(wèn)題第一連線至網(wǎng)絡(luò)專家。
網(wǎng)絡(luò)專家組每周與客戶進(jìn)行不少于 2 小時(shí)的電話技術(shù)交流 以最小成本保證及時(shí)解答客戶關(guān)心的技術(shù)問(wèn)題,并就某一領(lǐng)域技術(shù)問(wèn)題展開深層次溝通。
每月向客戶提交 CASE 匯總分析報(bào)告,并可擴(kuò)展到每年 17 次(月度、季度、年度)
使客戶了解網(wǎng)絡(luò)歷史故障情況以及故障預(yù)防建議,最大程度減少網(wǎng)絡(luò)故障隱患,更高效的進(jìn)行網(wǎng)絡(luò)管理。
(4) 重要時(shí)刻專人值守服務(wù) 保證重要時(shí)刻設(shè)備穩(wěn)定運(yùn)行對(duì)客戶成功尤為關(guān)鍵,因此,可對(duì)客戶提供重要時(shí)刻的專人現(xiàn)場(chǎng)值守支持,包括政府客戶的重大會(huì)議期間、金融客戶的年終結(jié)算日、運(yùn)營(yíng)商客戶的生產(chǎn)網(wǎng)重大割接或其它任何客戶認(rèn)為可能對(duì)其業(yè)務(wù)運(yùn)營(yíng)產(chǎn)生重大影響的時(shí)刻。
如需專人值守,客戶需至少提前 3 周與授權(quán)服務(wù)商客戶服務(wù)經(jīng)理聯(lián)系。對(duì)每位合約客戶,授權(quán)服務(wù)商均需按事先合同約定提供專人值守服務(wù)?蛻羧缧璩龊贤s定范圍的更多值守支持,需額外支付相應(yīng)人力和差旅費(fèi)用。
1.4 主機(jī) 、存儲(chǔ) 系統(tǒng)運(yùn) 維服務(wù) 主機(jī)、存儲(chǔ)系統(tǒng)的運(yùn)維服務(wù)包括:主機(jī)、存儲(chǔ)設(shè)備的日常監(jiān)控,設(shè)備的運(yùn)行狀態(tài)監(jiān)控,故障處理,操作系統(tǒng)維護(hù),補(bǔ)丁升級(jí)等內(nèi)容。
主機(jī)存儲(chǔ)系統(tǒng)基本服務(wù)內(nèi)容:
序號(hào) 服務(wù)模塊 內(nèi)容描述 提供方 1 現(xiàn)場(chǎng)備件安裝
配合用戶進(jìn)行。按備件到達(dá)現(xiàn)場(chǎng)時(shí)間工程師到達(dá)現(xiàn)場(chǎng)
2 補(bǔ)丁服務(wù) 消除軟件漏洞給系統(tǒng)帶來(lái)的安全隱患,并對(duì)安裝補(bǔ)丁所引起的系統(tǒng)連鎖反應(yīng)進(jìn)行合理的平衡。
3 升級(jí)服務(wù) 對(duì)系統(tǒng)進(jìn)行軟件或硬件的升級(jí),以改進(jìn)、完善現(xiàn)有系統(tǒng)或消除現(xiàn)有系統(tǒng)的漏洞。
4 現(xiàn)場(chǎng)故障診斷 按服務(wù)級(jí)別:7× 24 小時(shí)
5× 8 小時(shí)
5 電話遠(yuǎn)程技術(shù)支持 7× 24 小時(shí)
6 問(wèn)題管理系統(tǒng) 對(duì)遇到的問(wèn)題進(jìn)行匯總和發(fā)布
7 系統(tǒng)優(yōu)化 對(duì)客戶系統(tǒng)的括主機(jī)、存儲(chǔ)設(shè)備、操作系統(tǒng)、提供優(yōu)化服務(wù)。
現(xiàn)場(chǎng)值守人員可進(jìn)行監(jiān)控管理的內(nèi)容包括:
? CPU 性能管理; ? 內(nèi)存使用情況管理; ? 硬盤利用情況管理; ? 系統(tǒng)進(jìn)程管理; ? 主機(jī)性能管理; ? 實(shí)時(shí)監(jiān)控主機(jī)電源、風(fēng)扇的使用情況及主機(jī)機(jī)箱內(nèi)部溫度; ? 監(jiān)控主機(jī)硬盤運(yùn)行狀態(tài); ? 監(jiān)控主機(jī)網(wǎng)卡、陣列卡等硬件狀態(tài); ? 監(jiān)控主機(jī) HA 運(yùn)行狀況; ? 主機(jī)系統(tǒng)文件系統(tǒng)管理; ? 監(jiān)控存儲(chǔ)交換機(jī)設(shè)備狀態(tài)、端口狀態(tài)、傳輸速度; ? 監(jiān)控備份服務(wù)進(jìn)程、備份情況(起止時(shí)間、是否成功、出錯(cuò)告警); ? 監(jiān)控記錄磁盤陣列、磁帶庫(kù)等存儲(chǔ)硬件故障提示和告警,并及時(shí)解決故障問(wèn)題; ? 對(duì)存儲(chǔ)的性能(如高速緩存、光纖通道等)進(jìn)行監(jiān)控。
小型機(jī)系統(tǒng)巡檢典型作業(yè)計(jì)劃書(P HP 服務(wù)器部分)
系統(tǒng)管理單位:
設(shè)備名:
設(shè)備型號(hào)
設(shè)備序列號(hào)
管理 IP:
檢查內(nèi)容
參考標(biāo)準(zhǔn)
檢查結(jié)果
狀態(tài)是否正常
巡檢方法描述
巡檢周期
硬件運(yùn)行狀態(tài) 電源指示燈
▅正常
□異常
面板指示燈
▅正常
□異常
內(nèi)置磁帶機(jī)
▅正常
□異常
CPU 狀態(tài)
▅正常
□異常
內(nèi)存狀態(tài)
▅正常
□異常
磁盤狀態(tài)
▅正常
□異常
網(wǎng)卡狀態(tài)
▅正常
□異常
HBA 卡運(yùn)行狀態(tài)
▅正常
□異常
系統(tǒng)檢查 系統(tǒng)日志
▅正常
□異常
▅正常
□異常
文件系統(tǒng),包括磁盤卷剩余空間
▅正常
□異常
硬件檢測(cè)
▅正常
□異常
交換分區(qū)
▅正常
□異常
固件版本
▅正常
□異常
補(bǔ)丁包版本
▅正常
□異常
系統(tǒng)鏡像
▅正常
□異常
存儲(chǔ)磁盤
▅正常
□異常
存儲(chǔ)驅(qū)動(dòng)
▅正常
□異常
進(jìn)程狀態(tài)
▅正常
□異常
系統(tǒng)性能檢查 CPU 利用率
▅正常
□異常
內(nèi)存利用率
▅正常
□異常
磁盤 I/O 性能
▅正常
□異常
數(shù)據(jù)庫(kù)運(yùn)行狀態(tài) 數(shù)據(jù)庫(kù)安裝目錄
▅正常
□異常
數(shù)據(jù)庫(kù)進(jìn)程狀態(tài)
▅正常
□異常
集群檢查 集群進(jìn)程狀態(tài)
▅正常
□異常
集群日志
▅正常
□異常
存儲(chǔ)檢查 存儲(chǔ)設(shè)備故障燈狀態(tài)
▅正常
□異常
SAN 交換機(jī)端口狀態(tài)
▅正常
□異常
存儲(chǔ)交換機(jī)環(huán)境狀態(tài)
▅正常
□異常
系統(tǒng)故障報(bào)告
▅正常
□異常
1.5 數(shù)據(jù)庫(kù)系統(tǒng)運(yùn)維服務(wù) 數(shù)據(jù)庫(kù)運(yùn)行維護(hù)服務(wù)是包括主動(dòng)數(shù)據(jù)庫(kù)性能管理,數(shù)據(jù)庫(kù)的主動(dòng)性能管理對(duì)系統(tǒng)運(yùn)維非常重要。通過(guò)主動(dòng)式性能管理可了解數(shù)據(jù)庫(kù)的日常運(yùn)行狀態(tài),識(shí)別數(shù)據(jù)庫(kù)的性能問(wèn)題發(fā)生在什么地方,有針對(duì)性地進(jìn)行性能優(yōu)化。同時(shí),密切注意數(shù)據(jù)庫(kù)系統(tǒng)的變化,主動(dòng)地預(yù)防可能發(fā)生的問(wèn)題。
數(shù)據(jù)庫(kù)運(yùn)行維護(hù)服務(wù)還包括快速發(fā)現(xiàn)、診斷和解決性能問(wèn)題,在出現(xiàn)問(wèn)題時(shí),及時(shí)找出性能瓶頸,解決數(shù)據(jù)庫(kù)性能問(wèn)題,維護(hù)高效的應(yīng)用系統(tǒng)。
數(shù)據(jù)庫(kù)運(yùn)行維護(hù)服務(wù),主要工作是使用技術(shù)手段來(lái)達(dá)到管理的目標(biāo),以系統(tǒng)最終的運(yùn)行維護(hù)為目標(biāo),提高用戶的工作效率。
具體數(shù)據(jù)庫(kù)運(yùn)行維護(hù)監(jiān)控的基本服務(wù)內(nèi)容包括:
序號(hào) 服務(wù)模塊 內(nèi)容描述 提供方 1 Oracle 數(shù)據(jù)庫(kù) 7*24 電話支持服務(wù)
每周 7 天,每天 24 小時(shí)支持中心電話,電子郵件答詢,以滿足業(yè)務(wù)發(fā)展的需要。
Oracle 產(chǎn)品技術(shù)專家直接同客戶對(duì)話,幫助解決客戶提出的疑難問(wèn)題。
根據(jù)問(wèn)題的嚴(yán)重程度,將優(yōu)先解決客戶認(rèn)為是關(guān)鍵而緊急的任務(wù)。
對(duì)客戶提出的一般性問(wèn)題進(jìn)行技術(shù)咨詢、指導(dǎo)。
定期的客戶管理報(bào)告, 避免問(wèn)題再度發(fā)生。
2 Oracle 數(shù)據(jù)庫(kù)產(chǎn)品 現(xiàn)場(chǎng)服務(wù)響應(yīng) 數(shù)據(jù)庫(kù)宕機(jī) 數(shù)據(jù)壞塊 影響業(yè)務(wù)不能進(jìn)行的產(chǎn)品問(wèn)題 軟件產(chǎn)品的更新及維護(hù)。
3 Oracle 數(shù)據(jù)庫(kù)產(chǎn)品 系統(tǒng)健康檢查 對(duì)系統(tǒng)的配置及運(yùn)作框架提出建議,以幫助您得到一個(gè)更堅(jiān)強(qiáng)可靠的運(yùn)作環(huán)境 降低系統(tǒng)潛在的風(fēng)險(xiǎn),包括數(shù)據(jù)丟失、安全漏洞、系統(tǒng)崩潰、性能降低及資源緊張 檢查并分析系統(tǒng)日志及跟蹤文件,發(fā)現(xiàn)并排除數(shù)據(jù)庫(kù)系統(tǒng)錯(cuò)誤隱患 檢查數(shù)據(jù)庫(kù)系統(tǒng)是否需要應(yīng)用最新的補(bǔ)丁集 檢查數(shù)據(jù)庫(kù)空間的使用情況
序號(hào) 服務(wù)模塊 內(nèi)容描述 提供方 協(xié)助進(jìn)行數(shù)據(jù)庫(kù)空間的規(guī)劃管理 檢查數(shù)據(jù)庫(kù)備份的完整性 監(jiān)控?cái)?shù)據(jù)庫(kù)性能 確認(rèn)系統(tǒng)的資源需求 明確您系統(tǒng)的能力及不足 優(yōu)化 Oracle Server 的表現(xiàn) 通過(guò)改善系統(tǒng)環(huán)境的穩(wěn)定性來(lái)降低潛在的系統(tǒng)宕機(jī)時(shí)間 4 Oracle 數(shù)據(jù)庫(kù)產(chǎn)品 性能調(diào)優(yōu) 分析用戶的應(yīng)用類型和用戶行為 評(píng)價(jià)并修改 ORACLE 數(shù)據(jù)庫(kù)的參數(shù)設(shè)置 評(píng)價(jià)并調(diào)整 ORACLE 數(shù)據(jù)庫(kù)的數(shù)據(jù)分布 評(píng)價(jià)應(yīng)用對(duì)硬件和系統(tǒng)的使用情況,并提出建議 利用先進(jìn)的性能調(diào)整工具實(shí)施數(shù)據(jù)庫(kù)的性能調(diào)整 培訓(xùn)用戶有關(guān)性能調(diào)整的概念 提供用戶完整的性能調(diào)整報(bào)告和解決方法
1.6 中間件運(yùn)維服務(wù) 中間件管理是指對(duì) BEA Weblogic、MQ 等中間件的日常維護(hù)管理和監(jiān)控工作,提高對(duì)中間件平臺(tái)事件的分析解決能力,確保中間件平臺(tái)持續(xù)穩(wěn)定運(yùn)行。中間件監(jiān)控指標(biāo)包括配置信息管理、故障監(jiān)控、性能監(jiān)控。
? 執(zhí)行線程:監(jiān)控 WebLogic 配置執(zhí)行線程的空閑數(shù)量。
? JVM 內(nèi)存:JVM 內(nèi)存曲線正常,能夠及時(shí)的進(jìn)行內(nèi)存空間回收。
? JDBC 連接池:連接池的初始容量和最大容量應(yīng)該設(shè)置為相等,并且至少等于執(zhí)行線程的數(shù)量,以避免在運(yùn)行過(guò)程中創(chuàng)建數(shù)據(jù)庫(kù)連接所帶來(lái)的性能消耗。
? 檢查 WEBLOG 日志文件是否有異常報(bào)錯(cuò) ? 如果有 WEBLOG 集群配置,需要檢查集群的配置是否正常。
2 運(yùn)維服務(wù) 流程 建議用戶采用的服務(wù)方式為兩種:一種為技術(shù)人員現(xiàn)場(chǎng)值守,另一種是定期巡檢結(jié)合故障現(xiàn)場(chǎng)服務(wù)。
技術(shù)人員現(xiàn)場(chǎng)值守運(yùn)行維護(hù)服務(wù)的基本操作流程如下圖所示:
IT資源情況匯總故障記錄技術(shù)人員用戶現(xiàn)場(chǎng)值守,日常狀態(tài)監(jiān)控提交給用戶信息系統(tǒng)運(yùn)行維護(hù)報(bào)告和系統(tǒng)運(yùn)行分析報(bào)告記錄到維護(hù)數(shù)據(jù)庫(kù)備件更換 故障現(xiàn)場(chǎng)解決主動(dòng)式信息系統(tǒng)性能偵測(cè)故障現(xiàn)場(chǎng)解決系統(tǒng)運(yùn)維日志
定期巡檢結(jié)合故障現(xiàn)場(chǎng)運(yùn)行維護(hù)服務(wù)的基本操作流程如下圖所示:
技術(shù)專家7*24小時(shí)服務(wù)響應(yīng)IT資源情況匯總用戶故障報(bào)修備件更換 技術(shù)人員現(xiàn)場(chǎng)故障解決硬件設(shè)備故障軟件故障故障記錄用戶現(xiàn)場(chǎng)巡檢MICROSOFT CORPORATION用戶簽署故障解決單提交給用戶信息系統(tǒng)運(yùn)行維護(hù)報(bào)告和系統(tǒng)運(yùn)行分析報(bào)告巡檢記錄及系統(tǒng)可用性分析記錄到運(yùn)行維護(hù)數(shù)據(jù)庫(kù)用戶
3 服務(wù)管理制度規(guī)范 3.1 服務(wù)時(shí)間 (1) 接收服務(wù)請(qǐng)求和咨詢:
? 在 5*8 小時(shí)工作時(shí)間內(nèi)設(shè)置由專人職守的熱線電話,接聽(tīng)內(nèi)部的服務(wù)請(qǐng)求,并記錄服務(wù)臺(tái)事件處理結(jié)果。
(2) 在非工作時(shí)間設(shè)置有專人 7*24 小時(shí)接聽(tīng)的移動(dòng)電話熱線,用于解決內(nèi)部的技術(shù)問(wèn)題以及接聽(tīng) 7*24 小時(shí)機(jī)房監(jiān)控人員的機(jī)房突發(fā)情況匯報(bào)。
(3) 服務(wù)響應(yīng)時(shí)間:
故障級(jí)別
響應(yīng)時(shí)間
故障解決時(shí)間
I I 級(jí):屬于緊急問(wèn)題;其具體現(xiàn)象為:系統(tǒng)崩潰導(dǎo)致業(yè)務(wù)停止、數(shù)據(jù)丟失。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 12 小時(shí)以內(nèi) I II 級(jí):屬于嚴(yán)重問(wèn)題;其具體現(xiàn)象為:出現(xiàn)部分部件失效、系統(tǒng)性能下降但能正常運(yùn)行,不影響正常業(yè)務(wù)運(yùn)作。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 24 小時(shí)以內(nèi) I III 級(jí):屬于較嚴(yán)重問(wèn)題;其具體現(xiàn)象為:出現(xiàn)系統(tǒng)報(bào)錯(cuò)或警告,但業(yè)務(wù)系統(tǒng)能繼續(xù)運(yùn)行且性能不受影響。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 48 小時(shí)以內(nèi) V IV 級(jí):屬于普通問(wèn)題;其具體現(xiàn)象為:系統(tǒng)技術(shù)功能、安裝或配置咨詢,或其他顯然不影響業(yè)務(wù)的預(yù)約服務(wù)。
30 分鐘,2 小時(shí)內(nèi)提交故障處理方案 5 天內(nèi) ? 技術(shù)支持人員在解決故障時(shí),會(huì)最大限度保護(hù)好數(shù)據(jù),做好故障恢復(fù)的文檔,力爭(zhēng)恢復(fù)到故障點(diǎn)前的業(yè)務(wù)狀態(tài)。對(duì)于“系統(tǒng)癱瘓,業(yè)務(wù)系統(tǒng)不能運(yùn)轉(zhuǎn)”的故障級(jí)別,如果不能于 12 小時(shí)內(nèi)解決故障,將在 16 小時(shí)內(nèi)提出應(yīng)急方案,確保業(yè)務(wù)系統(tǒng)的運(yùn)行。故障解決后 24 小時(shí)內(nèi),提交故障處理報(bào)告。說(shuō)明故障種類、故障原因、故障解決中使用的方法及故障損失等情況。
3.2 行為規(guī)范 (1) 遵守用戶的各項(xiàng)規(guī)章制度,嚴(yán)格按照用戶相應(yīng)的規(guī)章制度辦事。
(2) 與用戶運(yùn)行維護(hù)體系其他部門和環(huán)節(jié)協(xié)同工作,密切配合,共同開展技術(shù)支持工作。
(3) 出現(xiàn)疑難技術(shù)、業(yè)務(wù)問(wèn)題和重大緊急情況時(shí),及時(shí)向負(fù)責(zé)人報(bào)告。
(4) 現(xiàn)場(chǎng)技術(shù)支持時(shí)要精神飽滿,穿著得體,談吐文明,舉止莊重。接聽(tīng)電話時(shí)要文明禮貌,語(yǔ)言清晰明了,語(yǔ)氣和善。
(5) 遵守保密原則。對(duì)被支持單位的網(wǎng)絡(luò)、主機(jī)、系統(tǒng)軟件、應(yīng)用軟件等的密碼、核心參數(shù)、業(yè)務(wù)數(shù)據(jù)等負(fù)有保密責(zé)任,不得隨意復(fù)制和傳播。
3.3 現(xiàn)場(chǎng)服務(wù)支持規(guī)范 運(yùn)維服務(wù)人員要做到耐心、細(xì)心、熱心的服務(wù)。工作要做到事事有記錄、事事有反饋、重大問(wèn)題及時(shí)匯報(bào)。嚴(yán)格遵守工作作息時(shí)間,嚴(yán)格按照服務(wù)工作流程操作。
(1) 現(xiàn)場(chǎng)支持工程師應(yīng)著裝整潔、言行禮貌大方,技術(shù)專業(yè),操作熟練、嚴(yán)謹(jǐn)、規(guī)范;現(xiàn)場(chǎng)支持時(shí)必須遵守用戶單位的相關(guān)規(guī)章制度。
(2) 現(xiàn)場(chǎng)支持工程師在進(jìn)行現(xiàn)場(chǎng)支持工作時(shí)必須在保證數(shù)據(jù)和系統(tǒng)安全的前提下開展工作。
(3) 現(xiàn)場(chǎng)支持時(shí)出現(xiàn)暫時(shí)無(wú)法解決的故障或其他新的故障時(shí),應(yīng)告知用戶并及時(shí)上報(bào)負(fù)責(zé)人,尋找其他解決途徑。
(4) 故障解決后,現(xiàn)場(chǎng)支持工程師要詳細(xì)記錄問(wèn)題的發(fā)生時(shí)間、地點(diǎn)、提出人和問(wèn)題描述,并形成書面文檔,必要時(shí)應(yīng)向用戶介紹故障出現(xiàn)的原因及預(yù)防方法和解決技巧。
3.4 問(wèn)題記錄規(guī)范 根據(jù)使用人員提出問(wèn)題的類別,將問(wèn)題分為咨詢類問(wèn)題和系統(tǒng)缺陷類問(wèn)題二類:咨詢類問(wèn)題是指通過(guò)服務(wù)熱線或現(xiàn)場(chǎng)解疑等方式能夠當(dāng)場(chǎng)解決用戶提出的問(wèn)題,具有問(wèn)題解答直接、快速和實(shí)時(shí)的特點(diǎn),該問(wèn)題到現(xiàn)場(chǎng)支持人員處即可中止,對(duì)于該類問(wèn)題的記錄可使用咨詢類問(wèn)題記錄模版進(jìn)行記錄。系統(tǒng)缺陷類問(wèn)題是指使用人員提出的問(wèn)題涉及到系統(tǒng)相應(yīng)環(huán)節(jié)的確認(rèn)修改,需要經(jīng)過(guò)逐級(jí)提交、診斷、確認(rèn)、處理和回復(fù)等環(huán)節(jié),處理解決需要項(xiàng)目組的分析確認(rèn),問(wèn)題有解決方案后,將解決方案反饋給用戶。具體提交流程如下:
(1) 問(wèn)題提交。應(yīng)用信息系統(tǒng)的用戶發(fā)現(xiàn)屬于系統(tǒng)缺陷類的問(wèn)題時(shí),填寫系統(tǒng)缺陷類問(wèn)題提交單,提交服務(wù)支持中心。
(2) 問(wèn)題分析。服務(wù)中心接到用戶提交的問(wèn)題單,要組織相應(yīng)人員對(duì)問(wèn)題單中描述的問(wèn)題進(jìn)行分析研判,確定問(wèn)題的類型(技術(shù)問(wèn)題、業(yè)務(wù)問(wèn)題或者操作問(wèn)題)。屬于技術(shù)問(wèn)題,提交服務(wù)中心技術(shù)人員對(duì)存在的問(wèn)題提出具體的處理意見(jiàn)和建議;屬于業(yè)務(wù)問(wèn)題,提交服務(wù)中心業(yè)務(wù)人員進(jìn)行處理;屬于操作問(wèn)題,可安排相關(guān)人員對(duì)問(wèn)題提出人進(jìn)行解釋,并將系統(tǒng)缺陷類問(wèn)題提交單轉(zhuǎn)為系統(tǒng)咨詢類問(wèn)題提交單。
(3) 問(wèn)題確認(rèn)、解決。服務(wù)中心的技術(shù)人員和業(yè)務(wù)人員收到系統(tǒng)缺陷類問(wèn)題提交單后,對(duì)提交的問(wèn)題進(jìn)行歸類匯總和分析、確認(rèn)?梢越鉀Q的,明確問(wèn)題解決的具體處理建議和措施,經(jīng)主管領(lǐng)導(dǎo)簽字同意后,交實(shí)施人員進(jìn)行解決方案的實(shí)施。服務(wù)人員確認(rèn)是否解決,并將解決方法附在系統(tǒng)缺陷類問(wèn)題提交單上反饋給問(wèn)題提出人員。
(4) 問(wèn)題上報(bào)。服務(wù)人員收到經(jīng)業(yè)務(wù)或技術(shù)人員確認(rèn)的系統(tǒng)缺陷類問(wèn)題提交單后,上報(bào)服務(wù)中心。
(5) 問(wèn)題回復(fù)。服務(wù)中心根據(jù)提交問(wèn)題的進(jìn)行分析,制定解決方案并進(jìn)行實(shí)施的解決,同時(shí)做好變更記錄。將解決方案匯總后及時(shí)向問(wèn)題提交單位或問(wèn)題交辦單位作出回復(fù),并將分析過(guò)程和問(wèn)題產(chǎn)生原因一并提交。
4 應(yīng)急服務(wù)響應(yīng)措施 針對(duì)項(xiàng)目制定了詳盡的設(shè)計(jì)、應(yīng)急處理預(yù)案,整個(gè)流程嚴(yán)謹(jǐn)而有序。但是,在服務(wù)維護(hù)過(guò)程中,意外情況將難以完全避免。下面,我們將對(duì)項(xiàng)目實(shí)施的突發(fā)風(fēng)險(xiǎn)進(jìn)行詳細(xì)分析,并且針對(duì)各類突發(fā)事件,設(shè)計(jì)了相應(yīng)的預(yù)防與解決措施,同時(shí)提供了完整的應(yīng)急處理流程。
4.1 應(yīng)急基本流程 出現(xiàn)突發(fā)情況報(bào)項(xiàng)目經(jīng)理項(xiàng)目經(jīng)理協(xié)調(diào)、處理結(jié)束問(wèn)題報(bào)告單采取措施避免類似事件發(fā)生處理記錄情況通報(bào)單 維護(hù)服務(wù)應(yīng)急處理流程 4.2 預(yù)防措施 針對(duì)上門服務(wù)過(guò)程中可能遇到的各種各樣的風(fēng)險(xiǎn),針對(duì)一些可能出現(xiàn)的情況,制定了一系列預(yù)防處理措施,舉例如下:
類型 事件 預(yù)防措施 處理 應(yīng)用軟件 無(wú)法啟動(dòng)軟件可執(zhí)行文件 上門人員提前準(zhǔn)備好各類需維護(hù)軟件安裝程序 將應(yīng)用軟件數(shù)據(jù)文件備份后,重新安裝 軟件打開過(guò)程中或運(yùn)行中異常錯(cuò)誤關(guān)閉 上門人員準(zhǔn)備好安裝程序,操作系統(tǒng)優(yōu)化和修補(bǔ)軟件,查殺病毒軟件 判斷出錯(cuò)原因,備份數(shù)據(jù),采取相關(guān)修復(fù)措施 操作系統(tǒng) 使用者本機(jī)操作系統(tǒng)異;蛳到y(tǒng)資源占用嚴(yán)重 準(zhǔn)備好系統(tǒng)檢查程序及修補(bǔ)程序,以及查殺病毒告知使用者錯(cuò)誤原因可能類型,提出解決方案,
類型 事件 預(yù)防措施 處理 軟件 經(jīng)使用者認(rèn)可后采取相應(yīng)措施 B/S 結(jié)構(gòu)系統(tǒng),IE 瀏覽器異常或無(wú)法下載控件 準(zhǔn)備流氓軟件清理程序、修復(fù)瀏覽器軟件、查殺病毒軟件 檢查 IE 瀏覽器選項(xiàng)設(shè)置,分析原因進(jìn)行修復(fù) 網(wǎng)絡(luò)或服務(wù)器 B/S 結(jié)構(gòu)系統(tǒng)網(wǎng)絡(luò)流量異;蚍⻊(wù)器登錄異常 判斷服務(wù)器是否異常,否則準(zhǔn)備殺毒軟件 檢查網(wǎng)絡(luò)流量,流量異常小則報(bào)修網(wǎng)絡(luò)服務(wù)商,流量異常大則查殺病毒
4.3 突發(fā)事件應(yīng)急策略 系統(tǒng)運(yùn)維應(yīng)急方案是對(duì)中斷或嚴(yán)重影響業(yè)務(wù)的故障,如宕機(jī)、數(shù)據(jù)丟失、業(yè)務(wù)中斷等,進(jìn)行快速響應(yīng)和處理,在最短時(shí)間內(nèi)恢復(fù)業(yè)務(wù)系統(tǒng),將損失降到最低。在系統(tǒng)維護(hù)過(guò)程中,突發(fā)事件的出現(xiàn)將是很難完全避免的,針對(duì)這種情況,設(shè)計(jì)了完善的突發(fā)事件應(yīng)急策略。
系統(tǒng)巡檢人員要定期規(guī)范檢查各硬件設(shè)備的運(yùn)轉(zhuǎn)情況和應(yīng)用軟件運(yùn)行情況,同時(shí)做好日常的數(shù)據(jù)增量備份和定期全備份。對(duì)發(fā)現(xiàn)的問(wèn)題在報(bào)各級(jí)負(fù)責(zé)人的同時(shí),要協(xié)調(diào)相關(guān)資源分析問(wèn)題根源,確定解決方案和臨時(shí)解決措施,避免造成更大的影響。問(wèn)題得到穩(wěn)定或徹底解決后,要形成問(wèn)題匯報(bào),避免以后類似重大緊急情況的發(fā)生。
對(duì)發(fā)現(xiàn)的問(wèn)題在報(bào)負(fù)責(zé)人的同時(shí),要協(xié)調(diào)相關(guān)資源分析問(wèn)題根源,確定解決方案和臨時(shí)解決措施,避免造成更大的影響。問(wèn)題得到穩(wěn)定或徹底解決后,要形成問(wèn)題匯報(bào),避免以后類似重大緊急情況的發(fā)生。
當(dāng)獲悉出現(xiàn)突發(fā)事件時(shí),技術(shù)支持人員可以立即從知識(shí)庫(kù)中獲取相應(yīng)的應(yīng)急策略,并綜合用戶方的具體情況,給出相關(guān)解決方案,然后在第一時(shí)間以電話、郵件支持或現(xiàn)場(chǎng)服務(wù)的方式幫助用戶解決問(wèn)題,盡最大努力減小突發(fā)事件對(duì)用戶日常應(yīng)用的影響。
緊急情況 預(yù)防措施 應(yīng)急策略 硬件損壞 項(xiàng)目單位操作用電腦硬件損壞 在磁盤數(shù)據(jù)未丟失情況下,保證數(shù)據(jù)安全性,建議項(xiàng)目單位替換相關(guān)硬件。
操作失誤 加強(qiáng)培訓(xùn)力度,掌握培訓(xùn)效果,檢驗(yàn)操作人員操作水準(zhǔn),提示注意事項(xiàng)。
操作失誤未造成即成結(jié)果或數(shù)據(jù)未丟失情況下,保障數(shù)據(jù)安全,反之,協(xié)調(diào)相關(guān)部門,進(jìn)行補(bǔ)救。對(duì)操作人員強(qiáng)調(diào)注意事項(xiàng) 配置丟失 培訓(xùn)時(shí)強(qiáng)調(diào)使用前配置方法和步驟,并特別提示需在使用前按要求操作 派出上門維護(hù)、培訓(xùn)人員重新配置,并耐心講解。
數(shù)據(jù)丟失 培訓(xùn)時(shí)強(qiáng)調(diào)使用過(guò)程中注意定期備份重要數(shù)據(jù),日常維護(hù)過(guò)程中,上門服務(wù)人員實(shí)時(shí)備份數(shù)據(jù)并告知用戶 協(xié)調(diào)有關(guān)部門,進(jìn)行補(bǔ)救,無(wú)法補(bǔ)救,提交報(bào)告說(shuō)明原因。
突發(fā)事件應(yīng)急策略服務(wù)流程圖如下:
技術(shù)故障客戶服務(wù)中心專職服務(wù)人員項(xiàng)目單位電話、傳真、 郵件等方式客戶服務(wù)中心技術(shù)人員診斷報(bào)告判斷故障類型配置問(wèn)題線路問(wèn)題操作問(wèn)題軟件問(wèn)題設(shè)備問(wèn)題聯(lián)系相關(guān)線路提供商提供正確的操作建議采取相關(guān)維護(hù)措施核實(shí)配置內(nèi)容,提供恢復(fù)手段轉(zhuǎn)入設(shè)備保修流程派出技術(shù)人員現(xiàn)場(chǎng)診斷故障核實(shí)技術(shù)故障現(xiàn)象問(wèn)題解決否其他問(wèn)題 提供相應(yīng)的應(yīng)急策略向項(xiàng)目單位提供有關(guān)故障的解決的詳細(xì)說(shuō)明是派出資深技術(shù)人員或書面報(bào)告項(xiàng)目單位否遠(yuǎn)程或現(xiàn)場(chǎng)協(xié)助故障解決方法報(bào)告
相關(guān)熱詞搜索:信息系統(tǒng) 方案
熱點(diǎn)文章閱讀