论坛首页 综合技术论坛

[转]网管IT服务管理五个心得(2)----突发事件管理 摆平漏子不罚款

浏览 1642 次
该帖已经被评为隐藏帖
作者 正文
   发表时间:2007-08-22  
2 突发事件管理 摆平漏子不罚款

建立了服务台管理之后,夏忙从八爪鱼变成了随需应变的百变神形。因为响应及时,夏忙最近没听见什么抱怨。

一天,电脑提示收到一封事件警报邮件,同时,另外三封事件报警邮件也发到了夏忙的信箱。桌上的电话刺耳地响起,另外两位同事的电话声此起彼伏。

销售部的同事反映无法接收邮件。夏忙刚刚扑到销售部查问题,不多久,人事那边也找夏忙,人事部的PC系统崩溃了,夏忙指挥同事去人事部处理这一问题。 事情还在处理中,忽然又接到一个报警,说财务的机器上不了网,现在是月底要报税,事情紧急。于是IT部门最后一个人去了财务部。夏忙忙乱得一头大汗,他不 知道假如再来一桩突发事件,他该怎么办。此时,一直有人在找夏忙,有的机器中毒,有的机器蓝屏了等等。夏忙只好不停地说,“稍等——,稍等——”,一位急 脾气的同事不耐烦了,“我急着要一份数据,硬盘却坏了,能不能先给我看看?”

“手边有紧急的事没处理完呢。”

“那你得分个轻重缓急啊。”夏忙一听,觉得有理,层出不穷的技术故障让IT部门的人疲于奔命,成了“救火队”。可状态不能老这么持续下去,需要有一套流程和方法来有序地处理。他决定把手边的事情忙完之后,好好思考一下。

经过紧张的排查,夏忙得出的结论是,网络中心的一台交换机出了故障,夏忙迅速联系网络中心并启用了备用的交换机。20分钟后,网络恢复正常。

趁着尘埃暂定,夏忙赶紧翻资料,能给目前无序的忙乱状态理出一个解决思路。他发现,对于突发事件,最重要的是避免业务中断。对此,首先要确定突发事件 管理流程,通过区分突发事件的优先级来确保流程的有效执行。显然,每个人都会认为自己故障是最紧急的,因此必须理清是火烧眉毛还是常规慢性病。

夏忙反思,网络中心那台出故障的交换机上连接着公司的销售部邮件服务器、库存数据库服务器、人力资源服务器,这一事故将直接影响到公司内关键部门的正 常生产,应该属于紧急一级,如果不尽快处理将发生一级生产事故;而急脾气同事的事件则属于一般级别。因此先处理网络中心交换机问题是对的。

但是自己在紧急事件的处理工时上把握不够,刚才用了大约3个工时来处理交换机的问题。那么如果当自己在规定的时间内不能解决或没有解决某个突发事件 时,又该怎么办?一般来说,如果不能在规定时间内解决,需将处理任务交给更有经验的支持人员。这叫突发事件升级,通常有两种方式:一、职能升级,安排更多 的专家或授予更多的特权以解决事故;二、层次升级,出现在所需的权限和资源不够的时候。

突发事件管理可以帮助IT部门更加系统、快速地处理突发事件,但是只是规范处理过程,以尽快恢复故障。好比是急诊抢救,治标不治本。

要使突发事件管理有质的提高,治标也治本,一种切实有效的方法就是问题管理流程。



小贴士:

当IT服务台必须同时处理数个突发事件时,由于受时间、资源和人力等的限制而无法实现时,首先要排定处理的先后次序,针对不同的优先级处理。

确定突发事件处理优先级,需要综合考虑突发事件的影响、紧迫性、大小、范围、复杂程度和当前可供资源。
论坛首页 综合技术版

跳转论坛:
Global site tag (gtag.js) - Google Analytics