第6章 IT服务运营管理

第6章 IT服务运营管理

6.1 概述

大量企业的实践表明,IT服务运营方面的问题更多的不是来自产品或技术(如硬件、软件、网络、电力故障等)方面,而是来自管理方面。IT服务的提供者,无论是企业内部的IT部门,还是外部的IT服务提供商,其IT服务运营的主要目的就是提供低成本、高质量的IT服务。为了达成上述目的,需要在IT服务运营的过程中对人员要素、资源要素、技术要素和过程要素进行有效的管控;同时,客户是IT服务运营过程的直接参与者,IT服务的提供者应控制客户的预期,适当地引导客户以提高其在服务过程中的配合程度,从而有效地达成客户满意。

6.2 人员要素管理

第6章 IT服务运营管理

对于IT服务来说,重要的是服务过程中给予客户的实际体验和感知,所以IT服务人员在服务业务中的角色和作用对业务关系的有效性和持续性具有重要的影响。

因此,在IT服务运营中,需要通过对人员进行有效评价后,进行有效管理与培养,并充分调动人员的积极性,稳定服务团队,保证服务项目人员的连续性,确保人员能力跟上客户需求的变化发展,最终保证客户对服务的认可。

人员管理成功的关键因素包括:
⓵是否具有成熟的知识管理体系;
⓶岗位培训是否充足且适用;
⓷团队能力的互备性;
⓸人员考核指标设定是否符合SMART原则;
⓹人员考核结果应用是否真正落地有效。

人员要素风险控制如表6.1所示。

表6.1 人员要素风险控制

可能的风险影响控制措施
沟通问题影响团队协作建立良好的沟通协作机制,进行服务意识及沟通能力培训
人员连续性问题服务持续性实行有效的人员连续性管理措施
负面情绪影响团队士气及工作积极性引导积极向上的团队文化,举行团队活动等其他方式进行团队建设
考核指标不明确无法评估和执行考核按照SMART原则定义人员绩效指标
6.2.1 人员储备与连续性管理

在IT服务运营实践中,通常会出现工程师离岗、离职或其他意外情况,造成服务人员脱离现有服务项目的情况。人员连续性主要面临的场景包括:人员离职和人员调岗。服务内容变更引发的人员需求变化包括:IT服务项目内容、范围变更,现有服务人员已不能满足项目服务的需要,需要进行人员数量的补充或能力提升。

  1. 目标

(1)保证IT服务连续性,满足客户对服务质量及满意度的要求。

(2)保持客户对IT服务的信心和信任,并获取支持。

(3)保持供应商及第三方接口关系的连续性。

(4)保持供应商及第三方的信心,并获取支持。

  1. 活动

人员连续性管理活动可以分为预防性活动和被动性活动。

(1)预防性活动。

  • 服务能力规划:在进行IT服务人员配备时,通常要预留一定的服务能力空间,也是能力管理流程的要求。预留服务能力空间一方面可以在遇到突发服务支持时维持正常的服务水平及质量,另一方面可以在出现人员离职、调岗等情况时,剩余能力得到有效的补充和释放。如某服务商在年初确定人员配置时,以20%的冗余作为配置基准,以应对突发支持需求及年中因客户业务规模扩大等原因引发的结构性支持增长。
  • 知识管理及培训:定期对IT服务运营过程中的知识进行积累和总结,形成标准化的知识体系,并定期举行知识培训,使服务能力得到快速复制和推广,在遇到人员连续性问题时,进行快速的交接和补充。
  • 岗位互备及轮岗:加强对核心岗位的互备,避免因关键人员离职带来的服务能力下降,同时可以采取轮岗的方式,在实践中培养、检验、巩固后备人员能力。
  • 识别能力发展曲线:服务团队人员随着时间的推移,其服务能力将逐步提升。在IT服务项目实践中,项目人员通常会经历学习期、提升期、稳定期三个过程;要识别不同服务内容的学习周期,以便制订相配套的人员连续性管理计划。如桌面支持服务从学习期到稳定期只需3个月,而ERP从学习期到稳定期可能需要1~2年。
  • 明确岗位交接管理说明:以制度的形式明确约束离职、调岗人员行为,引导正向积极的交接与知识共享。交接形式包括培训、知识文档、岗位切换指导、需跟进项目及重点工作说明等。
  • 与客户、供应商及第三方明确相关的人员连续性管理流程:如服务协议中已约定相关流程的,按服务协议流程执行,未明确相关接口人员连续性流程的,系统规划与管理师有责任主动建立相关管理流程。

(2)被动性活动。

被动性活动是指在发生人员连续性事件时,所采取的连续性管理措施,包括:

  • 岗位交接及培训:一旦获悉人员离职或调岗信息,需及时启动岗位交接流程。如新人无法及时到岗,可先面向现有服务团队其他成员进行岗位交接,再由该交接入向新人进行知识转移和传递,预留有岗位培训交接时间的,可直接面向新人员进行岗位交接。
  • 面向客户及服务团队进行人员更换说明:提前向客户及服务团队成员通报人员更换信息,面向双方确认新人员身份的合法性,获得客户的支持和理解。
  • 面向供应商及相关第二方进行接口关系变更:及时向供应商及相关第三方通报人员更换信息,确认新人员身份的合法性,及时变更相关接口关系。
  • 人员连续性安全管理:在IT服务项目实践中,人员连续性安全管理通常是岗位交接过程中易被忽视的问题,需给予足够的重视。这里所说的安全除包括安全培训外,还应及时消除原岗位人员接触的服务信息权限,包括清除个人账号、更换原授权系统操作口令等。
6.2.2 人员能力评价与管理

在IT服务运营中,可对人员能力进行有效评价与管理,对人员的培养、管理均提供有效的支持。

  1. 目标

建立人员能力模型,对人员能力进行评价与分析,提供人员能力培养与晋升的信息。

  1. 活动

(1)建立岗位职责的能力需求说明书。

为了完成岗位的职责,需要承担该职责的人员具有与职责需求相对应的能力,包括技术能力、分析能力、沟通能力、语言能力等诸多方面。系统规划与管理师不仅要识别与职责要求所对应的能力,还要识别出对担任同一职责或同一工作的不同人员能力要求的差异。

例如,同样是桌面故障处理的工作职责,对于一名助理工程师的能力要求是能解决该故障即可,而对于一名担任同样岗位且具有相同职责的高级工程师来讲,就不只是要求他有能力解决故障,还要有能力做故障分析,以减少故障再次发生的概率,或者有能力将故障解决的方法形成知识点,与同组的其他同事进行分享。之所以会发生以上的情况,是因为很多情况下,一个服务团队的组成是多样的,既有经验丰富的工程师,也有初出茅庐的技术人员,虽然在岗位和职责的定义上两者并无明显差异,但在能力的要求上两者就相差很大。

(2)建立人员能力现状评估和差异分析表。

  • 能力现状评估:基于岗位职责的能力识别的结果,可对现有服务人员进行能力评估,评估可以采取本人自评、主管审批的方式,既确保了评估结果的相对有效性,也保证了能力评估工作的效率。
  • 能力差异分析:服务人员完成能力评估工作之后,需将评估结果与相应岗位的能力需求进行差异识别和分析,确定能力差距。
  • 评价结果运用:人员能力评估的结果,可运用于人员职级的评定、岗位晋升或调动,甚至是薪酬福利的调整;对于有一定能力差距的人员,应在主管的指导下制订能力提升计划并遵照执行。
6.2.3 人员绩效管理

在IT服务运营中,人员绩效管理将对绩效考评后的结果采用评价、奖罚、改进等多种方式进行人员最终的提升。
1.目标
对人员绩效的成果进行分析,结合人员能力模型与岗位要求进行评价,根据评价的结果建立人员能力提升或工作改进的方法。

2.活动

(1)绩效考核成果报告。对岗位绩效考核成果进行分析,从岗位、客户、服务、行为等维度进行评估,根据不同维度得出相应报告,便于后续分析。

(2)绩效考核成果分析。对绩效考核成果报告进行分析,尤其对具有共性的问题进行根本分析,分析绩效无法达成的原因是组织原因还是个人原因,如果是个人原因,则要明确是能力因素还是工作积极性的因素。例如,我们发现某服务台工作人员一线解决率较低如果仅是其个人指标达成较低,可能是个人能力不够或激励不够,这时就要进行相应的培训与辅导,但如果存在普遍性,那么可能是知识库不够完整,也可能是服务过程中出现了问题。

(3)基于绩效考核分析的改进。

  • 管理改进:如果绩效考核存在普遍性,就要考虑从管理入手,解决过程体系的问题,或者引入更好的知识管理,还可能要引入升级机制与沟通机制。
  • 培训:如果是人员能力出现问题,就要针对人员能力进行系统的培训与辅导。
  • 激励:如果是人员的积极性出现问题,那么可以考虑采用激励手段。常见的激励手段有奖金、升迁、表扬等方式,必要情况下,采用惩罚机制也能起到激励作用。
  • 改变绩效方案:经过分析,如果发现绩效的设置明显不符合业务需求,或者存在无法实现的可能,又或是绩效过于容易实现,没有起到管理与促进的作用,就需要改变绩效考核方案,包括考核的标准与考核的方法。

【实例】系统规划与管理师绩效考核表,如表6.2所示。

6.2.4 人员培训计划执行
  1. 目标
    确保有效执行人员计划能并确保培训效果。

  2. 活动
    (1)按人员培训计划进行培训。

    • 企业内训:可由IT服务组织内部资深人员或聘请外部专家在企业内部进行培训。
    • 外部培训:可寻求培训机构的服务,将人员派送到培训机构接受培训。
    • 拓展训练:可自行组织或寻求拓展公司的服务,以拓展训练等方式接受培训。

    (2)对培训结果进行评价。

    • 收集培训反馈:为了保证培训的效果,收集培训的反馈是必须的。培训课程反馈方式主要是培训满意度调查,满意度包括对培训课程、培训讲师、培训课件、培训设施和环境等方面的满意度。满意度调查是培训工作待续改进的重要输入。
    • 对学员进行测试或评价:培训完成后需采取有效及合理的方式进行考核,如笔试、口试、上机操作等。考核一方面有助于了解授课效果,以便对课程进行持续改进;另一方面有助于了解培训对象对知识或能力的掌握和提升情况。目标对象参加培训比率或考核通过率过低,应考虑组织二次培训。

    (3)培训机构与培训讲师管理。

    对培训机构与培训讲师进行整理与记录,对培训的效果做出有效记录与评价,形成有效的师资库,对培训的安排做出进一步选择。

    (4)人员培训回顾和改进过程。

    人员培训过程需要持续的回顾和改进,以确保培训的结果符合客户和业务的发展与变化要求。

    • 人员培训回顾:系统规划与管理师应定期对人员培训进行回顾,回顾的内容主要有培训范围是否合理、培训过程是否有效、培训的满意度如何等。
    • 人员培训改进:依据培训回顾的结果,对人员培训过程进行改进。改进包括对能力需求的改进、对培训规划的改进、对培训范围的改进、对培训课件的改进等。

    【实例】培训记录表如表6.3所示。

    表 6.3 培训记录表
    培训内容学时8学时
    培训教师地点公司会议室时间2024-5-18
    参加人员
    学员分数是否准时参加,无迟到和早退现象能否理解此次培训的内容是否表现积极的参与意识能否主动提出问题回答问题的准确性

    注:每个考核项分5个等级,分别为5分、4分、3分、2分、1分,满分为5分,最低为1分。

    填表人: 日期:

6.3 资源要素管理
6.3.1 工具管狸
  1. 工具的基本运营

    (1)保持稳定性,按生产系统管理。IT服务是离不开IT服务工具的,系统规划与管理师要将IT服务工具的稳定性的重视程度提高到足够的高度。IT服务工具合理清晰的产品体系架构与7天24小时不间断运行的技术保障,是实现IT服务稳定性的最佳保障。IT服务项目应将重要的IT服务工具当做生产系统进行维护,不轻易移动、关停重启服务,所有的改动都通过严格的变更流程进行控制。

    (2)挑选合适的员工进行日常维护(工具维护岗)。在对工具进行日常维护时,要做到人驾驭工具、人监督工具,不能让工具牵着人的鼻子走,系统规划与管理师应尽可能地安排项目中合适的员工来专职负责工具的维护和改进,设立专职的工具维护岗位,不建议将工具的维护全部交给软件供应方。

    (3)适时的改进。每种工具都不可能完全适合各种IT服务项目,系统规划与管理师需要根据自己所负责项目的特点,及时跟踪客户的需求变化,对工具进行长期、分阶段的持续改进,以适应项目发展的需要。

  2. IT服务工具的淘汰

    IT服务工具同样具有生命周期的概念,所有的工具最后都会因各种原因而淘汰。工具淘汰的原因一般有两种:技术过时落后,有新的工具可以代替;或者,IT服务项目终止。

    当IT服务项目终止时,往往需要将IT服务工具移交给接手服务的另一方,它可能是客户自身的团队,也可能是第三方服务提供商。此时应做好以下工作。

    (1)工具由客户投资建设。收集工具管理过程中的所有文档,备份数据和软件副本,按照同客户及第三方协商确定的交接计划进行交接。

    (2)工具由IT服务项目提供方投资建设。若工具是服务项目提供方自己投资建设的,系统规划与管理师需计算成本,并向客户报告。当客户接受时,由客户决定是客户自己买入还是第三方买入。收集工具管理过程中所有的文档,按照同客户及第三方协商确定的交接计划进行交接。当客户不接受时,制订报废计划,向公司汇报,收集工具管理过程中所有的文档,备份数据和软件副本。当公司决定将工具免费送给客户时,与客户及第三方进行交接;当公司决定收回工具时,在项目撤出前,从生产系统上删除工具系统。

6.3.2 知识管理

知识管理流程的目标是将运维生产过程中产生的各类信息所包含的知识最大限度地提取、保留,通过评审后加以应用,包括:实现知识共享,实现知识转化,避免知识流失,提高运维响应速度和质量,挖掘、分析IT应用信息。知识管理包括系统规划与管理师对知识的获取、共享、保留(归档)、评审,如图6.1所示。

  1. 知识提取和获取的方法及途径

    系统规划与管理师首先要考虑本项目需要哪些知识,能从哪些方面获取。将项目相关知识进行分类,可能根据以下4方面进行:根据知识的覆盖使用范围分类,根据知识评分分类,按照浏览量分类,知识地图同样是知识分类的好方法。

    IT服务项目常见知识分类如下:项目相关业务知识,项目相关已知问题(故障)解决方案,IT服务相关技术跟踪,其他知识(消防知识、逃生知识等)。

    IT服务项目知识的提取和获取一般是在项目内部和项目外部两方面进行的。

    内部提取:日常运维故障典型解决方案的总结、积累,如在建立流程体系时规定必须从已知问题的解决方案中提取知识,这也是IT服务项目最实用的知识。

    外部查找:与其他类似项目进行知识共享,在互联网上查找、跟踪供应商发布的知识等。

  2. 知识共享的方法和方式

    项目知识共享分对内共享和对外共享两种。对内共享是要求项目组内成员积极主动地将自己的知识共享给其他员工;对外共享是与其他项目组或其他公司进行知识共享。知识具有保密性的要求,系统规划与管理师要制订知识共享制度,对各种知识设定保密级别,根据保密级别在共享时要进行审批。

  3. 知识的保留、归档与入库

    在知识保留、归档及入库时,先根据知识的分类进行分级工作,从以下两个角度进行知识分级,具体的级别可根据实际情况自行定义:业务重要性角度,整合、完整性角度。知识的归档与入库建议采用统一的知识管理工具,市场上常见的ITSM管理工具都有知识管理的功能,也可以使用其他开源工具来管理。

    知识入库时应按照分类进行保存,如可按IT服务运维对象(网络、主机、数据库、应用)进行分类,也可按业务进行分类:桌面、邮件、业务系统(如银行核心系统、卡系统)等。

    知识入库时要进行审核性工作,以保证知识质量,做到有用的知识才会进入知识库。同时,知识入库后要定期进行知识的评审,看看哪些知识需要更新和整合,哪些知识已经过期,以保证知识的有效性和提高知识的整合度。

    系统规划与管理师在知识的保留、归档、入库阶段,一方面要重视知识管理工具的建设,另一方面要积极协调技术专家一同进行知识的入库审核。

  4. 知识的评审

    系统规划与管理师应定期组织技术专家团队对知识库的知识进行全面评审。评审的内容涉及以下3方面:
    ⓵时效性:现阶段是否还有效。
    ⓶完整性:是否汇总完整,能否与其他知识条目合并。
    ⓷正确性:知识的内容是否正确。评审后应出具《知识评审报告》,并根据评审的结果对知识库中的内容进行更新、删除、合并等维护工作。知识的评审工作也是知识重新获取的一大来源。

  5. 知识管理关键成功因素

    在知识管理中,一方面应从流程制度考虑:
    ⓵知识识别与分类是否准确。
    ⓶知识管理流程是否制订,是否合理。

    另一方面设置知识使用的衡量指标进行考核,来判断知识管理的成熟度:
    ⓵知识积累的数量。
    ⓶知识的利用率。
    ⓷知识的更新率。
    ⓸知识的完整性。
    ⓹各类知识的比重。
    ⓺知识新增数量与事件、问题发生数量的对比关系。

  6. 知识管理可能存在的风险和控制

    (1)知识私有化观念(主动性):在知识管理中最容易出现的情况是员工不积极提交知识,员工不愿意与其他员工共享自己所拥有的知识。此时,系统规划与管理师应该考虑采取措施,提高员工提交知识的积极性,如对积极提交完整性高核心知识的员工进行奖励,激励员工共享自己所拥有的知识,也可将知识提交、共享与绩效考核挂钩;最好建立起良好的团队文化氛围,保持员工的积极性。

    (2)知识共享的风险:在实际操作过程中,知识共享确实存在着风险,主要是可能出现核心技术的泄露,所以应做好知识(信息资产)的保密性工作,建立共享安全制度。另外,也会存在其他部门、项目组不愿意共享知识的现象,系统规划与管理师应积极与对方进行沟通。

    (3)知识管理工具使用风险:知识管理工具上线运行之后,员工却不能经常性地使用系统,也不能对知识管理系统进行维护,从而难以保证知识管理系统中知识的数量和质量,在“恶性循环”中使知识管理系统逐渐成为一个华而不实的摆设。所以,在管理工具的建设期,系统规划与管理师要考虑工具的易用性。

    (4)持续性风险(知识的有效性、时效性):在初始知识提交后,长期没有再评审、再次更新修订,知识甚至已经过时或者随着环境的改变而不再正确,但仍保留在知识库中,造成知识的可用性和准确性降低,久而久之,员工会越来越不愿意使用知识系统,知识管理面临失败。因此,系统规划与管理师要重视知识的定期评审工作,保证知识的可用性和准确性。

    (5)隐性知识很难转化成显性知识:显性知识可以理解成书面化的文档,隐性知识就是存放在每个人头脑中的经验和体会,要让每个人头脑中的经验和体会都写出来的确很难。因为平常每个人工作都很忙,如果非要让忙了一天的员工能在工作时间内静下心把自己的经验和心得写出来,这对绝大多数企业和员工来讲是不现实的。很多知识管理项目的一个假定条件就是,每位员工都会把自己头脑中的知识主动拿出来,但事实并非如此:员工没有时间也没有动力。如果这个假定条件不成立,那么就没有了知识管理项目成功的基础,所以必须面对并解决好这个困难,不然知识管理系统最终将成为一个摆设。解决方法是让知识管理系统完全融合到员工日常的工作中,如客服人员每天处理客户的问题就在完成知识管理,这样就可以让员工一边工作一边积累知识;把知识管理融入项目管理、客户管理、流程管理、人力资源管理中,这样能够真正有效地让员工一边工作,一边把知识和经验积累到系统中。

6.3.3 服务台管理与评价

服务台是个职能单位,一般情况下需要由专职人员组成,他们负责处理各种服务时间,通常利用电话、邮箱、即时通信、网络或自动手段报告基础设施发生的事件以及用户的请求(或标准变更)。它在IT部门中是一个极为重要的组成部分,通常为整个IT部门与用户的联络点,同时使用专门的软件工具记录和管理所有这些事件。

服务台在IT服务运营中的主要工作如下:

(1)响应呼叫请求:呼叫请求是指用户与服务台进行的联系,所有的呼叫请求都应该记录下来,这样可以进行进度监控,并且为流程控制提供有关的量化指标,包括事件、服务请求、需求、抱怨、投诉等。部分变更请求也可能成为服务台需要受理的工作。

(2)发布信息:服务台作为主要的发布方,可以充当用户的主要信息来源。这既可以以消极的方式(如网站发布)进行,也可以以积极的方式(如电话通知)进行。服务台需要通过各种努力来通知用户当前或预期发生的错误,特别是在他们受到影响之前。服务台还应当向用户提供有关新的和现有的服务项目、服务级别协议(SLA)的供应及订购程序和成本等方面的信息。

(3)供应商联络:服务台通常负责与维护供应商进行联系,包括打印机、工作站的维修和替换,在有些情况下,还包括电信设备的维修和替换。这种类型的维护包括对纯粹感觉上的事件(干扰)及变更和服务请求的处理。

(4)运营任务:进行备份和恢复、提供局域网连接、对当地服务器进行磁盘空间管理、创建账号、设定和重设密码等也是服务台的职责。

(5)基础设施监控:服务台可能有权进入各种工具系统,这些系统被用来估计那些影响关键设备的故障可能产生的影响,如路由器、服务器、网关、关键任务系统、应用系统以及数据库等。通常,这些工具在某个故障出现或正对基础设施产生威胁时,就能自动地排除这些故障并通知事件管理。正常情况下,使用这些工具系统主要是运营小组的任务,由他们将有关的信息报告给服务台。

关于用户绕开服务台的场景回放如下:

  • 主角:
    李宁:男,24岁。北京XX投资有限公司员工,职位:IT桌面维护工程师。
    
    配角:
    王天:男,25岁。北京XX投资有限公司员工,职位:IT经理。
    罗薇:女,24岁。北京XX投资有限公司员工,职位:行政部工作人员。
    
    故事前情提要:
    搞好客户关系是IT服务工程师的一门必修课,良好的客户关系会为IT服务工程师的工作带来很大的方便,也会影响客户对工程师的评价。如果有客户绕过服务台找 到工程师来解决问题,那么应如何处理呢?
    
    剧情:
    李宁:“你好,IT技术服务中心李宁。”
    罗薇:“我是罗薇!我的Photoshop软件出了点问题,你能帮我看看吗?”
    
    处理方式1:
      李宁:“哦!没问题!等我,1分钟。”
      字幕:李宁挂了电话就匆匆忙忙地给罗薇去解决问题了。而这时候服务台正好给李宁打电话,通知他去给另外一个用户处理工单。李宁告知自己正在给行政部的罗薇处理问题,服务台只得转派工单给其他工程师。渐渐地,李宁为了加强和客户的关系,多次绕过服务台为用户处理问题,服务台对于李宁的调配也总是冲突。终于在月底工作总结时……
      王天:“李宁,你这个月怎么一共才处理了15个工单?”
      李宁愣了一下:“不对吧?怎么可能呢,我现在每天都处理好几个呢!”
      王天:“报告是服务台通过管理工具导出的。你通过服务台关闭了多少个工单,都会记录下来。”
      李宁:“哦,经理,是这样。我这不是跟客户要搞好关系吗?所以有时候客户嫌联系服务台麻烦,就直接来找我,我就给他们处理了,所以服务台那边没有记录。”
      王天:“那如果大家都这样,我们还要服务台干吗呢?那干脆就叫用户直接来找我们好了,何必多此一举呢?你说呢?”
      李宁:“啊?......“
    
    处理方式2:
      李宁:"哦那你为什么不找服务台呢?他们也能帮你处理问题啊!”
      罗薇:"嗨,找他们不如找你方便啊!你不会不帮忙吧?”
      李宁笑了笑:“怎么会呢,你等我几分钟就来。”罗薇:“好。”
      字幕:李宁挂了电话立刻将这个事情通知服务台,请他们帮助新建一个工单,记录自己的工作。这样服务台可以知道李宁的实际工作情况,在人员安排方面也不会冲突。随后,李宁帮助罗薇解决了电脑问题。
      李宁站在罗薇的电脑前:“行了,搞定了。你试试看能不能正常用?”
      罗薇:“好,可以用了。”
      李宁:“不过啊,罗薇。你下次有IT方面的问题需要解决最好通知服务台。”
      罗薇看着李宁:“为什么啊?我觉得找你更方便啊!”
      李宁:“你直接找我,服务台就不知道我的实际工作状态。”罗薇想了想:“好吧,不为难你了。”
      李宁笑了笑:“理解万岁!谢谢你了!”
    
6.3.4 备品备件管理

备件管理是确保服务如约定完成的重要手段,主要活动如下。

(1)备件申请:申请者需要列清单,根据报价完成申购表,提交给备件管理员。由备件管理员核查库存量,以确定申购单的合理性,并进一步提交部门主管审核。审核通过后,进行采购。如果备件的安全库存已经告警,也可以进行采购。

(2)采购:根据对供应商进行比选后,进行采购。采购后,需要对备件进行充分的测试,该测试工作需要持续。

(3)到货入库:备件管理员应当核对到货清单与申购单中的备件信息(型号规格、数量等),如不符合要求提出异议,而对符合要求的到货设备,直接办理入库登记。

(4)领用:备件管理员查询库存清单,从仓库调出相应备件,并填写领用单,申请人核对领用单的信息,确认后签字。领用后备件管理员需要记入台账。

(5)报废:在维护各自系统中,如果备件已经损坏,需要对损坏设备进行检测,对可以修复的,则送去维修,对确定报废的设备,需要妥善保管,以便到时统一回收。

【实例】备件领用表如表6.4所示。
表6.4 备件领用表

备件代码备件名称数量存放位置入库日期出库日期领用人审批人其他1其他2其他3其他4
B1001
BJ002
BJ003
BJ004
BJ005
6.4 技术要素管理

技术管理的目的是按照IT服务中技术工作的规律性,建立科学的管理工作程序,有计划地、合理地利用技术力量和资源,保证SLA高标准地完成。

在IT服务运营中,需要对技术研发的预算进行管理,同时对技术成果进行运行、改进等工作。

6.4.1 技术研发规划

如何从发现问题和解决问题的过程中发现需要做技术研发的需求,并完成立项评审,以及研发成果如何转为新的服务资源。

6.4.2 技术研发预算

通常情况下IT服务工具、应用或软件都是通过项目申请而完成的,在项目立项的过程中会要求进行成本收益分析和投资回报率分析,然而对于任何项目来说,这都将是一个巨大的挑战。通常项目没有成本收益分析和投资回报率分析,项目的目标是尽快”上线”,而不是最终达成期望的收益。项目创建之初预算申请尚且如此困难,在运行中的工具申请研发预算将是难上加难。常见的方法有如下两种:

(1)增量预算:启动项目时都会“将大化小“,逐步地去完成项目,这样项目具备整体规划,在后续的项目中可预留一部分费用,对之前已完成的工作根据新的需求和变化进行调整。这样的方法虽然不是传统意义上的研发预算,但可以有效地解决后续研发预算的问题,可以保证有持续的资金进行改进。

(2)零基预算:更详细的现状分析、费用分析、需求预测、效率提升比、研发投入与产出比、投资回报率分析等,当管理层拿到这样的数据或报告时,才可能打动他们,进而持续地拿出一笔钱投入一个已在运行的工作中。

6.4.3 技术成果的运行与改进
  1. 对技术成果进行培训与知识转移

    (1)知识性研发成果培训:如组织自行研发的或基于方法论衍生的方法论框架,如鱼骨图法、KT分析法。

    (2)工具类研发成果培训:对用于优化IT服务管理的工具的功能进行培训,例如对自行研发的监控或IT服务流程管理工具进行培训。

    (3)应急预案与解决方案手册的知识转移:对应急预案与解决方案手册,根据不同的岗位和工作范围,进行知识转移。

  2. 对技术成果的内容进行演练或推演

    (1)演练:定期对应急预案、灾备方案进行仿真演习,必要时需要所有相关方参加,并投入充足的资源。

    (2)推演:通过沙盘或模拟的方式,对于可能发生的情况进行研讨。根据多方的圆桌会议,最终对技术研究成果给予改进建议与评价。

  3. 对技术成果进行优化改进

    对于技术成果进行评价与评估,根据分析或在实践中的信息,对技术成果进行新一轮的开发,并增加相应的预算。

    【实例】演练计划模板。

    概述:
    演练目的:……
    演练地点:……
    演练时间:……
    演练内容:……
    演练类型:……
    口模拟演练 口真实演练 口模拟演练 口其他演练场景:
    演练场景一:XXXX演
    练场景二:XXXX
    

    演练参加人员

    内部人员

    序号姓名部门角色职责
    1
    2

    外部支持人员

    序号姓名部门角色职责
    1
    2

    演练过程记录
    演练计划步骤
    XXXX演练步骤:

    序号操作内容操作人计划时间
    1
    2

    演练结果记录
    XXXX演练过程记录:

    序号操作内容演练结果操作人记录人
    1
    2

    演练问题总结
    存在问题

    序号问题详细描述所属系统发生环节
    1
    2

    改进行动

    序号改进行动描述负责人完成时间
    1
    2

    演练结论

6.5 过程要素管理

在IT服务运营中,对流程的执行、监控与调优是至关重要的,因为流程是IT服务运营活动的主要体现,也是对用户体验产生直接感受的关键要素。作为系统规划与管理师,应对规划设计阶段所提及的流程,包括服务级别管理、服务报告管理、事件管理、问题管理、配置管理、变更管理、发布管理、安全管理,进行有效的支持并确保执行。

6.5.1 服务级别管理

服务级别管理流程须确保供方通过定义、签订和管理服务级别协议,满足需方对服务质量的要求。在IT服务运营的流程中应当充分执行以下事项。

(1)更新服务目录并管理服务级别变更:在服务运营中,随时会产生新的服务需求及请求,或组织的服务能力提升、服务范围扩大等,或客户在原有服务范围的基础上变更服务级别需求,均应对服务目录进行及时的更新,并在与客户协商一致的基础上对服务级别协议进行变更。

(2)监控服务级别协议执行情况:需定期监控服务级别的达成情况,做出服务级别监控图表,对不同程度的服务级别协议违反情况提出警告,通知相关人员。

(3)对如下关键指标进行管理:服务目录定义的完整性,签订服务级别协议文件的规范性,服务级别考核评估机制的有效性和完整性。

【实例】服务级别跟踪表实例如表6.5所示。
表6.5 服务级别跟踪表实例

服务流水号时间服务目录服务内容客户名称SLA定义实际响应达成率满意度
1
2
3
4
5
6
6.5.2 服务报告管理

服务报告管理流程须确保供方应通过及时、准确、可靠的报告与需方建立有效的信息沟通,为双方管理层提供决策支持。在IT服务运营的流程中应充分执行以下事项。

(1)建立、审批、分发服务报告。根据不同的对象,定期或阶段性地进行服务报告的建立与分发,分发前需要进行审批。

(2)对服务报告进行归档。将分发过的服务报告进行归档,按照不同时段、不同对象分门别类,以备查找,如进行服务改进、发生纠纷时均需要查找有关证据。

(3)更新服务报告模板。在服务报告提供时,因为服务需求或范围发生变化,或者有更优秀的展现形式时,都应该及时更新服务报告模板。更新服务报告模板需要提前与发布对象沟通。

(4)对如下关键指标进行管理:服务报告过程的完整性、服务报告的及时性、准确性。

【实例】服务报告。

服务报告
报告基本信息
报告目的:为了有效决策与沟通……
报告范围:SLA中界定的运维服务项目
报告对象:查看服务报告的相关干系人,如客户代表、系统规划与管理师等
报告人:编写报告的人员信息
服务间隔时间:XXXX年XX月XX日—XXXX年XX月XX日
报告时间:XXXX年XX月XX日
服务指标达成率
{提示:此处描述的SLA中定义服务指标达成率,是为了向客户展现服务期间内的服务质量,适用
于对外提供给客户与内部服务团队分析。}
统计
{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计实际服务指标数据与约定服务指标间的差距,为后续服务改进提供基础。}
指标名称服务标准实际值指标状态备注
事件平均响应时间10分钟5分钟正常
事件平均处理时间20分钟15分钟正常
现场服务满意度8.5分钟8分钟非正常
系统/网络可用性99%90%非正常
············
分析
{提示:此处主要针对指标状态为“非正常"的指标(违反SLA的指标)进行分析,寻找问题根源,分析问题原因。如现场服务满意度低:经分析后发现是因为上门服务的入员态度较差,造成客户不满意。}
改进建议
{提示:此处主要针对已经确认的问题原因提供改进建议,如提供服务意识培训。}
事件分析
{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计间隔时间段内所有事件的数量,同时可提供时间段内的不同时间的事件数量趋势,以便做后续分析。如事件总数、事件成功关闭数量、不同月份的事件趋势等。}
重大事件
{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计重大事件占据时间段中所有事件数量的比例。如重大事件数量等。}
可在此处附上间隔时间段内所产生的重大报告文档。
现场服务满意度
{提示:此处主要是按SLA约定的时间间隔(1次/季或1次/年或1次/合同期),统计间隔时间段内所有现场服务的满意度情况,可为SLA指标“现场服务满意度”提供数据支持。如现场服务满意度case总数、服务满意数昼、不同月份的服务满意度趋势等。}
趋势分析
服务达标趋势分析
{提示:此处描述按SLA约定的时间间隔(1次/季或1次/年或1次/合同期)内,每个时期内(如每月)服务达标情况的比较与分析。如与前几个服务报告达标情况的比较。}
服务回顾分析
{提示:自本标题后的所有章节(除“报告结论”外),都是面向内部服务团队具体的分析指标,各中心可根据策略定义的报告频率,借鉴如下报告编写指南,选择相应的报告模板,编制各自的内部服务报告。}
人员加班及培训情况
详细列出当月的加班情况,分析现有人员能力是否能够满足需求,是否有计划地安排相应的培训等。
分析
侧重于能力分析。
改进建议
描述能力改进。
报告结论
描述报告的总体结论。
6.5.3 事件管狸

事件管理流程须确保供方具有检测事件、尽快解决事件的能力。在IT服务运营中,流程应充分执行以下事项。

(1)对事件进行受理与处理:包括接收事件,对事件进行分类和初步支持、调查和诊断并解决。

(2)对事件进展进行监控与跟踪:需要对事件的处理过程进行跟踪,确保每个环节都在约定时间内完成。一般建议由服务台进行监控与跟踪,并确保事件的最终关闭。

(3)对事件进行升级:当出现技术不足、超时、事件范围超出、沟通不利、需要外部资源沟通等情况时,需要对事件根据预定的规则进行升级。

(4)进行事件满意度调查:应对每个事件的处理情况进行满意度调查,可以通过工具或人工的方式收集满意度得分。对于重大不满意事件,应当及时报备、升级并处理。

(5)完成事件报告:事件报告包括事件解决率、事件平均解决时间等指标,也需要对重大事件进行回顾。事件报告一般定期制订。

(6)对如下关键指标进行管理:事件管理过程的完整性、有效性,事件解决评估机制的有效性。

6.5.4 问题管理

问题管理流程须确保供方通过识别引起事件的原因并解决问题,预防同类事件重复发生。在IT服务运营中应充分执行以下事项。

(1)对问题管理进行受理:包括问题建立、分类、调查和诊断、解决、错误评估、关闭等。

(2)采用并更新知识库:可以在问题解决时调用知识库条目,同时在问题解决后,及时更新知识库,确保知识库能支持解决对问题引发的事件。

(3)完成问题报告:问题报告包括问题解决率、问题平均解决时间等指标,也需要对重大问题进行回顾。问题报告一般定期制订。

(4)对如下关键指标进行管理:问题管理过程的完整性,问题解决评估机制的有效性。

表6.6显示了变更请求日志和配置项状态报告。

表6.6 变更请求日志和配置项状态报告

变更请求日志

编号编号请求状态申请人申请日期批准人受影响项结论技术时间状态备注
合计请求数己关闭有时未关闭用时

配置项状态报告

序号配置库配置项名称配置项标识状态最新版本备份记录备 注
1
2
3
4
6.5.5 配置管理

配置管理流程须确保供方维护运行维护服务对象的必要记录,并保证配置数据的可靠性和时效性,关联支持其他服务过程。在IT服务运营中应充分执行以下事项。

(1)对配置项进行识别、记录、更新:对于新增加的配置项,需要进行识别,对其类别与属性做出判断与记录。变更后的配置项,需更新到配置管理数据库,确保其变更的记录能被追溯。

(2)对配置数据库进行管理与维护。

(3)对配置项进行审计。

(4)对如下关键指标进行管理:配置管理过程的完整性,配置数据的准确、完整、有效、可用、可追溯,配置项审计机制的有效性。

6.5.6 变更管理

变更管理流程须确保供方通过管理、控制变更的过程,确保变更有序实施。在IT服务运营中应充分执行以下事项。

(1)受理变更请求:对变更进行受理,对于变更进行分类,确保变更单填写规范。

(2)对变更进行评估、审核:对变更进行评估并最终审核,要充分考虑变更所带来的风险,对于变更或不变更带来的后果需要进行分析,必要时应该召开变更顾问委员会(CAB)进行讨论。

(3)对变更进行实施、确认和回顾等;需要协调发布管理或项目管理对变更的实施过程进行管理,在必要时需提出或批准回退计划,对变更后的成果要进行实施后评审。

(4)生成变更报告:对变更完成情况进行统计分析,包括未经批准变更数量及占比、不同类型的变更数量及占比、不成功的变更数量及占比、取消的变更数量及占比、变更关联的配置数等。变更报告应定期发布。

(5)对如下关键指标进行管理:变更管理过程的完整性、变更记录的完整性。

6.5.7 发布管狸

发布管理流程确保一个或多个变更的成功导入。在IT服务运营中应充分执行以下事项。

(1)执行发布计划,对发布进行测试:对发布计划的内容进行实施,确保按照里程碑完成发布阶段的各个发布包内容,对发布包要进行充分的测试,确保发布成功。

(2)发布失败时执行回退方案:在发布失败时,需要协调变更管理进行回退方案的执行。

(3)对发布进行记录,更新配置数据库:如果发布影响了配置项,需要及时主动保证配置管理数据库的更新。

(4)生成发布报告:对发布完成情况进行统计分析,包括发布成功率、发布及时率、是否更新配置管理数据库等。发布报告应定期发布。

(5)对如下关键指标进行管理:发布管理过程的完整性,发布过程记录的完整性、准确性。

6.5.8 安全管理

安全管理流程确保供方提供符合信息安全要求的服务。在IT服务运营中应充分执行以下事项。

(1)执行安全策略:应当按照安全策略制订的要求,进行日常工作,如移动介质的安全检查、进出入机房的安全检查、风险评估等多项工作。

(2)对违反安全策略的事件进行监控与追踪:应当对违反安全策略的事件进行监控,如非法用户的登入、非法软件的安装等。对于违反安全策略的事件要进行追责,并给予足够的重视。

(3)安全管理的关键指标包括:运行维护服务过程中信息的保密性,运行维护服务过程中信息的可用性,运行维护服务过程中信息的完整性。

【实例】典型移动介质安全策略。

典型移动介质安全策略

不得将载有重要信息的存储介质随意存放,未经安全责任人授权,不得带出公司。公司不得擅自使用私人自带设备。外来人员不经批准不得带入移动设备和介质。
若介质上的内容不再需要,应立即清除。对于存放有重要信息的存储介质,在销毁时,保证措施到位,避免不必要的泄露。
公司内的移动设备读取和光盘刻录限制在指定计算机上,并需要进行登记。
公用移动设备和介质,借用需要审批流程,使用完毕后及时归还,归还前要进行信息删除处理。
6.5.9 连续性和可用性管理

连续性和可用性管理应确保向客户承诺的协议的可用性、连续性在任何环境下都能满足。在IT服务运营中应充分执行以下事项。

(1)可用性和连续性计划必须至少每年开发、检查,确保协定的需求在从遭受一般损失到巨大损失的任何情况下,都得到满足。计划必须被维护来反映协议下的业务要求变更。

(2)当业务环境发生重大变更时,可用性和连续性计划必须被重新测试。

(3)变更管理流程必须评估变更对可用性和连续性计划的影响。

(4)可用性必须被测量和记录。计划之外发生的不可用情况,必须被调查并采取合适的行动;只要有可能,必须预告潜在的事件,并且采取预防行动。

(5)连续性计划、联系列表和配置管理数据库在正常办公室访问被禁止时必须仍可使用。连续性计划必须包括对正常工作的恢复。

(6)连续性计划必须被测试,以保证与业务的需求一致。

(7)所有的连续性计划的测试必须被记录,对测试失败必须产生行动计划。

6.5.10 容量管理

容量管理须确保服务提供者在任何时间都有足够的能力来满足当前和未来的客户业务需求。在IT服务运营中应充分执行以下事项。

(1)必须产生、维护一个能力计划。

(2)容量管理必须满足业务需求,包括:

  • 当前的和未来的容量和性能需求。
  • 服务升级时间、阈值和成本。
  • 对计划的服务升级、变更请求、新技术和新技能对能力所产生的作用的评估。
  • 外部变更对容量可能产生的影响,比如法律的。
  • 提出用来进行预测分析的数据、流程和方法。

(3)监控服务能力、调整服务绩效、提供足够能力的方法、步骤和技术必须被明确。

6.6 常见运营管理关键考核指标

服务运营过程中常见的关键考核指标如表6.7所示。
表6.7 运营管理关键考核指标

要素考核项目计算公式/方法建议考核周期
人员关键岗位人员储备率(关键岗位储备人员的数量/关键岗位人员数量)×100%年度
人员招聘达成率(实际招聘的人数/计划招聘的人数)×100%年度
人员培训次数检查培训计划和培训实施记录年度
人员绩效考核合格率(人员绩效考核合格数量/被考核人员总数)×100%年度
技术研发成果数量年度累计技术研发成果数量年度
资源备件可用率定期检查备件完好数量/定期抽检备件总数)X100%季度
新增知识条目统计知识库中新增知识条目年度
服务台一次派单成功率【1-(退回的派单(派单总数)】X 100%季度
服务台录入事件的完整性【1-(不完整事件数/总事件数)】X 100%季度
过程SLA达成率(SLA达成事件之和/事件总数)Xl00%年度
服务报告交付及时率服务报告按时提交的数量/服务报告总数量季度
事件解决率成功解决事件数/己关闭事件总数季度
变更成功率1-(回退变更/变更总数)X 100%季度
发布成功率1-(回退发布/发布总数)X 100%季度
信息安全事件数量信息安全事件的次数季度
质量客户满意度客户满意度综合评分年度
管理评审次数开展管理评审的次数年度
内部审核的次数开展内审的次数年度
6.7 常见监控内容

服务运营过程中常见的信息系统监控内容如表6.8~表6.11所示。

表6.8 机房基础设施监控内容

运行维护对象监控内容
空气调节系统(精密空调系统、新风系统)精密空调系统的环境温度、环境湿度、出风温度、回风温度,告警情况等
新风系统启停情况,进出风口温度等
电气系统(供配电系统、UPS系统、发电机系统、防雷接地系统)供配电系统的电流、电压、功率因数、有功功率、无功功率、谐波等
发电机启停情况、电流、电压、负载率、控制系统供电情况等
UPS的输入和输出电流电压、频率、负载率、温度和报警情况,电池的充电和放电电压等
电源使用效率:通过监控软件监测或计算PUE值
防雷接地系统的浪涌保护器、避雷器状态等
机房监控与安全防范系统(环境和设备监控系统、视频监控系统和门禁系统)环境和设备监控系统告警情况、运行情况等
视频监控系统的告警情况、监控录像等
门禁系统的门禁状态、告警情况等
消防系统消防系统的消防控制系统状态、气体灭火钢瓶压力、灭火器有效期检查等






表6.9 硬件设备监控内容

运行维护对象监控内容
网络及网络设备网络设备的良好状况、整体运行状态、各项硬件资源开销状况
链路良好状况如端到端时延变化、链路端口工作稳定性、链路负载情况、部署路由策略情况下端到端选路变化、路由条目变化
管理权限用户的行为审计
设备软件配置变动审计
设备日志审计
安全事件审计
服务器服务器整体运行情况
服务器电源工作情况
服务器CPU工作情况
服务器内存工作情况
服务器硬盘工作情况
服务器网络端口工作情况
存储设备存储设备控制器工作情况存
储设备电源工作情况
存储设备数据存储介质工作情况
存储设备接口卡工作情况
存储设备数据存储介质空间使用情况
存储设备读写速率情况
存储设备读写命中率情况

表6.10 基础软件监控内容

运行维护对象监控内容
操作系统操作系统CPU使用情况
操作系统内存使用情况
操作系统磁盘使用情况
操作系统网络端口状态和流量
操作系统光纤端口状态和流量
操作系统重要文件系统空间使用情况
操作系统日志情况
数据库数据库主要进程运行情况
数据库连接是否正常
数据库表空间使用情况
数据库日志是否有异常
数据库日常备份是否正常等
中间件中间件运行状态
主要进程运行状态
应用服务运行情况
中间件通信网络连接情况
中间件日志是否有报错信息

表6.11 应用资源监控内容

运行维护对象监控内容
应用资源应用的请求和反馈响应时间
资源消耗情况
进程状态
服务或端口响应情况
会话内容情况
日志和告警信息
数据库连接情况
存储连接情况
作业执行情况

【练习题】

一、单项选择题

  1. 下列不属于服务运营管理人员要素风险控制的是( )。

    A.沟通问题 B.人员连续性问题 C.负面情绪 D.工资待遇

  2. 知识管理流程不包括( )。

    A.知识识别 B.知识获取 C.知识共享 D.知识保留

  3. 服务运营管理中技术管理的目的是( )。

    A.保证SLA高标准地完成 B.保证技术的先进性

    C.保证客户的满意度 D.保证技术有效执行

  4. 对问题管理描述正确的是( )。

    A.问题管理流程须确保供方具有检测事件、尽快解决事件的能力

    B.问题管理流程须确保供方通过识别引起事件的原因并解决问题,预防同类事件重复发生

    C.问题管理流程须确保供方维护运行维护服务对象的必要记录

    D.问题管理流程须确保供方通过管理、控制变更的过程,确保变更有序实施

  5. 容量管理必须满足业务需求不包括( )。

    A.当前的和未来的容量和性能需求

    B.服务升级时间、阈值和成本

    C.对计划的服务升级、变更请求、新技术和新技能对能力所产生的作用的评估

    D.业务服务的连续性

二、案例分析题
某资产管理公司于1999年在北京正式成立,是具有独立法人资格、独立承担民事责任的国有独资非银行金融机构,公司实行总公司、办事处制。经财政部同意,中国人民银行批准,公司根据业务需要,在业务量较大、不良资产集中的地区设立29个办事处,办事处按国有独资商业银行省级分行管理,根据总公司授权开展业务,不具有法人资格。
IT的部门是技术保障部,它负责公司信息系统的规划、建设和管理部门,内设软件开发处、网络运行处和综合处等部门。先后建立了多项IT系统,为其管理、经营和决策奠定了坚实的基础。但在庞大的系统运维过程中难题较多,主要集中在4个方面:

(1)运维人员紧张,运维工作量较大,人员流动比较频繁,缺少绩效考核机制。
(2)缺少知识管理,解决问题全靠个人能力和经验,造成技术骨干人员流动,接替人员无法快速接手工作。
(3)业务部门寻求IT支持没有统一入口,IT运维工作缺少统计和跟踪。
(4)设备及主机系统较多,运维复杂度高,缺少规范的运维流程。

“蓝山科技“负责该资产管理公司的运维平台建设工作,对现有问题进行分析,提出相应解决方案。

(1)在服务运营阶段人员如何进行有效的管理?请结合本案例进行回答。

(2)知识管理具有哪些流程?并结合本案例对知识管理流程进行说明。

(3)结合本案例描述服务台的作用,并回答服务台有哪些主要工作?

(4)在运维过程中主要有哪些流程,并对流程进行简要说明。

【参考答案】:D A A B D

版权声明:如无特殊标注,文章均来自网络,本站编辑整理,转载时请以链接形式注明文章出处,请自行分辨。

本文链接:https://www.shbk5.com/dnsj/72993.html