GB/T 28827. 1—2022
1 范围
本文件描述了运行维护服务能力模型,规定了运行维护的能力建设、人员、过程、技术、资源等能力 要素的要求。
本文件适用于运行维护服务相关方。
2 规范性引用文件
下列文件中的内容通过文中的规范性引用而构成本文件必不可少的条款。其中,注日期的引用文 件,仅该日期对应的版本适用于本文件;不注日期的引用文件,其最新版本(包括所有的修改单)适用于 本文件。
GB/T 28827.3 信息技术服务 运行维护 第3部分:应急响应规范
3 术语和定义
下列术语和定义适用于本文件。
3.1
运行维护服务 operation and maintenance service
采用信息技术手段及方法,依据需方提出的服务要求,对其信息系统的机房基础设施、物理资源、虚 拟资源、平台资源、应用和数据,以及满足用户使用信息系统过程中的需求等提供的综合服务。
3.2
运行维护服务能力体系 operation and maintenance service capability system;MCS
为满足运行维护服务(3.1)及绩效要求的相互关联或相互作用的一组要素。
注:包括能力管理(3.3)、人员(3.4)、过程(3.5)、技术(3.6)和资源(3.7)等要素。
3.3
能力管理 capability management
围绕能力要素,通过策划、实施、检查和改进等活动,提升能力要素水平并持续改进各要素间的相互 作用关系和绩效水平。
3.4
人员 people
组织中从事运行维护服务的人。
3.5
过程 process
组织中利用输入实现预期结果的相互关联或相互作用的一组活动。
3.6
技术 technology
组织中为交付运行维护服务研究和转化的知识、经验、手段、方法的总和。
3.7
资源 resource
组织中用于交付运行维护服务所依存和产生的有形及无形资产。
注:主要包括运行维护工具、服务台、服务数据、备件库、最终软件库和服务知识等。
3.8
运行维护服务对象 operation and maintenance service object
运行维护服务的受体。
注:运行维护服务对象通常指机房基础设施、物理资源、虚拟资源、平台资源、应用和数据等。
3.9
运行维护服务内容 operation and maintenance service content
根据需方需求和服务级别协议承诺,向需方提供的调研评估、例行操作、响应支持、优化改善等 服务。
3.10
服务场景 service scenarios
为了满足服务需求,在特定时间、空间内发生的服务活动和人、物关系所构成的具体的服务画面,以 实现服务价值。
3.11
关键指标 key index
用于评估、衡量运行维护服务能力的关键参数。
3.12
服务台 service desk
面向用户的、完成大部分支持工作的支持组。
3.13
备件 spare parts
为保证失效部件或设备得到替换,所预先准备的、能够提供正常功能的部件或设备。
3.14
服务级别协议 service level agreement;SLA
运行维护服务组织与需方之间定义服务和服务指标所形成的文件。
3.15
服务数据 service data
从运行维护服务活动中采集或生成的各种信息或记录。
3.16
治理主体 governance subject
评估、指导、监督组织IT治理的人或组织。
[来源:GB/T34960.1—2017,3.2]
3.17
服务可用性 service availability
一项服务在约定的时间点或时间段内执行所需功能的能力。
注1:服务可用性基于基础设施(基础设施包括动环、网络、服务器、存储等)、系统以及运行维护服务三个层面。 注2:服务可用性表达为服务实际可用时间与约定时间的比率。
3.18
服务连续性 service continuity
一项服务在按照商定的服务可用性要求中连续无中断交付服务的能力。
3.19
最终软件库 definitive software library; DSL
存储所有软件配置项的最终批准版本的安全储存库。
3.20
A R M 服务器 ARM architecture server
采用基于 A R M体系架构的处理器作为C P U 的服务器。
3.21
虚拟资源 virtual resource
通过使用虚拟化技术对数据中心的计算、存储、网络等物理资源进行虚拟化,并通过管理软件动态 部署,提供给用户使用的虚拟化集中管理资源。
4 能力模型
运行维护服务能力模型包含治理要求、运行维护服务能力体系(MCS)和价值实现,见图2。治理要求是为实现运行维护服务绩效、风险控制和服务合规性的组织目标,提出的关于最高管理层领导作用及承诺的能力体系建设要求。
运行维护服务能力体系(MCS)是组织依据运行维护服务方针和目标,策划并制定运行维护服务能力方案,确保组织交付的运行维护服务内容符合附录A 规定,并满足质量要求,对运行维护服务交付过程、结 果以及运行维护服务能力体系进行监督、测量、分析和评审,以实现运行维护服务能力的持续提升。
价值实现是组织结合业务对信息系统的网络化、数字化和智能化的要求,识别内部和外部用户对服 务的需求或期望,定义多样化的服务场景,并通过服务能力、要素、活动的组合完成服务的提供,直接或 间接地为服务需求方和利益相关者实现服务价值。
图2 运行维护服务能力模型
5 能力建设要求
5.1 总体要求
组织应:
a) 考虑环境的内外部因素,在治理要求的指导下,根据服务场景,识别服务能力需求,围绕人员、 过程、技术、资源能力四要素,策划、实施、检查和改进运行维护能力体系,向各种服务场景赋 能,通过服务提供,实现服务价值;
b) 针对能力建设、人员、过程、技术、资源建立关键指标,关键指标的选取见附录B;
c) 定期评价运行维护服务能力成熟度,衡量能力水平差距,以持续提升运行维护服务能力。 注:本文件中不提供运行维护服务能力成熟度分级和评价准则。
5.2 治理
最高管理层应依据组织治理目标,提出运行维护服务能力管理治理要求,以确保实现运行维护服务
绩效、风险控制和服务合规性。至少应确保:
a) 运行维护服务方针和目标与组织环境相适应,与战略方向相一致;
b) 相关岗位的职责、权限得到分配、沟通和理解;
c) 运行维护能力建设所需的资源可用;
d) 基于风险的思维应用于运行维护能力管理过程;
e) 运行维护服务符合法律法规要求的重要性得到共识;
f) 能力建设实现其预期的结果;
g) 推动持续改进。
注:治理要求参见B/T 34960.1—2017。
5.3 能力管理
5.3.1 策划
组织应根据运行维护服务能力管理的治理要求,结合不同服务场景中的服务需求对能力要素和关 键指标进行整体策划,形成运行维护服务能力管理计划,以确保组织有能力提供运行维护服务。至少应 包括如下内容。
a) 根据业务需求和治理要求,结合新技术、新模式、新场景的要求,策划运行维护服务对象的服务 内容与要求,并形成服务目录。
b) 依据组织的业务发展需要,确定运行维护服务方针和目标,建立组织结构和管理制度,以支持 服务目录的实现。
c) 识别影响运行维护服务能力的外包服务,并对外包提供方的服务能力进行策划和管理。 注:对外包提供方和需求方的管理要BT 33770.1—2017、GB/T 33770.6—2023
d) 结合服务场景,对人员、过程、技术和资源进行策划并保留记录,包括:
1) 针对组织内部人员和外包人员,策划适宜的岗位结构和管理职责,并策划人员能力规划、 人员储备、人员培训、绩效管理、能力评价等;
2) 识别并建立过程,设计过程框架,确定过程之间的关系,策划各过程的目标、应达到的能力 要求、过程的执行保障等;
3) 识别现有技术与服务需求间的差距,确定技术管理目标,规 划技术研发与成果应用等方面的技术实现方案;
4) 综合评估资源的现状与趋势,确定资源管理目标,提出运行 维护工具、服务台、备件库、最 终软件库、服务数据、服务知识等
资源的配备方案。
e) 建立相适应的能力指标体系,包括指标、度量方法、数据来源及评 价方法等。
f) 确定质量目标,策划如何管理、审核并改进服务质量,形成服务质量管理计划。
g) 对策划结果适宜性、合规性等方面进行评审,必要时进行修订。
5.3.2 实施
组织按照运行维护服务能力管理计划进行实施,以确保组织运行维护服务能力和服务价值的实现,
至少应包括:
a) 制定与运行维护服务能力管理计划相适应的实施计划,并按计划实施;
b) 建立组织内外部的沟通协调机制;
c) 对实施活动进行管理,确保实施计划的执行可追溯,服务结果可计量或可评价并对其进行管理;
d) 提交满足质量要求的交付物;
e) 形成必要的记录,并对记录进行管理。
5.3.3 检查
组织应对运行维护服务能力管理的过程和实施结果进行监控、测量、分析和评审,以确保运行维护 服务能力满足策划的要求和服务目标,至少应包括:
a) 对服务绩效及能力水平进行评价,包含服务能力实施情况、各项指标达成情况、服务级别协议 达成情况、需方满意度等;
b) 评价适用的法律法规要求的符合性;
c) 组织进行内部审核,以评价运行维护服务能力要求的符合性和有 效性,识别体系运行过程的薄 弱环节和潜在的改进机会;
d) 组织进行管理评审,以评价运行维护服务能力体系的适宜性、充 分性和有效性,以找出与预期 目标的差距,以及任何可能改进的机会。
5.3.4 改进
组织应针对运行维护服务能力管理活动中发现的不足和提升机会,制定服务能力改进计划并保证 实施效果,持续提升运行维护服务能力。至少应包括:
a) 建立服务能力管理的持续改进机制;
b) 对不符合策划要求的行为进行总结分析;
c) 对未达成的指标进行调查分析;
d) 对需方不满意的情况进行分析与改进;
e) 根据分析结果确定改进措施,制定服务能力改进计划,并跟踪、评价改进活动的实施效果。
5.3.5 价值实现
组织应在不同的服务场景中识别服务需求,通过服务提供,满足用户需求,实现服务价值,至少包括 如下内容。
a) 服务需求。识别服务需求并遵循5.3能力管理的要求对服务场景进行完整的策划:
1) 与服务需求方和利益相关者建立互利互动的关系,并进行有效的服务关系管理;
2) 与服务需求方共同定义服务场景的范围边界、价值目标、关键服务绩效指标。
b) 服务提供。配置符合能力要素要求且和服务场景相适宜的人员、过程、技术和资源(PPTR),并遵循5.3能力管理的要求实施服务提供:
1) 对服务场景进行可行性分析、风险评估、成本预测;
2) 评估成本和风险对服务成果的影响,对服务绩效进行监控、评价和持续改进。
c) 服务价值。将运行维护服务能力体系输出的服务能力应用到服务场景中,通过服务成果、成本控制、风险控制实现服务价值:
1) 提高服务需求方和利益相关者的主观感知价值(例如,客户满意度);
2) 优先考虑新服务或变更服务需求,并提供改进机会,以确保该服务需求得到正确的资源分配。
6 人员
6.1 概述
为了保证人员能力满足运行维护服务的要求,组织依据运行维护服务能力策划要求,进行人员能力 策划、岗位结构、人员储备、人员培训、绩效管理和能力评价等管理活动,确保人员具备:
a) 与信息技术相关的基础知识,从事运行维护服务所需的专业知识、行业和组织等相关知识;
b) 从事运行维护服务所需的基本技能、专业技能、软技能;
c) 从事运行维护服务所需的经验;
d)特殊环境运行维护人员应具备相关资格
注:人员管理的范围包括内部人员和外包人员。
6.2 人员能力策划
组织应根据运行维护服务需求,识别出应具备的运行维护服务能力要求,并根据组织当前人员能力 现状,建立人员能力计划。应包括:
a) 根据当前和未来运行维护服务业务需求,识别应具备的运行维护服务能力要求,同时考虑新技 术、新模式以及信息技术应用创新方面所需要的运行维护服务能力要求;
b) 对组织当前运行维护服务能力现状进行差距分析,找出差距点, 识别人员能力改进方向;
c) 从投入成本、预期收益等方面考虑,确定人员需求、人员能力提升目标,制定未来一段时间内 的人员能力计划。
6.3 岗位结构
组织应依据运行维护服务能力策划要求和当前组织架构,建立岗位结构,确保人员能力在知识、技 能、经验、安全意识等方面满足服务要求,至少应包括如下内容。
a) 明确管理岗、技术岗、操作岗等岗位,对运行维护服务中的不同岗位进行明确分工和职责定义:
1) 管理岗职责应包括:负责管理运行维护服务;负责与需方建立顺畅的沟通渠道,准确地将 需方的需求传递到运行维护服务团队;负责策划、检查运行维护服务的各个过程,对运行 维护服务能力的策划、实施、检查、改进的范围、执行和成果负责;
2) 技术岗职责应包括:在运行维护服务中负责技术支持,包括运行维护服务对象相关的技 术、信息安全技术等;对运行维护服务过程中的请求、故障或问题做出响应并对处理结果 负责;必要时负责与技术研发、成果应用、预防风险等能力要素相关的技术实现;
3) 操作岗职责应包括:负责在运行维护服务中日常操作的实施,根据规范、手册等执行服务 操作,并对操作结果负责
b) 结合新技术、新模式、信息技术应用创新需求,明确各岗位在知识、技能、经验等方面需达到的 要求。
c) 明确运行维护服务对岗位的安全要求。
d) 对各岗位进行等级划分。
注:等级划分参见B/T 37696—2019。
e) 识别关键岗位,针对关键岗位建立备份机制。
f) 根据自身情况,结合行业特征和运行维护服务场景,建立优化岗位结构的机制。
6.4 人员储备
组织应按岗位结构和人员能力计划,考虑人员储备投入成本及预期效益,制定人员储备实施计划, 并进行人员储备,应包括:
a) 建立与运行维护服务相关的人员储备机制;
b) 根据业务需求和服务场景,在人员储备实施计划中考虑对应的人员储备;
c) 根据人员储备实施计划进行人员储备。
6.5 人员培训
组织应按人员能力计划,识别培训需求,制定年度培训实施计划,并进行人员培训,确保人员在知 识、技能、经验等方面满足服务要求,应包括:
a) 建立运行维护服务人员培训机制;
b) 根据业务需求和服务场景,在人员培训实施计划中考虑对应的培训内容、频次、受众等;
c) 实施人员培训,并对培训效果进行评价。
6.6 绩效管理
组织应按人员能力计划,进行人员绩效管理,以确保满足服务需求及服务价值的要求,至少应包括:
a) 建立运行维护服务人员绩效管理机制;
b) 根据绩效管理机制和人员能力计划,实施人员绩效管理。
6.7 能力评价
组织应按人员能力计划,进行运行维护人员能力评价,至少应包括:
a) 建立运行维护服务对应岗位的等级评价标准;
b) 建立运行维护服务团队和人员能力评价机制;
c) 实施团队和人员能力评价;
d) 依据评价结果对人员能力进行持续改进,需要时调整人员能力计划。
7 过程
7.1 概述
组织结合服务场景与运行维护服务能力策划要求,设计过程框架,明确各过程之间的关系和接口,
制定服务级别、服务报告、事件、问题、变更、发布、配置、可用性和连续性、系统容量、信息安全等管理过 程的目标、活动和考核指标,支撑服务过程的规范化管理和服务价值实现。
7.2 过程框架设计
组织应依据服务场景对过程框架进行设计,至少应包括如下内容。
a) 建立与过程规划相一致的活动,包括需求识别、过程框架设计、评价与改进等活动。
b) 组织在服务过程实施前,应对服务需求涉及范围、目标、关键绩效指标等进行协商并达成一致,形成服务需求结果。
c) 依据服务需求识别的结果进行分析,明确过程框架设计涵盖范围,并与相关方达成一致后输出 服务需求说明。
d) 依据已达成一致的需求说明指定过程框架设计所有者,由其主导过程框架设计活动。
e) 过程框架设计可依据服务需求进行过程组合或增加,包括但不限于以下过程:
1) 服务级别管理,
2) 服务报告,
3) 事件管理,
4) 问题管理,
5) 变更管理,
6) 发布管理,
7) 配置管理,
8) 服务可用性和连续性管理,
9) 系统容量管理,
10) 信息安全管理。
f) 过程框架设计应明确列出的过程之间关系及接口,至少包括过程间输入、输出的定义。
注:过程间的关系参见B/T 36074.3—2019。
g) 各过程应设置过程衡量指标,并定期进行回顾。
h) 过程框架设计应形成文件化的产出物,作为过程运行指导。
组织应定期对过程运行结果进行评估,回顾实际运行中存在的问题,并依据评估结果对过程框架设 计进行改进及持续跟踪。
7.3 服务级别管理
组织应依据运行维护服务能力策划要求,通过定义、约定和管理服务级别协议,满足服务质量要求, 至少应:
a) 建立服务级别管理过程,包括识别、约定、监控、评估等活动;
b) 定期对服务目录进行评审和修订;
c) 与需方约定服务级别协议;
d) 对成本投入要进行平衡;
e) 根据组织的考核评估要求,建立 S L A 考核自评估机制,包括S L A 完成情况、达成率等;
f) 定期识别服务级别需求并实施调整。
7.4 服务报告
组织应建立服务报告过程,通过及时、准确、可靠的报告与服务各方建立有效的信息沟通,为管理层
提供决策支持。至少应包括:
a) 建立与服务报告过程相一致的活动,包括计划、编制、审批、提交、归档等;
b) 建立服务报告模板,包括格式、提纲等;
c) 编制服务报告计划,包括需方接收对象、内容要求、提交方式、时间频次和报告形式等;
d) 服务报告内容应包括服务级别协议达成情况,服务报告编制完成并经过审批后按照服务报告 计划进行提交。
7.5 事件管理
组织应建立服务请求和计划外服务中断的处置过程,确保具有及时解决事件的能力,至少应包括:
a) 建立与事件管理流程相一致的活动,包括事件识别、报告、受理、调查和诊断、解决、进展监控与 跟踪、关闭等;
b) 建立事件分级、分类及升级机制;
c) 针对事件的处理过程和结果进行回访;
d) 定期统计分析事件数据与执行情况,建立事件评估及改进机制;
e) 将未知、无法解决和共性的事件,与问题管理建立必要的关联。
7.6 问题管理
组织应建立问题管理过程,分析问题根本原因和确定解决方案,至少应包括:
a) 建立与问题管理流程相一致的活动,包括问题识别、分类、调查和诊断、解决、关闭等;
b) 建立问题分类、分级机制,包括问题的影响范围、重要程度、紧急程度并确定优先级;
c) 应识别已知错误,在没有彻底解决前,组织应采取措施以减轻或消除问题对服务的影响;
d) 建立问题导入知识库的机制;
e) 建立问题解决评估机制。
7.7 变更管理
组织应控制变更的过程,确保变更有序实施,至少应包括:
a) 建立与变更管理过程一致的活动,包括请求、评估、审核、实施、确认和回顾等;
b) 明确变更范围,建立变更分类分级机制及相关的管理要求;
c) 准确记录变更过程及内容信息;
d) 评审变更活动的有效性,并与相关方协商达成一致;
e) 对变更流程的实施情况进行统计分析,包括未经批准变更数量及占比、不同类型的变更数量及 占比、不成功的变更数量及占比、取消的变更数量及占比、变更关联的配置数。
7.8 发布管理
组织应建立发布管理过程,控制部署实施活动,确保一个或多个变更的成功导入,至少应包括:
a) 建立与发布管理过程一致的活动,包括规划、测试、部署和验证等;
b) 建立发布类型、范围及相配套的管理机制;
c) 制定合适的发布方案,应包括发布计划、测试方案、回退方案等;
d) 记录部署活动中的主要动作、结果和相关信息;
e) 对发布完成情况进行统计分析,包括发布成功率、发布及时率、是否更新配置管理数据库等。
7.9 配置管理
组织应建立配置管理过程,整体规划配置管理范围,保留配置信息,并保证配置信息的可靠性、完整 性和时效性,以对其他服务过程提供支持,至少应包括:
a) 建立与配置管理过程相一致的活动,包括对配置项的识别、收集、记录、更新和审核等;
b) 建立满足服务交付要求的统一的配置管理数据库;
c) 及时更新维护配置管理数据库;
d) 建立配置管理数据库审核机制,至少包括审核范围、周期、方式等。
7.10 服务可用性和连续性管理
组织应确保与需方协商一致的服务可用性和连续性,至少应包括:
a) 建立与服务可用性和连续性管理过程相一致的活动,包括识别关键服务与业务应用、确定服务可用性和连续性需求和目标、定义可用性指标及目标值、对可用性进行监控、分析、评估、检查、 记录并制定优化改进机制,建立和实施服务连续性计划、定期对服务连续性进行演练等;
b) 基于业务需求、服务级别协议和已识别的风险,明确与需方协商一致的服务可用性和连续性要 求,制订保障及提高服务可用性的具体措施和计划,根据连续性要求,建立、实施并维护服务连 续性计划,同时明确定义出激活连续性计划的条件、程序、职责分工和恢复要求;
c) 针对连续性计划应至少每年演练一次,并根据测试结果完善连续性计划;
d) 当已经激活了连续性计划,应报告原因、影响、恢复活动及改进措施;
e) 当业务环境发生重大变更时,应重新演练连续性计划的有效性。
7.11 系统容量管理
为确保服务资产的数量和性能可以满足业务需求,服务供方应进行系统容量管理,至少应包括:
a) 建立与业务需求相一致的容量管理活动,包括识别、分析和调整等;
b) 识别出系统容量管理中宜考虑的核心要素,如计算/存储/网络等;
c) 分析容量现状与业务需求的匹配程度;
d) 依据业务需求变化的趋势判断,有针对性地对资产容量进行调整。
7.12 信息安全管理
组织应确保运行维护服务过程中涉及的信息安全,至少应包括:
a) 建立符合相关法律法规的信息安全管理制度,满足运行维护服务过程的信息安全需求,包括信 息安全方针、目标和安全策略;
b) 建立与信息安全管理过程一致的活动,包括计划、识别、评估、处置和改进等,并保留相关记录。
注1:信息安全的管理部门负责制定制度、标准和程序,保护组织的资产、信息IT数据和运行维护服务团队负责执行这些制度、标准和程序,并与信息安全管理或技术部门进行紧密合作。
注2:具体信息安全管理内容B/T 22080—2016。
8 技术
8.1 概述
组织应根据运行维护服务能力策划要求,实施技术管理、技术研发和技术成果应用等活动,保证技 术能力满足不同服务场景下的服务要求,包括运行维护服务能力长期发展的需求、治理、预期效益等,实 现其服务价值。
8.2 技术管理
组织应根据运行维护服务能力策划要求,实施技术管理活动,确保组织具备预防风险、发现问题、解 决问题和优化创新的技术能力,至少应:
a) 根据不同的服务场景,确定技术研发范围;
b) 选择技术研发方式,方式包括自研、外采及合作研发等;
c) 分配和管理资金及预算,配备必要的技术研发环境和研发队伍;
d) 识别和评估技术研发风险,采取有效控制措施;
e) 管理技术研发活动,监控和报告技术研发活动的执行情况;
f) 评价和验收技术研发成果。
8.3 技术研发
组织应根据技术需要进行技术研发,保证技术可靠、可用,至少应符合以下要求。
a) 分析技术需求,选择技术研发实现路径。
b) 识别满足需求的新技术机会,将成熟技术、储备技术和新技术进行融合,满足需要。
注:新技术包括基础设施运行维护技术、节能技术、新能源技术、网络技术、存储技术、虚拟
技术、数据库技术分布式 计算 技 术、云 计 算技 术、大 数 据 技 术、人 工 智 能 技 术、开 发 运 行 维 护一体化 技 术、物 联 网技术等。
c) 确定技术转化为服务能力的方法,包括但不限于:
1) 发现和解决问题的技术手段、方案或手册,以及验证标准和方法;
2) 对潜在风险诊断、分析、处置的方法和手段;
3) 业务系统或运行环境的二次开发,包括处理BUG、优化系统性能、系统的持续改进等;
4) 引入技术达到优化业务问题或为业务带来价值的技术或手段。
d) 验证、确认和发布技术研发结果。
8.4 技术应用
组织应确定技术研发成果在资源、人员和过程中的应用方案,确保技术成果在运行维护服务中得到 应用,至少应包括:
a) 识别技术成果应用机会,制定技术成果在人员、过程或资源等能力要素中的应用方案;
b) 按应用方案实施,确保技术成果得到有效应用;
c) 评价应用方案和技术成果的效果和价值。
9 资源
9.1 概述
组织应根据运行维护服务能力策划要求和特定服务场景的需求,按需建立和管理运行维护工具、服 务台、备件库、最终软件库、服务数据和服务知识等,以满足不同服务场景的服务需求。实现与人员、过 程和技术结合,保证资源能力满足价值实现过程中服务提供的需求。
9.2 运行维护工具
组织应在不同服务场景中使用工具支撑运行维护服务,以满足与需方约定的及需方未来的运行维 护服务需求,促进服务价值的实现和创新。运行维护工具可分为监控工具、过程管理工具、专用工具,组 织应通过工具提高服务效率和质量。至少应包括:
a) 依据服务需求,选择运行维护工具;
b) 制定运行维护工具的部署、应用方案,并实施;
c) 必要时,通过技术研发实现工具间的集成;
d) 制定运行维护工具的管理制度;
e) 定期评估运行维护工具的应用效果并改进。
注:常见专用工具包括信息安全防护、计算资源调度、自动化维护操作、服务数据分析、服务知识提炼、服务可视化 等类别。
9.3 服务台
组织应针对服务场景的特点建立服务台,服务台应具备服务接入、信息交互、资源调度、服务过程管
控等职能,并结合自身业务特点进行管理。至少应包括:
a) 选择适宜的服务台模式和支撑工具;
b) 设置服务接口,可包括热线电话、自助门户、移动应用、智能客服等方式提供服务;
c) 依据过程框架和过程管理要求,支撑已上线过程的相关活动;
d) 建立服务台的管理制度,包括服务请求的接收、记录、跟踪、反馈,以及服务台人员的监督和考 核等;
e) 定期评估服务台的运行效果并改进。
9.4 备件库
组织应针对服务场景的特点策划、建立备件库,以满足设备恢复或系统正常运行的要求。至少应 包括:
a) 规划备件的分类、分级、数量、响应方式等;
b) 制定备件管理策略及备件管理制度,包括计划、采购、出入库、检测、报废等活动;
c) 选择适宜的空间和位置存放各类备件;
d) 定期分析备件运营成本、备件库管理成本等,实施成本控制或优化措施;
e) 定期对备件的状态进行检测,确保满足服务需求;
f) 定期对备件库的使用和管理情况进行评估,持续改进;
g) 定期对备件供应商进行评价。
9.5 最终软件库
组织应建立最终软件库,以满足事件管理、发布管理、测试或系统正常运行的要求。至少应包括:
a) 规划最终软件库的应用范围、管理工具、控制手段等;
b) 制定最终软件库管理策略、权责及制度,包括计划、出入库、检测、退出等活动;
c) 选择适宜的空间和媒介存放各类软件;
d) 制定软件版本、配置项、配置基线等的管理制度,确保只有经过授权或评估后的软件才能进入 最终软件库;
e) 制定最终软件库的访问控制策略并执行;
f) 定期对最终软件库中的软件版本进行可用性检查,保持与运行维护服务需求的一致性;
g) 定期对软件库进行备份;
h) 定期对软件库的使用和管理情况进行评估,持续改进。
9.6 服务数据
组织应充分利用运行维护工具有效管理服务数据,以支持运行维护服务的量化管理或服务创新。
至少应包括:
a) 针对服务场景的特点定义服务数据的类型、内容、格式等;
b) 制定服务数据的采集、存储、分析、处理、展示和利用等活动的管理要求;
c) 确保服务数据管理活动的合规性;
d) 利用工具对服务数据进行管理;
e) 制定服务数据质量管理和数据安全等方面的要求;
f) 对服务数据进行统计分析,并运用服务数据分析结果,支持运行维护服务管理决策,改进运行 维护服务的效率和质量。
9.7 服务知识
组织应充分利用运行维护工具和管理手段对服务知识进行全生命周期管理,以保证服务知识为组织的运行维护服务或创新提供支持,至少应包括:
a) 明确定义服务知识范围和类型;
b) 确定提炼并形成服务知识的管理要求;
c) 建立服务知识管理制度,管理知识的获取、评审、保存、分享等活动;
d) 使用适宜的技术手段实现知识的全生命周期管理;
e) 建立知识有效性及利用率的评价机制,以促进知识更新;
f) 宜通过应用知识建模、算法实现和特征工程等手段实现知识的深度学习和进化。
附录A
(规范性)
运行维护服务和内容
A 概述
运行服务对象和内容如图A.1所示。
图A.1 运行维护服务对象和内容
A.2 运行维护服务对象
按照运行维护的资源分层视角,运行维护对象分为六个层次,包括如下内容。
a) 机房基础设施:
1) 电气系统:包括高低压供配电系统、电源系统、照明系统、电缆及母线槽、防雷与接地等;
2) 通风空调系统:包括空调水系统、空调风系统、机房空调系统等;
3) 消防系统:包括消防供配电设施、火灾自动报警系统、应急照明与疏散指示系统、应急广播 系统、消防供水设施及消火栓系统、自动灭火系统、防烟排烟系统、防火分隔设施、建筑灭 火器、空气(氧气)呼吸器等;
4) 建筑弱电/智能楼宇系统:环境和设备监控系统、安全防范系统、综合布缆系统等。
b) 物理资源:
1) 终端:台式计算终端、移动计算终端、输入输出设备、移动存储设备、通信设备等;
2) 网络:包括局域网、广域网、互联网、网络线路(包括专线、拨号网络、虚拟专用网)、路由器、 交换机、防火墙、入侵检测、负载均衡、语音以及通信传输设备等;
3) 服务器:包含A R M 服务器、X86 服务器、小型机和大型机等;
4) 存储:包括磁盘阵列、磁带库、光盘库等。
c) 虚拟资源:
1) 网络资源:如虚拟网络设备、虚拟链路、虚拟机网络等;
2) 计算资源:如虚拟机、虚拟机宿主机等;
3) 存储资源:如虚拟存储卷、存储控制器、存储链路等。
d) 平台资源:支撑应用系统运行的环境,如操作系统、数据库、中间件等。
e) 应用:
1) 指实现业务功能的各种软件,如财务软件、人力资源管理软件、办公自动化软件等;
2) 应用于自身管理的工具软件,如监控软件、流程管理软件、安全分析软件等。
f) 数据:
1) 业务数据:业务系统采集、分析并存储的各种信息载体等;
2) 运行维护数据:运行维护过程中,产生的各类运行维护信息、运行状态日志、故障处理文档 等信息;
3) 安全数据:在业务运行和运行维护过程中与安全相关的数据。
A.3 运行维护服务内容
运行维护服务根据其工作目标、工作内容、交付结果分为四大类,包括如下内容。
a) 调研评估:对运行维护对象的运行状况进行分析和评估,并提出方案建议。
b) 例行操作:
1) 监控:对运行维护对象的动态指标、静态指标、运行状况和发展趋势等进行记录、分析和 告警;
2) 预防性检查:对监控记录、运行条件和运行状况进行检查和趋势分析,发现其脆弱性,以消 除或改进;
3) 常规作业:对运行维护对象进行的日常维护,包括定期维护、配置备份、数据备份、数据恢 复、定期重启等活动。
c) 响应支持:
1) 事件驱动响应:由于外部事件、系统事件或安全事件,导致运行维护对象整体或部分性能 下降、功能丧失,而触发的将运行维护对象恢复到正常状态的活动;
2) 服务请求响应:由于需方提出各类服务请求,引发的需要针对运行维护对象、服务级别做 出调整或修改的响应型服务,可能涉及服务级别、服务范围、技术资源、服务提供方式等的 变更;
3) 应急响应:依据 GB/T 28827.3 规定的应急响应服务,执行运行维护服务应急操作流程 (EOP)
d) 优化改善:
1) 适应性改进:为保持运行维护对象在新环境中可持续运行而实施的优化改进;
2) 增强性改进:采取改进措施,增强数据中心的安全性、可用性和可靠性;
3) 预防性改进:检测和纠正维护对象运行过程中潜在的问题或缺陷。
注:运行维护服务内容(交付内容)详细要求见B/T 28827.2
附录B
(资料性)
关键指标参考
运行维护服务能力管理体系各要素中,供参考的关键指标如表B.1所示。
表 B.1 关键指标 (第 1 页 / 共 3 页 )
表 B.1 关键指标 (第 2 页 / 共 3 页 )
表 B.1 关键指标 (第 3 页 / 共 3 页 )
声明:文字来源于网络,仅以传递信息为目的,侵权请联系删除,谢谢!