IStorM DR灾难恢复案例-湖北农信
项目背景
湖北省农村信用社联合社(以下简称省农信联社)成立于 2005 年 7 月 28 日,承担对全省农村商业银行的管理、指导、协调和服务职能。截至 2017 年 4 月底,全省农商行共拥有 2142 个营业网点,在岗员工31800 多人,共有 3.4 万个惠农金融服务站,企业及个人客户达5600万个,各项存款 7726 亿元,各项贷款 4650 亿元,是全省网点最多、客户最多、服务范围最广、 人民币存贷款规模最大的银行机构。近年来,全省农商行在省委省政府的正确领导下,坚持依法从严治行,积极深化改革,提升服务,大力推进县域金融项目,努力打造“听党指挥、替政府分忧、湖北人民依赖、普通百姓满意的责任银行;人人事事时时处处合规、全面落实 全面风险管理的合规银行; 满足时代需要、引领行业发展的智慧银行”。
湖北农信联社目前在运行的生产主数据中心(以下简称“茶港数据中心”)位 于武汉市 武昌区水果湖街小洪山中区 70 号,主要承担全省农商行各类业务、管理、开发、测试等信息 系统运行;另在北京农信银清算中心建立并投产了异地数据灾备中心(以下简称“农信银灾备中心”),主要承担重要业务系统灾备功能。随着系统数量和复杂度快速增加,需要建设一套成熟的容灾切换管理平台以更加科学、统一、高效的方式来管理日常的容灾运维和容灾切换工作。
项目目标
为适应全省农信系统业务快速发展需要,满足全省农商行信息化支撑并引领业务发展的战略要求,省农信联社拟启动同城光谷应用双中心(含基础硬软件)建设项目,包括“两地三中心”IT 系统双活建设、综合管理及信息系统安全(含应急处置)建设。
“两地三中心”IT 系统双活建设:
建成“茶港-光谷”双活数据中心,实现业务系统分级,确保在灾难发生时,关 键业务系统 RTO 及 RPO 满足监管要求;完成分布式架构改造,解决现有架构在面对互联网类、数据分析类业务场景时,存在成本高、风险集中等问题;搭建“金融云平台”,实现业务开发“高速模式”,满足“快速、频繁、持续创新”发展新需求;建设“两地三中心”统一运维管理 平台,提升一体化、智能化、精细化管理水平。
根据湖北农信双活数据中心项目总体设计原则需要在茶港-光谷建立容灾切换机制,真正达到分钟级的业务全面切换、甚至是“一键切换”,实现业务的高可用、高可靠。
项目亮点
通过容灾切换平台建设,帮助客户建立完善灾备管理体系,并通过灾备管理平台实现灾备系统切换大屏指挥调度、灾备切换流程展现、灾难恢复预案(DRP)管理、生产与灾备环境比对等功能。在生产系统发生灾难时,结合灾难场景和灾难恢复预案,通过平台按照预先定义的流程将生产系统全部或部分切换到灾备系统。灾难后期,在生产系统恢复正常后,从灾备系统回切至生产系统,主要包括:
一、 灾备切换场景配置
场景功能配置需要结合更新后的灾难恢复预案,进行切换场景的定义。根据定义好的场景配置切换的流程、阶段。
二、 灾备切换环境监控
容灾环境监控时针对需要进行容灾切换的环境进行统一监控,包括对生产中心,灾备中心的的业务主机的状态进行检查,配置的一致性进行对比,还包括对复制链路的监控,例如对生产中心与灾备中心之间的数据库、存储复制链路,状态等信息进行监控,为灾备切换的决策提供判断依据。
三、 灾备切换流程管理
为保证容灾切换自动化的流程可实现,需要将配置好的切换流程和阶段进行拆解,拆分为步骤和原子操作。一个切换流程由若干条切换操作按串并行关系组合而成,保证切换的可靠性和成功率,需要对步骤和原子操作进行提前验证。并且随着系统的变更的持续进行,需要对操作进行同步的变更。
四、 灾备切换可视化展示
为了使灾难恢复领导小组和容灾切换演练全体参与成员在演练切换过程中能及时准确的了解生产中心和灾备中心现状、监控切换状态,采取科学有效的指挥调度方案,快速下达指挥命令,提高指挥和沟通效率,进而更好地达到灾难场景下信息系统恢复正常运行的目标。需要采用ECC大屏展示的方式,对容灾演练切换过程的重要信息进行全局展现、动态更新。