从灾备到未来:HyperBDR助力某国家级社会保障机构启动跨云容灾,激活数字化引擎
"HyperBDR令人惊喜,它满足了我们当前的合规和恢复需求,也与我们追求的更加深度的技术融合、持续创新与优化的战略布局相吻合。我们将从灾备体系出发,探索更多基于云原生技术的解决方案,应对未来更为复杂的挑战。"
️—— Juan Martínez,该国家级社会保障机构业务连续性及灾备管理总监
一、背景2023年8月,一所国家级社会保障机构的数据中心突发电力中断,致使业务系统停摆近1天,影响医院等医疗机构正常运作,威胁着百万民众的医疗健康与社保服务。
作为所在地区最大的社会保障机构之一,该机构为数百万民众提供医疗、社保、健康管理等服务,其数据庞大、业务复杂、业务连续性要求极高。此次停电使其意识到本地IDC灾备方案在恢复能力和速度上存在的局限。为避免业务中断再次发生,确保在突发状况下迅速恢复的同时兼顾相关法规合规,该机构计划短期内将本地Huawei Cloud Stack(HCS)私有云平台的业务系统容灾至华为公有云平台。
️1. 合规压力下的云灾备转型
该机构作为医疗健康与社会保障核心枢纽,需要满足严格的RPO和RTO合规要求。比如,医疗系统必须要确保电子健康记录(EHR)的安全,避免数据丢失以保护患者隐私;作为社会经济关键基础设施,应该重视恢复时间目标(RTO)和数据保护的重要性,减少公众信任危机。为此,该机构亟需借助公有云平台的容灾恢复能力。
️2. 大规模、复杂环境推高容灾成本
此次容灾计划涉及至少1000+台虚拟机,且运行环境复杂,包括7个版本的Windows主机和11个版本的Linux主机。这种大规模和多样性,使得传统灾备方案的建设和维护成本高昂且难以控制。该机构需要引入自动化部署和运维管理容灾方案,来降低容灾成本并提升效率。
️3. 单一架构,难以应对新型挑战和技术创新
该机构的业务需求在数字化转型和公共服务创新的驱动下不断变化,目前的私有云平台难以快速适应新的业务场景或需求变化。例如,在短时间内难以提供足够的扩展能力,需要提前规划和手动配置,难以应对突发公共服务负载激增或新型网络攻击等,严重制约业务敏捷性与创新能力。
三、解决方案️1. 差异化的数据同步策略,精准匹配保护
该机构的业务系统涵盖多个领域,各系统对数据一致性要求差异显著。为此,万博智云团队通过HyperBDR实施了差异化的增量同步策略,确保每一类系统获得与其重要性相匹配的保护级别:
○ 业务连续性要求极高的系统:如癌症患者管理应用(医疗健康类)、收费系统(财务与经济类)等系统,采取每5分钟增量同步的策略,RPO为5分钟。
○ 数据一致性要求高的系统:像数字化健康证系统(医疗健康类)等系统,每1小时增量同步,RPO为1小时。
○ 中等重要的系统:如监控和告警管理系统(技术支持与运维类),每12小时增量同步,RPO为12小时。
○ 次要或非实时需求的系统:如公共工程信息和跟踪系统(公共服务类),每24小时增量同步或按周、月完整同步,RPO为24小时及以上……
通过以上差异化策略,HyperBDR确保该机构的核心业务系统获得了低至5分钟的RPO保护,同时为非关键系统提供了适度的容灾支持,避免了资源浪费,实现了保护级别与业务价值的精准匹配。
️2. Boot in Cloud技术,一键云上启动业务
HyperBDR的Boot in Cloud技术通过与华为云侧API的无缝对接,灾难发生时系统能按预设策略和自动化指令,一键启动云侧资源,在10 - 15分钟内拉起多个业务主机,并迅速恢复到操作系统登录页面,显著缩短恢复时间,满足该机构 RTO 30分钟的合规性指标。
️3. 并发传输与自动化实施,提高部署效率
综合源端和目标存储系统I/O性能、网络带宽等因素,1000+台虚拟机的首次全量数据同步被安排每天40 - 50台并发完成;同时在客户同意前提下配置了Agent自动化安装脚本,快速完成了全部主机Agent安装。其中,500台Windows系统的安装只用了2个半小时,另外500台Linux系统因系统内核类型较多,适配和处理的时间较长,不过也在近2个工作日内完成。整体周期从15+天缩短至2个工作日内,提升了部署效率并降低了复杂性。
️4. 云深度集成,构建跨云韧性
HyperBDR通过与云原生能力的深度集成,为该机构实现跨云环境下的弹性资源调度与资源编排能力,动态适配突发公共服务负载、新型网络威胁及政策技术变革,确保该机构始终维持业务连续性;同时,基于可视化的统一管理以及对自动化脚本的支持,为该机构提供了更为高效简单的跨云保护,实现私有云到公有云的无忧、无缝容灾。
四、价值收益通过采用HyperBDR云容灾解决方案,该机构成功实现了本地数据中心到公有云的灾备计划,最大限度降低服务中断风险,为数百万民众的医疗和社保服务提供了坚实保障。具体价值体现在:
️1. 业务韧性及合规保障显著增强,核心系统RPO达5分钟
该机构实现了30分钟的RTO(恢复时间目标)和5分钟的RPO(恢复点目标)的SLA要求。其中,最核心的系统在灾难发生时,能够确保数据丢失量控制在5分钟以内,其余系统也能在短时间内恢复到最近的有效数据状态。既保障了数据的一致性,也满足了政策对业务连续性和数据保护的高标准。
️2. 灾备和运维成本显著降低,人力成本节省80%以上
借助自动化Agent安装脚本,该机构无需为每台虚拟机单独部署备份系统,容灾部署周期从15天大幅缩短至2天,人力成本节省达80%以上。另外,HyperBDR的无主机数据同步和全增量同步技术,有效降低了该机构的灾备存储成本。相比传统容灾方案,存储成本降低了70%以上。
️3. 适应未来,激活数字化引擎
该机构借助HyperBDR的跨云保护能力,不仅夯实了当前业务连续性基础,更以 “适应未来”的弹性架构,抢占数字化转型先机,保障公共服务高可用的同时,为驱动创新应用落地打下基础,从容灾架构升级开始,为业务创新启动“引擎”。具体表现为:
️a. 资源灵活调度与按需扩展 该机构的容灾架构能够保证在突发公共服务负载增加的情况下,系统能够从公有云侧动态调整资源分配,实现业务需求的快速响应,确保服务不中断。
️b. 数据的管理、分析与智能转型 该机构可以更加高效地管理和充分利用备份数据进行数据分析,引入AI深度学习和训练推理,开展业务优化、风险预测、医疗健康以及社会保障趋势分析等工作,推动智慧医疗健康和社会保障服务转型等。
HyperBDR基于云原生深度集成,以差异化数据同步、一键云上恢复、自动化高效部署为该机构构建了跨云保护能力,提升了业务韧性。更为重要的是,为其未来的数字化转型和创新场景埋下伏笔,令其逐步成长为公共服务领域数字化转型的先行者。
我们期望与更多公共部门合作,助其打造面向未来的,灵活、可靠、自动化的灾备体系。帮助他们在面对电力故障、自然灾害、网络攻击等突发事件时迅速恢复服务,提升其业务韧性和数据弹性,同时推动他们为数字化转型做好准备,让公共服务体系更加智能、敏捷,满足未来发展的需求。
相关推荐:
公有云容灾,中小企业最具性价比的选择
万博智云与统信软件完成产品兼容互认证