灾难是一种具有破坏性的突发事件,如图1所示,本文所关注的是灾难对单位的正常运营和社会的正常秩序造成的影响。其中最明显的影响是信息服务的中断和延迟。信息系统停顿的时间越长,单位的信息化程度越高,损失就越大。
信息系统的容灾,即对灾难的抵抗和防御,目的就是提高信息系统抵御灾难和重大事故的能力,减少灾难打击和重大事故对企业造成的损失,保证信息系统所支持的关键业务功能在灾难发生后能及时恢复和继续运作。
图1 信息系统灾难分布
1.通用容灾技术框架
1.1企业信息系统容灾的级别
信息系统的容灾可以分为三个级别:
(1)数据级容灾:只考虑将生产站点的数据如何复制到远程站点。
(2)应用级容灾:灾难发生时,不仅要保证数据在容灾中心可用,而且还要保证容灾端的存储设备、服务器设备、网络设备等系统处于可用或者待命的状态。
(3)业务级容灾:不光要保证容灾端的应用系统可以提供服务,而且还要保证范畴之外的例如人员、部门、物资、财力都要可用,这是最高层次的容灾。
1.2容灾技术模型
从技术角度看,企业IT平台一般可以划分为“接人平台、应用平台、数据平台”三部分,容灾技术平台建设主要着眼于这三部分的保护,如图2所示。
图2 容灾技术模型示意图
(1)接人平台冗余和切换
关键在于实现相同访问能力的网络设备,并在网络配置上确保能快速、方便地将网络访问从生产中心切换到容灾中心。
(2)业务处理能力的冗余
主要表现为对业务处理能力的冗余和复用,其中包括操作系统、应用系统、数据库、中间件等层面的复制及切换的能力。
(3)数据存储平台的保护
主要表现为对系统存储层面的保护。它是比应用平台更为底层的数据级保护。
在容灾系统建设中,数据存储平台的保护是实现企业灾难恢复的核心。保证数据的安全永远是第一位的。
2.不同容灾技术分析
2.1容灾技术方案概述
对所有的容灾技术平台建设而言,容灾方案的技术核心是实现远程数据复制,并能够在灾难发生时在远端利用复制数据提供企业业务运营支撑服务,因此数据复制技术是构建容灾技术平台的核心。不同数据复制技术的分类如图3所示。
图3 数据复制分类
根据所采用数据远程复制技术位于的不同层面,又可以分为以下三类容灾方案:
(1)基于存储层面的容灾方案:利用存储系统的远程数据复制功能建设容灾系统。
(2)基于主机层面的容灾方案:利用主机厂家提供的相关功能软件或第三方的主机软件实现远程的数据复制,建设容灾系统。
(3)基于应用层的容灾方案:如利用应用软件Oracle数据库的本身的远程数据复制技术建设容灾系统。
2.2基于存储数据复制技术的容灾系统
采用基于存储的容灾方案的技术核心是利用存储阵列自身复制技术实现数据的远程拷贝,从而实现生产数据的灾难保护。
基于存储的容灾方案示意图如图4所示。
图4 基于存储友制技术的容灾方案示意图
该方案的必要前提是:
(1)通常必须采用同一厂家的存储平台,存在一定的设备上的限制。
(2)采用同步方式可能对生产系统性能产生影响,对通信链路要求较高。
(3)采用异步方式存在数据丢失的风险,通常在远距离通信链路带宽有限的情况下实施。
尽管有以上限制,此方案也具有显著优点:
(1)独立于主机平台和应用,对各种应用都适用,而且完全不消耗主机的资源。
(2)由于在最底层实现,实施起来受应用、主机环境等相关技术的影响最小,非常适合于复杂的环境。
(3)采用同步方式可以完全不丢失数据,在同城容灾或园区内容灾方案中不会对生产主机的性能产生显著影响。
(4)采用异步方式虽然存在一定的数据丢失的风险,但没有距离限制,可以实现远距离保护。
由于以上优点,基于存储灾难保护方案是目前采用最多的灾难保护方案。典型的基于存储的容灾技术有EMC公司的MirrorView,SAN Copy, IBM公司的PPPC技术等。
2.3基于主机数据复制技术的容灾系统
采用基于主机的容灾方案的示意图如图5所示。
图5 基于主机的容灾方案示意图