关于我们
技术分享
技术分享
DSG大型数据库统一容灾备份热平台DBP软件
DSG大型数据库统一容灾备份热平台DBP软件
2021-06-11
目录
前言
本白皮书介绍了DSG的DBP (Disaster & Backup Platform)解决方案,是一种基于大型数据库Oracle的应用系统的容灾备份一体化的解决方案。
DSG的DBP是一种高性能的解决方案。当灾难发生时,基于数据库的物理备份和复制技术DBP解决方案,可以兼顾数据库的备份以保证数据不丢失、可以兼顾及小时以内容灾切换等目标,基本可以实现国际标准 SHARE 78 定义的5级左右的容灾目标等级。
DSG的DBP是一种模块化组合的、可以灵活配置的解决方案。DBP支持用户选购其中的高性能备份方案、或者选购其中的容灾方案、还支持企业选购备份和容灾模块以便构成一体化的数据容灾备份系统。
DSG的DBP是一种高性价比的解决方案。与能够实现同类功能和性能其它解决方案们相比,基于DBP的任何方案选择,都将展示明显的综合性价比优势,可以为用户大大降低其综合运营成本。
DBP:
是一种全球领先的综合容灾备份解决方案!
1 信息系统数据安全的四个指标
现代企业的信息系统达到了人类历史上的前所未有的高度。我们依赖的信息系统的信息量正在急剧增大、重要性也前所未有你,必须有一套安全可靠的数据保护机制,来确保企业的信息系统的数据安全和业务不停顿。
各种无法预知的挑战都会导致大型核心数据库的破坏,进而导致企业IT的系统崩溃。衡量一个企业的容灾备份的能力,至少应该有以下四个关键指标:
1)RPO (Recovery Point Objective):即恢复的数据丢失目标
主要指的是业务系统所能容忍的数据丢失率目标。RPO针对的是数据丢失的,一般由企业的数据备份系统的能力决定。
2)RTO (Recovery Time Objective):即指恢复的时间目标
RTO针对的是服务丢失时间长短,主要指的是所能容忍的业务停止服务的最长时间,也就是从灾难发生到业务系统恢复服务功能所需要的最短时间周期。
3)RCO (Recovery Continuity Objective):即指恢复的数据一致性目标
再好的容灾也不能单独解决数据的逻辑错误,即由于人为的删改、恶意篡改、人为的误操作等因素造成的逻辑数据错误。解决此类的数据逻辑错误往往需要依靠备份解决方案。RPO单独不能有效衡量业务连续性系统对数据丢失防范能力,系统恢复到某个正确完整的逻辑连续的状态的能力非常重要,因此,DSG提出了RCO(Recovery Continuity Objective)。
4)ROI (Return of Investment):综合的系统建设运维成本和收益比
好的能力意味着投资和成本。就容备项目来讲,绝大多数情况下容灾、数据库备份往往是不同的建设项目、解决方案也来自不同的厂家产品,项目投资、、成本重复、运维的成本增加。就容备的设备来讲,在大部分情况下,容灾端系统总是处于空闲状态,花费大量投资买来的系统根本无法有效利用。而主生产系统压力重重,又不得不扩容,又造成投资的重复和不可控。
好的容备系统意味着是上述指标的三好生:
即实现尽可能好的RTO(=0)、RPO(=0)和RCO(=100%)时,也需要通过支持一体化的容备架构、支持容灾端数据可用来实现业务分流、降低主生产端的压力,从而实现优良的ROI投资收益指标。
DSG公司在被技术白皮中,介绍了一个划时代的容备统一平台解决方案,追求实现超越业界其他厂家不能实现的RTO、RPO指标的同时,也实现了最优异的ROI指标。
DSG公司作为全球领先的业务连续性和容灾服务提供商,在大型数据库的容灾备份领域,拥有近10年的经验和全球领先的技术。截至2010年底,DSG公司已为我国近200个大型企业客户提供了先进的数据库备份、异构数据库复制和共享、数据库容灾、数据库历史数据库归档、海量数据库数据迁移等专业产品和服务技术服务,是全球的大型数据库容灾、备份、数据库服务管理领域的技术领先者。
2 企业信息系统面临的威胁和技术应对
统计所有对IT产生负面影响的事件,基本上是按照以下概率在发生:
系统不可用:(此类灾害合计约占47%)
● 地震、海啸、火灾等自然灾害: 小于 3% 主要依靠远程备份和容灾解决
方案
● IT 硬件设备损坏、网络中断种种灾害:约占 44% 主要靠双机集群、网络冗余或
者容灾等解决
数据不可用:(此类灾害合计约占53%)
● 人为故障(操作失误等): 约占 32% 主要依靠备份解决方案
● 软件故障 约占 14% 主要依靠备份解决方案
● 系统与网络的漏洞导致数据被***篡改等故障 7% 主要依靠备份解决方案
每种容灾和备份技术都有自身的特点和局限。
备份系统解决了数据不可用,即53%的故障率。数据备份是容灾方案的基础,是容灾系统数据高可用的最后一道防线,直接影响了容备系统的RTO和RCO。企业需要一个高效率的备份系统,以便实现好的RTO指标。企业还需要一个操作简单、容易核查的备份系统,以便保证数据完整性、正确性,即实现尽可能好的RCO (Recovery Continuity Objective)指标。
容灾系统可以解决47%的系统故障率。建设好的容灾系统,可以实现企业业务的不停顿,是现代企业的必备选择。
实现科学的RTO、RPO和RCO指标,从而实现ROI投资收益的最大化,就必须考虑业务系统的类型:是单业务系统还是多业务系统?是结构化的数据库应用还是非结构化文件应用?需要为不同的业务选择最合适的容备技术。
3 容备等级的建设目标和DBP统一容备的定位
容灾按其容灾能力的高低可分为多个层次,例如国际标准 SHARE 78 定义的容灾系统建设的技术目标有七个层次:
0级:最简单的仅在本地进行磁带备份;
1级:将备份的磁带存储在异地;
2级:建立异地数据热备系统,支持异地或本地数据恢复,时间可从几天到几个小时;
所以,0到2级,就是以技术最简单和投资最少的容灾解决方案,就是对业务系统每日备份的数据制作一个相同的拷贝并在容灾备份中心保存起来,这就是数据级容灾。当在机房发生火灾或者地震等,利用相关备份数据恢复数据,启用容灾中心启用备用业务系统。不难想像,这种容灾技术在恢复前需要准备相应的软硬件环境,可能导致业务中断时间较长,满足不了业务系统对中断时间要求,所以RTO是比较差的。
3级:建立异地数据热备、设立异地应用系统,数据和应用可在数天或数小时内异地恢复;
4级:建立异地数据热备、设立异地应用系统,实现有目标的异地远程业务数小时应用切换;
所以,3级到4级,就是通常的采用BCV,SRDF等智能盘阵镜像复制容灾技术,或者存储卷复制技术。此类技术往往对两点间的网络带宽有较大的要求、限制有效距离,由于软硬件必须同构造成成本高、而且容灾端系统利用率非常低,操作复杂造成容灾系统数据也不能够经常去验证,总体性价比不高。此外,如果没有备份技术保障,此类技术对过去时间点的数据恢复上无能为力,对逻辑错误导致的数据损坏无能为力。此类技术一般也就实现了4级左右的建设目标;
还有采取虚拟存储技术的发展,加强了基于网络的存储管理,由虚拟存储系统的管理平台负责存储池内所有数据逻辑卷的管理,安装在虚拟存储管理平台上的数据复制软件,组成虚拟存储系统虚拟逻辑卷之间复制的容灾解决方案,不太适合企业的关键业务,即基于数据库的业务系容灾。
5级:异地远程双活中心,即容灾端实现可用、实现小时内切换、数据一致可保证;
5级必须是是容备一体化的架构。此类技术开始用于企业的关键数据库应用业务容灾,可以选用基于数据库的复制技术。
数据库的复制技术分为逻辑复制技术和物理复制技术。逻辑复制技术可以实现数据库异构、操作系统异构、存储异构、实现热可用等级别的容灾,实现分钟级容灾切换,但是维护量较大,技术有难度。物理级的数据库复制技术往往需要操作系统的同构,但是DSG的DBP技术,实现了磁盘存储异构,并且支持容灾端的数据库可以使用,实现了该领域的新突破,居全球领先。
6级:异地远程双活中心,一直处于正常运行状态,实现0中断、数据0丢失、自动切换等。
6级技术,从目前来看,还没有真正成熟的技术和选择。
不仅仅是对容灾技术建设目标的关注就足够了。
容灾还是一个工程,需要关注:
1) 容灾的流程、规范
2) 具体验证、演练、操作方案的可行性
3) 严格地进行定期实地演练,否则一旦发生了灾难时具有很大风险的。
所以,作为工程化的容灾,其实地演练和操作可行性,也是容备系统的重要参考点。
4 DSG统一容灾备份DBP的原理
一般企业的核心信息系统往往是基于大型数据库如Oracle等来部署的。很明显,对于核心数据库及其系统,需要在均衡综合投资运营成本时,实现最高的RTO、RPO和RCO指标。
DSG的DBP:Disaster & Backup Platform基于数据库的物理复制技术,是一种大型数据库灾备一体化的解决方案,实现了备份和容灾技术的充分结合,支持企业构成一体化的数据容灾备份存储系统。当灾难发生时,DSG的DBP解决方案可以兼顾数据库的备份以保证数据不丢失、以及小时以内切换,实现5级到6级的容灾目标。
DSG DBP解决方案的原理如下:
第 |
二 |
次 |
同步, |
合并 |
源 |
与 |
目标端 |
变化 |
块 |
第二次同步前目标变化块位置告知 |
生产系统 |
目标 |
系统 |
追 |
踪变化数据块 |
第一次全同步 |
静态存储池 |
启 |
动数据库 |
5 DBP方案类别概述
5.1基于DBP的备份方案
1.单库备份
2.多库统一集中备份
DBP备份功能特点: (1) 数据库的在线热备份:DBP功能可实现大型数据库数据库在线热备份功能,能够静态保存数据库数据,可将数据库恢复到任意时间点。 (2) 数据库非归档热备份:全球唯一支持非归档备份。 (3) 数据库数据表恢复:DBP支持多种级别的表恢复功能,可以恢复固定时间点数据表,也可以按照时间点恢复数据表功能。 (4) 数据库精确恢复:结合容灾的数据库任意时间点精确恢复。 (5) 数据库备份的可验证:独创的备份数据预检测、备份数据模拟预恢复检测、模拟数据库恢复打开验证、结合容灾的自动验证等等。 |
DBP备份的性能特点: (1) 每小时Tbit级别的在线热备份; (2) 每小时Tbit级别的恢复性能: (3) 小时级别内完成的高速增备; (4) 10%以内的系统低干扰; (5) 自动智能全备,节约了所谓的增备的回复时间; |
5.2基于DBP的容灾方案
1. 单库容灾
2. 多库容灾
DBP的主要容灾功能: (1)数据库容灾全同步功能 DBP支持不落地或者落地的方式进行数据库全同步。 DBP的客户端agent在源端实时跟踪数据变化,DBP可根据定义规则设置固定时间间隔,如小时、分钟等,将变化数据同步到目标端,实现容灾端系统准实时同步。 (2)容灾数据可验证性 DBP软件在完成增量时候,数据库是关闭并处于加载和打开过程中。在数据库打开后,数据库已经完成数据是否一致的验证,容灾数据是否可靠。 (3)容灾端系统可用性 DBP软件支持容灾端数据打开,并支持做各种应用,例如报表、查询、应用软件的测试,以及接管业务的容灾切换。 (4)容灾数据库可读写 DBP的全球独创性是支持备份数据库服务器可读写功能方式。该功能特别适合于应用测试系统的调测。 而在同步时或者容灾时,可以将容灾端数据库的改写归零,然后用生产端的变化信息进行同步更新再打开使用;或者更新到最新时间点后,进行容灾切换和接管生产端业务。 (5)容灾端切换和回切功能 切换管理方便,只需要对应用系统进行切换即可;容灾可靠性高,容灾系统可在定期同步结束后一直处于正常运行状态,不存在无法切换的问题。 在生产业务切至容灾端之后,运行一段时间,可将业务切回至生产端,回切时仅需要将容灾端运行的增量数据回切即可。 (6)容灾备份兼容性 适用于大中型系统的Oracle数据库、基于物理复制技术,完全支持盘阵异构。可以利用现有的各类存储资源建立统一的备份容灾系。 |
容灾的性能特点: (1) 不受距离限制; (2) 完全适应大型和超大型的Oracle数据库运营系统,如5TBit以上的大型数据库; (3) 数据库首次同步可以实现1TBit每小时; (4) 大型数据库的增量同步可以在小时内完成; (5) 容灾切换可以在小时内完成; (6) 可以实现数据库的任意时间点的逻辑修复和恢复; (7) 数据库数据恢复的速度达到1TBit/小时,基于智能全备技术,避免一天以上的日志加载,大大缩短了数据库的恢复时间。 |
5.3基于DBP的容灾备份一体化解决方案
1.单库备份容灾一体化方案
2.单多备份容灾
容备一体化功能特点: 基于DBP实现的备份容灾一体化解决方案,节省投资,可以实现: 1) 构建容灾备份统一中心,并且拥有DBP支持的备份和容灾功能, 1) 构建一体化数据存储管理平台,实现备份容灾操作的一体化, 2) 在正常情况下,实现实时数据一致性传递,实现备份、容灾功能的直接互补, |
容备一体化份的性能特点: 一体化的容灾备份系统,实现两套功能的统一同时,完全不影响备份、容灾的各自的性能优势和指标。 |
5.4基于DBP的统一备份容灾和审计方案
DSG公司可以提供一整套订制的Audit专业产品,可以实时地、精确地、离线方式审计大型数据库的各类变化,并对其中的有危险的变化特别记录。当数据库数据出现逻辑错误时,可以借助此审计产品的功能,精确锁定出现逻辑错误的具体操作、SQL语句、登录信息等等,并且可以结合DSG的DBP备份容灾平台,告知如何获取正确的数据,来逻辑恢复出现故障的数据库。
DSG的Audit,能够对上述挑战有快速全面的监控和感知,能在灾难和不可预知事件发生后,有针对性地的快速恢复关键业务数据和业务,实现所设定的RTO和RPO指标,保障业务运营的连续性。
6 DSG DBP 与其他容灾备份技术的比较
比较项目 | 盘阵级容灾 | 卷复制容灾 CDP虚拟容灾 | DSG的RealSync 逻辑日志容灾 | DSG的DBP灾备一体化 | |
RTO恢复的时间效率 | 同步复制与数据同步性 | 高 | 高 | 高 | 差几个小时 |
切换时间 | 30分钟到1个半小时 | 30分钟到1个半小时 | 秒级10分钟 | 30分钟到1个半小时 | |
RPO数据恢复丢失率 | 数据丢失 | 数十分钟 | 数十分钟 | 数秒钟 | 数秒钟 |
RCO数据恢复的一致性 | 逻辑错误诊断 | 无 | 无 | 无 | 优 |
逻辑数据错误的修复 | 无 | 无 | 无 | 优 | |
ROI投资效益比 | 信息传输量 | 1 | 1 | 1/5 | 1/5 |
容灾距离 | 一般<100公里 | 受带宽限制 | 没有距离限制 | 没有距离限制 | |
数据共享 | 共享需要另外增加100%投资 | 无 | 完全共享,可为其它系统提供数据 | 完全共享,可为其它系统提供数据 | |
容灾端数据库是否可用 | 否 | 否 | 是 | 是 | |
对主生产影响 | 低 | 对业务系统有一定影响,主要在性能、部署、运行、变更和维护上 | 低 | 低 | |
资源利用 | 操作系统两端同构 | 操作系统两端同构 | 两端异构 | 同构 | |
存储必须相同阵列 | 存储支持不同阵列 | 存储支持不同阵列 | 支持不同存储 | ||
新增设备,原有资源浪费 | 新增设备,原有设备浪费 | 可以完全使用利旧设备 | 可以利旧 | ||
容灾应急流程 | 切换便利性 | 复杂 | 自动切换 | 两端同时运行 | 两端同时 |
切换可靠性 | 较低 | 较低 | 最高 | 高 | |
容灾端数据的可恢复验证性 | 必须安排具体计划,复杂 | 必须安排具体计划,复杂 | 随时 | 随时可以验证 | |
容灾回切 | 复杂 | 复杂 | 简单 | 简单 |
- 标签:
-
其他
您可能感兴趣的新闻 换一批
热门文章
现在下载,可享30天免费试用