WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

新闻资讯 > 大数据 > 正文
BCM2009:灾难恢复与业务持续管理
作者: 佚名 2009-11-09 23:43 【watchstor.com】

各位领导,各位专家,各位朋友,下午好!我今天针对我和我同事过去几年开展的BCM工作,经常遇到的几个问题,我想在这跟大家一起来交流。当然这是我个人的看法,如果有不当的地方希望会后我们一块讨论。

我想讲六个问题,一是灾难恢复与业务持续管理的关系,第二是灾难恢复的要素和等级关系。第三是信息安全等级保护和灾难恢复等级的关系,第五是生产系统和灾害系统。第六是自建和外包的关系。
对于第一我就不讲了,陈主任已经讲过了,这是个发展过程,是我们信息化越来越深入的过程。虽然DRII应该是BCM流程的载体,但是对于高度依赖信息系统运行及核心业务的机构来说,DRII这一环非常重要的。第二层意思,要把DRII建设好、运行好,应该在BCM的整体框架中考虑,才能确实的发挥DRII的作用。
七大要素我们国家标准都有,六个等级也是国家标准有的,我想讲的是这六个等级中,每一等级的七大要素应该怎么来准备。六个等级划分,第一个等级叫基本设施,应该有个地方,这个地方可能很简单,做的数据备份系统,可能是每周做一次,像备用处理系统、网络系统可能都不需要。灾难恢复预案也做了,但是做的方案可能比较简单,只有在什么样的情况下发挥作用,就是子系统数据发生损害,或者机械系统破坏,把备份数据拿过来恢复,只能做这件事,这实际也需要测试和演练,也得有预案,预案比较简单。
第二级与第一级差别在什么地方,它有个恢复的备份场地,备用数据处理系统可能在灾难室调配,有时候我们叫冷战,与厂家签个协议,你把你原来放在仓库的设备放到我这来进行调配。与第一相比,运营维护需要与产业有关的内容。
做到第三级,应该每天都有一次完全备份,可能每天除了完整的备份,可能两小时、四小时备份一次,备份的网络可能也跟厂家签过协议,也需要专职机房人员,预案比第一、二级更全面和复杂,各种制度也应该建立起来。
第四级首先有数据存放的地方,同时应该有场地,24小时应该可用。数据备份系统应该差不多,但是有更高的要求,备份的数据处理系统,全部设备应该是具备的,或者说基本具备的,而且这些设备应该处于可用状态。
备用的网络系统也应该是可用状态,技术支持就相对要高,要专职机房人员,数据备份人员,硬件网络人员,都得有,当然有更加完备的预案。运行维护,需要机房、硬件维护、数据运行、备份,都应该有相关的管理制度。

第五级,备用的基础设施应该差不多,从数据备份系统来说,完整的备份应该每天一次,数据应该实时复制,它的设备应该处于就绪状态,加电开工状态,整个网络也应该在就绪状态,以后进入支持了,应该在72小时都有专职的机房、数据备份、网络人员,预案都要经过完整的测试、演练,要进行定期演练。整个机房、硬件维护、系统运行等等都应该有相关的管理制度。
第六级,最大的差别,就是在数据备份系统方面应该注重同步实施,努力实现数据的零丢失,备用信息系统应该在同步的运行状态,当然其他的备用网络系统页应该处在同步运行状态,包括运行软件也应该都有,应该有完整的测试和演练。
我们要想做到一到六,每个要素应该怎么准备,随着级别的提高,对技术要素的内容相对要求要高。这我也是根据我的体会,第一级我刚才说了,如果发生灾难时,数据丢失或者破坏的灾难,可以做恢复,如果生产系统本生整个毁坏了,那么这个可能恢复不起来了,甚至好几个月才能恢复,这你们要与领导讲清楚。第二级,如果发生第一级灾难,它还在生产中心恢复,如果生产中心坏了,还可以搭建一个生产中心恢复。备份的数据应该包含系统和应用软件数据。
第三级就好了,业务数据的损害和场地不可用,或者部分设备故障,都可以防范,备份恢复可能需要几天时间就可以。第四级应该比较高了,能够在几小时或者几天内能够恢复用,防范的风险有三种了,刚才我说了。
第五级防范的风险与第四级一样,数据损失,业务处理场地不可用,硬件网络故障等等,这也需要几小时恢复,这与你整个系统有关。像工商银行几万个点,数据恢复就慢一点。
第六级,尽管是数据零丢失,但是数据恢复也需要几小时,也是跟系统有关,不同的系统,你的业务不同,你的复杂性跟范围也不太一样,恢复时间也不一样,总的来说,应该在几小时内恢复。
大家在选择等级的时候,要跟你的业务什么性质,人员怎么安排有关,不是等级越高越好。现在我们经常被问到,国家有个信息安全保护系统,安全等级保护的基本概念,范围是在国家安全、经济建设、社会生活的重要程度,根据这个来做的,提出基本的要求,包括信息系统物理安全、网络安全、数据安全等,制度也很多,因为信息安全要求很多,同时对数据备份要求是基本要求。
这两个有共同的地方,就是对数据层面有各交集,比如我们从第一级开始就要保护数据,差异性也是很明显,安全等级保护目标是数据保护,灾难业务持续是包括数据保护、业务的持续性,对业务持续的要求很高。
等级一高不是说数据重要性高,而是业务持续的要求高。金融行业也许持续能力要求非常高,所以银行制订的标准,规定性要求很高,要达到基本同步。但是备份业务的数据,对于国家来说我们定三级。人民银行就把业务明确文三大类,每大类都提出了原则性的要求,我经常被问到这个问题,所以我觉得在建设时我们要把这两个分开。
第四是同城和异地的安全,同城翻译没有翻好,应该是本地, 有时候城市很大,比如重庆市就很大,同城的话也会相距很远,本地就距离很近。受到相同灾难的威胁就相对大一些,能够应付局部的灾害,比如IT系统故障、局部停电、局部水灾、火灾等,但是有个优点,如果业务有需要的话可以做到第六级,但是不等于同城都是第六级,不是这个概念,根据业务需求。
从异地来讲,离中心比较远,受到相同灾难危害的概率比较小,能够应对区域的灾难,当然还能应对具体的灾难,如通讯大规模中断,洪水、地震,包括公共卫生事件,把这一块全部封了。
从管理上来说,因为在异地,比较困难,同城管理比较容易。所以做到第五级就可以了。这方面标准我也没有,也不能很好的回答这个问题,还要看你基本条件。
异地来说,500公里是异地还是700公里是异地,不是这样考虑,主要是看你要规避哪些灾难,属于规避的是地震,那么不能都在地震带,不是选择距离,是选择你规避什么灾难。
从投资来讲,如果两个等级都差不多,都是第五等级,比如本地和异地,那么投资都差不多,管理稍微难一点。从异地来讲,异地如果没有分支机构,异地一般找专业服务商更好些。
如果说个要求比较高的,像银行这样,选择这样的布局,大型银行应该是这样的架构,但是这个架构建设时你可以分步骤来建,不是说要么不建,要建就很完备,所有建设都是个过程。
生产系统和灾备系统的关系,灾备系统是根据自身需要,从概念上讲应该是整个IT系统的有机组成部分,不是外加的一块,如果是多余部分,那么这样考虑就不对了,应该是与生产系统统一规划,统一建设。
同时也应该与生产系统同步发展。比如杨总讲的他们管的业务越来越多,灾备系统与生产系统同步完善,当然生产系统是第一位的,不是说其他是次要,不是这样,重点是生产系统,但是这几个同步,特别业务持续性要求比较高的机构,同步应该是努力做到的。
如何选择场地,有几个建议,一个是同一个数据中心你不能又做生产中心,又做灾备中心,这不合适了。比如我们这个场地,说生产中心放在这里,恢复中心也放在这,这不行。另外应该努力把生产中心运营好、建设好。刚才主席讲的,首先要减少威胁,另外减少威胁的影响。你把生产中心建设好,你风险就减少了。

另外选择灾备中心,选择什么样子的,你如果想要建四级以上的系统,如果这个地方不具备条件,那么就应该换个地方。你要看这里适合建什么就应该建什么。
有个原则,不是说我选择灾备中心,那里什么灾难都不能发生,甚至有人问我,灾难发生后你能不能抗洪抗震,这两个站点不大可能同时发生你要规避的灾害,这是最重要的,你要掌握这个原则。
配套的设施也很有要求,特别是电力、通讯、水都有相应要求。如果选灾备,从灾备系统建设的特点,高风险、高投入、低回报,运营非常难,如果有可能选择第三方的站点是明智的选择。

第六,直接外包,我们生产建设有几个是完全自建的,我们谈自建可能经常说,一个系统没有自建的,IT设备基本是外包,我们的数据库软件、操作系统都是外包的,可能有的应用是自己开发的,但是大部分都不是。我讲的意思是什么呢?不管你做生产系统还是灾备系统,哪些应该是别人做,哪些应该是自己做,要合适选择。

比如说从灾备系统建设来说,刚才说了七要素,可能场地可以自建,当然也可以外包,你的灾害恢复系统,一般来说自建比较困难,你的运营管理可以自己运营,也可以请专门运营队伍管理。
你的预案和管理可能由专业服务商帮你一块来做,可能想的更全面,因为人家做的多一些,人家专业性强。你的演练和恢复重建,我觉得都可以选择专业的服务商来帮你一块做,把你的灾备系统分成多少起来考虑,这样可以让你灾备系统比较快的建立起来。

灾备系统建设有这些特点,使你面临很多问题,比如一次性投资很大,如果你自己来做,可能场地要求很高,你凑合的场地你不愿意,很好的场地运营成本高,长期运营管理很复杂,所以我觉得可以寻求专业服务商来进行服务,专业服务商可提供的服务我列了几项,比如场地的运营维护和提供,灾备系统建设如何建,可以搞个方案,可以帮你实施,搞切换演练,切换演练肯定自己要参与。在灾难发生后,由专业服务商协助你完成系统切换,进行恢复,包括你完成生产重建。
你要明确,签订服务协议,要选择一个可以与你长期合作的单位,并且要有评估和审计。时间问题就谈到这里,如果充分用专业服务商资源,积极推进建设,这是应该做的事情。谢谢大家!

【编辑推荐】

  1. BCM2009:工业信息化部信息安全协调司副司长欧阳武致辞
  2. BCM2009:中国BCM专业委员会主席陈建新致辞
  3. BCM2009:中国信息化推进联盟常务副理事长邓寿鹏致辞
  4. BCM2009:国际灾难恢复协会副主席Mr. Louis J. Drapeau
  5. BCM2009:中金数据系统有限公司总裁张利致辞

标签:大数据 混合云 数据保护 云存储 服务器虚拟化 

了不起的IT经理
LecVideo
论坛与活动