WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

评论分析 > 归档 > 正文

数据长期保留面临的挑战:100年您准备好了吗?

WatchStor  佚名丨2008-11-10 10:16 标签:归档 备份恢复 

拿起 100 年前的书,您也许可以毫不费力地进行阅读,但读取哪怕只是 10 年或 20 年前的备份磁带,可能要困难得多。即使具有正确的硬件来读取磁带(且磁带本身仍然完好),您还是需要知道磁带的写入格式,且需要可以识别此数据的应用程序。情况可能会非常复杂,且随着时间的推移只会变得更麻烦。此时您也许会想:“没什么,我不需要将数据保存那么久。”

不间断且可靠地访问信息企业的繁荣依赖于可及时获得所需信息。仅仅考虑一下员工、客户和供应商而不访问其关键信息和数据,就会对您的生产力、客户满意度和收益率产生直接影响。

信息可用性与业务弹性直接相关。灾难可以破坏大量的作业和数据,同时也会对企业生存能力造成毁灭性的影响。

但是,信息可用性不仅仅意味着具有合适而有效的灾难恢复措施。虽然不像飓风或火灾造成的物理影响那么严重,但是宕机一小时甚至也可以对企业造成灾难性的影响,导致巨大的开销,并且这种情况非常有可能发生。组织必须设法确保用户能够不间断访问关键数据。

但不是所有的信息都具有相同的价值。合理的信息可用性规划会识别那些对企业来说最关键的数据,然后使用最佳实践方针和过程来创建并实施全面的信息可用性策略。 

2007 年,存储网络工业协会 (SNIA) 完成了一项全面调查,在该调查中我们采访了来自世界各国各种组织的数百人。令人惊讶的是,80% 的人说他们的信息必须保存 50 年以上,68% 的人说他们的数据必须保存 100 年以上。足足 70% 的人还报告他们对阅读 50 年内所保留信息的感知能力很不满意。他们最关心什么类型的数据?电子邮件、客户记录、企业应用程序数据及数据库 — 我们大多数人每天处理的信息类型。还想再关注吗? 

NetApp观点:100年归档您准备好了吗?

在本文中,我将解释数据长期保留面临的挑战,讨论您现在可以使用的一最佳实践,以及通过我担任主席的 SNIA 长期归档和法规遵从存储计划 (LTACSI) 谈谈正在进行的工作。

数据长期保留面临的挑战是什么?

NetApp观点:100年归档您准备好了吗?

简而言之,我们需要保留信息的时间(即使使用相对保守的 50 年图)远远超过存储系统(磁盘或磁带)和应用程序的典型生命周期。甚至保留期还要很久才过期,物理介质就开始退化,变得无法读取。

当前的实践是每隔 3 至 5 年迁移数据(同时在物理上和逻辑上)。物理迁移需要将信息从一个物理存储系统移到另一个系统,或从一种介质格式移到另一种格式以维持物理可读性、可访问性和完整性。这种类型的迁移的推动因素包括介质故障、介质或存储系统过时、系统更改及运作成本(人员、电力、空间)。

逻辑迁移需要将信息从一种逻辑格式移到另一种格式(如从应用程序的旧版本移到新版本),以保持可读性和可解释性。推动因素可能包括更改应用程序格式、过时的应用程序及合并。这两种迁移类型的障碍因素包括成本、复杂性、巨大的信息量以及时间和/或预算的不足。

上述 SNIA 调查表明,逻辑和物理迁移不能有效地规模化成本来满足当前和未来的需要。事实上,只有 30% 的被调查者每隔 3 到 5 年迁移磁盘上的数据。显然,需要使用新的方法来满足长期数字信息保留的法律、法规、业务、成本及可扩展性要求。

过渡解决方案

由当前存储系统和应用程序引起的限制近期不会消除。那么,现在您应采取什么措施来解决长期保留问题?当前最佳的建议是,针对您的应用程序、操作及数据存储库实施正式生命周期管理流程,以在使用寿命中解决数据管理的效率问题。最佳实践应包括:

· 所有相关人员 (IT、RIM、法律、业务、安全性) 密切协作,以确保解决所有需要

· 清晰地标识现有的所有资产和资源

· 将信息分类,以便确定保留需求

· 制定保留、保护、安全性、法规遵从等等的要求

· 满足要求的服务实施

· 测评和改进

有用的实践可能包括:

· 按一些常用存储段将信息分类

· 设置保留期限及删除过期的数据

· 控制您针对数据保护维持的数据副本数

· 设置审计策略并加以执行

· 使用基于标准的存储平台

长期保存策略应确定业务、法律及法规遵从目标,且包括每个存储库遵守的最佳实践说明(包括物理和逻辑迁移)。物理迁移的目标应从固定期限(3 到 5 年)迁移到“所需的”策略。联合的、基于标准的虚拟化系统(如运行 Data ONTAP® GX 的 NetApp® 存储系统)有助于最大限度地减少迁移所涉及的中断、复杂性和人工。

对于逻辑迁移,您必须能维持真实性,即保证数据完好如初。此外,您应仅根据需要迁移,在保留某些数据时可能要考虑其它方法:将数据转换为标准格式(XML、PDF等),将硬件归档(若适用)或使用缩微胶片。

这似乎很复杂。虽然您必须按需执行物理和逻辑迁移,且这两种操作不能同时进行, 但目前几乎没有办法可确保保留的数据长期保持可读性。幸运的是,可以执行一些重要的工作来帮助解决这种情况。

标准工作

显然,迄今为止,存储行业还无法解决长期数据保留的问题。目前的归档应用程序所使用的专有数据格式会明显地将您限定在解决方案中,将来可能会使迁移工作更加复杂。所有这一切即将改变。

对于长期归档(15 年以上),最大的挑战是逻辑迁移。与专有存储格式相反,使用有效的生命周期管理流程和当前基于标准的存储技术足以解决物理迁移情况。此情况应该会得到进一步改善,因为供应商开始将注意力更加集中在可满足长期存储需求的硬件上。(见侧栏的示例:协作研究长期归档。)

另一方面,逻辑迁移保持了应用程序的特定性,自动化主要流程变得更困难。完整“保存”不仅需要保持数据的可读性和可解释性,还需要使用元数据长期保留数据,元数据包括起源、参考信息(上下文)及确保完整性和真实性的机制。

为此,SNIA LTACSI 建议 SNIA 成立长期数字信息保留和保存技术工作组来研究封装(见侧栏)。封装定义由内容(数据)及关联的保存元数据组成的“面向保存的”逻辑容器。可以在 OAIS AIP(归档信息包)上模拟封装。图 2 显示了 OAIS AIP 容器的内容。

NetApp观点:100年归档您准备好了吗?

封装意味着“自包含”,因为容器包含信息的数据、元数据、参考信息、完整性和真实性检查、访问控制及日志。此内容使容器更便携且独立于存储设备。它可根据您为信息制定的要求,独立于应用程序来管理容器。

封装是“自描述的”,因为容器可以由不同类型的系统进行解释,且可以包括阅读器,从而独立于应用程序解释内容。对于长期保存,此功能非常重要。封装提供了任何应用程序可以理解的标准格式,而且在理论上可让许多应用程序类型访问归档的内容,如 ECM、法律、迁移、保存等等。 

NetApp观点:100年归档您准备好了吗?

目标是消除对频繁的逻辑迁移的需要,以便组织在经过长时间后根据需要继续访问和使用归档数据,消除了因定期更新数据以适应应用程序更改而导致的开销和复杂性。

IBM和信息保留

IBM 围绕着归档和保留时间提供了全面的硬件、软件和服务以帮助利用信息的爆炸式发展。IBM 可以帮助您部署更具有弹性的基础架构,从而能够安全地存储信息并减轻业务风险。

利用关键信息保留技术:

混合存储(磁盘和磁带)环境 数据迁移和移动工具 数据压缩和数据去重 由策略驱动、可自动迁移的分层存储管理 用于数据保护的磁盘和磁带加密 不可擦除、不可重写的存储系统 可自动管理、用于内容识别和分类的记录/内容管理工具和解决方案 IBM 可以为您的企业定制集成的信息保留时间解决方案。IBM 可以帮助您利用旨在长期保留并保护数据的多层存储、压缩、去重和集成的归档解决方案,来满足延长信息保留期的要求。

IBM 信息归档和保留时间策略通过将组织信息价值与适当的存储介质进行匹配,有助于组织优化其存储基础架构。遵循这一策略,可以为用户带来了混合解决方案所具有的成本收益。不活动的信息可以存储在成本较低的存储器上,如磁带介质,而关系更密切、更重要、活动更频繁的信息则可以存储在近线磁盘上,以支持更快进行检索和搜索。

确保信息在保留期间安全且受保护,对于减轻关键信息泄露所造成的业务风险和成本至关重要。IBM 企业信息架构工具和解决方案支持在网络传输之前或一保留数据就将其保存在磁盘或磁带上时进行数据加密,并允许在其生命周期结束之前对其进行安全处理。

您现在应该做什么?

最重要的事是立即采取措施,避免陷入将 TB 数据需要物理和/或逻辑迁移的危机中。最好的方法是遵循“过渡解决方案”中所述的准则,包括尽可能地使用开放式标准。开放式标准可在开始迁移时为您提供更多选择,有助于防止受制约。

如果您的组织尚未进行这些操作,请考虑实施数据分类以更好地了解数据及支持生命周期管理。然后,寻找可执行策略及简化物理迁移流程的解决方案(硬件和软件)。现在采取这些措施后,在未来几年制定了新的长期归档标准时,您将可以很好地利用这些标准。


相关资讯

今日微信独家

《华尔街日报》报道日前援引知情人士的消息称,由于被美国政府以国家安全问题为由进行调查,联想斥资23亿美元收购IBM低端服务器业务的交易陷入了停滞状态。
关注新浪官博 订阅微信订阅号

订阅焦点周刊

论坛与活动

2016中国数据加速峰会直播专题
2016中国数据加速峰会直播专题[详细]
点击查看

精彩视频

最新文章

1111111
1111111
asdasd
asdasd
同有科技应用型大数据存储在南京掀起智能风暴
同有科技应用型大数据存储在南京掀起智能风暴
斯蒂芬斯蒂芬
斯蒂芬斯蒂芬
京东双11技术备战 构建多中心交易系统
京东双11技术备战 构建多中心交易系统