WatchStor.com — 领先的中文存储网络媒体 | 51CTO旗下网站

新闻资讯 > 重复数据删除 > 正文
EMC加码重复数据删除技术
作者: 旷文溱 2007-11-23 10:20 【CNETNews.com.cn】

今年将重复数据删除技术列为备份软件要项的EMC,再宣布延伸前者的产品线内容。

EMC昨(20)日宣布,该公司既有的备份软件NetWorker,将加入由收购Avamar取得的重复数据删除技术(Data De-duplication),而NetWorker亦将支持自家的持续数据保护(CDP, Continuous Data Protection)技术RecoverPoint,令企业用户仅使用单一数据备份软件,即可整合多种功能。

所谓的重复数据删除技术,意指扫描作业服务器(production)磁盘数据,判断数据是否为“重复”或“冗余”。原理是以算法切割磁盘里的数据成为 区块(Block)或是区段(Segment),并为每一个分割单位求出一个特征值(unique ID),即可以代表此区块的数据。

藉由这个特征值,系统就可以比对硬盘中已有数据新写入数据之间,是否具有相同之处。若是一致,即代表这笔数据为重复写入,系统便只会为这份数据留下一个索引(index),而不会重复储存占有磁盘空间。换言之只有特征值不同的数据才会被实际写入硬盘。

值得注意的是,NetWorker并非该公司首款支持重复数据删除技术的备份软件。该公司的Centera亦具有此功能。对于两者的功能区隔,EMC软件事业处资深技术经理蓝基能表示,Centera强调的系长期保存,安全层级更高;但是NetWorker的重复数据删除技术更为精细。

他举例道,两者虽然都能设定政策,规定数据必须在一定年限后才能删除,但是Centera能做到的是,未达年限一定无法进行修改、删除;NetWorker则相反,即便未达规定年限,也能由管理人员手动删除。而Centera是档案层级的重复数据删除;NetWorker则是子档案(sub-file)层级。

换言之,如果一个档案是10MB的大小,其中只要有50KB的异动,NetWorker都能侦测到,然后备份到那50KB。而Centera则可能将该档案视为重复数据,未予备份。

EMC指出,重复数据删除技术能将每日备份数据量减至300分之一,备份时间则可减少至10分之一。对于拥有5TB以上的备份数据量、集中在档案等非结构性数据的企业尤其适用。NetWorker将自7.4.1的版本开始提供重复数据删除技术和持续数据保护功能。现已开始提供给客户。

【返回新闻首页】

【责任编辑:常疆 TEL:(010)68476606】

标签:重复数据删除 数据保护 

了不起的IT经理
LecVideo
论坛与活动