NetApp存储效率资深营销经理谈重复数据删除技术的安全性如何
时间:10-24
来源:与非网
点击:
除非您最近像鸵鸟一样把头埋在沙子里,否则您或许会发觉重复数据删除是个非常热门的话题。似乎您有所耳闻的每个存储供应商(还有很多您不知道的公司)都在兜售重复数据删除技术,用于降低磁盘到磁盘备份的成本。
您或许也曾怀疑重复数据删除技术是否安全?在从已删除重复数据的备份还原数据时,您是否真的可以取回自己的数据?
评估重复数据删除技术的相对安全性可分为两个基本部分:
? 1.识别并消除重复数据所用的算法
? 2. 基础软硬件的可靠性
本文中,我将根据这两条标准评估重复数据删除技术。此外,我还将讲解 NetApp 为增强其重复数据删除技术的可靠性所作的选择。大多数其他供应商提供的重复数据删除仅用于备份,而我们却支持用于主存储和二级存储的重复数据删除,因此我们格外注重数据安全性。
识别重复数据
大多数现有重复数据删除产品都是在块级操作,即用新块比较上次存储的块,以判断是否存储过相同的块。如果上次存储过相同的块,则指针将指向这个存储的块,"新"块将被丢弃。
那么如何判断两个块是否完全相同?最常用的方法是计算每个块的指纹,即每个数据块中包含的哈希值。如果两个块有相同的指纹,则通常认为它们是相同的。
但是,两个不同的数据块也可能具有相同的指纹或哈希值,这种可能性虽然很低,但却是存在的。我们称之为"哈希冲突",这将导致唯一的数据块被意外删除。
正如我们所预料,降低哈希冲突的可能性必需有更为复杂的算法,这通常会耗费更多的 CPU 资源来计算哈希值,并会得出较大的输出值。显然,可靠性与速度之间存在某个平衡点。此外,哈希值越长,指纹存储所需的空间也越大。
在评估重复数据删除技术时,您必需清楚供应商识别重复数据的方式,以及所选算法带来哈希冲突的风险。很多供应商辨称磁盘故障、磁盘驱动器或磁带错误造成数据块损坏的概率要比哈希冲突的概率高。我不知道这是否只是令人宽慰的想法,但我相信绝大部分人都希望将风险降至最低。
由于 NetApp 支持主存储和备份存储的重复数据删除,因此我们需要采取一种更为积极的方法来防范哈希冲突。与大多数其他公司一样,我们也采用指纹算法,但只用于识别潜在的重复数据。发生哈希冲突时,我们会首先对两个块进行逐个字节的比较,核查它们是否完全相同,然后才会决定是否废弃任何块。NetApp 的技术总监 Blake Lewis 在上一篇文章中曾详细阐述 NetApp 如何识别重复数据块。
基础软硬件的可靠性
重复数据删除技术的可靠性程度取决于基础软硬件有多可靠。事实上,尽管这一点可能不会即刻体现,但是对于实施重复数据删除,可靠性确实变得更为关键。
例如,假设您按照比较标准的备份日程进行每晚的增量备份和每周的完整备份, 现在假设您在月初创建了一个文件,之后没有做过任何修改, 按照传统的备份方式,每周的完整备份都会产生一个副本,因此在月底这个文件将会有四个副本。如果您需要将文件还原至该点,则即使备份介质不可靠,您也可以至少恢复四个副本中的一个。
但是如果在此情景中加入重复数据删除,月底时,您只会有该文件的一个物理副本,外加三组指向相同文件块的指针。通过这个简单的例子,您或许认识到必须确保经过重复数据删除处理的备份一直可靠地存储在弹性硬件上,并具有很好的 RAID 保护。在这一年中,您可能会有数百个实际上引用着大多数相同数据块的备份。
NetApp 可靠性
凭借 NetApp® 存储,重复数据删除已是 Data ONTAP® 运行环境中不可或缺的一部分,贯穿整个产品系列。15 年来,Data ONTAP 随着 NetApp 硬件平台一直在不断发展。NetApp WAFL® 技术的独特功能确实简化了重复数据删除的实施,它可以删除任何存储数据(而不仅是备份数据)中的重复数据。
根据 NetApp 安装信息库的测量表明,公认的 NetApp 软硬件特有的高可靠性使数据可用性高达 99.999%。最近一份分析报告描述了 NatApp 的方法以及影响 NatApp 可靠性的许多功能。
我们非常重视细节,众所周之,随着时间推移,磁盘驱动器位错误会形成,这甚至也会在磁盘驱动器的制造过程中出现。每个驱动器都有内置的纠错机制来检测此类位错误,并通常会予以纠正。如果一连串过多的错误令 ECC 无法处理,驱动器就会报告此扇区不可读,此时 RAID 算法将根据其他扇区中存储的信息修复该错误。然而,NetApp 还采用校验和方案进一步保护,我们将驱动器的额外部分作为开销来存储在整个系统中随数据移动的校验和,以检查写入的数据是否能在数据恢复过程中完整返回。实质上,我们还提供第三层保护。
为了保护提交到磁盘的数据的可靠性,NetApp 还开发了高性能的 RAID-DP™,这是一个具有双奇偶校验的 RAID 6 实施,可以在不牺牲写入性能的情况防范双磁盘故障。有关防范磁盘驱动器误操作的 RAID-DP 和 NetApp 增强功能的更多信息,请参阅上一篇 Tech OnTap 文章。
您或许也曾怀疑重复数据删除技术是否安全?在从已删除重复数据的备份还原数据时,您是否真的可以取回自己的数据?
评估重复数据删除技术的相对安全性可分为两个基本部分:
? 1.识别并消除重复数据所用的算法
? 2. 基础软硬件的可靠性
本文中,我将根据这两条标准评估重复数据删除技术。此外,我还将讲解 NetApp 为增强其重复数据删除技术的可靠性所作的选择。大多数其他供应商提供的重复数据删除仅用于备份,而我们却支持用于主存储和二级存储的重复数据删除,因此我们格外注重数据安全性。
识别重复数据
大多数现有重复数据删除产品都是在块级操作,即用新块比较上次存储的块,以判断是否存储过相同的块。如果上次存储过相同的块,则指针将指向这个存储的块,"新"块将被丢弃。
那么如何判断两个块是否完全相同?最常用的方法是计算每个块的指纹,即每个数据块中包含的哈希值。如果两个块有相同的指纹,则通常认为它们是相同的。
但是,两个不同的数据块也可能具有相同的指纹或哈希值,这种可能性虽然很低,但却是存在的。我们称之为"哈希冲突",这将导致唯一的数据块被意外删除。
正如我们所预料,降低哈希冲突的可能性必需有更为复杂的算法,这通常会耗费更多的 CPU 资源来计算哈希值,并会得出较大的输出值。显然,可靠性与速度之间存在某个平衡点。此外,哈希值越长,指纹存储所需的空间也越大。
在评估重复数据删除技术时,您必需清楚供应商识别重复数据的方式,以及所选算法带来哈希冲突的风险。很多供应商辨称磁盘故障、磁盘驱动器或磁带错误造成数据块损坏的概率要比哈希冲突的概率高。我不知道这是否只是令人宽慰的想法,但我相信绝大部分人都希望将风险降至最低。
由于 NetApp 支持主存储和备份存储的重复数据删除,因此我们需要采取一种更为积极的方法来防范哈希冲突。与大多数其他公司一样,我们也采用指纹算法,但只用于识别潜在的重复数据。发生哈希冲突时,我们会首先对两个块进行逐个字节的比较,核查它们是否完全相同,然后才会决定是否废弃任何块。NetApp 的技术总监 Blake Lewis 在上一篇文章中曾详细阐述 NetApp 如何识别重复数据块。
基础软硬件的可靠性
重复数据删除技术的可靠性程度取决于基础软硬件有多可靠。事实上,尽管这一点可能不会即刻体现,但是对于实施重复数据删除,可靠性确实变得更为关键。
例如,假设您按照比较标准的备份日程进行每晚的增量备份和每周的完整备份, 现在假设您在月初创建了一个文件,之后没有做过任何修改, 按照传统的备份方式,每周的完整备份都会产生一个副本,因此在月底这个文件将会有四个副本。如果您需要将文件还原至该点,则即使备份介质不可靠,您也可以至少恢复四个副本中的一个。
但是如果在此情景中加入重复数据删除,月底时,您只会有该文件的一个物理副本,外加三组指向相同文件块的指针。通过这个简单的例子,您或许认识到必须确保经过重复数据删除处理的备份一直可靠地存储在弹性硬件上,并具有很好的 RAID 保护。在这一年中,您可能会有数百个实际上引用着大多数相同数据块的备份。
NetApp 可靠性
凭借 NetApp® 存储,重复数据删除已是 Data ONTAP® 运行环境中不可或缺的一部分,贯穿整个产品系列。15 年来,Data ONTAP 随着 NetApp 硬件平台一直在不断发展。NetApp WAFL® 技术的独特功能确实简化了重复数据删除的实施,它可以删除任何存储数据(而不仅是备份数据)中的重复数据。
根据 NetApp 安装信息库的测量表明,公认的 NetApp 软硬件特有的高可靠性使数据可用性高达 99.999%。最近一份分析报告描述了 NatApp 的方法以及影响 NatApp 可靠性的许多功能。
我们非常重视细节,众所周之,随着时间推移,磁盘驱动器位错误会形成,这甚至也会在磁盘驱动器的制造过程中出现。每个驱动器都有内置的纠错机制来检测此类位错误,并通常会予以纠正。如果一连串过多的错误令 ECC 无法处理,驱动器就会报告此扇区不可读,此时 RAID 算法将根据其他扇区中存储的信息修复该错误。然而,NetApp 还采用校验和方案进一步保护,我们将驱动器的额外部分作为开销来存储在整个系统中随数据移动的校验和,以检查写入的数据是否能在数据恢复过程中完整返回。实质上,我们还提供第三层保护。
为了保护提交到磁盘的数据的可靠性,NetApp 还开发了高性能的 RAID-DP™,这是一个具有双奇偶校验的 RAID 6 实施,可以在不牺牲写入性能的情况防范双磁盘故障。有关防范磁盘驱动器误操作的 RAID-DP 和 NetApp 增强功能的更多信息,请参阅上一篇 Tech OnTap 文章。
- NetApp 发布09 财年Q4 及全财年业绩报告(04-21)
- 凌力尔特公司高兴地宣布其高性能、高速 ADC系列有了新的出口管制分类号(ECCN)(06-13)
- 英国人是有多惨:政府坚持走4%的太阳能回报率(08-28)
- 威盛嵌入式相约2009年国际嵌入式技术巡展(07-01)
- 虹晶NAND Flash controller IP具备极佳ECC能力(01-14)
- 维肯推出推出多总线接口的安全微处理器(04-21)
鐏忓嫰顣舵稉鎾茬瑹閸╃顔勯弫娆戔柤閹恒劏宕�
- 妤傛ḿ楠囩亸鍕暥瀹搞儳鈻肩敮鍫濆悋閹存劕鐓跨拋顓熸殌缁嬪顨滅憗锟�
閸忋劍鏌熸担宥咁劅娑旂姴鐨犳0鎴滅瑩娑撴氨鐓$拠鍡礉閹绘劕宕岄惍鏂垮絺瀹搞儰缍旈懗钘夊閿涘苯濮幃銊ユ彥闁喐鍨氶梹澶歌礋娴兼ḿ顫呴惃鍕殸妫版垵浼愮粙瀣瑎...
- 娑擃厾楠囩亸鍕暥瀹搞儳鈻肩敮鍫濆悋閹存劕鐓跨拋顓熸殌缁嬪顨滅憗锟�
缁箖鈧拷30婢舵岸妫亸鍕暥閸╃顔勭拠鍓р柤閿涘奔绗撶€硅埖宸跨拠鎾呯礉閸斺晛顒熼崨妯烘彥闁喕鎻崚棰佺娑擃亜鎮庨弽鐓庣殸妫版垵浼愮粙瀣瑎閻ㄥ嫯顩﹀Ч锟�...
- Agilent ADS 閺佹瑥顒熼崺纭咁唲鐠囧墽鈻兼總妤勵棅
娑撴挸顔嶉幒鍫n嚦閿涘苯鍙忛棃銏n唹鐟欘枃DS閸氬嫮顫掗崝鐔诲厴閸滃苯浼愮粙瀣安閻㈩煉绱遍崝鈺傚亶閻€劍娓堕惌顓犳畱閺冨爼妫跨€涳缚绱癆DS...
- HFSS鐎涳缚绡勯崺纭咁唲鐠囧墽鈻兼總妤勵棅
鐠у嫭绻佹稉鎾愁啀閹哄牐顕抽敍灞藉弿闂堛垼顔夐幒鍦欶SS閻ㄥ嫬濮涢懗钘夋嫲鎼存梻鏁ら敍灞藉簻閸斺晜鍋嶉崗銊╂桨缁崵绮洪崷鏉款劅娑旂姵甯夐幓顡嶧SS...
- CST瀵邦喗灏濆銉ょ稊鐎广倕鐓跨拋顓熸殌缁嬪顨滅憗锟�
閺夊孩妲戝ú瀣╁瘜鐠佽绱濋崗銊╂桨鐠佸弶宸緾ST閸氬嫰銆嶉崝鐔诲厴閸滃苯浼愮粙瀣安閻㈩煉绱濋崝鈺傚亶韫囶偊鈧喕鍤滅€涳附甯夐幓顡塖T鐠佹崘顓告惔鏃傛暏...
- 鐏忓嫰顣堕崺铏诡攨閸╃顔勭拠鍓р柤
娑撳洣绗€妤傛ɑ銈奸獮鍐叉勾鐠у嚖绱濇潻娆庣昂鐠囧墽鈻兼稉杞扮稑閸︺劌鐨犳0鎴炲Η閺堫垶顣崺鐔枫亣鐏炴洘瀚甸懘姘剧礉閹垫挷绗呴崸姘杽閻ㄥ嫪绗撴稉姘唨绾偓...
- 瀵邦喗灏濈亸鍕暥濞村鍣洪幙宥勭稊閸╃顔勭拠鍓р柤閸氬牓娉�
鐠愵厺鎷遍崥鍫ユ肠閺囨潙鐤勯幆鐙呯礉缂冩垵鍨庨妴渚€顣剁拫鍙樺崕閵嗕胶銇氬▔銏犳珤閵嗕椒淇婇崣閿嬬爱閿涘本鍨滅憰浣圭壉閺嶉绨块柅锟�...
栏目分类