重复数据删除技术的安全性如何?除非您最近像鸵鸟一样把头埋在沙子里,否则您或许会发觉重复数据删除是个非常热门的话题。似乎您有所耳闻的每个存储供应商(还有很多您不知道的公司)都在兜售重复数据删除技术,用于降低磁盘到磁盘备份的成本。
本文中,我将根据这两条标准评估重复数据删除技术。此外,我还将讲解 NetApp 为增强其重复数据删除技术的可靠性所作的选择。大多数其他供应商提供的重复数据删除仅用于备份,而我们却支持用于主存储和二级存储的重复数据删除,因此我们格外注重数据安全性。 识别重复数据大多数现有重复数据删除产品都是在块级操作,即用新块比较上次存储的块,以判断是否存储过相同的块。如果上次存储过相同的块,则指针将指向这个存储的块,“新”块将被丢弃。 基础软硬件的可靠性重复数据删除技术的可靠性程度取决于基础软硬件有多可靠。事实上,尽管这一点可能不会即刻体现,但是对于实施重复数据删除,可靠性确实变得更为关键。 ![]()
市场上重复数据删除方面的产品多种多样。有些只有软件并可能用到多种基础硬件;有些包括软硬件(通过许可或 OEM 协议,从多种来源获得)。在做出决定之前,您应评估软件成熟度、基础硬件的可靠性以及两者的集成情况。 NetApp 可靠性凭借 NetApp® 存储,重复数据删除已是 Data ONTAP® 运行环境中不可或缺的一部分,贯穿整个产品系列。15 年来,Data ONTAP 随着 NetApp 硬件平台一直在不断发展。NetApp WAFL® 技术的独特功能确实简化了重复数据删除的实施,它可以删除任何存储数据(而不仅是备份数据)中的重复数据。根据 NetApp 安装信息库的测量表明,公认的 NetApp 软硬件特有的高可靠性使数据可用性高达 99.999%。最近一份分析报告描述了 NatApp 的方法以及影响 NatApp 可靠性的许多功能。 我们非常重视细节,众所周之,随着时间推移,磁盘驱动器位错误会形成,这甚至也会在磁盘驱动器的制造过程中出现。每个驱动器都有内置的纠错机制来检测此类位错误,并通常会予以纠正。如果一连串过多的错误令 ECC 无法处理,驱动器就会报告此扇区不可读,此时 RAID 算法将根据其他扇区中存储的信息修复该错误。然而,NetApp 还采用校验和方案进一步保护,我们将驱动器的额外部分作为开销来存储在整个系统中随数据移动的校验和,以检查写入的数据是否能在数据恢复过程中完整返回。实质上,我们还提供第三层保护。 为了保护提交到磁盘的数据的可靠性,NetApp 还开发了高性能的 RAID-DP™,这是一个具有双奇偶校验的 RAID 6 实施,可以在不牺牲写入性能的情况防范双磁盘故障。有关防范磁盘驱动器误操作的 RAID-DP 和 NetApp 增强功能的更多信息,请参阅上一篇 Tech OnTap 文章。 结论为了保护备份的数据,重复数据删除技术必须使用合适的算法来避免废弃唯一的数据块,同时还应提供可靠的基础软硬件,以便安全地存储经过重复数据删除处理的数据,用于以后的恢复。 由于 NetApp 重复数据删除技术不仅用于主数据存储,而且还用于备份数据,因此我们格外注意确保数据的可靠性。NetApp 重复数据删除技术结合使用指纹和数据块逐个字节的比较,从而绝不会由于哈希冲突而误删任何唯一的数据块。经过重复数据删除处理的数据存储在 NetApp 存储系统中,多年的实践证明该系统采用的硬件和软件不仅可靠而且富有弹性。因此我们相信您一定能在恢复数据时取回已备份的数据。 | ![]() |