NetApp Tech OnTap

解决 VMware 备份的难题

VMware® 在现代数据中心的快速部署带来了新的问题。一旦虚拟化,适合物理服务器的备份和恢复方法可能无法胜任数据保护的工作。

我想探讨 VMware 备份的三大难题,它们是:

  • 降低将几十台物理服务器整合到一台 ESX 服务器所带来的风险
  • 提高备份性能
  • 降低备份数十或数百台虚拟机 (VM) 的复杂性

我们首先笼统地讨论这些问题,然后再详细讲解有助于改善 VMware 备份的特定 NetApp® 解决方案。

您的数据是否受到充分保护?


整合服务器的同时,您也面临着更高的风险。如果使用 10 台或更多的物理服务器并将它们整合到一台 VMware ESX 服务器,这样虽然可显著降低物理复杂性,但其风险就好比是将所有鸡蛋放在一个篮子内。即使是似乎足够满足独立服务器需要的保护级别,也有可能使您的操作面临不必要的风险。

以下是一些快速的自我提问:

  • 我的基础设施是否可靠到无以复加的程度?除服务器本身外,类如 RAID 保护的存储、副本、冗余 HBA、网络、SAN 等也可以改善弹性。
  • 在应用程序和虚拟机层上的备份是否一致?为了提高性能,虚拟机和很多常用的应用程序会将数据缓存在存储器中。必须将这些信息刷新到磁盘,将文件系统的写入操作暂时挂起,使应用程序或虚拟机静止,这样才能生成一致的备份。很多 VMware 的早期采用者都惊讶地发现,他们创建的备份不一致。有了一致的备份,在还原了备份之后,所有的操作就可以从头再来。
  • 我备份数据的频繁是否够高?如果多个应用程序连接到一台服务器,您可能需要提高备份频率以提供多个恢复点。
  • 在我的 ESX 服务器上,备份工作负荷是否正困扰业务的开展? 您无法承受在指定的备份窗口之外进行备份,并妨碍业务的正常开展。

仔细回顾这些问题,您或许会发现自己的备份计划中确实存在一些潜在问题。

提高性能

对于托管多台虚拟机的某台 ESX 服务器,其 I/O 或 CPU 的合计能力可能无法达到与其替代的物理机器相同的水平。在虚拟机中运行的带宽密集型备份和还原操作会导致服务器瓶颈,延长备份窗口并将还原性能降至难以接受的水平。

改善备份性能的途径有两个:

  • 通过减少要移动的数据降低备份工作负荷
  • 将备份工作负荷从服务器转移到存储

降低复杂性

在有些 IT 工场中,每台物理服务器上可能运行着数十个虚拟机,管理的虚拟机总数可能达到数百个。这将需要安装很多备份代理,进行大量的跟踪和管理,并确保所有数据都得到适当的保护,显然比较困难。下列做法可能有所帮助:

  • 在 ESX 服务器级而不是单个虚拟机上进行处理,从而降低复杂性
  • 允许存储设备处理备份,保留策略和计划
  • 选择合适的管理工具

NetApp 针对 VMware 的备份解决方案

传统的备份方法会明显增大 ESX 服务器的工作负荷,从而导致备份窗口的延长,备份运行时关键应用程序的性能也可能降低。NetApp 提供了一套完整的解决方案,设计用来减低 VMware 和其他环境中的风险,提高性能,并消除在该环境中进行备份和还原的复杂性,同时减少或消除服务器负荷。这些解决方案可以显著缩短备份窗口,加快还原。

本讨论着重五个解决方案:

  • SnapManager® for Virtual Infrastructure
  • 用于应用程序备份的其他 SnapManager 产品套件解决方案
  • SnapVault®
  • Open Systems SnapVault
  • Protection Manager

如果您已使用 NetApp 存储系统作为 VMware 的主存储(通过 VMFS 或 NFS),则 SnapManager for Virtual Infrastructure 和 SnapVault 解决方案分别是本地磁盘到磁盘备份的上佳选择。如果没有,您可以结合使用 Open Systems SnapVault 和 NetApp 二级存储,从而达到与 NetApp 主存储相同的效果。NetApp Protection Manager 可以简化这些环境中的备份管理,尤其在要维护大量副本时更是如此。

SnapManager for Virtual Infrastructure
此数据管理工具使您可以为运行在 VMFS 上或使用 NFS 数据存储的虚拟机快速创建一致的 Snapshot™ 副本。(目前不支持原始设备映射 [RDM]。)它消除了服务器的备份处理,并将处理要求转移到基础存储。

 

通过 SnapManager for Virtual Infrastructure 的 GUI,您可以创建备份与保留日程,以定期保护您的虚拟机。可以在虚拟机层或数据存储层进行备份。备份创建后,ESX 可以在使用前装载并验证该备份。

如图 1 所示,设好备份日程之后,SnapManager for Virtual Infrastructure 与 VirtualCenter 和 NetApp 存储设备会进行必要的沟通以协调备份。由于备份时间很短,而且几乎没有增加 ESX 服务器上的工作负荷,因此您每天可以创建更多的备份以提升数据保护力度。

图 1) SnapManager for Virtual Infrastructure 创建 Snapshot。SnapManager for Virtual Infrastructure 向 VirtualCenter (VC) 发送信号,以将选定的虚拟机(VM1、VM3 和 VM6)置于热备份模式。接着,它触发 NetApp 主存储以创建合适的 Snapshot 副本。最后,它再次向 VC 发送信号,要求其取消虚拟机的热备份模式。

对于主存储中的快照,通过使用针对灾难恢复的 NetApp SnapMirror®,可以将其保留在本地、备份到磁带或复制到二级存储。从 SnapManager for Virtual Infrastructure 中可以直接控制这些功能。如下所述,您也可以手动协调 Snapshot 日程与 SnapVault,以便将捕获的 Snapshot 副本备份到本地或远程的二级存储系统。

SnapManager for Virtual Infrastructure 的还原功能使您可以还原特定虚拟机或整个数据存储,包括还原已从 VirtualCenter 中删除的虚拟机。需要恢复的虚拟机必须处于“电源已关闭”状态。在还原前,必须关闭虚拟机电源。

SnapManager for Virtual Infrastructure 可以充分感知 VMotion™。它会与 VirtualCenter 通信,因此它清楚运行 VMotion 后虚拟机的驻留位置。只有在 VMotion 活动完成后,才可以备份虚拟机。

SnapManager 产品套件
SnapManager for Virtual Infrastructure 使基础 虚拟机静止,从而使其在备份时保持一致。遗憾的是,它无法确保在虚拟机中运行的应用程序也是静止和一致的。这就需要对应用程序更为具体的说明。为了实现应用程序备份的一致性,您可以同时安装 NetApp SnapDrive® 和其他 SnapManager 解决方案,为 Microsoft® Exchange、SQL Server™ 和 Oracle® 等应用程序提供定制的保护,以生成一致的应用程序 Snapshot 副本。有关这些产品运用在物理服务器环境中的更多信息,请参阅最近一篇 Tech OnTap 文章 。与 SnapManager for Virtual Infrastructure 类似,这些 SnapManager 产品使服务器增加的工作负荷与传统备份方法相比微乎其微。

NetApp SnapVault
使用 NetApp SnapVault,您可以将 Snapshot 副本转移到同一数据中心或远程站点的二级存储,以实现更为长期的保留。遗憾的是,目前 SnapVault 和 SnapManager for Virtual Infrastructure 或者其他 SnapManager 产品之间缺乏明确的协调,因此您需要编写脚本以在 SnapVault 日程和为这些产品创建的 Snapshot 日程之间进行协调。

由于所有的工作均在存储系统中进行,因此 SnapVault 操作将不会影响 ESX 服务器。每个 SnapVault 备份都是文件系统在特定的时间点的只读版本。这些文件系统可以共享,也可以装载并用于克隆、测试、恢复 VMDK 等多种目的。

创建 SnapVault 关系的第一步是执行基线传输,生成需要保护的数据存储(包含虚拟机)的精确副本。后续的 SnapVault 备份只传输上次备份以来已更改的数据块,因此在网络带宽和存储空间方面显得十分高效。大多数备份方法会备份整个文件,即使只有一个数据块发生更改也如此。

即使文件几乎未曾更改,传统的备份方法也会日复一日地为相同的文件创建副本,而 SnapVault 备份方法将避免传统备份中高水平的重复数据。SnapVault 只复制和存储发生了变化的块。因此,SnapVault 备份在空间消耗方面极为高效,而且改变了磁盘到磁盘备份和磁带备份的经济性对比。(有关详情,请参阅本期中的姊妹篇 )。

备份转移到二级存储后,您将有多种选择:

  • 您可以恢复整个数据存储(配额树还原)。使用 Protection Manager(可选)简化此功能。
  • 您可以恢复单个虚拟机(带 NFS 数据存储)。使用 Protection Manager(可选)简化此功能。
  • 您可以使用 FlexClone® 恢复虚拟机中的单个文件。
  • 凭借 NetApp FlexClone,您可以在二级存储中克隆复制的虚拟机,并使用这些克隆进行测试和开发。
  • 您可以在场外复制自己的备份,以便进行区域性灾难恢复。
有关在 VMware 中使用 SnapVault 的详细信息,请参阅 TR 3610

图 2) 使用 SnapVault 为 VMware 提供集中的备份存储库。在将备份存入二级存储中后,您可以应用其它 NetApp 技术,例如通过 NetApp 重复数据删除技术进一步减少数据量或通过 NetApp FlexClone 创建用于测试和开发等用途的副本。

Open Systems SnapVault
历史上,Open Systems SnapVault 一直是针对 Windows®、UNIX® 和 Linux® 等备份平台的一个较为成功的解决方案。正如早先的介绍, SnapVault 采用非常适合远程办公室的块级增量传输,这是因为远程办公室缓慢的网络连接通常会影响集中备份,同时其不多的 IT 员工使得本地备份和数据管理问题重重。

Open Systems SnapVault 可将数据管理任务从远程站点移到集中的管理位置。正如 SnapVault,它使用网络带宽和二级磁盘存储的方式极为高效,使得磁盘到磁盘备份变得更为经济实惠。

Open Systems SnapVault 2.6 版发布之后,Open Systems SnapVault 可向您提供两种备份虚拟基础设施的选择,使其更适用于虚拟机未存储在 NetApp 主存储中的情况:

  • 您可以将 Open Systems SnapVault 代理安装在每个虚拟机中,然后按与物理服务器相同的方式备份它们。数据保留在原始虚拟服务器上的原有格式。
  • 凭借 Open Systems SnapVault 2.6,代理软件可以安装在 ESX 服务器的服务控制台中。

后一种方法使得备份组成每台虚拟机的各个文件成为可能。换句话说,现在您可以备份后缀名为 .vmx、.vmdk、.nvram 和 .log 的文件,使其或许可以恢复裸机和整个虚拟机。

由于只需在每台 ESX 服务器上安装和管理 Open Systems SnapVault,而无需在单个虚拟机上执行此类操作,因此备份环境的复杂性显著降低。

正如 SnapMirror for Virtual Infrastructure,Open Systems SnapVault 也可以感知 VMotion。有关在 VMware 中使用 Open Systems SnapVault 的详细信息,请参阅虚拟基础设施的 OSSV 最佳实践指导

Protection Manager
我想介绍的最后一个 NetApp 工具是 Protection Manager。Protection Manager 简化了在整个 NetApp 存储基础设施中配置、管理和监控 Snapshot 副本、基于磁盘的备份和复制的工作,它还可以通过 Open Systems SnapVault 纳入 Windows、UNIX、Linux 和 VMware 服务器的备份。对于 SnapVault 和 Open Systems SnapVault 而言,它都是理想的管理接口。

Protection Manager 提供了策略驱动的数据管理,这种管理方式通过消除典型备份环境中要求的很多重复性手动流程,从而简化了备份环境。(最近有一篇文章提供了更多详情。)

结论

要通过 VMware 备份实现最佳的数据保护,您需要消除风险、提高性能并降低复杂性。这篇文章的第一部分提供了实现这些目标的一些总则。我还介绍了一组独特的 NetApp 解决方案,它们在 VMware 环境中具有极大的效益。

通过实施 SnapManager for Virtual Infrastructure 和(或)SnapVault,您可以更快更频繁地实现一致的虚拟机备份,同时让 VMware 服务器摆脱备份工作负荷,从而在很大程度上降低了业务风险。您不必在要备份的每个虚拟机上安装软件,您可以在数据存储层进行备份,以进一步降低复杂度。您还可以根据需要从 NetApp SnapManager 产品套件中选择软件进行安装,以便备份虚拟机中运行的应用程序。

Open Systems SnapVault 也能为非 NetApp 的主存储环境带来类似的效益。虽然没有使 VMware 服务器完全摆脱备份工作负荷,Open Systems SnapVault 还是有效降低了 I/O 要求,使其与服务器的能力更为匹配,此外,在 ESX 服务器层的安装也显著降低了可能需要纳入数十台或甚至数百台虚拟机进行备份的配置复杂性。

最后,Protection Manager 可以结合 SnapVault 和 Open Systems SnapVault(还有用于灾难恢复的 NetApp SnapMirror 软件)一起使用,以极大降低管理具有大量备份和/或复制关系的环境的复杂性。

Darrin Chapman

Darrin Chapman
NetApp 数据保护课题专家
兼技术营销经理

在 NetApp,有关灾难恢复或者备份与还原的任何问题,您都可以求助 Darrin Chapman。从 2002 年以来,他几乎参加编写了每一份 NetApp 关于数据保护的最佳实践指南,并利用业余时间为客户和 NetApp 技术员设计培训课程。

Darrin 在学校的专业为电气工程师,他在 AT&T、Nortel 和 EMC 系统体系架构领域也具有多年经验。

 
浏览