NetApp Tech OnTap NetApp Logo NetApp Logo
NetApp Tech OnTap
     
集群模式 Data ONTAP 8.2 的新增功能
Julian Cates
Julian Cates
技术营销工程师

在过去一年半左右,Tech OnTap® 新闻简报中曾有多篇文章介绍过集群模式 Data ONTAP® 操作系统。集群模式 Data ONTAP 中的技术可帮助您提高 IT 灵活性,并在数据中心内创建灵活的软件定义的存储 (Software-Defined Storage, SDS) 基础架构,使其能够提供虚拟化存储服务和应用程序自助服务,并具备融合多供应商硬件的功能,由此为未来做好准备。您可阅读本月 Vaughn Stewart 发表的一篇文章,从中详细了解 SDS。

每个版本的集群模式 Data ONTAP 都会增强现有功能并添加新功能,以实现:

  • 无中断运行 — 避免计划内停机
  • 至极效率 — 您可以用更少的存储硬件完成更多的工作,同时花费更少的时间来管理这些硬件
  • 无缝扩展 — 您可以从小规模入手,逐渐扩展,无需使数据脱机即可执行技术更新从而有效避免中断

在本文中,我首先概括介绍集群模式 Data ONTAP 8.2 中的新功能,然后更为详细地深入探究一些最重要的功能:

  • 服务质量 (Quality of Service, QoS)
  • 数据原位控制器升级
  • 适用于 Microsoft® Windows® 的新功能

新功能

集群模式 Data ONTAP 8.2 具有大量的增强功能和新功能。表 1 着重列出了几项新功能。

表 1) 集群模式 Data ONTAP 8.2 的新增功能。

功能 优势
无中断运行和数据保护
  • 数据原位在线控制器升级
升级存储控制器而无需迁移数据或使其脱机。(详见下文。)
  • 卷级高效存储 SnapVault® 磁盘到磁盘备份
备份到二级或远程存储,同时保持通过重复数据删除实现的节省,减少所需的网络带宽和存储量。
效率和管理
  • 服务质量 (QoS)
限制存储虚拟机(Storage Virtual Machine,SVM — 以前称为 Vserver)、卷、文件或 LUN 可消耗的资源。(详见下文。)
可扩展性
  • 更大的 SAN 集群
SAN 和 SAN/NAS 混合集群现在最多支持 8 个节点。
  • 单节点集群和无交换机双节点集群
从小规模入手,然后经济高效地扩展:最多扩展到 8 个节点和 23 PB (SAN) 容量,或者 24 个节点和 69 PB (NAS) 容量。
  • 无限卷增强功能
借助无限卷,您可以创建一个跨越多个控制器的大型卷。有了 8.2,您现在可以在一个集群内创建多个无限卷,并同时使用 NFS 和 CIFS 协议。
  • 集群内 FlexCache® 软件
利用 FlexCache,您可在存储集群内增建一个缓存架构,加快在 NFS 上执行的并行软件构建、动画渲染、电子设计自动化 (EDA)、地震分析以及金融市场模拟的速度。
  • 拓宽限制
在 8.2 版本中,集群模式 Data ONTAP 中的多项限制得到明显拓宽,提高了平台的可扩展性。其中包括:
  • 支持多达 100,000 个 NFS 客户端
  • 支持容量高达 400 TB 的聚合
  • 24 节点 NAS 集群支持 12,000 个卷
  • 8 节点 SAN 集群支持 49,000 个 LUN
Windows 增强功能(详见下文)
  • SMB 3.0
增强了 Hyper-V™ 的无中断运行和其他功能
  • ODX
将数据传输从主机卸载到 NetApp® 存储
  • 自动定位
NetApp 独有的功能,支持客户端与存储建立最直接的路径
  • BranchCache v2
支持 Windows 客户端在本地缓存数据来提高性能,尤其是通过 WAN 连接
  • 文件访问审核
满足监控、证据、合规和恢复需求
其他
  • IPv6
支持协议和 SNMP

利用服务质量增强工作负载管理

集群模式 Data ONTAP 使用存储虚拟机(Storage Virtual Machine,SVM — 以前称为 Vserver)从物理存储设备中分离数据访问。一个 NetApp 存储集群可细分为不同的 SVM,每个 SVM 均由各自的权限加以控制。SVM 用于安全地隔离各个租户(例如,在服务提供商环境中)或各个应用程序、工作组、业务单位等。由于 SVM 并不与特定物理资源相关联,因此您可无中断地调整其资源。

各个应用程序或租户通常都有其自己的 SVM,该 SVM 可由应用程序所有者或租户进行管理。(如果需要,单租户环境可以在单个 SVM 中运行。)借助通过我们的 OnCommand® 插件和 API 获得的应用驱动型存储服务,应用程序所有者可以直接使用他们已经熟悉的应用程序管理工具自动配置、保护和管理数据。

集群模式 Data ONTAP 8.2 添加了工作负载管理功能

无论何时在存储系统或存储集群中运行多种工作负载,都有可能出现这样一种情况:一种工作负载的活动过多则会影响其他工作负载。在多租户环境(例如,服务提供商环境)中尤其如此,在此类环境中,您对特定租户使用您为其公司提供的存储做什么知之甚少甚至一无所知。正因如此,我们才在 Data ONTAP 8.2 中添加了服务质量 (QoS)。它是基本操作系统的一部分,因而无需单独的许可。

利用 QoS 工作负载管理功能,您可制定策略来定义服务级别,用于控制卷、LUN 和文件(包括 VMDK)或 SVM 等存储对象可消耗的资源,以便应对性能高峰期并提高客户满意度。限制以 MB/秒或每秒 I/O 操作数 (IOPS) 来定义。MB/秒限制对于处理大型块 I/O 的工作负载效果最佳,而 IOPS 限制对于事务性工作负载效果最佳。

借助 QoS,您可以整合集群中的多种工作负载或多个租户,而不必担心最重要的工作负载会受到影响或某一个租户分区中的活动影响另一个租户分区。

使用 QoS

注意一些最佳实践可帮助您使用 QoS 取得最佳成效。

QoS 当前支持最多包含八个节点的集群。您可以对同一集群内不同类型的存储对象设置限制,但是不能对对象嵌套限制。例如,如果您对某个卷设置了限制,不能也对该卷中的 LUN 或文件设置限制。同样,如果您对某个 SVM 设置了限制,不能也对该 SVM 中的存储对象设置进一步的限制。SVM 中的各个对象汇总起来,共同受 SVM 上策略的限制。

通过创建策略组并为各个策略组应用限制来应用 QoS。例如,一个策略组可以包含一个 SVM、多个 SVM 或一个应用程序使用的一组卷。在虚拟环境中,一个策略组可以包含一个或多个 VMDK 文件或者包含数据存储库的 LUN。应用于某个策略组的限制是对该策略组所含全部对象的综合限制。计划程序会主动控制工作,以便将资源公平地分配给组中的所有对象。

请注意,对象无需在同一集群节点上,如果某个对象发生了移动,策略限制仍然有效。您能以 IOPS 或 MB/秒(但不能同时使用两者)对策略组设置限制。

当某个策略组达到吞吐量限制时,会在协议层进行制约。额外的 I/O 加入队列,不会影响其他集群资源。对于应用程序或最终用户而言,达到限制的行为非常类似于物理存储系统即将达到性能限制时出现的行为。

一个策略组包含一组存储对象,例如 SVM、卷、LUN 或文件。对一个策略组的限制整体上应用于该组中的所有对象。

图 1) 一个策略组包含一组存储对象,例如 SVM、卷、LUN 或文件。对一个策略组的限制整体上应用于该组中的所有对象。

QoS 由集群管理员进行管理,不能委派给负责管理 SVM 的租户或应用程序所有者。

在不移动数据的情况下升级控制器

终有一天,需要将您的存储控制器升级到更新的硬件。如果使用早期版本的集群模式 Data ONTAP 执行这一过程,您首先要将活动数据移出高可用性对,接下来升级控制器,然后再将数据移回。事实证明,对于完成升级和执行多项其他维护与管理功能,这一数据迁移(即 vol move)过程深受青睐。

借助集群模式 Data ONTAP 8.2,您可以采用一个称为聚合重新定位(即 ARL)的新过程,在不移动数据的情况下完成控制器升级,从而进一步简化并加快升级过程。由于集群模式 Data ONTAP 中的所有集群节点都属于一个高可用性对(单节点集群除外),因此利用聚合重新定位功能,只需将活动聚合从高可用性对中的一个控制器转到另一个控制器,在不移动数据的情况下完成升级过程。

较之首先将数据迁移到其他控制器,接下来升级现有控制器,然后再将数据迁移回来的过程,使用 ARL 完成控制器升级所需的时间明显缩短。

ARL 工作原理

ARL 过程分为几个阶段。

  • 验证阶段:在这一阶段,将检查源节点和目标节点的情况,以及要重新定位的聚合。
  • 预调拨阶段:在这一阶段,将完成需要在进行重新定位之前执行的处理。其中包括准备要重新定位的聚合、设置标志以及传输某些非关键型子系统数据。如果需要,可以轻松地还原或清除在这一阶段进行的处理。
  • 调拨阶段:在这一阶段,将完成与将聚合重新定位到目标节点相关的处理。一旦进入调拨阶段,便不能再中止 ARL。在这一阶段进行的处理会在客户端或主机应用程序可接受的一段时间内完成。只有控制权从源节点转到目标节点时,聚合会暂时脱机。这段时间决不会超过 60 秒,通常会更短。一般为 30 秒。

如果出于某种原因而对验证阶段或预调拨阶段执行的检查不满意,可以中止 ARL 过程。ARL 过程中止后,会执行一系列清除过程,还原发生的所有活动。

下面简要列出了控制器升级过程中的几个步骤。请注意,逻辑接口 (Logical Interface, LIF) 是 NAS 客户端或 SAN 主机用来访问网络存储的"虚拟化"网络接口。

1. 使用 ARL 将聚合从节点 A 迁移到节点 B。
2.将数据逻辑接口 (LIF) 从节点 A 迁移到节点 B。
3.为高可用性对禁用存储故障转移 (Storage Failover, SFO)。
4.在双节点集群中,将 Epsilon(用于保持集群内有规定数目的节点)移至节点 B。
5.将节点 A 替换为节点 C(新控制器),为节点 C 执行所有设置、磁盘重新分配和许可管理。
6.使用 ARL 将聚合从节点 B 重新定位到节点 C。
7.将数据 LIF 从节点 B 迁移到节点 C。
8.将节点 B 替换为节点 D(新控制器),为节点 D 执行所有设置、磁盘重新分配和许可管理。
9.启用 SFO。将所选聚合和 LIF 迁移到节点 D。

使用 ARL 升级控制器的典型步骤。

图 2) 使用 ARL 升级控制器的典型步骤。

请注意,执行 ARL 时,一对控制器的高可用性处于禁用状态。在采用 Flash Cache™ 智能缓存技术的存储控制器中,移动聚合时不会在缓存之间传输缓存的数据。目标节点上的缓存需要一些时间来"加热"转移而来的聚合中的数据。如果新控制器容量大于它们所替换的控制器,可能需要更多的机架空间来容纳它们。

ARL 最佳实践

注意一些最佳实践可帮助您成功执行聚合重新定位。

  • 控制器机箱内带有内部磁盘的控制器(例如 FAS2200 系列)需要使用 vol move 命令将内部驱动器上的数据实际重新定位到其他存储。
  • 您可以使用 ARL 升级到运行同一版本或更高版本 Data ONTAP 的存储控制器。(新硬件有时可能要由更高的软件版本来支持。)如果升级导致若干版本混合,应尽快将集群中的其他节点更新到同一版本。运行较高版本 Data ONTAP 的节点无法将聚合重新定位到运行较低版本的节点。
  • 如果集群中的另一个高可用性对处于故障转移状态,请勿使用 ARL。
  • 您可以并行发起聚合重新定位作业。但是,可能有必要考虑目标节点上的容量限制。并行运行多个 ARL 时,验证检查可能无法发现会超过容量限制的情况。接近该限制时,最好按顺序运行 ARL 作业。
  • ARL 作业和 vol move 命令使用相同的资源时,应该单独执行这两项作业。
  • 将客户端和主机重试限制设置为最少 60 秒,并针对支持该功能的协议,将协议重试限时设置为 120 秒。

适用于 Microsoft Windows 的新功能

集群模式 Data ONTAP 8.2 添加了一系列新功能来增强 Windows 环境的体验。

SMB 3.0 支持

CIFS 使用底层 SMB 协议在 Windows 环境中进行网络文件共享。SMB 3.0 在早期修订版 SMB 协议(SMB 2.0 和 2.1)中添加了一些新功能,用于改进 Windows 环境中的无中断运行 (Nondisruptive Operations, NDO) 以及其他操作。

持续可用性 (Continuous Availability, CA) 共享可提高 Microsoft Windows Hyper-V 的可用性。如果使用较低版本的 SMB 协议,发生存储控制器故障转移事件后,客户端必须重新连接到存储。如果使用 CA,文件句柄持续保留,发生短暂的网络中断和存储故障转移时,不会造成服务中断。

发生存储故障转移时,将使用见证协议提醒客户端主动将请求移至无故障的存储节点。

为实现客户端的故障转移,运行 SMB 3.0 的客户端会在打开文件时指定一个应用程序实例 ID。随后,NetApp 集群中的相应节点会在文件句柄的整个生命周期内维护该 ID。如果一个客户端发生了故障,无故障的客户端可使用该 ID 重新获得对文件的访问权限。

卸载数据传输 (Offloaded Data Transfer, ODX)。借助这项 SMB 3.0 新功能,Windows 客户端可使用 NetApp 存储完成数据复制,从而减少主机和网络上的负载。该功能可以在同一卷中、同一节点上的卷之间以及不同节点上的卷之间执行。

用户启动文件复制时,将在相应的 SVM 中打开文件,这样会复制数据的令牌。然后将该令牌连同复制数据的说明一起传送到目标 SVM。复制随即开始,完成时客户端会收到通知。

为了节省存储并缩短完成操作所需的时间,应尽可能克隆要复制的文件,而不是实际进行复制。

SMB 自动定位。这是 NetApp 独有的一项功能,可将客户端请求重定向到托管相应卷的节点上的逻辑接口 (LIF),由此优化数据访问。由于可以在 NetApp 集群内动态地移动卷,因此可能会发生客户端通过位于其他集群节点上的 LIF 访问卷的情况。

有了自动定位功能,如果某个集群节点收到对另一个节点上某个卷的 SMB 请求,会让客户端访问该节点上 LIF 的 IP 地址来处理将来的请求,从而优化数据路径并最大限度地降低延迟。

BranchCache。借助 BranchCache,可以在客户端或专用缓存服务器本地缓存数据来提高读取性能,尤其是在通过 WAN 访问数据的情况下。有了 BranchCache,多个客户端均可缓存数据并在它们之间共享对该数据的访问(NetApp 集群充当 CIFS 共享的内容服务器对其进行调节),或者也可以配置托管的缓存服务器,用来从各个客户端提取缓存的数据。可针对每个 VSM 中的"所有共享"或"每个共享"配置 BranchCache。

Fpolicy

借助 FPolicy 可以对文件策略进行控制和配置。合作伙伴的应用程序可使用该框架连接到 NetApp 存储,来监控和控制文件访问操作。FPolicy 最初在 Data ONTAP 6.4 中推出,现在首次在集群模式 Data ONTAP 中提供。

FPolicy 的用例多种多样,例如文件阻止、配额管理、文件访问审核和归档。常见用例包括:

  • 文件归档。归档文件将在客户端访问时恢复。
  • 文件访问监控。可能会记录任何文件操作。
  • 文件审核。这种用例维护文件对象的访问记录。
  • 文件阻止。可阻止存储视频和音乐等文件。
  • 目录的配额。这种用例对目录的配额进行细化控制。

文件访问审核

通过文件访问审核,您可以:

  • 监控对受保护的资源的访问,必要时采取相应的措施。
  • 证明发生了(或未发生)安全事件,可能需要提供证据。
  • 符合法律记录保留要求。
  • 根据经过详细审核得到的信息进行恢复,恢复到已知的良好状态。

集群模式 Data ONTAP 会按照 NTFS ACL 和 NFSv4 审核 ACL 的规定,记录成功和未成功的数据访问。事件在 SVM 级别生成和呈现,生成的访问事件记录涵盖多个分布的节点。

结论

集群模式 Data ONTAP 8.2 版添加了多项新功能,不断扩展 NetApp 存储的能力,帮助您提高存储环境的效率和可扩展性,同时避免计划内停机。利用 QoS,您可以创建灵活的策略框架来控制给定工作负载可消耗的资源量,而借助聚合重新定位,您可以在数据原位不动的情况下方便快捷地升级存储控制器。适用于 Microsoft Windows 环境的新功能为您提供的选项之多前所未有,能够提高 Windows 的可用性,并控制和审核文件访问。

 对集群模式 Data ONTAP 8.2 有任何见解?

请在 NetApp 社区中在线提出问题、交流观点、分享看法。

作者:技术营销工程师 Julian Cates

Julian 目前是一名技术营销工程师,致力于集群模式 Data ONTAP 和安全多租户的相关工作。在 NetApp 九年的职业生涯中,他先后担任过系统工程和专业服务部门的售前和售后职务,以及 VMware® 和 NetApp 联合解决方案的技术营销职务。

Tech OnTap
立即订阅
Tech OnTap 每月发布一次,为用户提供 IT 见解,以及对实际应用的最佳实践、技巧和工具、幕后技术访谈、演示、同行评论等的独家访问。

访问 NetApp 社区中的 Tech OnTap,立即订阅。

相关内容
Explore
详细了解集群模式 Data ONTAP 和 8.2 版
"让您的企业摆脱 IT 束缚"网络广播系列

本系列共三期,将对集群模式 Data ONTAP 进行深入讲解。

  • "保持您的企业级应用环境 24x7 可用性",2013 年 7 月 2 日
  • "突破虚拟和私有云环境下的效率屏障",2013 年 7 月 23 日
  • "借助可横向扩展的统一基础架构从小规模入手,逐步扩展",2013 年 8 月 13 日
相关内容
 
TRUSTe
联系我们   |   如何购买   |   反馈   |   招聘  |   订阅   |   隐私政策   |   © 2013 NetApp