构建符合零恢复点目标 (RPO) 和尽可能低的恢复时间目标 (RTO) 的基础架构并非易事。原因之一是整个数据中心或可用性分区 (AZ) 都可能出现故障。解决方案是让您的基础架构跨越多个可用性分区,担这可能是一个挑战。
有些方法可以实现这种级别的可用性,但自行构建需要时间和精心管理,而且这种方法可能会导致性能和延迟问题。
在本文中,我们将讨论 Amazon FSx for NetApp ONTAP 如何提供更好的解决方案:一个内置的多可用区部署选项,可在 AWS 上提供高可用性。
使用以下链接跳转到每个部分:
实现多可用区高可用性并非易事
企业级部署需要能够处理故障(从单个组件到整个可用区)且不会丢失数据 (RPO=0) 的系统。这些系统还需要能够快速从中断中恢复以保持最小的恢复时间目标 (RTO),而这需要跨硬件、网络和地理位置的恢复能力。
有些方法可以在 AWS 上实现这种多可用区高可用性。但是,要构建这种基础架构,您需要构建实时数据同步、无缝数据安全以及跨可用区恢复的机制。添加另一个区域后,这些操作都会变得更加复杂。
底层任务非常复杂:
- 通过同步复制实现冗余。为了实现绝对冗余,您的数据需要跨区域同步镜像 — 这个过程通常由智能编排层管理。该设置必须保证复制的准确性和及时性,从而消除数据丢失的风险,以始终如一地实现 0 恢复点目标 (RPO)。
- 解决数据访问延迟问题。跨区域的实时数据同步使得延迟问题难以克服。虽然缓存和内容分发网络 (CDN) 可以部分抵消这种延迟,但最大的挑战在于开发一个具有专用互连的高性能网络,能够持续降低跨区域通信的延迟。
- 故障转移动态。实现区域之间的无缝过渡是一项微妙的挑战,尤其是在以最小化恢复点目标 (RTO) 为目标的情况下。存储框架需要具有恢复能力,并且能够在不同环境之间镜像数据(且不会出现差异)。它还必须能够进行故障转移和故障恢复,而不会丢失数据或中断用户体验。
- 无故障点的数据保护。
构建您自己的多可用区架构会将新的组件引入您的基础架构 — 其中任何一个都可能成为额外的故障点。为了避免数据泄露或丢失,重要的是要有针对时间点快照、一致备份和无缝灾难恢复 (DR) 流程的解决方案。
您还需要统一的安全标准,例如传输中和静态加密、访问控制、勒索软件防护以及一次写入、多次读取 (WORM) 数据锁。
- 控制成本和数据副本。对于跨多个可用区的冗余系统,存在两个主要的成本问题:高昂的开销和冗余成本。您不仅需要花费大量资源来构建和维护多可用区系统,而且在设置完成后,运行单个部署的所有成本都将被复制 — 从存储的数据到可用区之间的网络流量。
考虑到这些因素,多可用区高可用性并不是但在 AWS 上,有一个更简单的选择:使用 FSx for ONTAP 实现内置多可用区高可用性。
使用 FSx for ONTAP 实现多可用区高可用性
FSx for ONTAP 是 AWS 提供的一项完全托管的服务。它使用 NetApp® ONTAP® 标志性数据管理功能,为文件和块存储提供高性能共享存储选项。其中一项功能就是多可用区高可用性。
FSx for ONTAP 节点的基础架构资源配置在同一 AWS 区域内的不同可用区中,并且数据在两个节点之间同步镜像。仅当数据添加到两个节点后,写入操作才会完成 — 这样,即使发生中断,数据也不会丢失。
如果发生中断 — 即使像整个可用区故障这样严重的中断 — FSx for ONTAP 也会自动无缝地故障转移到运行状况良好的 FSx for ONTAP 节点,并持续提供数据。
此运行节点可以继续从其自己的独立数据副本处理所有数据请求,从而使您可以将 RPO 保持在 0。当故障节点恢复时,它会自动使用来自运行状况良好节点的最新数据进行刷新,并故障恢复到双模式操作。
FSx for ONTAP 多可用区高可用性架构。
如果您不需要如此高的可用性,您可以选择位于单个可用区内的双节点结构。
使用 FSx for ONTAP 实现多可用区高可用性部署的优势
使用 FSx for ONTAP 进行多可用区部署,您将获得以下优势:
- 高可用性:通过跨多个可用区实时同步镜像数据,实现 0 RPO,即使在中断期间也能防止数据丢失。这有助于实现 99.99% 的可用性,这对于关键任务应用程序至关重要。
FSx for ONTAP 会同时在多个可用区中存储数据的镜像副本。如果一个可用区发生故障,系统会自动将数据访问路由到另一个可用区中的副本。
- 数据弹性:通过其自动无缝的故障转移和故障恢复流程,FSx for ONTAP 可以帮助您实现少于 60 秒的 RTO。该解决方案会自动切换到冗余节点(故障转移),并在故障节点恢复后恢复到双节点运行(故障恢复)。
- 强大的安全性:除了实施严格的访问控制外,FSx for ONTAP 还会对静态数据和传输中的数据进行加密。该服务还使用不可变的 NetApp Snapshot™ 副本保护数据,以防止未经授权的数据更改,并提供恶意软件防护功能以防范网络威胁。
- 全面的数据保护:本地快照副本支持快速数据恢复,而优化的备份和跨区域灾难恢复选项可全面保障数据安全。
- 成本优化的数据副本:FSx for ONTAP 通过 ONTAP 存储效率功能优化成本。重复数据删除、数据压缩和数据精简功能可将存储使用量和成本降低高达 65%,而将不常用数据自动分层到容量层的功能可降低 SSD 高级存储的费用。这些功能不会以任何方式损害数据的可用性。
FSx for ONTAP 可帮助您的运维抵御最严重的中断。以下是一家公司如何利用这一点的。
一家软件公司如何利用 FSx for ONTAP 保持多可用区高可用性
一家使用 FSx for ONTAP 来确保业务平稳运行的公司是一家员工敬业度解决方案的软件开发商。这家跨国公司的软件即服务 (SaaS) 技术提供了高效的劳动力管理和合规的客户互动工具,而这些工具需要高可用性。
该公司需要一个统一的存储解决方案,该解决方案必须可以提供可扩展性,在多可用区设置中保持数据完整性,并帮助其遵守严格的合规性和安全性标准。
解决方案是迁移到云并采用 FSx for ONTAP,这样提供了多种优势:
- 企业级恢复能力。FSx for ONTAP 多可用区高可用性和跨区域灾难恢复功能可有效保护企业数据。
- 简化运维。迁移到 FSx for ONTAP 后,该公司无需再亲自管理其存储基础架构。现在,它拥有一个完全托管的存储服务,可同时处理其现代化的云原生 Kubernetes 工作负载以及从其旧系统迁移来的 SaaS 应用程序。
- 成本效益。凭借其存储效率功能,FSx for ONTAP 可显著节省成本,从而降低公司的云存储总拥有成本 (TCO)。
更轻松地保持业务连续性
您需要确保您的应用程序始终可用且安全。即使在最严重的中断情况下,FSx for ONTAP 也能帮您实现这一点。
借助多可用区部署选项,FSx for ONTAP 可实现 0 RPO 和低于 60 秒的 RTO — 开箱即用。这意味着您的运维不会受到重大中断的影响,也无需担心任何额外的开销。