NetApp Tech OnTap NetApp 标识
NetApp Tech OnTap
     
案例研究:Broome-Tioga
正确起步、力求简单和明智发展

Broome-Tioga 合作教育服务局 (BOCES) 通过共享的管理服务和 IT 基础架构服务帮助纽约的公立学校有效地控制了成本。我们要为约 50 个独立学区提供服务,正因为这一独特的职责,我们也面临着各种各样的挑战。其中有些挑战(例如在预算紧张的情况下满足 IT 的快速增长需求并适应运营上的变化),对于每一位 IT 业内人士而言几乎都不陌生。然而,除了要管理向所有学区提供各种应用程序的集中化数据中心,我们还要为其中的 14 个学区提供托管 IT 服务,也就是说实际上我们掌控着这些学区的 IT 命脉,而这一切使这些挑战变得更加错综复杂。

在过去的几年中,服务请求稳步上升,我们为学生和教职员工提供的新应用程序也越来越多。这种增长所带来的副作用是数据中心无序增长,大量数据被孤立存储,数据存储需求每年增长一倍。同时,按照适用于全州的法规要求,需要对数据进行长期异地归档,而这是我们无法完成的。这时就需要一种更灵活的 IT 基础架构,它将提高可用性并增强数据保护。

我们的关键是起步时要有正确的存储解决方案,它可以帮助我们简化操作和基础架构,然后实现明智发展。对我们而言,这个存储解决方案正是 NetApp®。通过在早期实施 NetApp 存储解决方案,随着时间的推移,我们的 NetApp 的功能也得以臻于完善。表 1 汇总了主要成果。

表 1) Broome-Tioga 成果。

主要成果
通过虚拟化,在三年的时间里,服务器的硬件成本降低了 85%,并节省了 50 万美元
通过 Windows® 存储整合,服务器存储需求减少了 35% 以上
总数据存储需求减少了 50%
将主要应用程序(例如 Exchange、SQL Server® 和 Oracle®)的备份时间缩短到数分钟
满足了异地数据归档的全州性要求

在本文中,我将探讨为什么 NetApp 是适合 Broome-Tioga 的正确解决方案,以及 NetApp 解决方案如何帮助我们实现力求简单和明智发展。

使用正确的解决方案起步

备份是另一个一直困扰我们的问题,究其原因,可归结为爆炸性数据增长和不断缩短的备份时间。例如,当我们在使用 NetBackup™ 完成任务时,每晚的 SQL Server 数据库的备份经常会与其他每晚执行的数据库维护任务相重叠,因而导致定期出现故障。

我们购买第一套 NetApp 系统的初衷是将它用作 Syncsort Backup Express 的备份目标,但后来我们发现,无论是针对备份问题、灾难恢复/归档问题还是各种其他问题,NetApp 都能提供正确的解决方案。

我们于 2003 年起开始使用 FAS250 系统。从那时起,我们便轻松稳步地扩展和升级该系统,以满足主数据中心的需求,先是升级到 FAS270,随后升级到 FAS3020。就此而言,NetApp 系统几乎存储了我们的所有数据。

如今,我们已将 NetApp 系统升级到了 FAS3240HA,容量约为 150 TB。由于每次升级采取的都是简单机头交换的方式,不需要进行复杂的数据迁移,因此,升级过程中不会遇到困难和障碍。新的存储控制器可直接连接到我们的现有磁盘架。我们在灾难恢复位置上运行 FAS3140 系统,还在 14 个学区中运行 NetApp 系统,我们使用额外的 250 TB 存储容量(总存储容量为 400 TB)对这些学区进行直接管理。在按照我们的建议实施 NetApp 前,大多数学区使用的是直连存储或简单的外部阵列。

Broome-Tioga BOCES 存储基础架构。

表 1) Broome-Tioga BOCES 存储基础架构。

轻松实现升级是一项不错的功能,但 NetApp 表现如此出色的真正原因还包括以下几点:

  • 统一存储。借助 NetApp,我们可以满足任何应用程序的存储需求,无论是来自主数据中心的需求,还是学区级需求。
  • 高效。借助精简配置和重复数据删除等功能,我们可大大降低存储需求。
  • 集成的数据保护。NetApp Snapshot™ 副本和应用程序备份/恢复通过 SnapManager® 套件完成,因此我们能以更低的成本,在更短的时间内完成关键备份。
  • 灾难恢复。与备份功能一样,NetApp 还简化了远程备份和数据复制功能,因此我们始终能够异地存储重要数据的副本。

在以下部分中,我会详细阐述这几点。

力求简单

在目前的经济环境下,很显然我们无法雇佣更多人员,因此我们必须力求简单,促进工作智能化。我们决定借助 NetApp 存储实现标准化是我们成功的关键。

我们只有两名管理员,每个人要在存储任务方面花费约四分之一的时间,这相当于一名全职 (FTE) 管理员有一半的时间在运营我们的所有存储系统(包括各学区的存储系统,目前容量为 400 TB)。我们希望在不需要额外增加人手的情况下,存储量能够得到不断提高。

特别需要指出的是,NetApp 已在以下三个重要领域为我们提供了帮助:

  • Windows 整合和虚拟化
  • 数据保护
  • 灾难恢复

Windows 存储和服务器整合
我们的许多学区过去一直运行的是 Novell NetWare,因此我们便着手将它们转换成 Windows,同时整合我们的存储和服务器基础架构。在每个受管学区部署 NetApp 存储后,我们便不再需要使用独立文件服务器了。例如,宾厄姆顿学区之前有 10 个文件服务器,但它们后来被单个 NetApp 系统上的 CIFS 共享所取代。这节省了一大笔管理开销,而且 NetApp 确实提供了更好的性能,可支持用户通过访问 Snapshot 目录恢复自己的数据。这些学区还受益于访问活动和归档学校数据体验的改善,同时降低了总服务成本。

我们不仅整合了存储并消除了文件服务器,还通过虚拟化整合了物理服务器。如今,我们在中央数据中心的 7 台物理服务器上运行约 250 台虚拟机。消除过剩的基础架构进一步降低了复杂性,并为我们节省了时间和资金。

目前,我们使用 SnapManager for Virtual Infrastructure (SMVI) 来帮助管理 VMware® 环境,但同时我们还在实施 OnCommand™ 软件,该软件可将 SMVI、NetApp Operations Manager、Provisioning Manager、Protection Manager 和 SnapManager for Hyper-V 技术的各种功能集成到单个产品中。

在服务器和桌面虚拟化方面,我们的目标是不受虚拟机管理程序的限制。这样我们可以实现最高的灵活性,从而满足各学区的不同要求(及预算限制)。如今,我们约有 10% 的虚拟服务器环境在由 SnapManager for Hyper-V (SMHV) 管理的 Microsoft Hyper-V 上运行。同时我们还在使用 Citrix XenDesktop 来支持我们的虚拟桌面环境。NetApp 可为全部三个虚拟机管理程序提供直接管理集成,这使我们能够得心应手地实施它们,如果不使用 NetApp,我们将无法做到应付自如。(阅读之前有关 Hyper-VXenServer 的 Tech OnTap® 文章。)

数据保护
我已经提到过在之前的环境中进行 SQL Server 数据库备份时会产生的问题,而与这些问题一样甚至更加令人堪忧的是我们在进行 Oracle 数据仓库备份时所遇到的问题。Oracle 备份过去一直使用一系列自行研发的流程和脚本来执行,而这些流程和脚本只有一位数据库管理员能真正理解。当这位数据管理员离开组织后,我们便需要进行一些改变,而且这也当务之急。我们转而使用了 NetApp SnapManager for Oracle (SMO),它能够大大简化备份、恢复和复制过程。

当然,Oracle 数据库管理员始终对进行转换持质疑态度,但就在我们进行转换后不久出现了一次提取操作失败,部分 Oracle 表中填入了错误的数据,因此需要进行恢复。当大家看到 SMO 仅用几分钟便完成了恢复流程时,都惊叹不已。从那以后,再也没有人抱怨使用 SMO 了。我们再也不用为是否已对 Oracle 进行备份而担心了,而且因为恢复操作非常简单,所以现在我们有六名员工能够在需要时恢复 Oracle。

目前,SnapManager 套件是我们大多数的备份策略的关键。除 SMO 外,我们还使用 SnapManager for SQL Server (SMSQL)、SnapManager for Exchange (SME) 以及 SMVI 和 SMHV(如我在前面的部分中所述)。所有这些产品均可在几秒内完成简单一致的应用感知型备份,并实现快速恢复。

为了简化操作,我们还集中了区域数据中心中的 Exchange 服务。现在,大多数学区都在使用这些服务,而不是维护自己的邮件服务器。与其他 SnapManager 产品一样,SME 可自动执行与备份、恢复和验证 Exchange Server 数据库相关的复杂耗时的手动流程,还利用 NetApp Snapshot 技术将备份时间缩短为数秒,将恢复时间缩短为数分钟。NetApp Single Mailbox Recovery 软件支持快速恢复和还原各个邮箱、邮件或附件,而不会造成其他 Exchange 用户中断。由于能够快速轻松地恢复到 SME 提供的不同恢复点,我们不再需要保留“滞后”的数据库副本,从而节省了额外的存储容量。

在学区级数据保护方面,我们使用 NetApp SnapVault 将 CIFS 共享及其他数据备份到主数据中心或灾难恢复站点。我们还将 NetApp 存储用作 NetBackup 目标,用于备份其余的一些物理服务器。我们曾希望能购买到廉价存储或将这些数据放在云中,但结果证明,将数据保留在 NetApp 上才是成本最低的存储数据方式,因为与 NetBackup 重复数据删除成本相比,NetApp 重复数据删除的效率更高,而且成本更低。

灾难恢复
我们的灾难恢复策略与数据保护策略直接相关,而且灾难恢复策略还支持我们异地维护单独的最新关键学生档案副本,以满足全州性要求。

我们在宾厄姆顿大学有一个灾难恢复站点(同时也充当该大学的灾难恢复站点)。灾难恢复站点上的 FAS3140 可作为 NetApp SnapVault 备份的目标,也可作为使用 NetApp SnapMirror 进行复制的目标。SnapManager 套件支持我们对 Exchange、SQL Server、Oracle 数据库以及 VMware 和 Hyper-V 虚拟机的一致映像的复制进行计划。

我们使用 VMware Site Recovery Manager (SRM) 来自动恢复我们的 VMware 环境。对我们这种运营规模的组织而言,要自动恢复并运行测试计划来进行验证,这的确是唯一可行的方法。

这种方法虽然简单、易于管理,但却有助于我们实现更高级别的灾难恢复。之前,我们能做的至多是在完成备份的第二天,将磁带从 NetBackup 上取下,然后送至灾难恢复站点。

明智发展

对我们来说,明智发展是指能够灵活地满足用户需求,同时限制存储增长并尽可能降低管理开销。使用 NetApp 存储后最令人兴奋的是,当学区级的用例发生变化时,我们的存储无需进行重大改变即可满足需求。例如,当我们将数据从 NetWare 移动至 NetApp 上的 CIFS 共享时,我们不必在 NetApp 端进行任何更改,因为 CIFS 许可证已准备就绪。同时,它还为一系列新改善创造了可能性,包括更高的性能和可用性,更好的数据保护,以及更简单的用户驱动型恢复。

如果某个学区想为其虚拟服务器环境使用光纤通道,根本不成问题,使用 iSCSI 也同样没问题。在某些学区,我们还使用 NFS for VMware,因为我们只需创建一个大数据存储库,他们可以根据需要向该数据存储库添加虚拟机。最近,在主数据中心中,我们已将核心交换机升级为完全冗余的 HP 万兆以太网交换机,然后,我们要将数据从光纤通道迁移到 iSCSI。更改协议并不是一件很困难的事。

通过使用 NetApp 的精简配置、重复数据删除和 FlexClone 等功能,我们可以将存储要求减少 30%-50%,具体视应用程序而定。我们的所有新部署均已经过精简配置,我们还将回头重新配置现有卷。我们使用 NetApp Operations Manager 来监控精简配置和避免出现不足问题。我们的采购流程可能需要长达两个月的时间,因此,避免出现不足问题非常重要。Operations Manager 可提供工具和报告,从而帮助我们满怀信心地进行精简配置并免去许多麻烦。

过去我们使用重复数据删除时总是小心谨慎,而现在我们几乎处处都在使用该功能。我们通过 Exchange 2010 节省了 20%-25% 的空间,通过 VMware 节省了 50%-70% 的空间,通过 CIFS 共享节省了 30% 的空间。

表 2) Broome-Tioga 通过重复数据删除实现的节省。

数据类型 平均节省比例
Microsoft Exchange 2010 20%-25%
VMware 50%-70%
CIFS 共享 30%

我们还利用 NetApp FlexClone 技术在开发环境中和灾难恢复测试方面节省存储空间。通过 FlexClone,开发人员在数秒内即可为数据库创建克隆,而且不占用大量的额外磁盘空间。这就意味着,他们可以更频繁、更彻底地进行测试。在灾难恢复方面,我们可以配合使用 FlexClone 与 SRM 来克隆已复制的卷,而无需中断正在进行的复制,然后,我们可以使用那些卷来对灾难恢复计划进行完整测试,同样也无需中断复制,只需增加磁盘空间量。

结论

借助 NetApp,我们可以向各学区提供企业级性能和功能,而如果没有 NetApp,我们将没有足够多的员工来管理大多数同类竞争技术所带来的复杂性。无需为了某一需求引入新的 NAS 系统,或是为了另一需求引入光纤通道存储。NetApp 能够灵活地满足我们的所有存储和数据保护需求。没有 NetApp,我们仅靠两个人是绝对无法满足所有存储需求的,因为他们除了负责存储工作外还肩负着许多其他职责。NetApp 帮助我们顺理成章地做出了正确的选择。

 对 Broome-Tioga 案例研究有任何见解?

请在 NetApp 社区中在线提出问题、交流观点、分享看法。
Michael Goodman

Broome-Tioga 合作教育服务局
网络分析师
Michael Goodman


Mike 整整 20 年的 IT 职业生涯都贡献给了 Broome-Tioga。他从计算机服务部门的一名应用程序员/支持人员做起,经过不懈努力,现已升职为工程团队的技术主管。他目前的职责包括设计和实施存储解决方案;服务器、桌面和应用程序虚拟化;系统和网络安全;以及灾难恢复。


Tech OnTap
立即订阅
Tech OnTap 每月发布一次,为用户提供 IT 见解,以及对实际应用的最佳实践、技巧和工具、幕后技术访谈、演示、同行评论等的独家访问。

访问 NetApp 社区中的 Tech OnTap,立即订阅。

相关内容
相关内容
关于 Broome-Tioga

Broome-Tioga 合作教育服务局 (BOCES) 是一家具有创新性的教育机构,旨在通过提供共享的管理应用程序和技术基础架构服务来帮助纽约的公立学校控制成本。该机构成立于 1954 年,是当地学区和纽约州教育厅的附设机构。Broome-Tioga BOCES 是全州 37 家同类实体之一,也是全州 12 家区域信息中心 (RIC) 之一,它为 Broome 和 Tioga 两县的 50 个学区提供服务,其中包括 70 多所学校和 6.7 万名中小学生和成人学生。


System Manager 2.0
作者:Broome-Tioga 的 Michael Goodman

或许您目前使用的不是 NetApp 工具,或者您最近并未关注过它们,但它们正在快速发展。我一直都在使用新的 System Manager 2.0 测试版。它极其直观,所有设置都很合理,您可以清楚地了解执行情况。

它可以替我完成日常任务,帮助我实现工作流自动化。如果我需要帮助其他人提速以摆脱特定任务,此工具可以很轻松地做到这一点。我过去是一名 UNIX® 管理员,最喜欢跟命令行打交道,但现在我才发现,自己已不知从何时起开始使用 System Manager 了。

(System Manager 2.0 自 2011 年 9 月 22 日起推出。有关详细信息,请查看 System Manager 网页。[Ed.])


Data ONTAP 8 体验
作者:Broome-Tioga 的 Michael Goodman

我们的主数据中心和灾难恢复站点中的 64 位 NetApp 系统运行的是 Data ONTAP® 8.0.2,而规模较小的学区系统仍继续运行 Data ONTAP 7G。正如最近的一篇 Tech OnTap 文章中所言,我们进行升级的主要原因是为了能使用 64 位聚合和更好地利用 2 TB SATA 磁盘。

我们已将主存储系统升级为 Data ONTAP 8,控制器同时也升级为 FAS3240,因此相对性能不言而喻。我要说的是升级过程简单顺利,而且在标准模式(7 模式)中运行 Data ONTAP 8 时,我们也没有遇到任何问题。

我想提醒用户的是,唯一的限制在于目前还无法将聚合从 32 位原位转换成 64 位。您必须将数据从现有 32 位聚合迁移到 64 位聚合。我相信在将来的 Data ONTAP 8 版本中将提供此功能。

(在 Data ONTAP 8.1 中,现有 32 位聚合可以在不进行数据移动的情况下无中断地原位转换成 64 位聚合。[Ed.])

相关内容
 


Go further, faster TRUSTe
联系我们   |   如何购买   |   反馈   |   招聘  |   订阅   |   隐私政策   |   © 2011 NetApp