Domino Data Lab 和 NetApp 共同利用无缝集成的功能来释放人工智能的全部承诺:强大的计算能力、高效的数据管理和简化的工作流程,为数据科学家提供自助服务自由,同时 IT 使用标准、可信赖的实践来保持运营完整性,从而减少数据蔓延并加速人工智能部署。
员工
成立年份
Fortune 100 强公司
人类的进步是由创新推动的,几千年来的稳步进步伴随着发明的飙升,这些发明在一夜之间重塑了未来——印刷机、蒸汽机、Internet 等具有重大影响的大创意。许多人认为,推动数据科学的人工智能 (AI) 的工业化就是这些里程碑之一。这就是为什么许多公司现在要求员工在招聘新人才、寻求复杂问题的明确答案、正式制定上市战略和设计下一代产品时首先使用 AI 工具的原因。
在这方面有令人兴奋的消息。Domino Data Lab(Domino)和 NetApp 看到了更深层次的东西,具有更广泛的潜力,超越了无处不在的 ChatGPT 和无处不在的 AI 清洗的泡沫。他们认识到,将 AI 工作负载从原型转移到生产环境的最重要挑战之一是在不同环境中高效、安全、无缝地管理和访问数据。
如今,大多数企业都使用分布在多个环境中的数据进行运营,而高效的数据访问仍然是一个持续存在的挑战。Domino 和 NetApp 合作伙伴关系独特地解决了这一关键问题,使 AI 团队能够无缝访问受管数据集,简化基础设施管理,并大规模加速创新,而从 IT 的角度来看,这一切都不会影响安全性或合规性。随着 AI 在其炒作周期中不断发展,AI 采用的新阶段正在进行中,企业、政府和行业都在寻找合作伙伴,帮助他们将 AI 原型大规模投入生产。
释放数据科学的力量,应对全球最重要的挑战
Domino 团队成员在旧金山人工智能实验室外
此次合作首次将 Domino 领先的 MLOps 平台与 NetApp 的先进底层数据管理解决方案进行了整合。数据科学家可以使用 Domino Volumes for NetApp® ONTAP® (DVNO)获得自助服务功能,直接在 Domino 中管理 AI 工作负载。Domino 使用Amazon FSx for NetApp® ONTAP®作为其 SaaS 产品的基础,与其他产品相比,性能提高了 2 倍,同时保留了其模型和代理的完全可追溯性。这种简化的方法使数据科学家和研究人员能够专注于创新而不是基础设施。
人工智能、机器学习操作(MLOps)和数据存储领域的这一里程碑标志着一个重大进步。它源于认识到解锁人工智能的全部承诺需要无缝集成的功能:强大的计算能力、高效的数据管理和简化的工作流程,为数据科学家提供自助服务自由,同时 IT 使用标准的可信实践来保持运营完整性——减少数据蔓延并加速人工智能部署。
这一切都始于 NVIDIA 的同事推荐 Domino 和 NetApp 的朋友共进午餐。很快,这些公司的领导者意识到他们对未来有着共同的愿景,即 AI 计算和 AI 存储在定义上是混合云或多云的。他们的愿景承诺为数据科学家和存储工程师提供一种新的方式,共同开创数据科学的新时代。
领先的企业 MLOps 平台 Domino 拥有 AI 生命周期管理和计算编排专业知识。而智能数据基础设施公司 NetApp 拥有数据存储专业知识。但这种合作关系不仅仅是思想的融合,也是技术能力的匹配。Domino 首席运营官 Thomas 'T-Rob' Robinson 将这种合作伙伴关系描述为"花生酱和果冻三明治(或者对于国际人士来说,是 Marmite 和奶酪)"。简直太好了。
例如,我们喜欢与了解 Kubernetes 等先进技术价值的人合作。当我们与 NetApp 团队会面时,我们立即知道我们分享了新架构的新愿景。用最简单的术语来说,就是 1+1=3。
Thomas 'T-Rob' Robinson, 首席运营官, Domino Data Lab
这种新的前进方向的愿景意味着当今的数据科学家和组织可以轻松自信地从原型模型转变为现实环境中的自主功能代理,其中统一平台上的 AI 可以发挥真正的作用。
Domino 首席营销官 Thomas Been 表示:"阻碍许多组织成功采用人工智能的一个挑战是信任。"相信在试点级别发现的人工智能结果将在代理级别扩展到相同的结果,其中监管治理和硬成本是特别关键的考虑因素。
同样具有挑战性的是,大多数 AI 试点项目都是在云中运行的,这对于数据科学家来说是一个经过验证的敏捷、可扩展且具有成本效益的弹性按需付费处理和存储环境。云还使不同的团队能够以流畅、高度协作的方式访问和共享数据。
因此,当企业和组织在云端建立原型时,往往会对 AI 的价值产生诱人的一瞥。但是,孤立运行并使用精心策划的数据集,模型容易过度训练和学习偏见,仅举两个陷阱。在测试环境之外大规模解锁价值仍然更加难以捉摸,因为更大的数据集会引入模型无法识别的变体。模型幻觉、不准确的预测和有效性降低解释了为什么 85% 的 AI 投资仍然停留在试点模式。Thomas 指出,"大多数组织并没有通过将数据转化为 AI 来考虑所有的选择。"出于习惯,这意味着云。但有了Amazon FSx for NetApp® ONTAP®,旧习惯正在改变。
Domino 和 NetApp 的联合客户正在加紧克服这些障碍。他们正在成功地将 AI 项目从试点和测试模型领域转移到生产中。
Thomas Been, 首席营销官, Domino Data Lab
他们在混合和多云环境中执行此操作,因为世界上最重要的大多数数据仍然是本地数据。正如 NVIDIA CEO Jensen Huang 指出的那样,"世界上近一半的文件存储在本地 NetApp 上。"这就是为什么 Domino 和 NetApp 的联合客户在考虑他们的选择后选择了不同的路径。Thomas 说:"他们正在将 AI 引入他们的数据。"一个例子是 Domino 的 AI 和数据科学平台在混合和多云环境中的扩展方式,其中最密集的企业 AI 工作负载需要高吞吐量,特别是当数据科学家针对跨越本地和云的常见数据集运行多个模型时。Amazon FSx for NetApp ONTAP 能够像 GPU 处理数据一样快速地馈送模型,这本身就是游戏规则的改变者,但故事还有更多。
人工智能计算的货币成本差异很大,从入门级 GPU 到高端选项,无论是芯片的实际价格标签,还是处理数据集所需的时间,无论是在云端还是在现场。但 Thomas 提出了一个同样重要的话题。他说:"您还必须增加员工的时间成本。"
过去,数据科学家遵循高度线性的流程,从遵守监管治理、公司政策和安全协议开始,包括通过 SQL 和 Tableau 等经批准的工具对数据湖和数据仓库进行受管访问。这种请求、守门、等待和下载的过程可以为数据科学家的研究项目增加数小时、数天甚至数周。这些障碍不仅会刺激数据科学家寻找影子 IT,还会大大延长投产时间。最后,数据从一个环境到另一个环境的每次移动都会给数据本身带来风险,从数据丢失和复制到因暴露于不太安全的系统而导致的损坏。现在考虑一下,IDC 发现典型的数据科学家在构建单个模型时要经历 7-10 次此过程。从 TB 和 GPU 到天数和美元,这些数字可能很重要,特别是当乘以组织中的数据科学家数量及其当前众多实验时。
NetApp 多年前开发了"快照"作为 ONTAP 操作系统 的核心功能。也就是说,他们使数据科学家能够在任何时间点制作其数据的即时副本,而无需繁琐而耗时的"另存为"流程。如今,通过 Amazon FSx for NetApp® ONTAP®保存这些不可变副本是 Domino 解决方案的核心价值主张——只需单击一下,即可获得即时捕获的数据和数据模型的零占地面积快照。这不仅对于审计和参考目的非常宝贵,而且对于恢复到更早、更有用的模型以及与同事共享也非常宝贵。现在,数据科学家可以进行研究,存储工程师可以专注于管理和保护他们的领域。
FSx for ONTAP® 解决方案在可重复的 MLOps 生命周期中实现大规模人工智能。它还利用了 NetApp 中丰富的智能数据管理技术,而用户无需了解有关存储或如何管理卷的任何信息。Domino 的一位制药客户说:"这正是我们所需要的!"FSx for ONTAP® 是产品驱动策略的结果,该策略使用户能够以更少的成本做更多的事情——也就是说,工作更快,完成更快,成本更低。这与之前的情况正好相反。即性能较低、GPU 瓶颈和效率低下的通用超大规模存储。使用 Domino 和 NetApp 解决方案重新平台化已经对早期采用者产生了影响,他们现在意识到在其混合域上大规模运行模型的好处,所有这些都具有更快的吞吐量和无浪费的 GPU 容量。
在人工智能能耗激增的头条新闻中,事实证明人工智能可能比其声誉更环保,因为更高的吞吐量和更快的处理速度也减少了组织的环境足迹,而不仅仅是他们的 GPU 和电力费用。FSx for ONTAP® 可以成为公司在可持续发展之旅中迈出的又一步。
Thomas Been 将 2025 年视为"之前"和"之后"的拐点,届时组织将超越 AI 的"手工时代",工业 AI 开始兴起。他说:"我们对与 NetApp 的合作感到兴奋,因为我们一起改变了游戏规则。Domino 和 NetApp 创建了标准化流程——包括正确的治理——使企业能够大规模采用 AI。"但 Domino 通过 Amazon FSx for NetApp ONTAP 提供的服务仅仅是个开始。下一步是什么?
首先是产品设计工作,将 Domino 的功能直接集成到 NetApp ONTAP 中,以及一套 NetApp 感知功能,供 MLOps 专业人员在进一步成熟其试点到代理 AI 管道时使用。
虽然它可能不是 Singularity,但 FSx for ONTAP® 是一个独特的解决方案,为希望提高作物产量、设计更安全的药物和加速自动驾驶汽车生产的数据科学家带来独特的功能和宝贵的好处。T-Rob 总结道:"与 Domino 和 NetApp 以及 AWS 和 NVIDIA 等合作伙伴搭建堆栈的巨大价值来自于它是一个具有人工智能所需的所有弹性、效率和安全性的企业基础。"的确是花生酱和果冻。
Amazon FSx for NetApp® ONTAP® 专为业务关键型工作负载而构建。