Domino Data Lab 與 NetApp 攜手合作,以無縫整合的功能充分發揮 AI 的承諾:強大的運算能力、高效的資料管理和簡化的工作流程,讓資料科學家可以自由自助服務,同時 IT 部門使用值得信賴的標準實務做法來保持營運完整性,從而減少資料蔓延並加速 AI 部署。
員工數
成立年份
(財星雜誌 100 大企業)
人類的進步是由創新推動的,幾千年來的穩步進步被一夜之間重塑未來的發明高峰所打斷——像印刷機、蒸汽機、互聯網這樣具有重大影響的大創意。許多人認為,推動數據科學的人工智慧 (AI) 產業化是這些里程碑之一。這就是為什麼許多公司現在要求員工在招聘新人才、尋求複雜問題的明確答案、正式制定上市戰略和設計下一代產品時首先使用 AI 工具。
在這方面有令人振奮的消息。Domino Data Lab(Domino)和 NetApp 看到了更深層次的東西,一些具有更廣泛潛力的東西,超越了無處不在的 ChatGPT 泡沫和無處不在的人工智慧清洗。他們認識到,將 AI 工作負載從原型移動到正式作業環境中的最重大挑戰之一是在各種環境中高效、安全、順暢地管理和存取資料。
如今,大多數企業的營運數據分散在多個環境中,高效的數據訪問仍然是一項持續的挑戰。Domino 與 NetApp 的合作關係以獨特的方式解決了這一關鍵問題,使 AI 團隊能夠無縫存取受管控的資料集、簡化基礎架構管理並加速大規模創新,而且從 IT 的角度來看,所有這些都不會影響安全性或合規性。隨著 AI 在其炒作週期中順利進行,AI 採用的新階段正在進行中,企業、政府和行業正在尋找合作夥伴來幫助他們將 AI 原型大規模投入生產。
釋放資料科學的力量,應對全球最重要的挑戰
Domino 團隊成員在舊金山的 AI 實驗室外
此次合作使 Domino 領先的 MLOps 平台首次與 NetApp 先進的底層數據管理解決方案集成。資料科學家可以使用 Domino Volumes for NetApp® ONTAP® (DVNO) 獲得自助服務功能,直接在 Domino 內部管理 AI 工作負載。Domino 使用 Amazon FSx for NetApp® ONTAP® 作為其 SaaS 產品的基礎,與其他產品相比,性能提高了 2 倍,同時保持了其模型和代理程式的完全可追溯性。這種簡化的方法使數據科學家和研究人員能夠專注於創新而不是基礎設施。
人工智慧、機器學習作業(MLOps)和資料儲存領域的這一里程碑代表著一項重大進步。它源於人們認識到,要充分發揮 AI 的全部前景,需要無縫整合的功能:強大的運算能力、高效的資料管理和簡化的工作流程,讓資料科學家能夠自由自助服務,同時 IT 部門使用值得信賴的標準實務做法來保持營運完整性,從而減少資料蔓延並加速 AI 部署。
這一切都始於 NVIDIA 的同事推薦 Domino 和 NetApp 的朋友共進午餐。很快,兩家公司的領導者意識到他們有一個共同的願景,即人工智慧運算和人工智慧儲存根據定義是混合雲或多雲的未來。他們的願景承諾為資料科學家和儲存工程師提供一種新的方式,共同開創資料科學的新時代。
Domino 是領先的企業 MLOps 平台,擁有 AI 生命週期管理和運算協調專業知識。而 NetApp 智慧型資料基礎架構公司,擁有資料儲存專業知識。但這種合作關係不僅僅是一次思想上的碰撞,更是技術能力的匹配。Domino 首席營運長 Thomas 'T-Rob' Robinson 將這種合作關係描述為類似於「花生醬和果凍三明治(或者,對於國際套裝,Marmite 和乳酪)」。簡直太好了。
例如,我們希望與瞭解 Kubernetes 等先進技術價值的人合作。當我們與 NetApp 團隊會面時,我們立即知道我們對新架構有著共同的新願景。用最簡單的術語來說,它是 1+1=3。
Thomas 'T-Rob' Robinson, 營運長, Domino Data Lab
這種新前進方向的願景意味著,如今的數據科學家和組織可以輕鬆自信地超越原型模型,在現實世界中實現自主運作的 agent,統一平台上的 AI 可以發揮真正的作用。
Domino 首席行銷官 Thomas Been 表示:「阻礙許多組織成功採用 AI 的一個挑戰是信任。」信任在試點層面發現的 AI 結果將在代理層面擴展到相同的結果,其中監管治理和硬成本是特別關鍵的考慮因素。
同樣具有挑戰性的是,大多數 AI 試點專案都是在雲端中運行的,事實證明,資料科學家在雲端環境中具有敏捷、可擴展且具成本效益的能力,可以靈活地隨需付費進行處理和儲存。雲端還使不同的團隊能夠以流暢、高度協作的方式存取和共享資料。
因此,企業和組織在雲端中建立原型時,往往會瞥見 AI 的價值。但是,孤立運行並使用精心策劃的數據集,模型容易過度訓練和習得偏差,僅舉兩個陷阱。在測試環境之外大規模解鎖價值仍然更加難以捉摸,因為較大的數據集會引入模型無法識別的變化。模型幻覺、不準確的預測和有效性的降低解釋了為什麼 85% 的 AI 投資仍然停留在試點模式。Thomas 指出,「大多數組織並沒有考慮將數據提交給 AI 的所有選擇。」出於習慣,這意味著要去雲端。但隨著 Amazon FSx for NetApp® ONTAP®,舊習慣正在改變。
Domino 和 NetApp 的共同客戶正在加緊努力克服這些障礙。他們成功地將 AI 專案從試點和測試模型的領域轉移到了生產環境中。
Thomas Been, 首席行銷長, Domino Data Lab
他們在混合雲和多雲環境中進行此操作,因為世界上大部分最重要的資料仍在內部部署。正如 NVIDIA 執行長 Jensen Huang 所指出:「全球近一半的檔案都儲存在內部部署的 NetApp 上。」這就是為什麼 Domino 和 NetApp 的聯合客戶在考慮其選項後採取了不同的路徑。Thomas 表示:「他們正在將 AI 帶到其資料中。」其中一個例子是 Domino 的 AI 和資料科學平台在混合雲和多雲環境中擴展的方式,在這些環境中,最密集的企業 AI 工作負載需要高傳輸量,特別是當資料科學家針對跨內部部署和雲端的通用資料集執行多個模型時。Amazon FSx for NetApp ONTAP 能夠以 GPU 處理資料的速度饋送模型,這本身就是一個遊戲規則改變者,但故事還有更多內容。
從入門級 GPU 到高端選項,AI 計算的貨幣成本差異很大,無論是晶片的實際價格標籤,還是處理數據集所需的時間,無論是在雲端還是在現場。但 Thomas 提出了一個同樣重要的話題。他說,「你還必須增加人員時間成本。」
過去,數據科學家遵循高度線性的流程,從遵守法規治理、公司政策和安全協議開始,包括通過 SQL 和 Tableau 等經批准的工具對數據湖和倉庫進行託管訪問。這種請求、把關、等待和下載的過程可能會使數據科學家的研究專案增加數小時、數天甚至數周。這些障礙不僅會刺激數據科學家尋找影子 IT,還會顯著減慢生產時間。最後,每次將資料從一個環境移動到另一個環境都會給資料本身帶來風險,從資料遺失和重複到暴露於安全性較低的系統而導致損壞。現在考慮一下,IDC 發現典型的數據科學家在構建單個模型時會經歷 7-10 次此過程。這些數字(從 TB 和 GPU,到天數和美元)可能非常重要,尤其是當乘以組織的數據科學家數量和他們當前進行的眾多實驗時。
NetApp 多年前開發了「快照」作為 ONTAP 作業系統 的核心功能。也就是說,它們使資料科學家能夠在任何時間點製作資料的即時副本,而無需麻煩且耗時的「另存為」流程。現在,儲存這些不可變副本是 Domino 解決方案的核心價值主張,透過 Amazon FSx for NetApp® ONTAP®——只需按一下滑鼠即可即時捕獲資料和資料模型的零佔用空間快照。這不僅對於稽核和參考目的非常寶貴,而且對於恢復到早期、更有用的模型以及與同事共享也非常寶貴。現在,資料科學家可以進行研究,儲存工程師可以專注於管理和保護他們的領域。
FSx for ONTAP® 解決方案可在可重複的 MLOps 生命週期內實現大規模 AI。此外,它也無需使用者瞭解有關儲存或如何管理 Volume 的任何資訊,就能充分利用 NetApp 中可用的大量智慧型資料管理技術。Domino 的一位製藥客戶說:「這正是我們所需要的!」FSx for ONTAP® 是產品驅動策略的結果,該策略使用戶能夠以更少的成本完成更多的事情,即以更低的成本更快地工作並更快地完成工作。這與以前的情況相反。也就是說,通用的大型公有雲儲存設備效能較低、GPU 瓶頸大,效率低下。使用 Domino 和 NetApp 解決方案重新建立平台已經為早期採用者帶來了不同,他們現在意識到模型在其混合域中大規模運行的好處,所有這些都具有更快的輸送量和不浪費 GPU 容量。
在 AI 能源消耗激增的頭條新聞中迷失了方向,事實證明 AI 可以比其聲譽更環保,因為更高的輸送量和更快的處理速度也減少了組織的環境足跡,而不僅僅是他們的 GPU 和電源費用。FSx for ONTAP® 可能是公司在永續發展之旅中邁出的又一步。
Thomas Been 將 2025 年視為一個「之前」和「之後」的拐點,屆時組織將超越人工智慧的「手工時代」,工業人工智慧開始。他說:「我們很高興能與 NetApp 合作,因為我們一起改變了遊戲規則。Domino 和 NetApp 已經創建了標準化流程,並始終採用正確的治理,使企業能夠大規模擁抱 AI。但 Domino 通過 Amazon FSx for NetApp® ONTAP® 提供的產品只是一個開始。下一步是什麼?
首先是產品設計工作,將 Domino 的功能直接整合到 NetApp ONTAP 中,以及一套 NetApp 感知功能,供 MLOps 專業人員在進一步成熟其試點到代理 AI 管道時使用。
雖然它可能不是奇點,FSx for ONTAP® 是一個獨特的解決方案,為希望提高作物產量、設計更安全藥物和加速自動駕駛汽車生產的數據科學家帶來了獨特的功能和寶貴的好處。T-Rob 總結道:「與 Domino 和 NetApp 以及 AWS 和 NVIDIA 等合作夥伴合作的堆疊的巨大價值來自於它是一個企業基礎,具有 AI 所需的所有彈性、效率和安全性。」花生醬和果凍,確實。
Amazon FSx for NetApp® ONTAP® 專為業務關鍵型工作負載所打造。