Domino Data Lab et NetApp libèrent ensemble tout le potentiel de l’IA grâce à des fonctionnalités intégrées de manière transparente : une puissance de calcul robuste, une gestion des données efficace et des workflows rationalisés qui offrent aux data scientists la liberté du libre-service tandis que le service IT préserve l’intégrité opérationnelle grâce à des pratiques standard fiables, réduisant la prolifération des données et accélérant le déploiement de l’IA.
Employés
Année de création
Des entreprises du Fortune 100
Le progrès humain est alimenté par l’innovation, avec des progrès constants au fil des millénaires ponctués de pics d’inventions qui remodèlent l’avenir du jour au lendemain : des idées ambitieuses ayant un impact considérable comme l’imprimerie, la machine à vapeur, l’Internet. Beaucoup pensent que l’industrialisation de l’intelligence artificielle (IA) qui alimente la science des données est l’un de ces jalons. C’est pourquoi de nombreuses entreprises exigent désormais que les employés utilisent d’abord des outils d’IA lorsqu'ils recrutent de nouveaux talents, cherchent des réponses claires à des questions complexes, formalisent des stratégies de commercialisation et conçoivent des produits nouvelle génération.
Il y a des nouvelles passionnantes à ce sujet. Domino Data Lab (Domino) et NetApp ont vu quelque chose de plus profond, avec un potentiel plus large au-delà de l’engouement général pour ChatGPT et de l'omniprésence de l’IA. Ils ont reconnu que l’un des principaux défis pour faire passer les workloads d’IA du prototype à la production était de gérer et d’accéder aux données de manière efficace, sécurisée et transparente dans divers environnements.
Aujourd’hui, la plupart des entreprises fonctionnent avec des données réparties dans plusieurs environnements, et l’accès aux données efficace reste un défi permanent. Le partenariat entre Domino et NetApp répond de manière unique à ce problème stratégique en permettant aux équipes d’IA d’accéder directement aux datasets régis, de simplifier la gestion de l’infrastructure et d’accélérer l’innovation à grande échelle, le tout sans compromettre la sécurité ou la conformité du point de vue IT. L’IA ayant largement dépassé le stade du battage médiatique, une nouvelle phase d’adoption de l’IA est en cours : les entreprises, les gouvernements et les industries recherchent des partenaires pour les aider à mettre en production des prototypes d’IA à grande échelle.
Libérez la puissance de la data science pour relever les défis les plus importants du monde
Des membres de l’équipe Domino devant leur laboratoire d’IA à San Francisco
Ce partenariat a abouti à la première intégration de la principale plateforme MLOps de Domino avec la solution avancée de gestion des données sous-jacente de NetApp. Les data scientists bénéficient de fonctionnalités en libre-service pour gérer les workloads d’IA directement dans Domino à l’aide de Domino Volumes for NetApp® ONTAP® (DVNO). Domino utilise Amazon FSx pour NetApp® ONTAP® comme base de son offre SaaS, ce qui se traduit par une amélioration des performances deux fois supérieure à celle des solutions alternatives, tout en préservant la traçabilité complète de leurs modèles et agents. Cette approche rationalisée permet aux data scientists et aux chercheurs de se concentrer sur l’innovation plutôt que sur l’infrastructure.
Cette avancée majeure dans les domaines de l’IA, des opérations de machine learning (MLOps) et du stockage des données représente un progès considérable. Elle découle de la prise de conscience que pour exploiter toutes le potentiel de l’IA, il faut disposer de capacités parfaitement intégrées : une puissance de calcul robuste, une gestion des données efficace et des workflows rationalisés qui offrent aux data scientists la liberté du libre-service, tandis que le service IT préserve l’intégrité opérationnelle en s’appuyant sur des pratiques standard fiables, réduisant ainsi la prolifération des données et accélérant le déploiement de l’IA.
Tout commence lorsque des collègues de NVIDIA recommandent à des amis de Domino et de NetApp de déjeuner ensemble. Très vite, les dirigeants des deux entreprises se rendent compte qu’ils partagent la même vision d’un avenir où le calcul et le stockage IA sont, par définition, hybrides ou multi-cloud. Leur vision promettait une nouvelle façon pour les data scientists et les ingénieurs en stockage d’entrer ensemble dans une nouvelle ère de la data science.
Domino, la principale plateforme MLOps d’entreprise, possède l’expertise en gestion du cycle de vie de l’IA et en orchestration du calcul. Et NetApp, l’entreprise d’infrastructure de données intelligente, possède l’expertise en stockage des données. Mais le partenariat est plus qu’une simple rencontre d’esprits, c’est aussi une combinaison de capacités techniques. Thomas Robinson, directeur de l’exploitation de Domino, décrit le partenariat comme « un sandwich au beurre de cacahuète et à la confiture ». C’est tout simplement excellent.
Nous aimons travailler avec des personnes qui comprennent la valeur des technologies avancées comme Kubernetes, par exemple. Lorsque nous avons rencontré l’équipe NetApp, nous avons tout de suite su que nous partagions une nouvelle vision pour une nouvelle architecture. En termes simples, c’était 1+1=3.
Thomas Robinson, Chef de l’exploitation, Domino Data Lab
Grâce à cette vision d’une nouvelle voie à suivre, les data scientists et les entreprises peuvent aujourd’hui passer facilement, et en toute confiance, des modèles prototypes à des agents fonctionnant de manière autonome dans le monde réel, où l’IA sur une plateforme unifiée peut faire une réelle différence.
Thomas Been, directeur marketing chez Domino, déclare : « L'un des obstacle à l’adoption réussie de l’IA par de nombreuses entreprises est la confiance. » La confiance que les résultats d’IA découverts au niveau du projet pilote se traduiront par les mêmes résultats au niveau des agents, où la gouvernance réglementaire et les coûts fixes sont des considérations particulièrement importantes.
Tout aussi difficile, la plupart des projets pilotes d’IA sont exécutés dans le cloud, un environnement qui s'est avéré agile, évolutif et économique pour les data scientists, grâce à un traitement et un stockage élastiques avec paiement à l’utilisation. Le cloud permet également à des équipes disparates d’accéder aux données et de les partager de manière fluide et hautement collaborative.
Par conséquent, les entreprises et les organisations ont souvent un aperçu alléchant de la valeur de l’IA lorsqu’elles mettent en place des prototypes dans le cloud. Mais lorsqu'ils sont exécutés de manière isolée et à partir de datasets soigneusement sélectionnés, les modèles sont sujets à un surentraînement et à des biais d'apprentissage, pour ne citer que deux écueils. Il reste difficile d'exploiter la valeur à grande échelle en dehors de l’environnement de test, car les datasets plus volumineux introduisent des variations que le modèle ne reconnaît pas. Les hallucinations des modèles, les prédictions inexactes et l’efficacité réduite expliquent pourquoi 85 % des investissements dans l’IA restent bloqués en mode pilote. Thomas Robinson note : « La plupart des organisations n’envisagent pas toutes les options qui s'offrent à elle en transférant leurs données vers l’IA. » Par habitude, cela signifie vers le cloud. Mais avec Amazon FSx pour NetApp® ONTAP®, les vieilles habitudes changent.
Les clients communs de Domino et NetApp se mobilisent pour surmonter ces obstacles. Ils réussissent à faire passer leurs projets d’IA du stade des pilotes et des modèles de test à celui de la production.
Thomas Been, Directeur marketing, Domino Data Lab
Ils le font dans des environnements hybrides et multicloud, car la plupart des données mondiales les plus importantes sont encore stockées sur site. Comme le souligne Jensen Huang, PDG de NVIDIA : « Près de la moitié des fichiers dans le monde sont stockés sur site chez NetApp. » C’est pourquoi les clients communs de Domino et de NetApp ont choisi une autre voie après avoir examiné leurs options qui s'offraient à eux. Thomas Robinson explique : « Ils intègrent l’IA à leurs données. » Un exemple est la façon dont la plateforme d’IA et de data science de Domino évolue dans des environnements hybrides et multicloud où les workloads d’IA les plus intensifs des entreprise nécessitent un débit élevé, en particulier lorsque les data scientists exécutent plusieurs modèles sur des ensembles de données communs couvrant ce qui est sur site et dans le cloud. Amazon FSx pour NetApp® ONTAP® permet d’alimenter les modèles aussi rapidement que les processeurs graphiques traitent les données, ce qui constitue en soi une véritable révolution, mais ce n'est pas tout.
Le coût en devise du calcul basé sur l’IA varie considérablement, des processeurs graphiques d’entrée de gamme aux options haut de gamme, tant en termes de prix réel d’une puce que de temps nécessaire au traitement d’un dataset, que ce soit dans le cloud ou sur site. Mais Thomas Robinson soulève un sujet tout aussi important. Il déclare : « Il faut aussi ajouter le coût du temps de travail des employés. »
Auparavant, les data scientists suivaient un processus très linéaire, commençant par le respect de la gouvernance réglementaire, des politiques de l’entreprise et des protocoles de sécurité, et incluant la gestion de l’accès aux data lakes et aux entrepôts via des outils approuvés comme SQL et Tableau. Ce processus de demande, de contrôle, d’attente et de téléchargement peut ajouter des heures, des jours, voire des semaines au projet de recherche d’un data scientist. Non seulement ces obstacles peuvent inciter les data scientists à recourir au shadow IT, mais ils allongent aussi considérablement le délai de mise en production. Enfin, chaque transfert de données d’un environnement à un autre comporte des risques pour les données elles-mêmes : pertes, duplication, corruption due à l’exposition à des systèmes moins sécurisés, etc. Considérons maintenant que, selon IDC, un data scientist passe par ce processus 7 à 10 fois pour construire un seul modèle. Les chiffres (To, processeurs graphiques, jours et dollars) peuvent être importants, surtout lorsqu’ils sont multipliés par le nombre de data scientists d’une entreprise et leurs nombreuses expériences en cours.
Il y a plusieurs années, NetApp a développé le « snapshot » (capture instantanée) comme fonctionnalité centrale du système d’exploitation ONTAP. Cela parmetaux data scientists de faire des copies instantanées de leurs données à tout moment, sans les tracas des sauvegardes fastidieuses et chronophages. Aujourd’hui, la sauvegarde de ces copies immuables est une proposition de valeur centrale de la solution Domino via Amazon FSx pour NetApp® ONTAP® : des snapshots sans empreinte des données et des modèles de données capturés à la volée en un clic. C’est inestimable non seulement à des fins d’audit et de référence, mais aussi pour revenir à des modèles antérieurs plus utiles et pour les partager avec des collègues. Désormais, les data scientists peuvent se consacrer à la recherche, tandis que les ingénieurs de stockage peuvent se concentrer sur la gestion et la sécurisation de leur domaine.
La solution FSx pour ONTAP® permet l’IA à grande échelle dans un cycle de vie MLOps reproductible. Elle tire également parti de la richesse des technologies de gestion intelligente des données disponibles dans NetApp sans que les utilisateurs aient besoin de connaître quoi que ce soit au stockage ou à l’administration des volumes. Un client pharmaceutique de Domino’s a déclaré : « C’est exactement ce dont nous avons besoin ! » FSx pour ONTAP® est le résultat d’une stratégie axée sur les produits qui permet aux utilisateurs d’en faire plus pour moins cher, c’est-à-dire de travailler plus vite et de terminer plus rapidement à moindre coût. C’est l’opposé de ce qui existait auparavant, à savoir, le stockage générique d’hyperscaler avec des performances inférieures, des goulots d’étranglement au niveau des processeurs graphiques et des inefficacités. La refonte de la plateforme avec la solution Domino et NetApp fait déjà la différence pour les premiers utilisateurs qui réalisent désormais les avantages des modèles fonctionnant à grande échelle dans leur domaine hybride, le tout avec un débit plus rapide et sans gaspillage de capacité des processeurs graphiques.
Malgré les gros titres sur la consommation d’énergie exponentielle de l’IA, il s’avère que l’IA peut être plus écologique que sa réputation, car un débit plus élevé et un traitement plus rapide réduisent également l’empreinte environnementale d’une entreprise, et pas seulement ses dépenses en processeurs graphiques et en énergie. FSx pour ONTAP® peut être une étape supplémentaire pour une entreprise dans son parcours vers la durabilité.
Thomas Been voit 2025 comme un point d’inflexion marquant un « avant » et un « après », lorsque les entreprises dépasseront « l’ère artisanale » de l’IA et que l’IA industrielle commencera. Il déclare : « Nous sommes ravis de notre partenariat avec NetApp, car, ensemble, nous avons changé la donne. Domino et NetApp ont créé des processus standardisés, avec une gouvernance appropriée à tous les niveaux, pour permettre aux entreprises d’adopter l’IA à grande échelle. » Toutefois, l’offre de Domino via Amazon FSx pour NetApp® ONTAP® n’est qu’un début. Et ensuite ?
La première étape consiste à concevoir des produits visant à intégrer les fonctionnalités de Domino directement dans NetApp ONTAP, ainsi qu’une suite de fonctionnalités compatibles avec NetApp que les professionnels du MLOps pourront utiliser à mesure qu’ils perfectionnent leur pipeline d’IA, du pilote à l'agent.
FSx pour NetApp® ONTAP® est une solution unique qui offre des fonctionnalités uniques et des avantages précieux aux data scientists qui cherchent à augmenter les rendements agricoles, à concevoir des médicaments plus sûrs et à accélérer la production de véhicules autonomes. Thomas Robinson résume la situation en déclarant : « La valeur immense d’une pile avec Domino et NetApp, et des partenaires comme AWS et NVIDIA, provient du fait qu’il s’agit d’une base d’entreprise offrant toute la résilience, l’efficacité et la sécurité dont l’IA a besoin. » Du beurre de cacahuète et de la confiture, en effet.
Amazon FSx pour NetApp® ONTAP® est conçu pour les workloads stratégiques.