Einheitliche Datenarchitekturen für KI-Workflows

Durch ein Gebäude gehende und dabei durch eine Glaswand blickende Person mit einem Tablet in der Hand

Inhalt

Diese Seite teilen

Arun Gururajan

2024-01-31

692 Aufrufe

In der sich rasch weiterentwickelnden Landschaft der künstlichen Intelligenz (KI) und des Machine Learning (ML) ist die Fähigkeit, verschiedene Datentypen zu managen und zu verarbeiten, von entscheidender Bedeutung für die Qualität der durch die Modelle gewonnenen Erkenntnisse.

Optimierung der Storage-Strategie

Bei einer optimalen Storage-Strategie müssen folgende Aspekte berücksichtigt werden:

die verschiedenen Datentypen in Unternehmen (einerseits strukturierte Daten wie Datenbanken und Tabellenkalkulationen, andererseits unstrukturierte Daten, etwa E-Mails, Bilder, Audio- und Videoinhalte sowie sonstige Dokumente)
der Ort, an dem diese Datentypen jeweils gespeichert sind (lokal und/oder innerhalb einer oder mehrerer Public Clouds bzw. bei SaaS-Anbietern verteilt über mehrere geografische Regionen)
die Arten von Storage-Architekturen wie File-Storage (mit Datenzugriff und Datenmanagement auf Basis von Dateien), Block-Storage (mit Datenspeicherung in Form von Blöcken, die effiziente Operationen mit niedriger Latenz ermöglichen) und Objektspeicher (mit Datenmanagement auf Basis von Objekten, die jeweils Daten, Metadaten und eine eindeutige ID enthalten, wodurch sie hochskalierbar und für unstrukturierte Daten geeignet sind)

Überwindung von Hindernissen bei der KI-Implementierung

Eine Architektur der Daten für die umfassende Einführung von künstlicher Intelligenz in einem Unternehmen aufzubauen, ist keine leichte Aufgabe. Daher überrascht es kaum, dass viele Unternehmen, die GPU-Server kaufen oder über Hyperscaler nutzen, in der Phase des Datenmanagements ins Stocken geraten. Untersuchungen von IDC zeigen, dass Datenverschiebung beziehungsweise Datenmanagement zu den häufigsten Hindernissen für einen erfolgreichen KI-Einsatz gehören.

Mit einem einheitlichen und intelligenten Infrastrukturansatz unterstützt NetApp KI-Teams dabei, Datensilos aufzubrechen und die darin befindlichen Daten zu nutzen – unabhängig davon, wo und wie diese gespeichert sind. Dies sind die spezifischen Vorteile, durch die NetApp für KI-Workflows entscheidend ist:

Datenverschiebung:Insbesondere die heutigen multimodalen KI- und ML-Workflows erfordern während der unterschiedlichen Verarbeitungsschritte häufig das Verschieben umfassender Datensätze. Derartige Verschiebungen werden durch eine Unified Storage-Architektur erleichtert, die für jede Etappe den richtigen Storage bereitstellt und ihn je nach Bedarf in puncto Geschwindigkeit, Zugriff und Langlebigkeit optimiert. Für die Operationalisierung von KI ist ein solcher Ansatz unverzichtbar, da große Datenmengen ungehindert durch die Inferenz-Pipeline verschoben werden müssen.

Datenmanagement:Die Heterogenität und Multimodalität von KI-Datensätzen mit Bildern, Videos, Sensordaten und vielem mehr machen einen flexiblen Ansatz für das Datenmanagement erforderlich. Dieser ist durch die intelligente NetApp Infrastruktur gegeben. Ein NetApp Storage-System kann die heterogenen Datensätze sehr effektiv speichern, sodass sie für komplexe KI-Aufgaben unmittelbar einsatzbereit sind. Bei Anwendungen im Gesundheitswesen ist beispielsweise Block-Storage sinnvoll für Workflows im Bereich der medizinischen Bildgebung, wo hochperformanter Zugriff auf die Daten notwendig ist. Patientenakten und andere unstrukturierte Daten können dagegen als Objekte mit umfassenden Metadaten gespeichert werden, sodass sie unkompliziert wieder abrufbar und analysierbar sind.

Daten-Governance: Unternehmen müssen dafür sorgen, dass die richtigen Daten mit einer entsprechenden Zugriffssteuerung versehen sind. So werden interne Richtlinien und lokale Vorgaben erfüllt; gleichzeitig sind dabei Sicherheit und Schutz des geistigen Eigentums gegeben. In den Datenmanagementfunktionen von NetApp ist Daten-Governance bereits von vornherein berücksichtigt.

Aufbau einer intelligenten Dateninfrastruktur

NetApp Kunden profitieren schon seit Jahren von einer vereinheitlichten Hybrid-Multi-Cloud-Nutzung. Obwohl NetApp die explosionsartige Entwicklung der generativen KI im Verlauf der letzten zwölf Monate nicht vorhersehen konnte, haben unsere Experten eine intelligente Dateninfrastruktur für datenfokussierte Unternehmen aufgebaut. Wie sich jetzt zeigt, ist dieses Framework genau das, was Unternehmen brauchen, um durch KI und generative KI Wettbewerbsvorteile zu erzielen.

Weitere Informationen

Wenn Sie genauer wissen möchten, was IDC über Datenarchitekturen für KI-Workflows geschrieben hat, lesen Sie den Bericht Unified Data Architectures Provide Needed Flexibility for AI Workflows. Informieren Sie sich außerdem über Erkenntnisse von NetApp Führungskräften zu KI und generativer KI.

Arun Gururajan

Als Vice President des Bereichs Research & Data Science bei NetApp leitet Arun Gururajan die KI-, ML- und Data-Science-Initiativen für die gesamte Produktpalette des Unternehmens. Zuvor war er in verschiedenen Führungspositionen bei Meta und Microsoft tätig, wo er KI-gestützte Produkte mit breiter Wirkung für den dauerhaften Einsatz entwickelte.

Alle Beiträge von Arun Gururajan anzeigen

Nächste Schritte

Blogs

Informieren Sie sich über die neuesten Trends und Entwicklungen in der Cloud, On-Premises und überall dazwischen. Hier wird alles real, mit einem Sahnehäubchen obendrauf.

Loslesen

Community

Erkunden Sie eine große Auswahl an offenen Foren, in denen Sie Fragen stellen, Antworten austauschen und sich einfach über alle NetApp Technologien informieren können, die Ihnen am wichtigsten sind.

Mitreden