Datendeduplizierung ist ein Prozess, der überflüssige Datenkopien beseitigt und die benötigte Storage-Kapazität deutlich verringert.
Eine Deduplizierung kann als Inline-Prozess beim Schreiben der Daten auf das Storage-System und/oder als Hintergrundprozess zur Beseitigung von Duplikaten nach dem Schreiben der Daten durchgeführt werden.
Bei NetApp ist Deduplizierung eine Technologie ohne jeglichen Datenverlust, die sowohl als Inline-Prozess als auch als Hintergrundprozess ausgeführt wird, um Einsparungen zu maximieren. Deduplizierung wird (in der Regel) möglichst als Inline-Prozess ausgeführt, sodass sie den Client-Betrieb nicht stört. Um die Einsparungen zu maximieren, läuft zusätzlich der vollständige/komplette Prozess im Hintergrund. Die Deduplizierung ist standardmäßig aktiviert, und das System führt sie automatisch auf allen Volumes und Aggregaten ohne manuellen Eingriff aus.
Der Performance-Overhead durch die Deduplizierungsoperationen ist minimal, da diese in einer eigenen Domain ausgeführt werden, die von der Domain für Lese-/und Schreiboperationen der Clients getrennt ist. Deduplizierung läuft unbemerkt, unabhängig von der ausgeführten Applikation und der Art des Datenzugriffs (NAS oder SAN).
Einsparungen durch Deduplizierung bleiben beim Verschieben der Daten erhalten – wenn sie auf einen Disaster-Recovery-Standort repliziert werden, in einem Vault gesichert oder zwischen On-Premises, Hybrid Cloud und/oder Public Cloud verschoben werden.