NetApp Tech OnTap
     

So machen Sie Ihren DR-Plan wasserdicht

Nach Auskunft des United States Department of Homeland Security verfügt nur jedes vierte Unternehmen in den USA über einen Disaster Recovery-Plan (DR). Von diesen Unternehmen testen nur 30 % tatsächlich ihre Pläne. Die beängstigende Tatsache ist, dass die meisten Unternehmen vermutlich nicht ausreichend geschützt sind, und diejenigen, die glauben, über einen adäquaten Plan zu verfügen, sollten vermutlich noch einmal darüber nachdenken.

Wir bei Datalink unterstützen Unternehmen seit über 20 Jahren bei den komplexen Herausforderungen der Speicherung, des Managements und des Schutzes von Informationen. Wir haben umfangreiche Erfahrungen mit Datensicherheit gesammelt und Best Practices entwickelt, die sich in unseren Verfahren zur Datenverfügbarkeit und erweitertem Data-Recovery widerspiegeln.

Ca. 75 % der neuen Datalink-Kunden kommen zu uns, ohne über einen tatsächlichen Disaster Recovery-Plan zu verfügen. Ein DR-Plan ist eine natürliche Ergänzung Ihrer Backup- und Recovery-Verfahren und sollte Bestandteil eines umfassenden Datensicherheitsplans sein, der Backup/Recovery, Business Continuity und Disaster Recovery umfasst. In diesem Artikel erläutere ich einige der Faustregeln, die wir verwenden, um Kunden bei dieser Art von Planung zu unterstützen, und zwar:

  • Wie stellen Sie fest, ob Ihr DR-Plan zuverlässig genug ist
  • Technologien, die die DR-Planung vereinfachen können
  • Den Wert von integrierter Datensicherheit

Ist Ihr Plan zuverlässig genug?

In dem Maße wie sich Geschäftspraktiken ändern und Datenspeicher in zahlreichen Unternehmen wachsen, ist ein DR-Plan, der zum Zeitpunkt seiner Erstellung adäquat war, dies heute möglicherweise nicht mehr. Bei Datalink stellen wir häufig Diskrepanzen zwischen den geschäftlichen Anforderungen und der IT-Infrastruktur fest. Diese Diskrepanzen können technologiebedingt, prozessbedingt und neuerdings auch mitarbeiterbedingt sein. In Anbetracht der wirtschaftlichen Situation reduzieren Unternehmen den Mitarbeiterstand soweit wie möglich, was zu Lücken führen kann, die sich auf die DR-Bereitschaft auswirken.

Beispielsweise haben wir vor kurzem mit einem mittelgroßen produzierenden Unternehmen zusammengearbeitet, um dessen Disaster Recovery zu verbessern. Das Unternehmen hat vor einigen Jahren eine Business Impact Analysis (BIA) durchgeführt und dabei festgestellt, dass 40 Applikationen zur Aufrechterhaltung des Geschäftsbetriebs erforderlich sind. Unsere Analyse hat jedoch ergeben, dass tatsächlich ca. 70 Applikationen erforderlich sind. Fairerweise muss man einräumen, dass einige der Abweichungen auf Änderungen seit der ersten Auswertung zurückzuführen sind, während andere vermutlich von dieser Analyse übersehen wurden.

Einsatz eines prozessorientierten Verfahrens zur Ermittlung geschäftskritischer Applikationen
Wir verwenden ein prozessorientiertes Verfahren, mit dem wir ermitteln können, welche Applikationen kritisch für ein Unternehmen sind. Für ein produzierendes Unternehmen sind im Wesentlichen vier Aspekte für den Geschäftsbetrieb erforderlich:

  • Bestellung und Empfang von Rohmaterialien
  • Bezahlung von Rohmaterialien
  • Fertigung und Auslieferung von Produkten
  • Rechnungsstellung für gelieferte Produkte

In dem oben genannten Beispiel haben wir 70 Applikationen identifiziert, indem wir jede Applikation entsprechend einer Prozessperspektive zugeordnet und gefragt haben, inwieweit diese Applikation für mindestens eine der oben genannten Funktionen erforderlich ist. Sie können eine ähnliche Analyse für Ihr eigenes Unternehmen ausführen.

In Betracht ziehen von Infrastrukturapplikationen
Vergessen Sie keine kritischen Infrastrukturapplikationen. Es gibt zahlreiche Applikationen der „Stufe 0“, die ausgeführt werden müssen, wie Active Directory, DNS, Telefonsysteme, Netzwerk usw. Wenn DNS nicht funktioniert, wird die geschäftskritische Applikation vermutlich auch nicht laufen.

Festlegung von Recovery-Zielen für jede Applikation
Nachdem Sie die Liste der Applikationen zusammengestellt haben, müssen Sie Ziele für jede Einzelne festlegen. Normalerweise gibt es vier Hauptkriterien, die bedacht werden müssen:

  • Verfügbarkeit.Dies ist die Zeit, die eine Applikation oder ein Datensatz zur Verwendung zur Verfügung steht. Diese wird in der Regel als Prozentsatz angegeben. Beispielsweise entsprechen 99 % Laufzeit einer Ausfallzeit von knapp unter 88 Stunden pro Jahr, während eine Laufzeit von 99,999 % einer Ausfallzeit von knapp über 5 Minuten pro Jahr entspricht.
  • Recovery-Zeitvorgabe. Diese definiert, wie lange die Wiederherstellung dauern soll, wenn ein Fehler auftritt. Eine Recovery-Zeitvorgabe von 20 Minuten bedeutet, dass eine Applikation oder ein Datensatz nach einem Fehler innerhalb von 20 Minuten wieder verfügbar ist. Beachten Sie, dass eine lange Recovery-Zeitvorgabe einem anspruchsvollen Verfügbarkeitsziel widerspricht.
  • Recovery-Zeitpunkt. In den meisten Fällen ist es unverantwortlich teuer, alle Möglichkeiten eines Datenverlustes im Falle eines Fehlers zu verhindern. Der Recovery-Zeitpunkt definiert die maximale Anzahl von Daten, die Sie bereit sind, zu verlieren. Beispielsweise legt ein Recovery-Zeitpunkt von einer Stunde fest, dass Sie in der Lage sind, eine Applikation oder einen Datensatz in einem Zustand wiederherzustellen, der maximal eine Stunde vor dem Auftreten des Ausfalls liegt. (Beachten Sie, dass für ein solches Ziel für die meisten Applikationen stündliche Backups erforderlich wären.) Der Recovery-Zeitpunkt wirkt sich nicht direkt auf die Verfügbarkeit oder die Recovery-Zeitvorgabe aus, außer wenn ein anspruchsvoller (kurzer) Recovery-Zeitpunkt zu einer Verlängerung der Zeit führt, die für den Recovery-Prozess erforderlich ist.
  • Datenhaltung. Kriterien für die Datenhaltung legen fest, wie lange ein bestimmter Datensatz aufbewahrt werden muss, um den Backup- oder Compliance-Anforderungen zu entsprechen. Sie können Datenhaltungskriterien sowohl für Online- als auch Offline-Kopien (Band) von Daten besitzen. Sie können beispielsweise ein bestimmtes Backup für einen Monat online aufbewahren und es anschließend für ein Jahr auf Band aufbewahren.

Anstatt unterschiedliche Ziele für jede Applikation zu definieren, sollten Sie einige unterschiedliche „Serviceebenen“ festlegen und Ihre Applikationen in diese Ebenen einordnen. Sie sollten auch die Abhängigkeiten zwischen Applikationen erfassen und die Reihenfolge festlegen, in der Applikationen neu gestartet werden. Abhängigkeiten, die im normalen Betrieb als offensichtlich erscheinen – beispielsweise Starten der Datenbank vor der Datenbankapplikation – werden in einer Krise leicht übersehen, und selbst kleine Fehler können Sie viel Zeit kosten.

Koordinieren Sie Ihre Aktivitäten
Damit Ihre DR-Planung wirklich erfolgreich ist, müssen Sie einen koordinierten, abteilungsübergreifenden Zugang verwenden, der sich auf alle Geschäftsbereiche erstreckt. Leider wurde bisher keine Software entwickelt, die Ihnen eine sorgfältige und durchdachte Vorarbeit abnimmt. Wenn die IT-Abteilung nicht mit den operativen Abteilungen des Unternehmens kommuniziert, werden unzureichende Ergebnisse erzielt.

Verwendung von Technologie zur Optimierung Ihrer Infrastruktur

Es gibt mehrere Tools und Technologien, die Sie bei der Analyse Ihrer Umgebung und der Entwicklung einer funktionalen DR-Infrastruktur unterstützen.

Verwenden von Tools für die Bestandsaufnahme
Es gibt zahlreiche Software-Tools, die Sie beim Verständnis der Applikations-, Storage- und Netzwerkverwendung und beim Erkennen von Trends unterstützen. Die überlegte Verwendung dieser Tools kann Sie nicht nur bei der Anfangsanalyse Ihrer Umgebung unterstützen, sondern auch dabei, Ihre Planungen abzustimmen, damit Kapazitäten und Bandbreite adäquat sind.

Bei Datalink verwenden wir häufig NetApp SANscreen für die Storage-Analyse. Unter anderem ordnet SANscreen Servicepfade zwischen Applikationen auf Servern und den auf Storage-Systemen gespeicherten Daten zu. SANscreen benötigt für die Installation keine Agents, Sie können es also sofort in Betrieb nehmen und erhalten schnell Ergebnisse. Wir verwenden ebenfalls Riverbed Cascade und ähnliche Tools, um die Netzwerknutzung, die Netzwerkleistung und das Netzwerkverhalten zu überprüfen.

Wenn Sie den quantitativen Umfang Ihres Betriebs überblicken, ist es leichter, die Art der DR-Lösungen zu ermitteln, die Sie benötigten, oder die Sie unterstützen können.

Deduplizieren und/oder Komprimieren
Die Kosten für eine Netzwerkverbindung, die genug Kapazität für die Verarbeitung Ihres Replikations-Datenverkehrs besitzt, können exorbitant sein. Durch die Verwendung von Primärspeicher-Deduplizierung mit oder ohne LAN-Komprimierung lassen sich die Bandbreitenanforderungen deutlich reduzieren, sodass sich vermutlich die Kapazität der benötigten Netzwerkverbindung verringern lässt. Wenn Sie beispielsweise die NetApp Deduplizierung auf Ihre Umgebung virtueller Server anwenden, können Sie bis zu 90 % sparen. Dies führt offensichtlich zu umfangreichen Bandbreiteneinsparungen während der SnapMirror Replikation. Im Allgemeinen lassen sich durch die Anwendung der Deduplizierung auf Ihre Storage-Volumes in Abhängigkeit von den Datentypen Einsparungen zwischen 25 % und 90 % erzielen.

Konsolidieren und Virtualisieren
Wenn Sie dies noch nicht getan haben, kann die Konsolidierung und Virtualisierung Ihrer Server und Netzwerke und Ihres Storage große Auswirkung auf die Fähigkeit zur Ausführung des DR besitzen. Die Eliminierung der Komplexität verringert nicht nur die Betriebskosten in Ihrem Datacenter, sondern erleichtert auch den Überblick über den Bestand und wo er sich befindet – was entscheidend für Ihre Datensicherheit und DR-Strategien ist.

Die neuesten Servervirtualisierungstechnologien verfügen möglicherweise auch über integrierte Funktionen, die den Neustart von Virtual Machines und Applikationen an einem sekundären Standort erleichtern. (In einem vor kurzem veröffentlichten Tech OnTap Artikel wurde die Nutzung von VMware Site Recovery Manager und NetApp Storage erörtert.)

Ein anderer neuer Trend ist die Konsolidierung Ihrer Netzwerke in einer einzigen Ethernet Fabric. Auf diese Weise lassen sich die Kosten erneut verringern und das Netzwerk-Management vereinfachen, und es kann einfacher sein, die Netzwerkbandbreite auf den DR-Bedarf abzustimmen. Mit der Verfügbarkeit von Fibre Channel over Ethernet (FCoE) lässt sich vorhandener FC-Storage innerhalb einer Unified Network Fabric integrieren.

Einige der Vorteile von virtualisiertem Storage werden im folgenden Abschnitt erörtert.

Integrierte Datensicherheit kann das Leben vereinfachen

Vom Standpunkt eines professionellen Entwicklers von DR-Implementierungen kann die Möglichkeit, alle Funktionen der Datensicherheit und des Disaster Recovery in den zugrundeliegenden Storage zu integrieren, ein entscheidendes Entwicklungselement sein. Anstatt unterschiedliche Lösungen für jeden Datensatz zu verwenden, ermöglicht die integrierte Datensicherheit, die gleiche konsistente Methode auf alle Ihre Daten anzuwenden.

NetApp Storage verfügt über eine breite Palette von Datensicherheitsfunktionen, einschließlich der speicherplatzeffizienten Snapshot Technologie, SnapVault für festplattenbasierte Backups, SnapMirror für DR und MetroCluster für die kontinuierliche Datenverfügbarkeit. (Diese Technologien werden detaillierter in zwei begleitenden Artikeln in dieser Ausgabe erläutert, von denen der eine integrierte Datensicherheit behandelt, und der andere eine Fallstudie zu MetroCluster enthält.)

Wie oben erwähnt, ist es fast immer sinnvoll, mehrere Serviceebenen mit unterschiedlichen Datensicherheits- und Disaster Recovery-Funktionen für jede Ebene zu definieren. Aufgrund der von NetApp bereitgestellten Funktionen entwickeln wir, wann immer dies möglich ist, NetApp Lösungen, um diese Anforderungen zu erfüllen.

Wenn Sie bereits eine große Investition in andere Storage-Systeme getätigt haben, die nicht über die integrierten Datensicherheitsfunktionen von NetApp verfügen, ermöglicht die NetApp V-Series den weiteren Einsatz dieses Storage bei gleichzeitiger Bereitstellung der NetApp Funktionen. Datalink war sehr erfolgreich mit der Verwendung der V-Series bei mehreren aktuellen Aufträgen. (V-Series wird auch in der MetroCluster Kundenreferenz in dieser Ausgabe vorgestellt.)

Schließlich ist die einzige Möglichkeit, um sicher zu sein, dass Ihr DR-Plan funktioniert, ihn regelmäßig zu testen. Die NetApp FlexClone Technologie macht diesen Testprozess wesentlich einfacher. Sie benötigen weniger zusätzlichen Storage, und der Prozess wirkt sich wesentlich weniger unterbrechend auf die Produktion aus.

In einem üblichen DR-Testszenario müssen alle Daten für den Test vor dem Testbeginn auf andere Festplatten kopiert werden. Dies bedeutet, dass Sie den doppelten Speicherplatz benötigen und zeitaufwändige Kopien erstellen müssen, bevor Sie mit dem Testen beginnen können.

Mithilfe von FlexClone können Sie speicherplatzeffiziente, beschreibbare Klone von einigen oder allen DR-Volumes erstellen. Zusätzlicher Speicherplatz wird nur benötigt, wenn Sie Änderungen an dem geklonten Volume vornehmen. Diese FlexClone Volumes ermöglichen eine statische Ansicht Ihrer DR-Daten zu einem festen Zeitpunkt, ohne dass laufende Updates unterbrochen werden oder große Mengen zusätzlichen Speicherplatzes benötigt werden.

Mithilfe von FlexClone können Sie die erforderliche Zeit für den DR-Test von 24 Stunden oder länger auf wenige Stunden verringern, da der Prozess schnell, zuverlässig und wesentlich weniger ressourcenintensiv ist.

Schließlich stellt ein DR-Standort eine substanzielle Ressourceninvestition dar. Mithilfe von FlexClone können diese Ressourcen auch für andere Aufgaben verwendet werden, beispielsweise für Entwicklung, Data Mining, QA usw., ohne dass dies negative Einflüsse auf die DR-Bereitschaft besitzt.

Testen und aktualisieren Sie Ihren Plan regelmäßig

Wie im vorstehenden Abschnitt erwähnt, sind regelmäßige Tests entscheidend, um auf Ausfälle vorbereitet zu sein. Ich empfehle Ihnen, Ihren DR-Plan mindestens einmal pro Jahr zu testen, bzw. häufiger, wenn sich Ihr Geschäftsvolumen ändert und/oder das Storage-Wachstum ungewöhnlich hoch ist. Verwenden Sie nach Möglichkeit automatische Tools, um Trends bei der Storage-Kapazität, der Netzwerkbandbreite usw. zu verfolgen.

Abschließend sollten Sie eine jährliche Prüfung Ihrer Geschäftsanforderungen planen und Ihren DR-Plan und seine Leistung entsprechend aktualisieren. Auf dieses Weise bleibt Ihr Plan nicht nur entwicklungsfähig, sondern erfüllt auch weiterhin die allgemeinen Anforderungen Ihres Unternehmens in Bezug auf Wachstum und Veränderung.

Abbildung 1) Wert der Daten im Vergleich zur erforderlichen Schutzstufe

Welches sind die ersten Schritte?

Wenn Sie Starthilfe bei der Entwicklung Ihres DR-Plans oder bei der Aktualisierung eines vorhandenen Plans benötigen, stehen zahlreiche Ressourcen zu Ihrer Unterstützung zur Verfügung. Sie brauchen das Rad nicht neu zu erfinden. Die Regierung der USA stellt auf der Website "ready.gov" eine Checkliste und weitere Ressourcen zur Verfügung, die als guter Ausgangspunkt dienen können.

Wenn Sie noch immer unsicher sind, holen Sie sich Hilfe von außen. Die Anbieter Ihres Servers, Netzwerks oder Ihrer Applikationen können Ihnen möglicherweise weitere Ressourcen anbieten (kostenlos oder kostenpflichtig). Auch Dienstleistungsunternehmen wie Datalink können Sie unterstützen. Diese zusätzlichen Ausgaben können sich beim Schutz Ihres Unternehmens und durch Sorgenfreiheit mehrfach auszahlen.

Ihre Meinung zur DR-Planung

Stellen Sie Fragen, tauschen Sie Ideen aus, und teilen Sie Ihre Meinung mit der NetApp Online Community!

Joshua Konkle

James Mason
National Practice Lead und Storage Architect
Data Continuity Lead
Datalink

James hat die letzen 5 Jahre seiner 25-jährigen IT-Karriere bei Datalink verbracht. Seit 10 Jahren beschäftigt er sich nahezu ausschließlich mit Disaster Recovery. Die Entwicklung der größten SAN-Lösung in der Geschichte von Datalink ist eine seiner jüngsten Leistungen. Zuvor war er unter anderem bei IBM und Convex beschäftigt.

Weitere Infos hier