복구 지점 목표(RPO)를 0으로 설정하고 복구 시간 목표(RTO)를 최소화하는 인프라를 구축하는 것은 쉽지 않습니다. 그 이유 중 하나는 전체 데이터 센터 또는 가용성 영역(AZ)에 장애가 발생할 수 있기 때문입니다. 해결책은 인프라를 여러 AZ에 걸쳐 배치하는 것인데, 이는 어려울 수 있습니다.
이러한 수준의 가용성을 달성하는 방법은 있지만, 직접 구축하는 데는 시간과 세심한 관리가 필요하며, 이러한 접근 방식은 성능 및 지연 시간 문제를 야기할 수 있습니다.
이 게시물에서는 Amazon FSx for NetApp ONTAP이 어떻게 더 나은 솔루션을 제공하는지 설명합니다. 즉, AWS에서 고가용성을 제공하는 다중 AZ 배포를 위한 기본 제공 옵션입니다.
다음 링크를 사용하여 각 섹션으로 이동하세요.
다중 AZ 고가용성은 쉽지 않습니다
엔터프라이즈급 배포에는 개별 구성 요소부터 전체 AZ에 이르기까지 데이터 손실 없이 장애를 처리할 수 있는 시스템(RPO=0)이 필요합니다. 또한 이러한 시스템은 최소 RTO를 유지하기 위해 장애 발생 시 신속하게 복구해야 하며, 이를 위해서는 하드웨어, 네트워크 및 지리적 위치 전반에 걸친 복원력이 필요합니다.
AWS에서 이러한 다중 AZ 고가용성을 달성하는 방법은 여러 가지가 있습니다. 그러나 이러한 인프라를 구축하려면 실시간 데이터 동기화, 원활한 데이터 보안, 그리고 AZ 간 복구를 위한 메커니즘을 설계해야 합니다. 이러한 작업은 영역을 추가할 때마다 더욱 복잡해집니다.
기본 작업은 다음과 같습니다.
- 동기화된 복제를 통한 중복성. 완벽한 중복성을 달성하려면 데이터를 여러 영역 간에 동기적으로 미러링해야 합니다. 이 프로세스는 일반적으로 지능형 오케스트레이션 계층에서 관리됩니다. 설정은 복제의 정확성과 시기적절성을 보장하여 데이터 손실 위험을 제거하고 RPO(데이터 액세스 목표)를 0으로 일관되게 달성해야 합니다.
- 데이터 액세스 지연 시간 해결. 여러 영역 간의 실시간 데이터 동기화는 지연 시간을 극복하기 어렵게 만듭니다. 캐싱 및 콘텐츠 전송 네트워크(CDN)를 통해 이러한 지연 시간을 부분적으로 상쇄할 수 있지만, 가장 중요한 과제는 전용 상호 연결을 통해 영역 간 통신 지연 시간을 지속적으로 줄일 수 있는 고성능 네트워크를 구축하는 것입니다.
- 장애 조치 역학. 영역 간 원활한 전환을 달성하는 것은 미묘한 과제이며, 특히 RTO를 최소화하는 것이 목표인 경우에는 더욱 그렇습니다. 스토리지 프레임워크는 복원력이 뛰어나야 하며 환경 간에 불일치 없이 데이터를 미러링할 수 있어야 합니다. 또한 데이터 손실이나 사용자 경험 저하 없이 장애 조치(failover) 및 장애 복구(failback)를 수행할 수 있어야 합니다.
- 장애 지점 없는 데이터 보호.
자체 다중 AZ 아키텍처를 구축하면 인프라에 새로운 구성 요소가 추가되며, 이러한 구성 요소는 추가적인 장애 지점이 될 수 있습니다. 데이터 노출이나 손실을 방지하려면 특정 시점 스냅샷, 일관된 백업, 원활한 재해 복구(DR) 프로세스를 위한 솔루션을 마련하는 것이 중요합니다.
또한 전송 중 및 저장 중 암호화, 액세스 제어, 랜섬웨어 차단, WORM(Write Once Read Many) 데이터 잠금과 같은 일관된 보안 표준이 필요합니다.
- 비용 절감 및 데이터 복사본 저장. 여러 AZ에 걸쳐 있는 중복 시스템의 경우 높은 오버헤드와 중복 비용이라는 두 가지 주요 비용 문제가 발생합니다. 다중 AZ 시스템을 구축하고 유지 관리하는 데 상당한 리소스를 소비할 뿐만 아니라, 설정 후에는 저장되는 데이터부터 AZ 간 네트워크 트래픽까지 단일 배포를 실행하는 데 드는 모든 비용이 중복됩니다.
이러한 요소를 고려할 때 다중 AZ 고가용성은 하지만 AWS에는 더 쉬운 옵션이 있습니다. 바로 FSx for ONTAP을 통해 내장된 다중 AZ 고가용성입니다.
FSx for ONTAP을 통해 다중 AZ 고가용성 달성
FSx for ONTAP은 AWS의 완전 관리형 서비스입니다. NetApp® ONTAP®의 고유한 데이터 관리 기능을 사용하여 파일 및 블록 스토리지를 위한 고성능 공유 스토리지 옵션을 제공합니다. 이러한 기능 중 하나가 다중 AZ 고가용성입니다.
FSx for ONTAP 노드의 인프라 리소스는 동일한 AWS 리전 내의 서로 다른 AZ에 프로비저닝되며, 데이터는 두 노드에 동기적으로 미러링됩니다. 쓰기 작업은 두 노드에 데이터가 추가된 후에만 완료되므로, 장애 발생 시 데이터가 손실되지 않습니다.
전체 AZ 장애와 같은 대규모 장애가 발생하는 경우에도 FSx for ONTAP은 정상 상태의 FSx for ONTAP 노드로 자동적이고 원활하게 장애 조치(failover)하여 지속적으로 데이터를 제공합니다.
이 운영 노드는 자체 독립 데이터 복사본에서 모든 데이터 요청을 계속 처리할 수 있으므로 RPO를 0으로 유지할 수 있습니다 . 장애가 발생한 노드가 복구되면 정상 상태의 노드에서 최신 데이터로 자동 업데이트되고 이중 모드 운영으로 장애 복구됩니다.
FSx for ONTAP 다중 AZ 고가용성 아키텍처.
이처럼 높은 수준의 가용성이 필요하지 않은 경우 단일 AZ 내에 있는 이중 노드 구조를 선택하세요.
FSx for ONTAP을 사용한 다중 AZ 고가용성 배포의 이점
FSx for ONTAP을 다중 AZ 배포에 사용하면 다음과 같은 이점을 얻을 수 있습니다.
- 고가용성: 여러 AZ에 실시간으로 데이터를 동기식으로 미러링하여 RPO(복구 시점 목표) 0을 달성하고, 장애 발생 시에도 데이터 손실을 방지합니다. 이를 통해 미션 크리티컬 애플리케이션에 필수적인 99.99% 가용성을 확보할 수 있습니다.
FSx for ONTAP은 여러 AZ에 데이터의 미러링된 복제본을 동시에 저장합니다. 한 AZ에 장애가 발생하면 시스템은 다른 AZ의 복제본으로 데이터 액세스를 자동으로 라우팅합니다.
- 데이터 복원력: FSx for ONTAP은 원활한 자동 장애 조치 및 장애 복구 프로세스를 통해 60초 미만의 RTO를 달성할 수 있도록 지원합니다. 이 솔루션은 자동으로 중복 노드(페일오버)로 전환하고, 장애가 발생한 노드가 복구되면 이중 노드 운영(페일백)으로 재개합니다.
- 강력한 보안: FSx for ONTAP은 엄격한 액세스 제어를 시행할 뿐만 아니라 저장 데이터와 전송 중인 데이터를 암호화합니다. 또한 변경 불가능한 NetApp Snapshot™ 복사본을 통해 데이터를 보호하여 무단 데이터 변경을 방지하고, 사이버 위협으로부터 데이터를 보호하기 위한 맬웨어 방지 기능을 제공합니다.
- 포괄적인 데이터 보호: 로컬 스냅샷 복사본을 통해 빠른 데이터 복구를 지원하는 동시에, 최적화된 백업 및 리전 간 재해 복구 옵션을 통해 데이터를 안전하게 보호합니다.
- 비용 최적화된 데이터 복사본: FSx for ONTAP은 ONTAP 스토리지 효율성 기능을 통해 비용을 최적화합니다. 데이터 중복 제거, 압축 및 압축 기능은 스토리지 사용량과 비용을 최대 65%까지 절감하며, 자주 사용되지 않는 데이터를 용량 계층으로 자동 계층화하여 SSD의 프리미엄 스토리지 요금을 절감합니다. 이러한 기능은 데이터 가용성에 어떠한 영향도 미치지 않습니다.
FSx for ONTAP은 최악의 운영 중단에도 안정적으로 운영할 수 있도록 지원합니다. 한 회사가 이를 어떻게 활용하고 있는지 소개합니다.
소프트웨어 회사가 FSx for ONTAP을 통해 다중 AZ의 고가용성을 유지하는 방법
FSx for ONTAP을 사용하여 원활한 비즈니스 운영을 유지하는 한 회사는 인력 참여 솔루션 소프트웨어 개발사입니다. 이 글로벌 회사의 SaaS(Software-as-a-Service) 기술은 효율적인 인력 관리 및 규정 준수 고객 참여를 위한 도구를 제공하며 이러한 도구에는 높은 가용성이 필요합니다.
이 회사에는 확장성을 제공하고 다중 AZ 설정에서 데이터 무결성을 유지하며 엄격한 규정 준수 및 보안 표준을 준수하는 데 도움이 되는 통합 스토리지 솔루션이 필요했습니다.
해결책은 클라우드로 전환하고 여러 가지 기능을 제공하는 FSx for ONTAP을 도입하는 것이었습니다. FSx for ONTAP의 다중 AZ 고가용성 및 리전 간 재해 복구 기능은 회사의 데이터를 안전하게 보호합니다.
- 운영 간소화. FSx for ONTAP으로 전환하면서 회사는 스토리지 인프라를 직접 관리할 필요가 없어졌습니다. 이제 현대화된 클라우드 네이티브 쿠버네티스 워크로드와 기존 시스템에서 마이그레이션된 SaaS 애플리케이션을 모두 처리하는 단일 완전 관리형 스토리지 서비스를 구축했습니다.
- 비용 효율성. FSx for ONTAP은 스토리지 효율성 기능을 통해 상당한 비용 절감 효과를 제공하여 클라우드 스토리지 총소유비용(TCO)을 절감했습니다.
비즈니스 연속성을 유지하는 더 쉬운 방법
애플리케이션은 항상 가용성과 보안을 유지해야 합니다. FSx for ONTAP은 최악의 정전 상황에서도 이러한 문제를 해결할 수 있도록 지원합니다. 다중 AZ 배포 옵션을 통해 FSx for ONTAP은 RPO=0, RTO<60초를 즉시 달성합니다. 즉, 심각한 장애 발생 시 운영에 지장을 받지 않으며, 추가 오버헤드도 걱정할 필요가 없습니다.