기업에서는 다양한 수준의 가용성과 SLA 목표를 요구하는 애플리케이션을 사용합니다. 애플리케이션의 중요도 또는 요구 사항은 처리량, 응답성, 장애 발생 시 복구 시간에 대한 요구 사항에 비례합니다. AWS 고가용성 모범 사례를 수립할 때도 동일한 고려 사항이 적용됩니다.
배포의 특정 요구 사항에 따라 AWS 가용 영역과 배치 그룹을 결합하여 컴퓨팅 및 스토리지를 분산하는 것이 AWS 고가용성 문제를 해결하는 한 가지 방법입니다. 이러한 옵션들을 최적화하여 Cloud Volumes ONTAP HA 배포와 함께 사용하면 각 계층의 요구 사항을 충족할 수 있습니다.
이 문서에서는 단일 및 다중 가용 영역, 배치 그룹에 대한 AWS 고가용성 모범 사례와 사용 사례를 살펴봅니다. 또한 스토리지 수준에서 Cloud Volumes ONTAP HA 솔루션이 제공하는 추가적인 이점도 알아봅니다.
이 문서에서 다음 내용을 학습할 수 있습니다.
가용 영역은 각 AWS 리전 내에 있는 고가용성 데이터 센터입니다. 리전은 별개의 지리적 영역을 나타냅니다. 각 가용 영역은 독립적인 전원, 냉각 및 네트워킹을 갖추고 있습니다. 전체 가용 영역에 장애가 발생하면 AWS는 동일 리전 내의 다른 가용 영역으로 워크로드를 페일오버할 수 있는데, 이를 "다중 가용 영역(Multi-AZ)" 이중화라고 합니다.
각 AWS 리전은 격리되어 다른 리전과 독립적으로 운영되지만, 각 리전 내의 가용 영역은 저지연 링크를 통해 연결되어 복제 및 내결함성을 제공합니다. 모든 데이터와 인스턴스를 단일 가용 영역에 호스팅하고 해당 영역에 장애가 발생하면 데이터에 접근할 수 없게 됩니다.
이러한 격리는 특정 지리적 리전 외부로 사용자 데이터가 유출되는 것을 허용하지 않는 높은 데이터 주권 및 규정 준수 요구 사항을 가진 워크로드를 지원하기 위한 것입니다. 이러한 유형의 워크로드는 저지연과 다른 리전과의 완벽한 분리를 제공하는 AWS 가용 영역 구조의 이점을 누릴 수 있습니다.
전체 리전 목록은 AWS 글로벌 인프라에서 확인하세요.
서로 다른 리전에서 워크로드를 실행하는 것과 동일 리전 내의 서로 다른 가용 영역에서 실행하는 것에는 두 가지 주요 운영상의 차이점이 있습니다.
AWS 리전 및 가용 영역의 지리적 분산은 애플리케이션의 성능과 안정성에 중요한 역할을 합니다.
단일 리전 내의 여러 가용 영역에 애플리케이션을 배포하면 일정 수준의 고가용성과 내결함성을 달성할 수 있지만, 서로 다른 리전에 배포하는 것보다는 낮은 수준입니다. 한 가용 영역에 장애가 발생하더라도 애플리케이션은 다른 가용 영역에서 중단 없이 계속 실행될 수 있습니다. 그러나 전체 리전에 장애가 발생하면 애플리케이션도 중단됩니다.
반면, 애플리케이션을 여러 리전에 배포하면 전체 리전에 장애가 발생하더라도(매우 드문 시나리오) 애플리케이션이 계속 작동할 수 있습니다. 여러 리전에 배포하면 전 세계 사용자의 지연 시간을 줄이고 재해 복구 속도를 높이는 등의 추가적인 이점도 얻을 수 있습니다.
비용 측면에서 AWS 리소스의 위치는 상당한 영향을 미칠 수 있습니다. 각 AWS 리전은 현지 수요, 인프라 비용, 현지 세법 등의 요인으로 인해 서비스 요금이 다릅니다. 예를 들어, 아시아 태평양(뭄바이) 리전에서 EC2 인스턴스를 실행하는 비용은 미국 동부(버지니아 북부) 리전에서 동일한 인스턴스를 실행하는 비용보다 더 비쌀 수 있습니다. 하지만 동일 리전 내의 서로 다른 가용 영역에서 워크로드를 실행하는 비용은 일반적으로 동일합니다.
또한 데이터 전송 비용은 동일 리전 내 전송, 다른 리전 간 전송, 또는 리전과 공용 인터넷 간 전송 여부에 따라 달라질 수 있습니다. 동일 리전 내 또는 동일 리전 내 가용 영역 간 데이터 전송은 일반적으로 리전 간 또는 공용 인터넷으로의 데이터 전송보다 저렴합니다.
최상의 결과를 얻으려면 애플리케이션을 호스팅하고 배포할 AWS 리전 및 가용 영역을 선택하기 전에 몇 가지 중요한 매개변수를 고려해야 합니다.
다음은 고려해야 할 가장 중요한 매개변수 목록입니다.
매개변수 #1: 지연 시간 및 근접성—지연 시간이 짧도록 가장 가까운 리전을 선택하세요.
서버에 대한 빠른 연결은 빠른 로딩 및 전송 시간 측면에서 더 나은 성능을 보장하여 전반적으로 더 나은 사용자 경험을 제공합니다. 이를 위해서는 대부분의 고객 기반과 가장 가까운 AWS 리전을 선택하는 것이 좋습니다. 클라우드와 최종 사용자 간의 거리가 짧을수록 지연 시간이 줄어듭니다. 예를 들어, 대부분의 고객이 북미 지역에서 애플리케이션에 액세스하는 경우 미국 또는 캐나다 지역의 가용 영역을 선택하면 최상의 결과를 얻을 수 있습니다.
AWS 서비스 가격은 물리적 인프라 비용 및 세금과 같은 요소에 따라 지역별로 다릅니다. 지역별 가격 차이는 수백 달러에 달할 수 있으므로 적절한 지역을 선택하는 것이 불필요한 비용을 줄이는 데 중요합니다. 공식 가격 계산기를 사용하여 요구 사항에 가장 적합한 지역을 확인할 수 있습니다. 또한 NetApp의 AWS Calculator도 확인해 보세요. 스토리지 서비스 비용을 포함한 총소유비용(TCO)을 계산할 수 있습니다.
매개변수 #2: 비용—가격 대비 성능이 가장 우수한 지역을 선택하세요.
아래 표는 1TB 데이터 전송에 대한 각 지역의 가격을 보여줍니다.
매개변수 #3: 규정 준수 및 보안—회사 자산 보호
모든 국가 또는 연합은 사용자 데이터를 보호하기 위한 서로 다른 규정 준수 규범과 규칙을 가지고 있습니다. 일부 지역에서는 해당 지역과 다른 지역 간의 전송을 금지할 수 있습니다. 이러한 규정 준수 규정을 위반하면 소송으로 이어져 조직에 심각한 재정적 및 평판 손실을 초래할 수 있습니다. 또한 전 세계적으로 서비스를 제공하는 경우 고객에게 가장 빠르고 안정적인 서비스를 제공하기 위해 여러 AWS 리전 및 가용 영역을 사용하는 것을 고려해야 합니다.
매개변수 #4: 서비스 수준 계약(SLA)—더 나은 서비스를 위한 올바른 매개변수.
AWS 서비스는 고유한 가용성 및 매개변수에 따라 다양한 SLA를 제공합니다. AWS는 애플리케이션을 AWS 설계에 따라 배포할 때 SLA를 가장 잘 준수합니다. 애플리케이션을 호스팅하고 배포하는 데 최적의 솔루션을 제공하도록 리전과 가용 영역을 선택할 때는 요구 사항과 함께 다른 모든 매개변수를 고려해야 합니다.
엔터프라이즈 데이터베이스와 같은 미션 크리티컬 워크로드의 경우—Amazon EC2 인스턴스 또는 Amazon 네이티브 데이터베이스 서비스(예: Amazon RDS)에서 호스팅되는 경우—다중 가용 영역 분산 모델은 전체 가용 영역에서 주요 장애가 발생할 경우 고가용성을 제공합니다.
단 몇 분의 다운타임도 허용할 수 없는 중요한 프로덕션 애플리케이션은 이 모델의 이점을 누릴 수 있으며, 이러한 유형의 일반적인 장애 발생 가능성을 염두에 두어야 합니다. 애플리케이션을 구성하는 상위 계층에도 동일하게 적용됩니다. 애플리케이션의 웹 서비스가 모두 하나의 가용 영역에 호스팅되는 경우, 기본 데이터베이스를 고가용성 다중 가용 영역 구성으로 구축하더라도 웹 계층이 하나의 가용 영역에만 호스팅된다면 큰 도움이 되지 않습니다.
고가용성 관점에서 볼 때, 단일 가용 영역 배포 환경에서는 해당 가용 영역에 장애가 발생하면 모든 서비스가 중단되고 복구 시간 목표가 훨씬 높아집니다. 게다가 그 과정에서 데이터 손실도 발생할 수 있습니다.
다중 가용 영역 배포의 또 다른 중요한 이점은 다음과 같습니다.
물론 모든 애플리케이션 사용 사례에 다중 가용 영역 배포가 필요한 것은 아닙니다. 임시 테스트, 개발 배포 또는 중요하지 않은 사용 사례는 단일 가용 영역에서 호스팅하여 다중 가용 영역 운영에 따른 추가 비용을 절감할 수 있습니다. 심지어 고강도 및 초저지연이 요구되는 사용 사례는 단일 가용 영역 모델에 더 적합할 수도 있습니다.
간단히 말해, 배치 그룹은 AWS에서 제공하는 구성 옵션으로, 상호 의존적인 인스턴스 그룹을 해당 인스턴스가 위치한 기본 하드웨어에 특정 방식으로 배치할 수 있도록 합니다. 인스턴스는 서로 가깝게 배치하거나, 서로 다른 랙에 분산하거나, 서로 다른 가용 영역에 분산할 수 있습니다. 이제 선택할 수 있는 각 배치 그룹 유형과 각 분산 옵션에 가장 적합한 워크로드 유형을 자세히 살펴보겠습니다.
클러스터 배치 그룹 구성을 사용하면 상호 연관된 인스턴스 그룹을 서로 가깝게 배치하여 최상의 처리량과 낮은 지연 시간을 얻을 수 있습니다. 이 옵션은 동일한 가용 영역 내에서만 인스턴스를 함께 배치할 수 있으며, 동일한 VPC 또는 피어링된 VPC 간에 배치할 수 있습니다.
클러스터 배치 그룹의 장점은 인스턴스 간 통신이 5Gbps의 단일 흐름 트래픽으로 제한되지 않고 10Gbps의 단일 흐름(지점 간) 트래픽과 총 25Gbps의 집계 트래픽으로 제한되지 않는다는 것입니다. 고성능 컴퓨팅(HPC) 네트워크 기반 애플리케이션이 이 배포 모델에 가장 적합한 사용 사례입니다. 컴퓨팅 엔지니어링, 라이브 이벤트 스트리밍, 유전체 시퀀싱, 천문학 모델, 지구 기후 컴퓨팅 모델 등은 클라우드에서 이러한 유형의 그룹화에 적합한 사용 사례입니다.
파티션 배치 그룹을 사용하면 인스턴스를 배치 그룹을 구성하는 별도의 논리 파티션으로 그룹화할 수 있습니다. 이는 각 논리 파티션을 별도의 하드웨어 랙에 구축하여 공통 하드웨어 장애를 방지하기 위한 것입니다. 하나의 랙에 장애가 발생하면 해당 논리 파티션에 있는 인스턴스에만 영향을 미칩니다. 각 논리 파티션은 여러 인스턴스로 구성됩니다. 파티션 배치 그룹 옵션을 사용하면 이러한 파티션을 단일 가용 영역 또는 동일 지역 내의 다중 가용 영역 구성에 배치할 수 있습니다.
그렇다면 어떤 유형의 부하가 이 모델에 가장 적합할까요? 분산 및 복제가 필요한 빅 데이터 저장소가 좋은 예입니다. HDFS나 Cassandra 같은 대용량 파일 시스템도 매우 적합합니다. 파티션 배치 그룹을 사용하면 어떤 인스턴스가 어떤 파티션에 배치되는지 확인할 수 있으므로 Hadoop이나 Cassandra의 토폴로지를 인식하고 데이터 복제를 적절하게 구성할 수 있습니다. 빅 데이터 분석, 데이터 보고 또는 대규모 인덱싱이 필요한 모든 사용 사례에도 파티션 배치 그룹이 적합합니다.
스프레드 배치 그룹에서는 각 단일 인스턴스가 별도의 물리적 하드웨어 랙에서 실행됩니다. 따라서 5개의 인스턴스를 배포하고 이 유형의 배치 그룹에 넣으면 각 인스턴스는 단일 가용 영역 또는 다중 가용 영역 아키텍처 내에서 자체 네트워크 액세스 및 전원을 갖춘 서로 다른 랙에 위치하게 됩니다.
스프레드 배치 그룹 설정은 파티션 배치 그룹과 유사할 수 있지만, 주요 차이점은 파티션 배치 그룹은 각 파티션에 여러 인스턴스가 있는 반면 스프레드 그룹은 서로 다른 랙 또는 가용 영역에 분산된 단일 개별 인스턴스라는 점입니다.
이 모델은 비즈니스에 중요한 소수의 인스턴스에 권장됩니다. 예를 들어 소수의 SQL 데이터베이스 인스턴스나 웹 애플리케이션 계층을 여기에서 실행할 수 있습니다. 이 구성은 파티션 및 클러스터 배치 그룹에서 제공하는 강력한 컴퓨팅 성능이 덜 필요하므로 이중화에 이상적인 사용 사례입니다.
Cloud Volumes ONTAP HA 구성은 AWS 고가용성을 제공합니다. Amazon EC2 컴퓨팅 인스턴스의 듀얼 노드에서 실행되고 모든 데이터가 기본 Amazon EBS 스토리지에 저장되므로 장애 발생 시 데이터 손실을 방지하고 60초 이내에 복구할 수 있습니다.
이 Cloud Volumes ONTAP 쌍에서 모든 데이터는 두 노드 간에 미러링되며, 두 노드 모두 클라이언트에 서비스를 제공하는 액티브-액티브 구성 또는 한 노드가 대기인 액티브-패시브 구성으로 배포할 수 있습니다. 두 경우 모두 새 데이터가 기록될 때마다 데이터가 동기적으로 미러링됩니다. 이 구성은 단일 가용 영역 시나리오 또는 다중 가용 영역 시나리오에 배포할 수 있습니다.
Cloud Volumes ONTAP HA가 작동하려면 세 개의 Amazon EC2 인스턴스가 필요합니다. 모든 스토리지 작업을 수행하는 두 개의 주 노드와 자동 페일오버 및 페일백 관련 작업을 규제하고 관리하는 하나의 작은 미디에이터 t2.micro 인스턴스입니다. RPO(복구 시점 목표)는 0이며, 데이터가 동기적으로 미러링되므로 항상 일관성이 유지되고, RTO(복구 시간 목표)는 다른 노드로 페일오버되는 경우 60초 이내에 데이터를 다시 사용할 수 있습니다.
AWS에는 Amazon EBS와 같은 다른 네이티브 스토리지 계층 이중화 기능이 있습니다. 앞서 언급했듯이 Amazon EBS는 단일 가용 영역 내의 서버 내에서만 복제되며, Amazon EBS만 사용하여 스토리지 수준에서 이중화를 제공하려면 Amazon S3 스냅샷을 생성하여 다른 가용 영역으로 전송해야 하는데, 이 역시 추가 비용이 발생합니다. Amazon EFS와 같은 다른 AWS 네이티브 고가용성 기능은 저장된 데이터를 NFS를 통해서만 내보내며, 현재 Windows 인스턴스를 지원하지 않습니다.
이 문서에서 제공된 AWS 고가용성 모범 사례에 대한 모든 정보는 세 가지 주요 결론으로 이어집니다.
비즈니스 연속성은 매우 중요합니다. Cloud Volumes ONTAP은 이를 보장할 수 있는 기능을 제공합니다.