메뉴

Amazon FSx for NetApp ONTAP을 통한 데이터 캐싱으로 어디서나 더 나은 협업 실현

목차

이 페이지 공유하기

Yifat Perry
Yifat Perry

오늘날 끊임없이 확장되는 데이터 자산과 원격으로 작업하는 분산된 팀으로 인해 데이터에 대한 요구 사항이 변했습니다. 다양한 환경에서 공유 데이터 세트에 대한 데이터를 빠르게 검색하고 효과적으로 협업하는 것은 데이터가 어디에 호스팅되는지와 관계없이 필수적입니다.

이러한 유형의 데이터 배포는 데이터 무결성, 비호환성, 성능 문제로 인해 조율하기가 매우 어려울 수 있습니다. 조직은 이러한 어려움 없이 데이터 접근성을 높이고 데이터 민첩성과 협업을 촉진할 수 있는 방법이 필요합니다.

NetApp과 AWS는 Amazon FSx for NetApp ONTAP을 활용한 데이터 캐싱 솔루션을 제공하기 위해 파트너십을 맺었습니다. 이 게시물에서는 전 세계적으로 분산된 데이터 작업의 과제를 해결하는 데 도움이 되는 FSx for ONTAP의 데이터 캐싱 기능을 살펴봅니다.

자세한 내용을 읽어 보거나 다음 링크를 사용하여 관심 있는 섹션으로 바로 이동하십시오.

분산 데이터의 복잡한 과제

분산된 데이터는 조직이 극복해야 할 몇 가지 과제를 제시합니다.

  • 데이터 통합. 데이터가 여러 위치에 분산되어 있는 경우 다양한 소스의 데이터를 통합해야 합니다. 데이터를 단일 파일 시스템으로 일관되게 볼 수 없다면 데이터를 효율적으로 읽고 쓸 수 없고, 데이터를 분석하여 의미 있는 비즈니스 가치를 도출할 수도 없습니다.
  • 다중 네임스페이스. 다양한 소스의 데이터 간에 일관된 네임스페이스가 부족하면 복잡성이 한층 더 커집니다. 데이터에 일관되게 접근하고 사용하려면 다양한 명명 규칙과 구조를 통합해야 하지만, 이 과정에는 많은 노력이 필요할 수 있습니다.
  • 성능 저하. 모든 사용자에게 데이터를 제공하는 것은 성능 저하 없이는 어려울 수 있습니다. 사용자가 데이터 세트에서 멀어질수록 지연 시간이 길어집니다.

    저지연 액세스, 최적화된 대역폭, 비용 간의 적절한 균형을 찾는 것이 필요합니다. 다양한 환경과 지역에 걸쳐 데이터 사일로를 만드는 것은 해결책이 아닙니다. 로컬 사용자가 데이터에 더 빨리 액세스할 수는 있지만, 동기화 문제가 발생합니다.
  • 데이터 복제. 여러 환경에 복제된 데이터는 일관성이 있어야 하며 최신 상태여야 합니다. 가장 큰 위험은 복제 중에 불일치가 발생할 수 있다는 점인데, 이로 인해 데이터 무결성이 부족해질 수 있습니다.
  • 비용 증가. 에지와 클라우드 시스템의 분산된 특성으로 인해 비용과 관련된 몇 가지 과제가 발생합니다. 데이터의 전체 사본이 여러 위치에 저장될 수 있으며, 이에 대한 비용을 지불해야 할 수도 있습니다. 데이터 전송 및 중앙 관리와 관련된 비용을 관리하는 것에 대해 생각해야 합니다.

분산된 데이터로 작업하는 데 따르는 복잡성을 파악하는 것은 매우 어려울 수 있습니다. 바로 FSx for ONTAP이 도움을 드릴 수 있는 부분입니다.

FSx for ONTAP을 활용한 데이터 캐싱

FSx for ONTAP은 AWS의 완전 관리형 스토리지 서비스로, 신뢰할 수 있는 NetApp® ONTAP® 데이터 관리 솔루션을 제공합니다.

FSx for ONTAP은 데이터 캐싱 기능을 갖추고 있어 여러 환경에서 데이터에 더 빠르게 액세스하고 원활한 실시간 협업을 지원합니다. FSx for ONTAP은 두 가지 주요 방식으로 이를 수행합니다. 하나는 엣지에서 데이터를 통합하는 것이고, 다른 하나는 쓰기 가능한 데이터 사본을 로컬에 캐싱하는 것입니다.

에지에서의 데이터 통합

FSx for ONTAP은 NetApp Global File Cache(GFC) 기술을 사용하여 비정형 데이터를 통합하여 고성능 환경, 운영 효율성 및 대규모 협업을 지원합니다. FSx for ONTAP은 각 위치에 필요한 데이터만 캐시하고 SMB(Server Message Block)/CIFS(Common Internet File System) 프로토콜을 사용합니다. 사용자에게 투명하게 공개되어 GFC를 통한 협업은 마치 로컬 파일을 사용하는 것처럼 느껴집니다.

GFC는 에지 위치에 분산 데이터 캐시를 갖춘 중앙 집중식 스토리지 솔루션을 제공함으로써 온프레미스 ONTAP 및 FSx for ONTAP 시스템으로 구성된 하이브리드 클라우드 아키텍처를 지원할 수 있습니다. 전 세계 사용자가 페타바이트급 확장성을 갖춘 이 단일 데이터 세트에 액세스할 수 있습니다.

자주 사용되는 데이터는 캐시되므로 협업 앱의 성능이 향상됩니다. 지능형 파일 잠금 기능은 글로벌 네임스페이스를 사용하여 여러 위치에서 데이터에 액세스하더라도 데이터 무결성을 유지합니다.

Picture1 2024년 3월 12일 오후 12시 01분 20초 2948NetApp Global File Cache 고급 아키텍처

원격 위치에 완벽하게 쓰기 가능한 캐시 데이터

FSx for ONTAP을 사용하면 원격 위치에 최신의 가장 일관되고 일관된 데이터 사본을 포함하는 쓰기 가능한 영구 캐시를 생성할 수 있습니다. 이렇게 데이터가 희박하게 저장된 쓰기 가능 캐시 볼륨을 사용하여 동일한 시스템이나 다른 시스템에 캐시를 생성하여 더 빠른 데이터 액세스를 제공할 수 있습니다. NetApp FlexCache® 기술이 이를 가능하게 합니다.

FlexCache1FSx for ONTAP의 FlexCache

캐시된 데이터는 네트워크 파일 시스템(NFS) 및 SMB/CIFS를 통해 액세스할 수 있으므로, 시스템을 재구성하지 않고도 캐시 데이터를 사용할 수 있습니다. 이 데이터는 여러 호스트가 데이터를 공유하고 두 번 이상 액세스하는 읽기 집약적인 환경에서 유용합니다.

캐시된 데이터 복사본의 크기를 최적화하기 위해 클라이언트가 읽은 데이터만 캐시됩니다. 클라이언트는 모든 볼륨을 마운트하여 여러 위치에서 미리 채워진 최신 데이터에 액세스할 수 있습니다. 캐시된 볼륨은 호스트와 데이터 소스 사이의 임시 저장 공간 역할을 하며, 자주 액세스하는 데이터 청크를 저장하여 소스에서 가져오는 것보다 더 빠르게 처리할 수 있도록 합니다.

FlexCache2캐시 사본은 복사본의 크기를 최적화하기 위해 소스 데이터의 관련 데이터 블록을 가리킵니다.

FSx for ONTAP을 활용한 데이터 캐싱 사용 사례

FSx for ONTAP 사용한 데이터 캐싱은 다양한 시나리오에 도움이 될 수 있습니다.

  • 원격 사무실 또는 지점 사무실(ROBO) 위치
  • 고성능 컴퓨팅(HPC) 워크로드
  • 인공지능/머신러닝(AI/ML) 및 딥러닝(DL) 사용 사례
  • 클라우드 버스팅

FSx for ONTAP 및 데이터 캐싱 이점

FSx for ONTAP을 사용하면 모든 데이터 캐싱 요구 사항에서 오버헤드가 낮은 솔루션을 얻을 수 있습니다.

  • 원격 데이터에 대한 빠른 액세스. 데이터 캐싱을 통해 추가적인 아키텍처 요구 사항을 최소화하거나 전혀 없이 원격 데이터를 사용자에게 더 가까운 위치에서 사용할 수 있습니다.
  • 고성능. FSx for ONTAP을 통한 데이터 캐싱은 데이터 무결성이나 품질을 손상시키지 않으면서 전 세계 어디에서든 데이터에 액세스할 때 발생하는 지연 시간 문제를 해결합니다.
  • 파일 잠금. FSx for ONTAP 파일 잠금 메커니즘은 데이터 무결성 문제를 일으킬 수 있는 병렬 쓰기 작업을 방지합니다.
  • 제로터치 설정. 캐시된 데이터 세트와 원본 데이터 세트 모두 FSx for ONTAP을 통해 아무런 노력 없이 다양한 환경의 데이터세트를 일관성 있게 유지합니다.
  • 데이터 보호 및 복원력. FSx for ONTAP은 기본적으로 높은 가용성과 복원력을 제공하며, 단일 또는 여러 가용 영역을 사용하여 가동 시간을 유지합니다. 자동화된 지역 간 백업 및 재해 복구 기능을 통해 손상이나 지역 재해가 발생하더라도 데이터를 사용할 수 있습니다.
  • 단일 네임스페이스. FSx for ONTAP은 데이터가 여러 위치에 저장될 때 발생하는 네임스페이스 문제를 해결합니다. 인프라 통합 없이 단일 네임스페이스를 통해 데이터를 통합하고 액세스할 수 있습니다.
  • 스토리지 비용 절감. FSx for ONTAP을 통한 데이터 캐싱은 전체 복사본이 아닌 활성 데이터만 캐싱하므로 공간을 절약합니다. 또한, 내장된 FSx for ONTAP 스토리지 효율성 기능은 지능형 파일 캐싱과 연동됩니다. 이를 통해 스토리지 비용과 전송 비용이 모두 절감됩니다.

FSx for ONTAP을 활용하여 AWS에서 협업하는 제조업체 

FSx for ONTAP의 데이터 캐싱 기능을 사용하는 한 회사는 인쇄 회로 기판(PCB) 장비 생산에 주력하는 유럽 제조업체입니다. 이 회사는 전 세계 40개국 이상에 지사를 두고 있습니다.

하지만 클라우드에 저장된 데이터가 유럽 연합, 미국, 아시아 태평양 지역에 분산되어 있어 지연 시간과 생산성 문제가 발생했습니다. 원격 근무지(ROBO)에 분산된 팀들은 동일한 데이터에 대해 효과적으로 협업할 수 없었습니다.

FSx for ONTAP과 글로벌 파일 캐시는 원격 근무지 전반의 지연 시간 문제를 해결하고 여러 가지 이점을 제공했습니다..

  • 파일에 대한 글로벌 액세스. 분산 파일 시스템 네임스페이스(DFS-N)와의 통합은 네임스페이스와 액세스 제어 목록(ACL)을 보존합니다. 즉, 직원들은 글로벌 센터의 모든 FSx for ONTAP 파일 시스템에 저장된 파일을 마치 로컬에 저장된 것처럼 액세스할 수 있습니다.
  • 파일 잠금. 이 기능을 통해 회사 팀은 변경 사항 충돌 없이 공유 프로젝트 파일에서 협업할 수 있으며, 전 세계에 위치한 팀의 생산성을 향상합니다.
  • 완전 관리형 서비스의 편의성. 기본 리소스, 소프트웨어 업데이트 및 유지 관리는 모두 AWS에서 처리되므로 운영 부담이 줄어듭니다. 마찬가지로 GFC는 특별한 최종 사용자 교육이 필요 없는 간단한 추가 기능입니다.
  • 여러 요인으로 인한 비용 절감:
    • FSx for ONTAP은 스토리지 효율성과 콜드 데이터 계층화를 적용하여 공유 파일 저장의 전반적인 비용을 절감합니다.
    • 각 GFC 인스턴스는 해당 에지 사이트에서 자주 액세스되는 파일만 캐시하며, 파일이 변경될 때마다 변경된 블록만 전송됩니다. 이 접근 방식은 데이터 트래픽과 송신 전송 비용을 최소화합니다.
    • FSx for ONTAP 파일 공유는 비용 효율적인 NetApp Snapshot™ 기술을 사용하여 보호됩니다. 엣지 사이트에 추가적인 데이터 보호 솔루션을 구축할 필요가 없습니다.

FSx for ONTAP을 통해 데이터와 팀을 하나로 통합

팀은 지연이나 비용 증가 및 데이터 무결성 저해를 유발하는 데이터 사일로 생성 없이 전체 데이터 자산에서 협업할 수 있는 방법이 필요합니다. FSx for ONTAP을 사용하면 다양한 데이터 자산을 손쉽게 관리할 수 있습니다.

FSx for ONTAP은 NetApp FlexCache 및 GFC 기술을 기반으로 하는 데이터 캐싱 기능을 사용하여 퍼스트 파티 AWS 서비스의 일부로 데이터 캐싱을 원활하게 제공합니다.

안정적인 분산 데이터 아키텍처를 구축하고, 사용자 간의 동기화를 유지하며, 비용 급증을 억제하십시오.

자세한 내용은 Amazon FSx for NetApp ONTAP을 활용한 데이터 캐싱을 참조하십시오.

Drift chat loading