Menu

Colabore melhor em qualquer lugar: cache de dados com Amazon FSx for NetApp ONTAP

Conteúdo

Compartilhe esta página

Yifat Perry
Yifat Perry

Os atuais conjuntos de dados em constante expansão e as equipes distribuídas trabalhando remotamente mudaram as demandas colocadas sobre os dados. Recuperar dados rapidamente e colaborar efetivamente em conjuntos de dados compartilhados em diversos ambientes é essencial, não importa onde os dados estejam hospedados.

Esse tipo de distribuição de dados pode ser um pesadelo para orquestrar, com problemas de integridade de dados, incompatibilidade e desempenho, todos causando dificuldades. As organizações precisam de maneiras de acelerar o acesso aos dados e promover a agilidade e a colaboração dos dados sem esses desafios.

A NetApp e a AWS fizeram uma parceria para oferecer a solução: cache de dados com Amazon FSx for NetApp ONTAP. Esta postagem explora os recursos de cache de dados do FSx para ONTAP que ajudam a enfrentar os desafios de trabalhar com dados dispersos globalmente.

Continue lendo para saber todos os detalhes ou use estes links para ir direto para a seção que lhe interessa:

O complexo desafio dos dados distribuídos

Dados distribuídos apresentam vários desafios que as organizações precisam superar:

  • Consolidação de dados. Quando os dados estão espalhados por vários locais, é necessário consolidá-los de várias fontes. Se você não puder visualizar os dados de forma coerente como um único sistema de arquivos, não poderá ler e gravar os dados de forma eficiente, nem analisá-los para obter deles qualquer valor comercial significativo.
  • Vários namespaces. A falta de namespaces coerentes entre dados de diferentes fontes acrescenta uma camada extra de complexidade. Para acessar e usar dados de forma consistente, você precisa unificar as diferentes convenções e estruturas de nomenclatura, mas esse processo pode exigir um esforço intenso.
  • Degradação de desempenho. Disponibilizar dados para todos os seus usuários pode ser difícil sem que o desempenho diminua em algum ponto do caminho. Quanto mais distantes os usuários estiverem do conjunto de dados, maior será a latência que eles experimentarão.

    Você precisa de um equilíbrio perfeito entre acesso de baixa latência, largura de banda otimizada e custo. Criar silos de dados em diferentes ambientes e geografias não é uma solução. Embora dê aos usuários locais acesso mais rápido aos dados, isso causa problemas de sincronização.
  • Replicação de dados. Dados replicados em vários ambientes precisam ser consistentes e atualizados. O maior risco é que discrepâncias podem surgir durante a replicação, o que abre caminho para a falta de integridade dos dados.
  • Aumento de custos. A natureza distribuída dos sistemas de ponta e nuvem apresenta alguns desafios relacionados a custos. Você pode acabar com diferentes cópias completas de dados em locais diferentes, pelas quais terá que pagar. Você precisa pensar em gerenciar os custos associados à transferência de dados e ao gerenciamento centralizado.

Navegar pelas complexidades do trabalho com dados distribuídos pode ser extremamente desafiador. É aí que o FSx for ONTAP pode ajudar.

Cache de dados com FSx for ONTAP

O FSx for ONTAP é o serviço de storage totalmente gerenciado da AWS que fornece soluções de gerenciamento de dados confiáveis com NetApp® ONTAP®.

O FSx for ONTAP é equipado com recursos de cache de dados que permitem acesso mais rápido aos dados e colaboração contínua em tempo real em vários ambientes. Há duas maneiras principais pelas quais o FSx for ONTAP faz isso: consolidando dados na borda e armazenando em cache cópias graváveis de dados localmente.

Consolidando dados na borda

O FSx for ONTAP ajuda as organizações a consolidar dados não estruturados para uma experiência de alto desempenho, eficiência operacional e colaboração em escala usando a tecnologia NetApp Global File Cache (GFC). O FSx para ONTAP armazena em cache apenas os dados necessários nos respectivos locais e usa o protocolo SMB (Server Message Block) / Common Internet File System (CIFS). É transparente para o usuário, a colaboração através do GFC parece trabalhar com arquivos locais.

O GFC pode dar suporte a arquiteturas de nuvem híbrida compostas por ONTAP local e FSx para sistemas ONTAP, fornecendo uma solução de storage centralizada com um cache de dados distribuído em locais de ponta. Seus usuários em todo o mundo podem acessar esse único conjunto de dados, com escalabilidade de petabytes.

Como os dados usados com frequência são armazenados em cache, você obtém melhor desempenho para aplicativos colaborativos. O recurso de bloqueio inteligente de arquivos mantém a integridade dos dados mesmo se eles forem acessados de vários locais usando um namespace global.

Imagem 1 12 de março de 2024 12 01 20 2948 PMArquitetura de alto nível do NetApp Global File Cache

Dados em cache totalmente graváveis em locais remotos

O FSx para ONTAP permite que você crie um cache gravável e persistente em um local remoto com a cópia mais recente, consistente e coerente dos seus dados. Esses volumes em cache graváveis e pouco povoados podem ser usados para criar um cache no mesmo sistema ou em um diferente para acesso mais rápido aos dados. A tecnologia NetApp FlexCache® torna isso possível.

FlexCache1FlexCache no FSx for ONTAP.

Os dados armazenados em cache podem ser acessados pelo sistema de arquivos de rede (NFS) e SMB/CIFS, o que significa que você pode usar os dados em cache sem precisar reestruturar seus sistemas de forma alguma. Esses dados são benéficos em ambientes de leitura intensiva, onde os dados são compartilhados por vários hosts e acessados mais de uma vez.

Para otimizar o tamanho da cópia de dados em cache, somente os dados lidos pelo cliente são armazenados em cache. Os clientes podem montar qualquer um dos volumes para acessar os mesmos dados pré-preenchidos e atualizados de vários locais. O volume em cache atua como um local de storage temporário entre um host e a fonte de dados, armazenando os blocos de dados acessados com frequência para que eles possam ser atendidos mais rapidamente do que a busca na fonte.

FlexCache2Cópias de cache apontam para blocos de dados relevantes nos dados de origem para otimizar o tamanho da cópia.

Casos de uso para cache de dados com FSx for ONTAP

O cache de dados com FSx para ONTAP pode ajudar em uma ampla variedade de cenários:

  • Locais de escritórios remotos ou filiais (ROBO)
  • Workloads de computação de alto desempenho (HPC)
  • Casos de uso de inteligência artificial/aprendizado de máquina (IA/ML) e aprendizado profundo (DL)
  • Cloud bursting

Benefícios do uso do FSx para ONTAP e cache de dados

Com o FSx para ONTAP, você tem uma solução de baixa sobrecarga para todos os seus requisitos de cache de dados:

  • Acesso rápido a dados remotos. O cache de dados torna os dados remotos disponíveis mais próximos dos usuários, com requisitos arquitetônicos adicionais mínimos ou inexistentes.
  • Alto desempenho. O cache de dados com FSx for ONTAP elimina os desafios de latência associados ao acesso a dados de todo o mundo, sem comprometer a integridade ou a qualidade dos dados.
  • Bloqueio de arquivo. O mecanismo de bloqueio de arquivo do FSx for ONTAP impede operações de gravação paralelas que podem causar problemas de integridade de dados.
  • Configuração sem toque. Os conjuntos de dados em todos os diferentes ambientes, tanto em cache quanto na origem, são mantidos consistentes pelo FSx for ONTAP sem nenhum esforço.
  • Proteção de dados e resiliência. O FSx for ONTAP é altamente disponível e resiliente por padrão, usando uma ou várias zonas de disponibilidade para manter o tempo de atividade. Com seus recursos automatizados de backup inter-regional e recuperação de desastres, os dados estarão disponíveis mesmo se ocorrerem corrupção ou desastres regionais.
  • Espaço de nome único. O FSx for ONTAP resolve o problema de namespace que ocorre quando os dados são armazenados em vários locais. Os dados podem ser consolidados e acessados por meio de um único namespace sem a necessidade de qualquer consolidação de infraestrutura.
  • Custos de storage reduzidos. O cache de dados com o FSx for ONTAP economiza espaço porque ele armazena em cache apenas dados ativos, não cópias completas. Além disso, os recursos de eficiência de storage integrados do FSx for ONTAP funcionam com cache de arquivos inteligente. Isso reduz os custos de storage e transferência.

Como um fabricante colabora na AWS com a FSx for ONTAP 

Uma empresa que usa os recursos de cache de dados do FSx for ONTAP é um fabricante europeu que se concentra na produção de equipamentos de placas de circuito impresso (PCB). Suas operações mundiais estão localizadas em mais de 40 países.

Mas com os dados na nuvem dispersos pela União Europeia, Estados Unidos e Ásia-Pacífico, a empresa estava enfrentando problemas de latência e produtividade. Equipes espalhadas pelos locais do ROBO não conseguiam colaborar efetivamente nos mesmos dados.

O FSx for ONTAP com Global File Cache resolveu os problemas de latência nos locais ROBO e forneceu diversas outras vantagens:

  • Acesso global aos arquivos. A integração com Namespaces do Sistema de Arquivos Distribuídos (DFS-N) preserva namespaces e listas de controle de acesso (ACLs). Isso significa que os funcionários podem acessar arquivos armazenados em qualquer um dos sistemas de arquivos FSx for ONTAP nos centros globais como se estivessem armazenados localmente.
  • Bloqueio de arquivo. Esse recurso permite que as equipes da empresa colaborem em arquivos de projetos compartilhados sem fazer alterações conflitantes, além de melhorar a produtividade entre equipes localizadas ao redor do mundo.
  • A facilidade de um serviço totalmente gerenciado. Os recursos subjacentes, atualizações de software e manutenção são todos gerenciados pela AWS, tirando a carga operacional das suas mãos. Da mesma forma, o GFC é um complemento simples que não requer nenhum treinamento especial do usuário final.
  • Economia de custos devido a vários fatores:
    • O FSx for ONTAP aplica eficiências de storage e camadas de dados frios que reduzem os custos gerais de storage de arquivos compartilhados.
    • Cada instância do GFC armazena em cache apenas os arquivos acessados com frequência naquele site de borda e, sempre que um arquivo é alterado, apenas os blocos alterados são transferidos. Essa abordagem resulta em custos mínimos de tráfego de dados e transferência de saída.
    • Os compartilhamentos de arquivos do FSx for ONTAP são protegidos usando a econômica tecnologia NetApp Snapshot. Você não precisa implementar soluções adicionais de proteção de dados nos sites de ponta.

Reúna seus dados e equipes com o FSx for ONTAP

Suas equipes precisam de uma maneira de colaborar em todo o seu acervo de dados sem sofrer atrasos ou criar silos de dados que aumentam os custos e prejudicam a integridade dos dados. Para um conjunto de dados diversificado, é fácil fazer isso com o FSx for ONTAP.

O FSx for ONTAP usa recursos de cache de dados fornecidos pelas tecnologias NetApp FlexCache e GFC para fornecer cache de dados como parte integrante de um serviço AWS primário.

Crie arquiteturas de dados distribuídas confiáveis, mantenha seus usuários sincronizados e evite que os custos saiam do controle.

Para mais informações, visite Armazenamento de dados em cache usando o Amazon FSx for NetApp ONTAP.

Drift chat loading