Menu

A tradução automática foi usada para esta página. Algum conteúdo pode não ser perfeito. Diga-nos como podemos melhorar.

Compartilhar Feedback

NetApp Jornada de automação do IT ONTAP

Aumentando a eficiência e a resiliência

Tenha uma visão geral detalhada da jornada simplificada de automação de storage da NetApp IT e como a NetApp aproveitou com sucesso a automação para aprimorar nossas operações.

Uma pessoa operando uma guia
Conteúdo

Compartilhe esta página

NetApp arch logo
David Tanigawa 

Apresentação INSIGHT 2024

No cenário acelerado de TI atual, a automação se tornou um fator essencial para aumentar a eficiência, reduzir a complexidade operacional e melhorar a resiliência. Na NetApp, nossa jornada em direção à automação de storage tem sido um processo de várias fases, com cada etapa aprimorando significativamente nossa infraestrutura e atendendo às necessidades de negócios em evolução. Estou animado para compartilhar os principais aspectos da jornada simplificada de automação de storage da NetApp TI e como aproveitamos com sucesso a automação para aprimorar nossas operações.

O caminho para a maturidade da automação

No início de nossa jornada de automação, entendemos que a automação não é uma abordagem única para todos. Cada etapa requer estratégias personalizadas que se alinham às necessidades exclusivas do negócio e a ambientes dinâmicos. Como em qualquer processo de automação, nossa abordagem evoluiu, tornando-se mais estratégica à medida que aprendemos e nos adaptamos.

Nos estágios iniciais, nossos esforços de automação se concentraram principalmente no gerenciamento de configurações e na aplicação de padrões. À medida que amadurecemos, expandimos nosso escopo para automatizar processos manuais, abordar pontos problemáticos e desenvolver playbooks para tarefas críticas como novas configurações e upgrades de sistema.

Pontos problemáticos e oportunidades para automação

A automação oferece inúmeros benefícios—economia de tempo, redução do risco de erro humano e gerenciamento de configuração mais consistente, para citar alguns. Na NetApp IT, experimentamos esses benefícios em primeira mão. No entanto, a automação também traz seus próprios desafios. Um dos principais pontos problemáticos que encontramos é garantir a integração perfeita de ferramentas de automação nos fluxos de trabalho existentes e lidar com casos extremos que não se encaixam perfeitamente nos processos automatizados.

Apesar desses desafios, identificamos oportunidades de automação que acreditamos que ajudarão a melhorar a eficiência de processos manuais demorados e o uso ineficiente de recursos de storage, como:

  • Evacuações de nós no fim do suporte: automatizando a migração de volumes NAS e LIFs de gerenciamento de SVM e garantindo que os relacionamentos de peer de cluster sejam atualizados durante os processos de descomissionamento.
  • Limpezas de volumes órfãos: identificando e desativando volumes que não estão mais em uso ou não têm IOPS, reduzindo o desperdício de storage.
  • Verificações de pré-atualização: estamos expandindo as verificações de pré-atualização para garantir que os hosts SAN sejam configurados com multipath, que as versões do switch de cluster sejam compatíveis e que o firmware esteja atualizado. Essas verificações nos ajudam a evitar possíveis interrupções durante as atualizações do sistema.

Histórias de sucesso de automação

Exemplos do mundo real ilustram melhor o sucesso da automação. Uma história de sucesso notável para NetApp TI envolve o aumento automático dos limites de inode em resposta a alertas de utilização. Esse playbook nos permite aumentar os limites de inode em 10%, até um máximo de 1,8 bilhão de arquivos, sem intervenção manual. Outro sucesso é a automação de novas configurações do sistema—o que antes levava horas para ser concluído manualmente agora pode ser feito em minutos.

Também desenvolvemos manuais que impõem consistência em todo o nosso ambiente, garantindo que configurações como políticas de Snapshot, SnapMirror políticas e configurações de eficiência de storage sejam configuradas corretamente de acordo com nossos padrões. Essa automação nos ajuda a manter a conformidade e a segurança, reduzindo os riscos de desvio de configuração.

O poder dos playbooks: uma olhada na automação de configuração de nós

Uma das áreas mais impactantes da nossa jornada de automação tem sido o desenvolvimento de playbooks do Ansible para configurar novos nós do ONTAP. Antes da automação, configurar um novo cluster podia ser um processo demorado e propenso a erros. Graças à automação, podemos configurar clusters com velocidade, precisão e consistência.

Nossos playbooks lidam com tudo, desde renomear nós e configurar VLANs até criar domínios de broadcast personalizados e habilitar recursos como auditoria de segurança e encaminhamento de eventos. Também automatizamos a limpeza de domínios de broadcast padrão, garantindo que nosso ambiente sempre esteja alinhado com nossas configurações de rede padrão.

Em um exemplo, nosso manual para configurar um novo cluster executa uma ampla variedade de tarefas:

  1. Renomeando nós e agregados para corresponder às nossas convenções de nomenclatura padrão.
  2. Configurar processadores de serviço (BMCs) e configurar portas de rede com controle de fluxo padrão, velocidade e configurações de MTU.
  3. Criação de VLANs e domínios de broadcast para garantir a segmentação de rede configurada corretamente.
  4. Mover LIFs para as portas apropriadas e aplicar corretamente as configurações de DNS, SNMP e segurança.

O resultado é um cluster ONTAP totalmente configurado e pronto para uso que atende aos nossos padrões exigentes. O que costumava levar horas para configurar agora leva apenas minutos, reduzindo o risco de erro humano e garantindo a consistência em todo o nosso ambiente.

O que vem a seguir?

À medida que continuamos a amadurecer nossos esforços de automação, buscamos expandir em várias áreas-chave:

  • Gerenciamento de capacidade e ciclo de vida: Reduzindo as etapas manuais para analisar tendências de crescimento e gerenciar hardware de fim de suporte para melhorar o planejamento e o orçamento.
  • Redundância de rede: garantir configurações adequadas de redundância de rede para evitar interrupções durante a manutenção ou upgrades de rede.
  • Verificações aprimoradas de pré-atualização: estamos automatizando ainda mais nossos processos de pré-atualização para incluir uma análise mais profunda de possíveis problemas de configuração que poderiam causar tempo de inatividade.

Nossa jornada com a automação de storage na NetApp IT destacou o imenso potencial para melhorar a eficiência, a resiliência e a consistência em todo o nosso ambiente de storage unificado. Ao automatizar processos manuais, aplicar padrões e refinar continuamente nossos playbooks, dimensionamos nossas operações e reduzimos o risco de erros.

Ao olharmos para o futuro, a automação continuará sendo um foco central de nossa estratégia. Ela nos ajudará a atender às demandas em evolução de nossa infraestrutura e garantir que continuemos a oferecer serviço de alta qualidade aos nossos stakeholders internos e externos.

Para mais insights sobre a jornada de automação de TI da NetApp, fique atento para mais sessões e atualizações da NetApp em NetApp e visite nosso site para recursos adicionais.

NetApp em NetApp

David Tanigawa 

David Tanigawa começou na NetApp há 16 anos como Engenheiro de Suporte Técnico antes de ingressar na equipe de Operações de Storage da NetApp IT para ajudar a dar suporte à nossa própria infraestrutura de storage corporativa. Agora, como membro do grupo de Engenharia de Storage da NetApp IT, David ajuda a arquitetar e projetar soluções que melhor atendam aos requisitos de storage de dados da NetApp IT.

Ver todas as publicações de David Tanigawa 
Drift chat loading