Crie seu data Lake no StorageGRID

Conteúdo

Compartilhar esta página

Joseph Kandatilparambil

2022-08-23

820 visualizações

Em muitas das principais empresas de hoje, o data Lake está se tornando um grande tópico de conversa. Em setores como finanças, manufatura e saúde, a Internet das coisas (IoT) permite que os dados sejam coletados e agregados de mais fontes do que nunca. Para essas empresas, os principais objetivos da coleta de dados são acelerar a inovação, melhorar a eficiência operacional, melhorar a sustentabilidade, reduzir riscos e, em última análise, melhorar a qualidade de vida. Para alcançar essas metas, as empresas estão procurando maneiras de ajudar os cientistas de dados a obter o máximo de valor dos dados em um ritmo mais rápido e se manter à frente em seu setor.

E a velocidade e os requisitos para análise de dados, aprendizado de máquina e inteligência artificial vêm aumentando. De acordo com a Forbes, 90% dos dados mundiais foram gerados nos últimos 2 anos. Está claro que as necessidades de dados empresariais continuarão a crescer rapidamente. A NetApp está altamente motivada para ajudar nossos clientes a criar pipelines de dados resilientes e ricos em recursos. Com a flexibilidade de se adaptar aos requisitos em constante evolução e escalar com facilidade no futuro.

A manutenção de um data Lake envolve muitas tarefas manuais complexas. Mas, em um data Lake moderno, essas tarefas podem ser simplificadas e automatizadas para tornar os fluxos de trabalho mais eficientes e eficazes. Essas tarefas incluem coleta, ingestão, limpeza, movimentação e catalogação de conjuntos de dados, além de disponibilizar esses conjuntos de dados com segurança para aplicações de análise e aprendizado de máquina. Hoje, muitos de nossos clientes estão buscando o armazenamento de objetos Simple Storage Service (S3) para seus data Lakes, porque o armazenamento de objetos tem vantagens incomparáveis em relação a outras opções, como nas e HDFS. As plataformas de storage de objetos evoluíram ao longo dos últimos anos para fornecer o desempenho, a durabilidade e a escala necessários para aplicações de análise e aprendizado de máquina . Um data Lake moderno que usa storage de objetos quebrará silos, permitindo que os cientistas de dados maximizem o valor com a consolidação de diferentes tipos de dados estruturados, semiestruturados e não estruturados em uma fonte acessível.

Imagem do ciclo de vida dos dados de análise e aprendizado de máquina com o StorageGRID

Ciclo de vida dos dados de análises e aprendizado de máquina com o StorageGRID

A solução de storage baseada em objetos StorageGRID da NetApp, de nível empresarial, líder do setor , está bem posicionada para dar suporte aos workloads atuais de análise e aprendizado de máquina. O mecanismo de gerenciamento do ciclo de vida das informações incorporado diferencia o StorageGRID de outras plataformas de storage de objetos no local. E como as soluções da StorageGRID podem utilizar os serviços de computação, seja em uma nuvem pública ou privada, os cientistas de dados têm a flexibilidade de criar pipelines de dados com uso econômico e de recursos. Além disso, ao separar a computação e o storage, o StorageGRID ajuda a reduzir o TCO geral das aplicações de análise e aprendizado de máquina, já que agora as equipes DE TI podem escalar a computação e o storage de forma independente.

Principais benefícios da criação de seu data Lake no StorageGRID

Ao criar seu data Lake no StorageGRID, você terá os seguintes benefícios:

Unificar o namespace de dados minimiza a movimentação de dados e fornece acesso fácil aos recursos de computação.
Você pode categorizar e rotular seus conjuntos de dados usando recursos nativos do S3, facilitando o controle de dados confidenciais e a correspondência dos recursos certos para suas tarefas.
Você tem a flexibilidade de utilizar qualquer serviço de computação onde quer que esteja, na nuvem pública ou na nuvem privada da sua empresa.
A integração aprimorada com o NetApp Cloud Data Sense e aplicações de terceiros agrega valor e organização aos conjuntos de dados, ajudando os cientistas de dados a melhorar a tomada de decisões e reduzir os riscos e custos operacionais.
Ao separar os dados em categorias no StorageGRID de acordo com a atividade dos conjuntos de dados, você se dedica apenas à quantidade necessária de recursos para otimizar os custos.
As soluções da StorageGRID para governança e proteção de dados permitem Planejar a conformidade de dados como parte da estratégia de implementação de data Lake.
Ao usar os recursos de criptografia e as integrações de gerenciamento de acesso no StorageGRID, você pode proteger os dados do data Lake contra acesso não autorizado.

Saiba mais

Para saber mais sobre como o NetApp pode ajudar sua equipe a modernizar sua arquitetura de dados, confira nosso infográfico sobre como chegar onde você precisa estar nesse mercado competitivo.

Joseph Kandatilparambil

Joseph Kandatilparambil é engenheiro técnico de marketing da StorageGRID, com mais de 7 anos de experiência no setor de armazenamento. Joseph ajuda na inovação orientada para o cliente, capacitando os clientes com soluções que os ajudam a se concentrar em impulsionar seus produtos e expandir seus horizontes. Fora do trabalho, Joseph gosta de kite-surf, escalada e caminhadas.

Ver todas as publicações de Joseph Kandatilparambil

Próximas etapas

Blogs

Informe-se sobre as últimas tendências e avanços em nuvem, on premises e em tudo relacionado. É aqui que tudo fica real, com uma cereja no topo.

Comece a ler

Comunidade

Explore uma ampla variedade de fóruns abertos onde você pode postar perguntas, compartilhar respostas e, em geral, saber mais sobre todas as tecnologias da NetApp que mais importam para você.

Participe da discussão