Desbloqueando o poder do rastreamento de Blocos Alterados no Kubernetes

2024년 10월 9일 Luciano Bertene

Quando as equipes de TI, virtualização, backup, armazenamento e operações exploram Kubernetes, eles comparam recursos de proteção de dados e armazenamento com instalações tradicionais de bare metal e máquina virtual (VM).

Como a arquitetura nativa da nuvem é inerentemente distribuída, orientada por API e fracamente acoplada, as operações nativas da nuvem exigem novas ferramentas e habilidades para atingir os mesmos resultados comerciais de recuperação de desastres (DR). Embora muitos benefícios do armazenamento nativo da nuvem sejam impressionantes, uma área crítica ainda está faltando: rastreamento de bloco alterado (CBT).

Poder do Rastreamento de Blocos Alterados

No caso mais simples, o CBT melhora a eficiência do backup com backup incremental — encontrando e transmitindo apenas a diferença entre o que está atualmente armazenado e a imagem de backup mais recente. O CBT pode descobrir que houve pouca ou nenhuma alteração desde o último backup e fazer um novo backup quase instantâneo com consumo mínimo de tempo, CPU, memória ou armazenamento. Tornar as janelas de backup curtas e leves também ajuda as organizações a executar backups em uma frequência maior, o que reduz os objetivos do ponto de recuperação (RPOs) ou a quantidade de perda de dados incorrida.

CBT é um recurso de sistemas de armazenamento. A maioria desses sistemas oferece a capacidade de fazer snapshots de volumes, o que cria uma visualização somente leitura do seu volume no momento em que o snapshot é tirado.

Com o CBT habilitado, o sistema de armazenamento rastreará cada bloco gravado e pode fornecer uma lista de blocos que foram alterados entre os dois snapshots. Se um bloco for gravado várias vezes entre snapshots, ele só precisa ser copiado uma vez, pois o estado no momento do backup do snapshot é o único que precisa ser mantido. Isso torna o backup de volume muito eficiente, principalmente porque blocos que nunca foram gravados não precisam ser copiados.

A Ausência de CBT no Armazenamento Nativo da Nuvem

Como quase todos os provedores de armazenamento oferecem CBT, é surpreendente que o armazenamento nativo em nuvem com Kubernetes não tenha essa capacidade. Por quê? Uma resposta mais longa segue, mas a resposta curta é que, após dois anos de trabalho, o CBT do Kubernetes está quase aqui! Fornecedores e projetos de armazenamento e backup podem prototipar, dar feedback e melhorar o CBT em uma solução para todo o setor à medida que ele entra na fase alfa do Kubernetes.

Cargas de Trabalho e Armazenamento do Kubernetes com Estado

Dez anos após o lançamento do Kubernetes, cargas de trabalho com estado são comuns. Mas quando o Kubernetes lançou o StatefulSets em 2018, levou tempo para o armazenamento nativo da nuvem acelerar.

A versão 1.0 do Container Storage Interface (CSI) também foi adotada em 2018 com o Kubernetes 1.13 . O CSI fornece uma API uniforme para diferentes provedores de armazenamento e é um consórcio independente que publica especificações para todo o setor. Ele foi adotado por plataformas líderes, como Cloud Foundry , Apache Mesos e HashiCorp Nomad.

Os fornecedores de armazenamento criam drivers CSI, que são instalados em clusters Kubernetes . Todos os drivers de armazenamento "in-tree" proprietários na base de código do Kubernetes foram (ou estão em processo de serem) removidos em favor do CSI.

O Trabalho da Comunidade

O Kubernetes Data Protection Working Group (DPWG) foi formado em 2020 pelo Kubernetes Storage Special Interest Group (SIG-Storage). Também em 2020, a especificação CSI foi publicada VolumeSnapShot, que foi lançada no Kubernetes 1.20.

Anteriormente, o backup e a recuperação do Kubernetes só podiam lidar com sistemas de arquivos via CSI ou recorrer a drivers de armazenamento proprietários. O backup de armazenamento em bloco CSI rapidamente se tornou possível e mais robusto do que o backup do sistema de arquivos.

Em maio de 2022, o DPWG iniciou a Kubernetes Enhancement Proposal (KEP) #3314: Changed Block Tracking . Com orientação e revisão da liderança do SIG, SIGs pares, fornecedores (incluindo Veeam ) e a comunidade Kubernetes, o KEP 3314 passou por três grandes reformulações.

Cada uma progrediu por fases conceituais repetidas para revisão e defesa do design, com cada etapa melhorando o escopo para abordar problemas e lacunas. Este design CBT melhorou depois que os Grupos de Interesse Especial de API e Segurança (SIG API e SIG Security ) ajudaram a incorporar a arquitetura do Kubernetes e as melhores práticas de segurança.

Finalmente, em 2023, o terceiro design foi aprovado pelo DPWG, um protótipo de código foi concluído e uma proposta foi feita para adicionar CBT à especificação CSI.

O Design do CBT Nativo da Nuvem

A especificação CSI 1.11.0 com CBT por meio do SnapshotMetadataserviço foi publicada e atualizou o status do KEP-3314 para "implementável" em junho de 2024. O primeiro alvo foi o Kubernetes 1.31 como APIs alfa com o código protótipo, mas preparar pipelines para testar, adicionar documentação e aprender outras tarefas do Kubernetes e do mantenedor CSI fez com que ele escorregasse para o Kubernetes 1.32.

O público-alvo para a implementação do CSI CBT são os fornecedores de backup e armazenamento nativos em nuvem do Kubernetes. O processo de design do CBT inclui duas novas áreas:

Fornecedores e projetos de armazenamento devem adotar e implantar o contêiner sidecar do serviço de metadados CBT do SIG-Storage CSI e recurso(s) personalizado(s). Então, o driver CSI deve implementar: - Adicione um novo SnapshotMetadataserviço para permitir que o orquestrador de contêineres obtenha metadados de bloco alocados ou alterados para snapshots.
Fornecedores e projetos de backup devem adotar novas APIs do Kubernetes, que consomem CBT via gRPC

O diagrama de segurança a seguir mostra como o software de backup e o armazenamento em cluster podem orquestrar e fornecer acesso CBT a VolumeSnapShot:

Compartilhe Seu Feedback

A jornada para o CSI CBT nativo da nuvem acaba de começar sua fase de implementação. O Kubernetes DPWG e o CSI Consortium querem seu feedback sobre o CSI CBT.

Conforme o CSI CBT entra em sua fase alfa, você pode ajudar com a adoção e melhorias. Por favor, espalhe a palavra e forneça feedback que pode ser incorporado na fase beta.

Para fornecedores e projetos de armazenamento: Adotar o CSI CBT é tão simples quanto expor funcionalidades existentes por meio da nova API de contêiner sidecar do CSI CBT? Isso depende da arquitetura atual do driver CSI e da sua funcionalidade de CBT de armazenamento subjacente. Por favor, deixe-nos saber se este exemplo é útil.

Para fornecedores e projetos de backup: A adoção do CSI CBT não deveria ser tão fácil quanto consumir as novas APIs do Kubernetes com um fornecedor de armazenamento CSI CBT de suporte? Onde estão os provedores e testes simulados, e eles atendem às suas necessidades?

Para a comunidade Kubernetes: entre em contato com seus fornecedores e projetos de backup e armazenamento e peça que adotem o CSI CBT para melhorar sua proteção de dados. Ajude o CSI CBT a ser um sucesso. Participe da reunião quinzenal do DPWG ou entre em contato pelo canal do Slack e pela lista de e-mails ; estamos disponíveis para responder perguntas.

Além disso, registre-se para participar da palestra Kubernetes Data Protection Working Group Deep Dive na quarta-feira, 13 de novembro, na KubeCon + CloudNativeCon North America.

A cada dia, mais pessoas perguntam: "Agora é a hora de migrar para o Kubernetes?" Levar o CSI CBT para o armazenamento nativo da nuvem remove RPOs mais longos, uma desvantagem crítica quando comparado à infraestrutura tradicional. Estamos ansiosos para colaborar com o ecossistema e a comunidade nativos da nuvem para implementar o CSI CBT e impulsionar a proteção de dados nativa da nuvem de classe mundial.

Conteúdo relacionado

OCaml vs. F#: Comparando Linguagens Funcionais e de Tipagem Estática

Na era da computação moderna, onde a eficiência e a confiabilidade são cruciais, as linguagens de programação funcionais e de tipagem estática têm se destacado como opções poderosas. Neste artigo, ...
Alumínio Anodizado: Proteção, Durabilidade e Estética

O alumínio anodizado é um material metálico que passou por um processo eletroquímico chamado anodização, criando uma camada de óxido de alumínio na sua superfície. Essa camada não apenas protege o ...
Curso de Power BI para Engenharia Civil

Power BI na Engenharia Civil: Da Introdução às Aplicações Avançadas No cenário competitivo da engenharia civil e da construção, a capacidade de gerenciar e analisar dados se tornou uma habilidade ...
Poça de Fusão: Técnicas Essenciais para Soldagem TIG Perfeita

A soldagem TIG (Tungsten Inert Gas) é uma técnica versátil e precisa, amplamente utilizada na indústria e construção. No entanto, manter a poça de fusão sob controle pode ser um desafio, especialme...
Como ajustar Corretamente a Amperagem na Solda com Eletrodo Revestido

A solda com eletrodo revestido é uma técnica amplamente utilizada na indústria e construção, sendo essencial para a união de peças metálicas. Um dos fatores críticos neste processo é o ajuste preci...
Paredes de Tijolos vs. Paredes de Blocos de Concreto: Qual a Melhor Opção para sua Construção?

Ao planejar uma construção, uma das decisões mais importantes a ser tomada é a escolha do material para as paredes. Duas opções populares são as paredes de tijolos e as paredes de blocos de concret...
Aço no Agronegócio - Equipamentos, Armazenagem, Maquinário e Inovação

O aço é um material fundamental no agronegócio, desempenhando um papel crucial em diversas aplicações. Sua resistência, durabilidade e versatilidade o tornam indispensável para a indústria agrícola...