Lidando com interrupções inesperadas com SQL Server

Lidando com interrupções inesperadas com SQL Server

Como seu sistema de banco de dados pode ajudá-lo a superar uma falha catastrófica e colocar seus negócios de volta nos trilhos o mais rápido possível?

Recuperação de desastres SQL

Ocorre uma falha catastrófica. Há um backup, mas você tem algum atraso para extraí-lo do armazenamento remoto ou do provedor de nuvem. Você também precisa de um DBA disponível e experiente, não importa a hora, para lidar com isso da maneira mais integrada possível. Como seu sistema de banco de dados pode ajudá-lo a superar isso e colocar seu negócio de volta nos trilhos o mais rápido possível?

De onde você começa?

Sua empresa pode ter muitos níveis distintos de criticidade e o primeiro passo é fazer algumas perguntas a si mesmo para identificar onde uma falha pode colocá-la em risco. Os dois mais importantes são: Quais são os seus limites para perda de dados e tempo de inatividade aceitáveis? Qual momento é suficiente para sua empresa voltar a funcionar?

Existem dois conceitos que você pode usar para responder a essas perguntas: Objetivo do ponto de recuperação (RPO) e Objetivo de tempo de recuperação (RTO).

RPO é o momento em que você deseja que seus dados estejam disponíveis – pelo menos 2 minutos atrás dos registros íntegros antes da falha, por exemplo.

RTO é o tempo de SLA para sua empresa voltar a funcionar dentro do RPO que você definiu. Por exemplo, você deseja o restabelecimento do serviço em no máximo 3 minutos. Dê uma olhada em qual ponto seus bancos de dados estão atualmente. Com base nessas respostas, você pode começar a planejar seu Plano de Continuidade de Negócios.

Tipos de interrupção

Compreender quais tipos de interrupções seu SQL Server pode sofrer pode ajudá-lo a escolher a infraestrutura e os recursos certos para superá-los.

Quando algo falha e afeta apenas um servidor, como falha no sistema operacional, falha na instalação do patch, falha na RAM/CPU, falha no disco, você precisa de um Alta disponibilidade solução para onde mover seus recursos.

Às vezes, seus problemas são generalizados, como switches de rede ou falhas de SAN, desastres naturais como incêndio, inundação, queda de energia e tantos outros. Então, você precisa de um Recuperação de desastres solução, como mover seus recursos para outra sala ou local do datacenter, por exemplo.

Corrupção de banco de dados podem ocorrer em falhas de SAN, bugs de SQL que também precisam de processos e planos para corrigir essa corrupção. Erros humanos incluem quedas erradas de tabelas ou bancos de dados, atualizações sem uma cláusula where e assim por diante.

Características

Como o SQL Server pode ajudá-lo a se livrar das interrupções? Aqui estão os recursos que irão alavancar a alta disponibilidade do seu negócio de forma segura e robusta.

Backup e restauração – Sim! A parte mais básica da recuperação de dados deve ser levada em consideração! Certifique-se de que seus backups atendam ao seu RPO e RTO e teste-os periodicamente. Existem diferentes tipos de backups, completos, diferenciais, log transacional e também grupos de arquivos, que podem colocar seu banco de dados online com mais rapidez e por partes.

Replicação – Copie e distribua dados entre bancos de dados em instâncias locais ou remotas em intervalos programados, com diversas direções e tipos disponíveis. Replique apenas dados, ideal para subconjuntos específicos e para enviar/receber dados de/para locais específicos, como filiais de lojas, centros de distribuição, etc.

Log Shipping – Backup e restauração automatizados do log transacional para outro banco de dados local ou remoto, com réplicas somente leitura disponíveis (Standby).

Always-ON FCI (Failover Clustered Instances) – Um cluster de 2 ou mais servidores com armazenamento compartilhado. Quando ocorre uma falha em um nó, todos os recursos são movidos para um nó disponível. Esses nós podem estar no mesmo datacenter ou remoto.

Grupos de disponibilidade Always-ON – Um cluster de instâncias SQL autônomas com volumes de armazenamento independentes onde você pode mover grupos de bancos de dados em vez de toda a instância em caso de falha. Você pode aproveitar uma réplica secundária somente leitura, descarregamento de backup e pode ser assíncrona ou sincronizada. Ideal para ambientes de missão crítica

Replicação de armazenamento – Replicação de volumes entre servidores ou clusters, replicando os blocos de disco para que os dados possam ser movidos entre sites e clusters SAN

Replicação de Máquina Virtual – Replicação de instâncias virtuais com todo o servidor como um instantâneo, tornando-se VMs totalmente funcionais para trazer sua infraestrutura de volta em tempo hábil.

Investimento

Comecei falando que você deve estar atento à criticidade dos seus bancos de dados. Quanto menos RTO e RPO você precisar, mais terá que investir em recursos e infraestrutura SQL para fornecer quase zero perda de dados. Criticidades bem definidas fornecerão um cenário onde você poderá investir mais no que é mais valioso.

Aqui você tem 3 opções principais:

Enterprise Edition: O pacote completo de recursos SQL fornece soluções de ponta e alta escalabilidade para computação e disponibilidade. Todos os recursos estão disponíveis. Gostaria de mencionar aqui os grupos de disponibilidade distribuída (disponibilidade entre domínios e rede), restauração online de páginas e arquivos e alta escalabilidade de E/S.

Standard Edition: um pacote de recursos SQL básico que fornece a maioria dos recursos do Enterprise com algumas limitações, como grupos de disponibilidade básica para clusters de 2 servidores, recuperação acelerada de banco de dados e instâncias de cluster de failover.

Web e Express: Edições gratuitas com recursos e funcionalidades muito limitados.

Faça acontecer

Você pode começar com uma implementação muito simples, como corrigir seus agendamentos e tipos de backup, otimizar seus parâmetros, como E/S, número de arquivos, e passar por um design mais complexo, como grupos de disponibilidade entre diferentes salas, domínios e datacenters, garantindo que seu negócio ganhe. Não sofra grandes interrupções e você estará tranquilo e tranquilo para focar em estratégias de negócios que alavancarão seus lucros.

Conteúdo Relacionado

O Rails 8 sempre foi um divisor de águas...
A GenAI está transformando a força de trabalho com...
Entenda o papel fundamental dos testes unitários na validação...
Aprenda como os testes de carga garantem que seu...
Aprofunde-se nas funções complementares dos testes positivos e negativos...
Vídeos deep fake ao vivo cada vez mais sofisticados...
Entenda a metodologia por trás dos testes de estresse...
Descubra a imprevisibilidade dos testes ad hoc e seu...
A nomeação de Nacho De Marco para o Fast...
Aprenda como os processos baseados em IA aprimoram o...
A escalabilidade é um fator crítico quando se trata...
O Oracle NoSQL Database é uma solução robusta que...
Um banco de dados SQL deve manipular várias conexões...
  O uso de índices no PostgreSQL é uma...
Em bancos de dados relacionais, um relacionamento um-para-um (1:1)...
PostgreSQL é um dos bancos de dados SQL mais...
ブログに戻る

コメントを残す

コメントは公開前に承認される必要があることにご注意ください。