Lidando com interrupções inesperadas com SQL Server

Manejo de interrupciones inesperadas con SQL Server

¿Cómo puede su sistema de base de datos ayudarle a superar una falla catastrófica y volver a encaminar su negocio lo más rápido posible?

Recuperação de desastres SQL

Ocurre una falla catastrófica. Hay una copia de seguridad, pero tiene algún retraso para extraerla del almacenamiento remoto o del proveedor de la nube. También necesita un DBA disponible y con experiencia, sin importar el momento, para manejar esto de la manera más fluida posible. ¿Cómo puede su sistema de base de datos ayudarle a superar esto y a que su negocio vuelva a funcionar lo más rápido posible?

¿Por dónde empiezas?

Su empresa puede tener muchos niveles diferentes de criticidad y el primer paso es hacerse algunas preguntas para identificar dónde una falla podría ponerlo en riesgo. Los dos más importantes son: ¿Cuáles son sus límites de pérdida de datos y tiempo de inactividad aceptables? ¿Cuándo será tiempo suficiente para que su empresa vuelva a funcionar?

Hay dos conceptos que puede utilizar para responder estas preguntas: objetivo de punto de recuperación (RPO) y objetivo de tiempo de recuperación (RTO ).

RPO es el momento en el que desea que sus datos estén disponibles: al menos 2 minutos detrás de los registros saludables antes de fallar, por ejemplo.

RTO es el tiempo del SLA para que su empresa vuelva a operar dentro del RPO que definió. Por ejemplo, desea que se restablezca el servicio en un máximo de 3 minutos. Eche un vistazo a la situación actual de sus bases de datos. Con base en estas respuestas, puede comenzar a planificar su Plan de Continuidad de Negocio.

Tipos de interrupción

Comprender qué tipos de interrupciones puede experimentar su SQL Server puede ayudarlo a elegir la infraestructura y los recursos adecuados para superarlas.

Cuando falla algo que afecta solo a un servidor, como falla del sistema operativo, falla de instalación de parches, falla de RAM/CPU, falla de disco, necesita una solución de alta disponibilidad a la que mover sus recursos.

A veces, sus problemas son generalizados, como conmutadores de red o fallas de SAN, desastres naturales como incendios, inundaciones, cortes de energía y muchos otros. Por lo tanto, necesita una solución de recuperación ante desastres , como mover sus recursos a otra habitación o ubicación en el centro de datos, por ejemplo.

La corrupción de la base de datos puede ocurrir debido a fallas de SAN, errores de SQL que también necesitan procesos y planes para corregir esta corrupción. Los errores humanos incluyen caídas erróneas de tablas o bases de datos, actualizaciones sin una cláusula dónde, etc.

Características

¿Cómo SQL Server puede ayudarle a deshacerse de las interrupciones? Estos son los recursos que aprovecharán la alta disponibilidad de su negocio de forma segura y sólida.

Copia de seguridad y restauración – ¡Sí! ¡Se debe tener en cuenta la parte más básica de la recuperación de datos! Asegúrese de que sus copias de seguridad cumplan con su RPO y RTO y pruébelas periódicamente. Existen diferentes tipos de copias de seguridad, completas, diferenciales, de registros transaccionales y también de grupos de archivos, que pueden poner su base de datos en línea más rápido y por partes.

Replicación: copie y distribuya datos entre bases de datos en instancias locales o remotas a intervalos programados, con múltiples direcciones y tipos disponibles. Replica solo datos, ideal para subconjuntos específicos y para enviar/recibir datos hacia/desde ubicaciones específicas, como sucursales de tiendas, centros de distribución, etc.

Envío de registros: copia de seguridad y restauración automatizadas del registro de transacciones en otra base de datos local o remota, con réplicas de solo lectura disponibles (en espera).

FCI (instancias en clúster de conmutación por error) siempre activas: un clúster de 2 o más servidores con almacenamiento compartido. Cuando un nodo falla, todos los recursos se trasladan a un nodo disponible. Estos nodos pueden estar en el mismo centro de datos o de forma remota.

Grupos de disponibilidad siempre activos: un clúster de instancias de SQL independientes con volúmenes de almacenamiento independientes donde puede mover grupos de bases de datos en lugar de la instancia completa en caso de falla. Puede aprovechar una réplica secundaria de solo lectura, la descarga de copias de seguridad y puede ser asincrónica o sincronizada. Ideal para entornos de misión crítica

Replicación de almacenamiento: replicación de volúmenes entre servidores o clústeres, replicando bloques de disco para que los datos se puedan mover entre sitios y clústeres SAN.

Replicación de máquinas virtuales: replicación de instancias virtuales con todo el servidor como una instantánea, convirtiéndose en máquinas virtuales completamente funcionales para recuperar su infraestructura de manera oportuna.

Inversión

Comencé diciendo que debes ser consciente de la importancia de tus bases de datos. Cuanto menos RTO y RPO necesite, más tendrá que invertir en recursos e infraestructura de SQL para proporcionar una pérdida de datos casi nula. Los puntos críticos bien definidos proporcionarán un escenario en el que podrá invertir más en lo que es más valioso.

Aquí tienes 3 opciones principales:

Enterprise Edition: el conjunto completo de funciones de SQL proporciona soluciones de vanguardia y altamente escalables para computación y disponibilidad. Todas las funciones están disponibles. Me gustaría mencionar aquí los grupos de disponibilidad distribuida (disponibilidad entre dominios y red), la restauración en línea de páginas y archivos y la alta escalabilidad de E/S.

Edición estándar: un paquete de funciones básicas de SQL que proporciona la mayoría de las funciones empresariales con algunas limitaciones, como grupos de disponibilidad básicos para clústeres de 2 servidores, recuperación acelerada de bases de datos e instancias de clústeres de conmutación por error.

Web y Express: Ediciones gratuitas con características y funcionalidades muy limitadas.

Haga suceder

Puede comenzar con una implementación muy simple, como fijar sus cronogramas y tipos de respaldo, optimizar sus parámetros como E/S, cantidad de archivos, y pasar a diseños más complejos, como grupos de disponibilidad en diferentes salas, dominios y centros de datos, asegurando que su el negocio gana. No sufras grandes interrupciones y estarás tranquilo y a gusto para centrarte en estrategias de negocio que impulsarán tus ganancias.

contenido relacionado

Regresar al blog

Deja un comentario

Ten en cuenta que los comentarios deben aprobarse antes de que se publiquen.