Veeam: Como funciona Instant VM Recovery (vSphere)

[Total: 5    Average: 3.4/5]
Con Veeam Backup and Replication tenemos una variedad de opciones de recuperación, tanto de VM completas, como granulares, pudiendo recuperar archivos individuales, así como objetos de aplicaciones utilizando los Veeam Explorer.  Una de las características más destacadas para recuperar una VM con Veeam es Instant VM Recovery (IVMR).
Cuando ocurre algún desastre con una VM, como la corrupción de los datos, fallas a nivel de Sistema Operativo, infección con Ransomware, o incluso si hemos perdido acceso a los archivos de la VM por alguna falla a nivel de Storage, en ocasiones esto nos obliga a restaurar una VM completa.  Restaurar una VM completa, dependiendo de su tamaño, puede tardar horas, tiempo en el que los usuarios no pueden acceder a los servicios afectados por la falla.
Para poder acelerar este proceso, y poder tener los servicios operativos a la brevedad posible, Veeam nos ofrece Instant VM Recovery, una funcionalidad que permite tener una VM operativa en cosa de minutos a partir de un respaldo.   Suena bien no?  Incluso hasta suena como “magia”!!!  Pero la verdad es que no hay nada de mágico en el funcionamiento de IVMR, sino que corresponde a un conjunto de tecnologías y procesos muy ingeniosos desarrollados por Veeam.
En este post hablaremos acerca de IVMR y de como funciona en detalle en un ambiente VMware vSphere, permitiendo que puedan entender esta característica, y las consideraciones de diseño que debemos tener para que esta característica opere adecuadamente.
Instant VM Recovery nos permite restaurar inmediatamente una VM en un ambiente de producción ejecutando la VM directamente desde el archivo de respaldo.  Tal como suena!!!  La VM en si misma no es restaurada directamente al Storage de producción, sino que Veeam logra encenderla en un host ESXi mientras que los archivos que componen la VM se encuentran aun en el Repositorio de Respaldo en estado deduplicado y comprimido.
Debido a que no se necesita extraer la VM desde el archivo de respaldo y copiarlo en el Storage de producción, se puede iniciar la VM desde cualquier punto de restauración, ya sea Full o Incremental, en cosa de minutos, mejorando el RTO y minimizando el downtime de las VM en producción.   De esta forma, una VM restaurada con Instant VM Recovery permite que los usuarios puedan volver a usar los servicios en Producción, mientras que resolvemos el problema que provocó la falla en la VM original.

vPower NFS

Pero como logramos que esto funcione realmente???  Bueno, para esto Veeam utiliza una tecnología propietaria llamada vPower NFS, la cual nos permite montar la imagen de la VM a un host ESXi directamente desde el archivo de respaldo deduplicado y comprimido.   El componente principal de la tecnologia vPower es el servicio vPower NFS, un servicio que corre en una maquina Microsoft Windows y que permite que esta maquina funcione como un servidor NFS que pueda ser accedido por los hosts ESXi.
Y que servidor es utilizado para correr el servicio vPower NFS?   Bueno, esto depende de la arquitectura de la infraestructura de respaldos, y del tipo de repositorios utilizados:
  • Veeam Backup Server: Por defecto, Veeam Backup Server puede ser utilizado como Mount Server, y como tal puede ser utilizado para ejecutar el servicio vPower NFS.  Esta configuración no es la más recomendada desde el punto de vista de la performance de la VM que se quiere recuperar, ya que la conexión entre ESXi y el repositorio de respaldos estará dividida en dos:
    • Desde ESXi al servidor vPower NFS (Veeam Backup Server)
    • Desde vPower NFS (Veeam Backup Server) al Repositorio
  • Backup Repository (Windows): Cualquier repositorio Windows puede ser utilizado para ejecutar el servicio vPower NFS cuando deseamos restaurar con IVMR una VM respaldadas en dicho repositorio.  De hecho, se recomienda que en todos los repositorios Windows se habilite el servicio vPower NFS, de manera que la comunicación entre vPower NFS y el repositorio sea mas directa y no tenga que pasar a través de la red, como seria el caso si estuvieran en maquinas separadas.
  • Mount Server: En caso de utilizar repositorios que no sean Windows, es posible especificar cualquier maquina Windows registrada en Veeam Backup Server para funcionar como Mount Server para este repositorio, y proveer el servicio vPower NFS.  Se recomienda que este Mount Server esté lo más cercano posible al Repositorio, de manera de asegurar una buena conectividad con un throughput adecuado.
Que ocurre entonces cuando solicitamos una recuperación con Instant VM Recovery?  Bueno, el proceso funciona así:
  • En el servidor seleccionado para ejecutar el servicio vPower NFS, Veeam crea un directorio especial que será utilizado como Datastore vPower NFS.
  • Veeam publica los archivos VMDK de la VM directamente desde desde el respaldo al “datastore” vPower NFS.  Este proceso no implica en ningún caso mover/copiar los archivos de respaldo desde el Backup Repository.  Los archivos VMDK permanecen siempre en el repositorio como parte de la cadena de respaldo, y Veeam emula la presencia de estos archivos en el datastore creado por vPower NFS.

  • El datastore vPower NFS es montado en el host ESXi seleccionado durante la operación IVMR, lo cual permite que el host pueda ver los archivos de la VM respaldada, y utilizados como archivos VMDK comunes.  Estos archivos VMDK son básicamente archivos “emulados” y funcionan como punteros a los archivos VMDK reales que permanecen en todo momento en los archivos de respaldo en el repositorio.
Nota: El datastore vPower NFS no puede ser usado como un Datastore normal en vSphere donde podamos copiar y ejecutar VM.  Este datastore solo esta diseñado para ser utilizado por las operaciones nativas de vPower.
vPower NFS es utilizado no solo para utilizar Instant VM Recovery, sino que también es utilizado por las siguientes operaciones:
  • SureBackup
  • Universal Application-Item Recovery (U-AIR)
  • On-Demand Sandbox

Protección de los archivos de respaldo

Para evitar que el archivo de respaldo se vea afectado por las operaciones realizadas y no sufra modificaciones una vez que se solicita una recuperación con Instant VM Recovery, Veeam mantiene los archivos de respaldo involucrados en un estado de solo-lectura.
Una vez que la VM sea levantada en un host ESXi con IVMR, claramente se generarán operaciones de lectura y escritura propias del funcionamiento del Sistema Operativo y las aplicaciones, las cuales generarán cambios en la VM.  Estos cambios serán registrados en un Redo Log que reside en el servidor utilizado por vPower (Backup Server, Mount Server o Backup Repository).  Estos cambios serán posteriormente descartados cuando se detiene el proceso IVMR, o se consolidarán con la data de la VM original una vez la VM sea recuperada completamente en la infraestructura de producción.
Para mejorar la performance de I/O de una VM restaurada con Instant VM Recovery, los cambios registrados originalmente en el Redo Log sobre NFS pueden ser redirigiros a un Datastore especifico en vSphere, lo cual permite operaciones de escritura más rápidas.
  • Veeam generará un Snapshot y lo pondra en el directorio “Veeam IR” en el Datastore seleccionado, donde serán almacenados los cambios sobre la VM.
  • Por otro lado, esta opción impone una limitación importante: No es posible utilizar Storage vMotion para mover la VM a un Storage de producción y finalizar así la sesión de IVMR.

Restauración con Instant VM Recovery

La restauración de una VM con Instant VM Recovery es un proceso bastante simple, y lo podemos resumir en los siguientes pasos:
  • Lanzamos el asistente de restauración

  • Seleccionamos la opción “Instant VM recovery”

  • Seleccionamos la o las VM que queremos recuperar con IVMR

  • Seleccionamos el punto de restauración a utilizar

  • Seleccionamos si deseamos restaurar la VM a su ubicación original, lo cual además incluye la eliminación de la VM original en vSphere, o si vamos a restaurar la VM a una ubicación alterna donde podemos especificar distintos parámetros, incluyendo el nombre de la VM.

  • Si seleccionamos una ubicación alterna debemos especificar el host ESXi y Datastore a utilizar, además de especificar el nombre con el que la VM será restaurada.
  • Ingresamos un detalle de las razones para la restauración para efectos de auditoria.
  • Y por ultimo especificamos si la VM deberá ser encendida y conectada a la red una vez que sea restaurada con IVMR.


Finalizacion de Instant VM Recovery

Instant VM Recovery es solo una restauración temporal de una VM, ya que no podemos dejarla corriendo permanentemente desde vPower NFS, por dos razones principales:
  • La performance de la VM no será comparable a la de una VM completamente en Producción, ya que estaremos utilizando un archivo de respaldo que se encuentra en estado comprimido y deduplicado, y en un Repositorio de Respaldo cuyo diseño no está necesariamente optimizado para performance, sino para capacidad.
  • La VM depende de que el servidor vPower NFS se encuentre operativo para que se mantenga en funcionamiento.  Si el servidor vPower NFS falla o deja de funcionar por cualquier motivo, la VM recuperada con Instant VM Recovery dejará de funcionar inmediatamente.
Entonces lo importante ahora es definir como mover de forma permanente esta VM a producción, sin perder los cambios realizados durante el tiempo que la VM ha estado corriendo sobre vPower NFS, finalizando así la sesión de Instant VM Recovery.  Esto lo podemos conseguir con una de las siguientes 3 técnicas:
  • Storage vMotion: Se puede usar Storage vMotion para migrar la VM restaurada desde el datastore vPower NFS al Storage en Producción sin ningún downtime.  En este caso, la data de la VM será movida desde el repositorio de respaldo (a través de vPower NFS) a Producción, consolidando además los cambios realizados mientras la VM se encontraba corriendo con IVMR.   Recuerden que Storage vMotion solo puede ser utilizado si los cambios sobre la VM con IVMR son almacenados en el Redo Log sobre el datastore NFS.
  • Replicar o copiar la VM con las funcionalidades nativas de Veeam.  En este caso, al finalizar la copia/replica se debe realizar una operación de Failover, lo cual requiere un periodo de downtime mientras se copia/replica la VM, se apaga la VM con IVMR, y se enciende la VM copiada/replicada.
  • Quick Migration:  En este caso Veeam realizará un proceso de migración en dos etapas:
    • Veeam restaurará la VM desde el Backup Repository al storage de Producción, sin el uso de vPower NFS, utilizando una restauración tradicional.
    • Suponiendo que solo estamos moviendo la VM de Datastore y la estamos manteniendo en el mismo host, o si la estamos moviendo a un host ESXi con CPU compatible, Veeam utilizará SmartSwitch realizando el siguiente proceso para consolidar los cambios con la VM restaurada en el paso anterior.
      • Veeam suspende la VM temporalmente.
      • El estado de la VM y los cambios que se han producido mientras la VM se encontraba en ejecución con IVMR serán movidos a la nueva ubicación donde se está realizando la restauración.
      • La ejecución de la VM es reanudada.
      • Este proceso asegura un downtime mínimo durante la migración.
    • Si estamos moviendo la VM a otro host con CPU no compatible, el procedimiento realizado por Veeam es ligeramente distinto para conseguir consolidar los cambios.
      • Veeam apaga la VM.
      • Los cambios que se han producido mientras la VM se encontraba en ejecución con IVMR serán movidos a la nueva ubicación donde se ha realizando la restauración.
      • La VM es encendida nuevamente.
      • Este proceso genera un downtime mayor.
 

Requisitos de Instant VM Recovery

Para poder utilizar Instant VM Recovery se debe cumplir con los siguientes pre-requisitos:
  • La VM a recuperar debe tener al menos un punto de restauración disponible.
  • Si la VM recuperada con IVMR será conectada a la red de producción, se debe tener precaución de no provocar conflictos de IP en caso de que la VM original siga encendida.
  • Para establecer una conexión entre el host ESXi y el servidor vPower NFS se debe tener una interfaz VMkernel correctamente configurada en el host ESXi, y que permita la comunicación con el servidor vPower NFS.  No es obligatorio que esta conexión sea Layer 2, es decir que ambos se encuentren en el mismo segmento de red.
  • Se requiere al menos 10GB de espacio libre en el datastore vPower NFS para almacenar los cambios realizados sobre la VM restaurada.
    • Se recomienda asegurar un espacio equivalente al 10% de los datos restaurados con IVMR, considerando una tasa de cambios conservadora de un 10% diario.
    • Este espacio no es utilizado cuando se decide almacenar los cambios sobre un Datastore en producción al momento de lanzar la restauración con Instant VM Recovery.
  • Para finalizar Instant VM Recovery usando Quick Migration con Smart Switch, se requiere suficiente espacio libre en el datastore vPower NFS.  El espacio requerido corresponde a un equivalente a la RAM asignada a la VM recuperada, más 200 MB.  Es decir, si la VM tiene 8 GB en RAM, se requieren 8.2 GB de espacio libre en vPower NFS.

Conclusiones

Vemos entonces que Instant VM Recovery es una excelente herramienta para poder realizar una rápida restauración de una VM cuando se ha producido una falla en la VM original.  Puede ser utilizada para aplicaciones criticas del negocio con poca tolerancia a las interrupciones en el servicio.
Instant VM Recovery es una alternativa al uso de las Replicas, las cuales también me permiten iniciar rápidamente una VM en caso de que la VM original haya fallado.  La ventaja de las replicas, es que finalmente son VM en formato nativo en una plataforma vSphere, así que no dependen de vPower NFS y ofrecen una mejor performance al ejecutarse desde un Datastore en formato nativo, y no desde el repositorio de respaldo en formato Deduplicado y Comprimido.
IVMR también podría ser utilizado para realizar pruebas de los respaldos.  De hecho SureBackup utiliza vPower NFS como herramienta clave para poder realizar verificaciones de respaldos sobre una plataforma vSphere.
Espero que les haya resultado de interés y que puedan comprender mejor el funcionamiento de Instant VM Recovery y de vPower NFS.  Próximamente veremos como funciona Instant VM Recovery en Hyper-V, pudiendo ver las diferencias en el funcionamiento de IVMR entre ambas plataformas de virtualización.

About the Author:

EnglishPortugueseSpanish