Como remover una LUN en ESXi y evitar la condición de APD y PDL

/, iSCSI, Storage, VMware, vSphere/Como remover una LUN en ESXi y evitar la condición de APD y PDL

[Total: 0    Average: 0/5]
Quienes han trabajado con VMware por un tiempo, sabrán que agregar nuevas LUNs a un host ESXi es una tarea bastante sencilla. No obstante, al momento de querer eliminar una LUN, se darán cuenta que no es tan sencillo como simplemente elegir la opción “Delete”.

Si no se realiza el procedimiento correcto para remover las LUNs de un host ESXi, podrían sufrir las consecuencias de una condición conocida como APD (All Paths Down) o PDL (Permanent Device Lost)

Primero, veamos que sucede cuando una de estas dos condiciones se presenta

All Paths Down (APD)

Las condiciones All Paths Down ocurren comúnmente cuando una LUN es des-presentada del host ESXi en forma incorrecta. El host ESXi aun cree que el dispositivo está disponible, por lo que reintenta enviar los comandos SCSI indefinidamente. Esto tiene un impacto en el agente de administración del host, debido a que estos comandos SCSI enviados una y otra vez, no son respondidos hasta que el dispositivo este disponible nuevamente. Esto provoca que el host ESXi deje de responder y sea inaccesible por vCenter Server.

Los síntomas de una condición APD son los siguientes:

  • El datastore es mostrado como no-disponible en la vista de Storage
  • Un adaptador de storage indica que el Operational State del dispositivo se encuentra en estado “Dead” o “Error”
  • Todos los paths del dispositivo están marcados como “Dead”
  • No es posible conectarse directamente al host ESXi usando vSphere Client
  • El host ESXi aparece con estado “Disconnected” en vCenter Server

Debido a la naturaleza de una situación APD, no hay una manera “limpia” para recuperar la plataforma:

  • La situación primero necesita ser resuelta en el Storage para restaurar la conectividad con el host.
  • Todos los hosts afectados podrían requerir un reboot para remover cualquier referencia residual con los dispositivos afectados que están en estado APD.
  • Realizar una migración con vMotion de una MV no es posible, debido a que los agentes de administración de ESXi podrían estar afectados por la condición ADP, y el host ESXi podría quedar inaccesible para ser administrado. Debido a esto, un reboot de un host afectado fuerza a un apagado de todas las MV en dicho host.

Permanent Device Loss (PDL)

Una situación de PDL planificada ocurre cuando hay un intento de remover una LUN presentada a un host ESXi. El Datastore debe primer ser desmontado, para luego ser des-atachado, antes de que la LUN pueda ser despresentada en el Storage. Luego veremos como realizar este procedimiento correctamente.

Una situación de PDL no planificada ocurre cuando el dispositivo de almacenamiento es des-presentado inesperadamente desde el Storage, sin haber realizado antes el desmontado y des-atachado del Datastore previamente.

  • Cuando se produce una condición PDL, lo síntomas son los siguientes:
  • El Datastore afectado se muestra como no-disponible en la vista de Storage.
  • El Storage Adapter indica que el Operational State de la LUN se encienta en estado “Lost Communication”
  • Todos los paths del dispositivo son marcados como “Dead”

Para solucionar una condición de PDL no planificado, se puede realizar lo siguiente:

  • Todas las MV que se encuentren en el Datastore afectado deben ser apagadas y des-registradas de dicho Datastore.
  • Desde el vSphere Client, en el tab Configuration del host ESXi, hacer click en Storage.
  • Hacer click derecho sobre el Datastore afectado y hacer click en Unmount.
  • Realizar un rescan de todos los hosts ESXi que tenían visibilidad con dicho Datastore.

Como remover correctamente un Datastore?

Los pasos varían si se está trabajando en vSphere 4.x o en vSphere 5.x. Nos vamos a concentrar en como realizar esta operación sobre vSphere 5.x, pero rápidamente daremos un vistazo a los pasos básico para remover una LUN en vSphere 4.x

Remover una LUN en vSphere 4.x

Los pasos recomendados para remover una LUN en vSphere 4.x son los descritos en el KB 1029786 de VMware:

  • Des-registrar todos los objetos que se encuentran en el Datastore, incluyendo MVs y Templates
  • Asegurar que no hay herramientas de tejeros accediendo al Datastore.
  • Asegurar que no hay otras funcionalidades, como SIOC, haciendo uso del dispositivo.
  • Enmascarar la LUN (LUN Masking) desde el host ESXi creando reglas en la PSA. Esto debe hacerse en cada host si la LUN está presentada a un cluster de ESXi.
  • Des-presentar físicamente la LUN del host ESXi utilizando las herramientas de administración del Storage.
  • Hacer un rescan en los hosts ESXi afectados.
  • Borrar las reglas de LUN Masking creadas previamente en cada host ESXi.

Remover una LUN en vSphere 5.x

Ahora veamos como realizar esta tarea en una plataforma vSphere 5.x. Estos pasos son descritos en el KB 2004605:

En primer lugar, debemos asegurarnos de que se cumplan las siguientes condiciones antes de remover una LUN:

  • Si la LUN esta siendo usada como Datastore VMFS, todos los objetos almacenados en el (MVs, Snapshots, templares), deben ser des-registrados o movidos a otro Datastore.
  • El Datastore no es parte de un Datastore Clister
  • El Datastore no esta siendo administrado por Storage DRS.
  • Storage I/O Control se encuentra deshabilitado en el Datastore.
  • El Datastore no es utilizado por el Heartbeat de vSphere HA.
  • La LUN no está siendo utilizada por scripts o herramientas de terceros.
  • Si la LUN esta siendo utilizada como RDM, remover el disco RDM desde la MV.
  • Verificar que el Datastore no este siendo usado como ubicación para el Scratch persistente del host.

Una vez que se verifica que se han cumplido las condiciones indicadas previamente, podemos proceder con el procedimiento para remover la LUN:

1. Obtener el ID NAA de la LUN a ser removida.
Esto lo podemos conseguir desde un host ESXi a través de SSH utilizando el siguiente comando:
esxcli storage vmfs extent list

Captura de pantalla 2013-03-11 a la(s) 0.53.16

De la lista que aquí aparece, debemos buscar la LUN que queremos remover, y anotar el ID NAA del Datastore. Este ID lo utilizaremos posteriormente.

2. Desmontar la LUN utilizando el vSphere Client
Si vamos a desmontar la LUN de un host ESXi en particular, vamos al tab Configuration del host ESXi y vamos a la sección Storage. Hacemos click derecho sobre el Datastore a remover y hacemos click en Unmount.

Si vamos a desmontar una LUN presentada a múltiples hosts, en vSphere Client nos vamos a la vista Datastores and Datastore Cluster.

Captura de pantalla 2013-03-10 a la(s) 0.49.24

Hacemos click derecho sobre el Datastore a remover y hacemos click en Unmount.

Captura de pantalla 2013-03-10 a la(s) 0.50.40

 

Luego de lo cual seleccionamos los hosts en los cuales queremos remover el acceso al Datastore.

Captura de pantalla 2013-03-10 a la(s) 0.50.55

Una ventana de confirmación aparece, la cual valida que se cumplan todos los pre-requisitos. Hacemos click en OK.

Captura de pantalla 2013-03-10 a la(s) 0.53.12

La LUN ahora aparece en estado Inactive.

Captura de pantalla 2013-03-10 a la(s) 0.52.45

3. Des-atachar la LUN utilizando el vSphere Client.
Nos dirigimos al tab Configuration del host ESXi y vamos a la sección Storage. Aquí seleccionamos la vista Devices.

Hacemos click derecho sobre el ID NAA de la LUN (el cual conseguimos en el paso 1) que queremos remover y hacemos click en Detach.

Captura de pantalla 2013-03-10 a la(s) 0.59.28
Una ventana de configuración aparecerá asegurando que se cumplan los requisitos. Hacemos click en OK.

Captura de pantalla 2013-03-10 a la(s) 0.59.31

Importante: La operación de Detach debe ser realizada por host, ya que esta no se propaga a todos los hosts en vCenter Server de forma automática. Se debe asegurar que esta operación se lleve a cabo en cada host en el que haya sido montada la LUN, de lo contrario, el proceso resultará en una condición All-Paths-Down para aquellos hosts en que la operación de Detach no se haya realizado correctamente.

La LUN ahora puede ser des-presentada desde el arreglo de Storage.

4 Rescan
Finalmente se debe realizar un rescan en todos los hosts ESXi que tenían visibilidad de la LUN removida. El dispositivo es automáticamente removido de la lista de LUN/Datastores.

Si quieren ver como realizar el proceso a traves de la linea de comando, utilizando PowerCLI u otro SDK, pueden revisar el procedimiento en el KB 2004605 de VMware.

By | 2014-02-20T17:38:13+00:00 March 11th, 2013|Formacion, iSCSI, Storage, VMware, vSphere|0 Comments

About the Author:

Leave A Comment

EnglishPortugueseSpanish