Résoudre les problèmes de démarrage lent des hôtes ESXi avec un cluster MSCS (WSFC)

Résoudre les problèmes de démarrage lent des hôtes ESXi avec un cluster MSCS (WSFC)

A la suite d’une intervention qui nous a conduits à  redémarrer nos ESXIs, nous avons constaté que certains de nos hyperviseurs  (en 6.0U2) étaient très lents à rebooter……1h30 pour redémarrer au lieu des 6 à 10 min habituellement.

 

Nos serveurs restaient bloqué pendant le démarrage des Services sur « Running esxui start ».

Starting-Up-Services-Running-esxui-start

Nous avions dans les logs de l’ESXI lors de son démarrage,  des Warning ScsiPath, mais la cause était loin d’être clair.

Après quelques recherches, je suis tombé sur une discussion sur communities.vmware.com évoquant des soucis similaires aux nôtres dans un niveau de patch équivalant.

 

La discussion nous renvoyait vers un KB VMware  https://kb.vmware.com/s/article/1016106  pointant du doigt un ralentissement au démarrage des ESXIs pouvant voir les Luns RDM utilisés par les noeuds MSCS (Microsoft Cluster Service) avec RDM………. et oui, nous venions de déployer sur ce cluster d’ESXI un Cluster de Fichiers Windows avec 5 Raw Disks.

 

Dans le Kb nous pouvions lire la cause

 

During the start of an ESXi host, the storage mid-layer attempts to discover all devices presented to an ESXi host during the device claiming phase. However, MSCS LUNs that have a permanent SCSI reservation cause the start process to lengthen as the ESXi host cannot interrogate the LUN due to the persistent SCSI reservation placed on a device by an active MSCS Node hosted on another ESXi host.

 

 

en Francais Google :

 

Au cours du démarrage d'un hôte ESXi, la couche intermédiaire de stockage tente de découvrir tous les périphériques présentés à un hôte ESXi pendant la phase de revendication de périphérique. Toutefois, les LUN MSCS qui ont une réservation SCSI permanente allongent le processus de démarrage car l'hôte ESXi ne peut pas interroger le LUN en raison de la réservation SCSI persistante placée sur un périphérique par un nœud MSCS actif hébergé sur un autre hôte ESXi.

Comme préconisé dans le KB, nous avons lancer sur chaque ESXI de notre cluster (hébergeant le Cluster Microsoft) des commandes esxcli pour flager chaque Lun RDM comme perpétuellement réservé, en passant à « True » la valeur « IsPerenniallyReserved »

 

Pour des raisons de simplicité, nous avons exécuté ces commandes sous la console PowerShell.

 

Pré-requis : 

  • Il faut au préalable récupérer l’identifiant de chaque lun (naa.xxxxxxxxxxxxxxx)

 

On se connecte en PowerShell au Vcenter hébergeant  les ESXI.

 

On crée une instance esxcli pour l’Esxi sur lequel on lance la commande. (Vous répéterez cette opération  pour chaque ESXI du cluster)

 

 

Ensuite vous pouvez lister les données de votre Lun (vérifier les données avant de modifier, ce n’est pas une mauvaise habitude)

 

Puis on passe à « True » la variable « IsPerenniallyReserved »  ….

 

On vérifie la modification,

 

Puis on recommence cette opération pour Chaque Raw Disk du MSCS…..

Vous pouvez rebooter vos ESXIs pour vérifier les changements …. Vous devriez alors constater un vrai changement.

Par contre, pensez à refaire les Hosts Profiles de vos hyperviseurs après la modification.

 

Cette information est inscrite dans Host Profile  dans la configuration du Lun à l’emplacement :

Storage Configuration  –>  Pluggable Storage Architecture (PSA) configuration –>   PSA device setting

Recherchez votre Lun ….et vous devriez avoir l’information  « Device perennially reserved status » à « True »

et en cliquant sur le fichier de configuration , on retrouve notre case à cocher valider……

No Comments

Sorry, the comment form is closed at this time.