Nutanix – Remplacement d’un disque dans un bloc

Nutanix – Remplacement d’un disque dans un bloc

13 octobre 2015 0 Par Michael PERES

D’après les documents techniques Nutanix

REMPLACEMENT DU DISQUE DUR

Vue d’ensemble
Ce document décrit comment remplacer des composants matériels dans un bloc Nutanix.

Attention:
• Tout entretien doit être effectué par un technicien qualifié. Au cours de la procédure, porter un bracelet antistatique pour éviter d’endommager l’ESD des composants ou du système. Manipulez tous les composants avec précaution: placez-les sur une surface tendre, sans électricité statique.
• Contactez le service à la client pour toute opération qui implique l’hyperviseur (ESXi, Hyper-V ou KVM), les machines virtuelles, ou la partie logicielle Nutanix.
• Si vous avez verrouillé le cluster ou l’hyperviseur, vous devrez activer à nouveau l’accès SSH.

Remarque:
Nutanix ne fournit pas de garanties ou de services à l’égard des constructeurs non-Nutanix, ni des problèmes résultants de l’utilisation des éléments non-Nutanix qui restent expressément exclus de la garantie et de la maintenance Nutanix. Si vous remplacez ou modifiez des composants Nutanix ou si vous installez des composants non-Nutanix vous le faites à vos risques.

Disque de données en statut « Failed »

Chaque noeud Nutanix contient des disques SSD et disques HDD. Les données utilisateur sont réparties sur ces disques. Ces disques sont appelés « Data Drives »
Deux scénarios de défaillance sont possibles pour les Data Drives :
• Le disque rencontre des erreurs récupérables contenant des avertissements qui indiquent qu’il peut potentialement passer en statut « Failed ». Dans ce cas, il n’y aura aucune interruption du contrôleur VM.
• Le disque passe en échec sans avertissement. Dans ce cas, l’hyperviseur et le contrôleur VM peuvent passer en échec et doivent par conséquent être redémarré. Si le Cluster n’a pas été configuré pour vSphere HA (High Availability), les VM subiront une interruption de service. Lorsque le contrôleur VM est redémarré, il détecte le disque en statut « Failed ». Les données stockées sur le disque dur seront récupérées à partir d’autres emplacements de stockage dans le Cluster.
Dans les deux cas, vous devez remplacer le disque dès que possible.

Indications
• La console Web Nutanix affiche une alerte de disque.
Figure: Disk Alert (Multi-Node Block)

2015-10-12_101310

• Si le nœud ne répond pas, l’hyperviseur, Contrôleur VM et les VMs seront inaccessibles et la console Web Nutanix affichera une alerte de type « l’hôte est inaccessible ».

Le nommage
Nutanix attribue un nom à chaque noeud dans un bloc, qui varie selon le type de produit.

Exemple : Le nommage (NX-2000)
Pour NX-2000, ces noms sont:
• Node A
• Node B
• Node C
• Node D
Les disques physiques sont disposés en fonction de cet ordre dans chaque nœud du châssis, comme indiqué dans le schéma suivant.
Front and back panel for NX-2000 block

2015-10-12_102141

A minima, le premier disque dur de chaque nœud est un SSD, et les autres sont des disques durs de type HDD.

Avant de commencer:
Connectez-vous à n’importe quel contrôleur VM dans le cluster. Exécutez le script breakfix.py afin de recueillir l’information dont vous aurez besoin pour remplacer le disque défectueux.
nutanix@cvm$ ~/serviceability/bin/breakfix.py –drive –disk_id=disk_id –ip=cvm_ip_addr
• Remplacer cvm_ip_addr avec l’adresse IP du contrôleur VM ayant le disque défaillant.
• Remplacer disk_id par l’ID du disque défectueux.

Astuce: Enregistrer le résultat en sortie de ce script pour vous en servir comme référence pendant que vous déroulerez la procédure de remplacement.
1. Préparez disque de données pour son remplacement en suivant le tuto Préparation au remplacement d’un disque de données.
2. Arrêtez le nœud en suivant le tuto Arrêt d’un nœud de Cluster (Ligne de commande vSphere).
3. Remplacez le disque défectueux en suivant le tuto Remplacer physiquement un disque.
4. Démarrer le nœud en suivant le tuto Démarrage d’un noeud.
5. Configurez le nouveau disque en suivant le tuto Terminer le remplacement d’un disque de données.
6. Si le Cluster a plus qu’un pool de stockage, ajouter le disque au pool de stockage approprié en suivant Ajout d’un nouveau disque à un pool de stockage.