Résilience d’un cluster HA

28 juillet 2019 0 Par Michael PERES

Dans un cluster HA, la détection d’isolement est active et permet à HA de redémarrer les VMs situées sur un hyperviseur qui est isolé du réseau, sur un hyperviseur disponible. Cependant, cela signifie également qu’il est possible que, sans redondance appropriée, la réponse d’isolement puisse être déclenchée inutilement, et entraîne un temps d’indisponibilité qui pourrait être évité.

Pour accroître la résilience des réseaux, VMware a mis en œuvre le concept d’association de cartes réseau dans un hyperviseur pour les réseaux de type VMkernel et VM.

Lorsque nous parlons de haute disponibilité, cela est particulièrement important pour le réseau de management. L’association de cartes réseau consiste à regrouper plusieurs cartes réseau physiques en une seule carte réseau logique, qui peut être utilisée pour la tolérance de panne et l’équilibrage de charge réseau. Il est donc possible d’ajouter de la redondance au niveau du réseau de management comme pour d’autres type de port groups, afin de réduire les risques d’isolation.

Une autre option consiste à configurer un réseau de management supplémentaire en cochant la case « Management Network » sur un autre port VMkernel.

Bon à savoir : S’il existe plusieurs réseaux VMkernel sur le même sous-réseau, HA les utilisera tous pour le trafic de management, même s’il n’y en a qu’un seul de spécifié pour le Management Traffic.

Les réseaux Management Network et vMotion font bien souvent parti du même vSwitch. C’est aussi la configuration recommandée par VMware, car elle est simple, résiliente, et reste la configuration la plus utilisée. Bien évidemment, selon les architectures et les différents besoins comme la segmentation par exemple, il existe plusieurs types de configuration, y compris lorsque nous utilisons des Distributed vSwitchs (DVS).

Prérequis :

▪ 2 cartes réseau physiques

▪ Trunking VLAN recommandé

▪ Minimum de 2 switchs physiques

▪ Si possible, activez le « Link state tracking » pour signaler les défaillances de lien de connexion

Le vSwitch doit être configuré comme suit :

▪ vSwitch0 : 2 cartes réseau physiques (vmnic0 et vmnic1)

▪ 2 groupes de port (Management Network et vMotion VMkernel)

▪ Réseau de gestion actif sur vmnic0 et en standby sur vmnic1

▪ vMotion VMkernel actif sur vmnic1 et en standby sur vmnic0

▪ Le Failback défini sur « Non »

Chaque groupe de ports possède un ID de VLAN attribué et s’exécute sur sa propre carte réseau physique. Ce n’est qu’en cas de panne qu’il est basculé sur la carte réseau en standby. Il est vivement recommandé de définir la valeur de restauration sur « Non » afin d’éviter tout risque d’isolement indésirable, qui peut se produire lorsque le commutateur physique n’achemine aucun trafic au démarrage, mais les ports sont signalés comme « actifs ». (Onglet NIC Teaming)

Avantages : Seulement 2 cartes réseau au total sont nécessaires pour le Management Network et vMotion VMkernel, particulièrement utiles dans les environnements de serveur lame, car facile à configurer.

Inconvénients : Il y a juste un seul chemin actif pour les heartbeats.

Pour augmenter la résilience, il est également recommandé d’appliquer les paramètres avancés suivants et d’utiliser des ports de carte réseau sur différents bus PCI, de préférence des cartes réseau d’une marque et d’un modèle différents, ce qui évitera les pannes dues aux mises à jour de firmwares de carte.

Paramètres avancés : das.isolationaddressX = <adresse ip>

Il s’agit de l’adresse IP identifiée par l’agent HA pour déterminer si l’hôte est complètement isolé du réseau ou ne reçoit tout simplement aucun heartbeats. Si plusieurs réseaux VMkernel sur différents sous-réseaux sont utilisés, il est recommandé de définir une adresse d’isolation par réseau afin de s’assurer que chacun d’entre eux sera en mesure de valider l’isolation de l’hôte.