NUTANIX : Disponibilité et protection des données

NUTANIX : Disponibilité et protection des données

1 mars 2016 2 Par Michael PERES

Disponibilité et protection des données

 

Data Path Redundancy : la solution Nutanix Virtual Computing Platform est constituée de machines virtuelles appelées Controller VM qui assument plusieurs rôles importants. Il peut arriver que cette machine virtuelle se retrouve indisponible (arrêt volontaire ou involontaire, suppression, redémarrage, mise à jour…). La fonctionnalité Data Path Redundancy ou encore appelé Autopath va permettre de rediriger le trafic des autres machines virtuelles vers les Controller VM voisins, afin d’assurer la continuité du service de stockage.

Disponibilité et protection des données -image1

Lorsque le Controller VM local est à nouveau disponible, le trafic est redirigé automatiquement en local. Cette fonctionnalité a pour avantage de garantir en permanence un accès au stockage sans interruption de service, même lors de la perte du Controller VM local. C’est la raison pour laquelle il est possible de faire une mise à jour des Controllers VM sans interruption de service.

Tunable Redundancy Factor : Lors de l’écriture des données, il est possible de déterminer le nombre de copies des données souhaitées afin de garantir la disponibilité des données en cas de perte d’un ou plusieurs nœuds dans un cluster. Cette fonctionnalité est appelée Tunable Redundancy Factor et est définie par un facteur de réplication RF=2 ou RF=3.

Disponibilité et protection des données -image2

Le schéma ci-dessous décrit les étapes d’écriture de la donnée ainsi que l’écriture synchrone des copies sur un 2ème nœud et 3ème nœud (RF=3).

Disponibilité et protection des données -image3

Si la configuration est de type RF=2, la donnée sera disponible 2 fois dans le cluster. La 1ère copie est toujours locale, et la 2ème est distribuée sur un autre nœud du cluster de manière distribuée. L’acquittement de l’écriture est toujours fait après que les 2 copies de la donnée soient faites.
Cette configuration RF=2 permet la perte simultanée d’un seul nœud s’il y a un minimum de 3 nœuds, ou d’un bloc de plusieurs nœuds si le nombre de blocs est au minimum de 6 placé de façon équilibrée (pour 6 nœuds, 2 nœuds par bloc ; pour 9 nœuds, 3 nœuds par bloc ; …)
Si la configuration est de type RF=3, la donnée sera disponible 3 fois dans le cluster. La 1ère copie est toujours locale, et la 2ème et 3ème copie est distribuée sur deux autres nœuds du cluster. L’acquittement de l’écriture sera fait après que les 3 copies de la donnée soient faites.
Cette configuration RF=3 permet la perte simultanée de 2 nœuds s’il y a un minimum de 5 nœuds.

Availability Domains : cette fonctionnalité, appelée aussi Block Awareness, permet de placer les données avec une connaissance de l’emplacement physique des nœuds de façon à pouvoir perdre un bloc entier sans aucune perte de donnée. Elle est utilisée en combinaison avec la fonctionnalité Tunable Redundancy Factor.

Protection des données

VMCaliber Snapshots : Nutanix propose des snapshots utilisant un algorithme redirect-on-write permettant de réduire tout impact de performance. Contrairement à une solution de stockage traditionnelle qui ferait un snapshot au niveau du volume ou d’un LUN, la fonctionnalité VMCaliber Snapshosts permet une granularité à la machine virtuelle, beaucoup plus fine.
Le système de fichier NDFS supporte nativement les fonctionnalités de déchargement des hyperviseurs, de type VAAI pour vSphere et ODX pour Hyper-V.

Disponibilité et protection des données -image4La gestion des snapshots avec Nutanix permet de réduire considérablement l’espace de stockage utilisé en s’appuyant sur un vDisk de base et des différentiels pour chaque snaphosts.
Concrètement cela permet d’utiliser les blocs identiques pour toutes les taches de snapshots et de clones. En version Starter, le nombre de snapshot est limité à 1 par machine virtuelle. Dans les éditions Pro et Ultimate il est possible d’avoir un nombre illimité de snapshots par machine virtuelle.

VMCaliber Clones : la fonctionnalité VMCaliber Clones s’appuie sur le même mécanisme que pour le VMCaliber Snapshot, à savoir l’utilisation de blocs identiques lors de la copie de machine virtuelle.

Disponibilité et protection des données -image5La création des clones se fait immédiatement (en quelques secondes) quelle que soit la taille de l’image de base de la machine virtuelle. De plus, l’espace de stockage consommé correspondra uniquement à la somme des différences de chaque machine virtuelle par rapport à l’image de base.

Single Site DR (1-to-1) : Nutanix propose nativement de la réplication entres plusieurs sites avec une granularité à la machine virtuelle. Cette fonctionnalité Single Site DR (1-to-1) permet la réplication et la reprise d’activité entre 2 sites comme sur le schéma ci-dessous.

Disponibilité et protection des données -image6

La réplication effectuée par Nutanix est faite avec un niveau de granularité qui est la machine virtuelle. Plutôt que de réplication l’intégralité d’un LUN ou d’un volume, Nutanix propose une approche permettant de simplifier la gestion de la réplication.

En version NOS 4.0.1, la fréquence minimum de réplication est de 1 heure.

De plus, la réplication s’accompagne d’une fonctionnalité de déduplication globale qui consiste à copier uniquement les blocs uniques à travers tous les sites, ce qui permet réduire très fortement la bande passante nécessaire à la réplication. Lors d’une réplication, avant d’envoyer une donnée, le système de fichier NDFS va vérifier sur le site secondaire si une empreinte identique est déjà présente. Si c’est le cas, la donnée existe déjà.

Disponibilité et protection des données -image7

La réplication peut également subir une compression supplémentaire qui sera
effectuée pendant la réplication permettant de compresser les données avant de les envoyer
sur le réseau. Il sera également possible de limiter l’usage de la bande passante afin de ne pas saturer le lien réseau sur des sites avec une faible bande passante.

La gestion de la réplication s’organise sous forme de Protection Domain. Un Protection Domain est une définition logique des machines virtuelles qui doivent être répliquées en même temps avec les mêmes destinations et les mêmes politiques de rétention.

Disponibilité et protection des données -image8

Le Protection Domain va également permettre la bascule automatique des machines virtuelles d’un site vers autre grâce à une orchestration effectuée par Nutanix. Cette fonctionnalité permet de s’affranchir d’une solution d’orchestration pour le basculement dans le cadre d’un PRA.

Disponibilité et protection des données -image9

La bascule automatique peut être initiée dans 2 cas de figure :

– bascule planifiée ou retour arrière planifié :
1. Crée et réplique un snapshot du Protection Domain
2. Eteins proprement les machines virtuelles du site principal
3. Crée et réplique un autre snapshot du Protection Domain
4. Désenregistre toutes les machines virtuelles du site principal
5. Marque le Protection Domain du site principal comme inactif
6. Restaure toutes les machines virtuelles sur le site secondaire
7. Marque le Protection Domain du site secondaire comme actif
8. Redémarre les machines virtuelles du Protection Domaine

– bascule après un sinistre :

1. Restaure toutes les machines virtuelles de la dernière réplication du Protection Domain
2. Enregistre toutes les machines virtuelles sur le site de reprise
3. Marque le Protection Domain du site de reprise comme actif
4. Redémarre les machines virtuelles du Protection Domaine

Lors d’un retour arrière, seront répliquées uniquement les différences depuis la dernière réplication, sous réserve que le délai de rétention des données ne soit pas expiré.

Intégration SRA : Pour les utilisateurs de la solution VMware Site Recovery Manager, Nutanix fournit le Storage Replication Adapter nécessaire pour s’intégrer à VMware Site Recovery Manager.

Disponibilité et protection des données -image10

Multiple Site DR (1-to many, many to many) : l’édition Ultimate offre la possibilité de faire du PRA d’un site vers plusieurs sites, et même de plusieurs sites vers plusieurs sites, appelé également many to many. Les typologies de réplication n’ont plus aucune limitation, car la réplication est configurée au niveau des machines virtuelles, et non au niveau d’un volume de stockage ou d’un LUN.

Disponibilité et protection des données -image11

Lors de la réplication entre plusieurs sites, des mécanismes de déduplication globale vont permettre de réduire la quantité de données répliquées grâce à la comparaison des données identiques avant l’envoi des données à travers le réseau. Cette fonctionnalité de déduplication globale est utilisée par défaut et permet de s’affranchir d’un boitier spécifique de compression réseau.

Le schéma ci-dessous explique dans le détail le fonctionnement de la déduplication globale :

Disponibilité et protection des données -image12

Online Cluster Grow/Shrink : depuis l’interface de gestion Prism, il sera possible d’ajouter des nœuds supplémentaires à chaud afin d’étendre la volumétrie de stockage ainsi que les ressources CPU et RAM. L’ajout de nœuds supplémentaire apportera également de performance stockage IOPS. Cet ajout se fait sans aucune interruption de service et étendra automatiquement le stockage.

Disponibilité et protection des données -image13

Time Stream : lorsqu’il s’agit de protéger des machines virtuelles, il est parfois utile de pouvoir repartir rapidement sur une version N-1 ou N-2 d’une image. Sur une architecture traditionnelle, il faut le plus souvent s’appuyer sur des plugins externes pour le stockage ou utiliser un logiciel de sauvegarde tiers. La fonctionnalité Time Stream permet de faire des snapshots locaux en nombre illimité. Il sera alors possible de restaurer en quelques secondes la version N-1 ou N-10 d’une machine virtuelle sans ajout de plugin supplémentaire.

Intégration VSS : Le snapshot ou la réplication nécessite parfois une consistance applicative. Nutanix utilise le Volume Shadow Copy Service (VSS) de Microsoft afin de garantir une consistance applicative des applications supportant le VSS.

Cluster Shield : cette fonctionnalité aussi appelée Cluster Lockdown permet de protéger l’accès à la console d’administration par une clé SSL de verrouillage tout en désactivant les accès distants. Cluster Shield va ainsi restreindre l’accès à la plateforme en désactivant les authentifications shell interactive.

Disponibilité et protection des données -image14

Common Access Card : permets d’augmenter la sécurité d’un cluster Nutanix par une authentification forte à deux facteurs. La fonctionnalité Common Access Card autorise l’accès et le contrôle par la combinaison d’une carte de sécurité physique ainsi que d’un mot de passe. Cette fonctionnalité est généralement utilisée pour les environnements avec une exigence forte de sécurité.