NUTANIX – Services de données

9 mars 2016 0 Par Michael PERES

Services de données

Cluster size : la taille d’un cluster n’a pas de limite théorique. La version Starter limite (de façon logicielle) le nombre de nœuds dans un cluster à 12.

vSphere & Hyper-V Support : le support des hyperviseurs VMware vSphere et Microsoft Hyper-V sont disponibles dans toutes les éditions. A ce jour Nutanix Virtual Computing Platform supporte les versions suivantes des hyperviseurs :

Voici également un découpage par gamme de produits :

Heterogeneous Clusters : les différents modèles de la gamme peuvent être mélangés dans un même cluster sans restriction de fonctionnalités (à l’exception de la gamme NX-1020 qui ne peut être mélangée qu’avec des nœuds de la même gamme).

MapReduce Tiering : le placement intelligent des données dans une infrastructure Nutanix est effectué par la fonctionnalité MapReduce Tiering. Le stockage est constitué de RAM dans le CVM, de SSD et également de disques SATA 7.2k. La fonctionnalité MapReduce Tiering placera les données en fonction de l’accès des données.

Les données fréquemment utilisées seront placées dans le stockage rapide, la RAM ou les SSD. Les données moins sollicitées seront déplacées automatiquement sur les disques SATA 7.2k. Les algorithmes de MapReduce vont analyser efficacement les metadatas sur chaque nœud de la plateforme afin d’effectuer des tâches de type tiering, replacement de données, défragmentation, réparation de la redondance après la perte d’un disque par exemple. Les données sont déplacées sur les disques SSD si elles sont accédées plus de 3 fois en 20 minutes. La distribution des données est faite équitablement et proportionnellement sur chaque nœud.

Inline Compression : la compression de type inline permet de compresser la donnée à la volée les écritures séquentielles afin d’optimiser la capacité de stockage tout en garantissant un niveau de performance. Peut fonctionner en complément du MapReduce Compression.

MapReduce Compression : les données aléatoires sont écrites sur le SSD sans compression pour de meilleures performances. La compression a lieu en post-process après que les données froides soient déplacées sur les disques SATA 7.2k. Les tâches de compression sont effectuées sans impacter les performances de l’infrastructure, uniquement lorsqu’il y a de la ressource disponible. Peut fonctionner en complément de l’Inline Compression.

Les ratios de compression généralement relevés sont plus importants que sur une infrastructure traditionnelle du fait de la méthode de compression innovante que propose Nutanix :

Les applications pouvant bénéficier de l’Inline Compression et de MapReduce sont les suivantes :

VDI : données utilisateurs et serveurs de fichiers
Hadoop : données d’analyse et bases de données
Cloud Privé : machines virtuelles serveur
Archive ou Sauvegarde : données de sauvegarde

Inline Performance Deduplication : Le cache contient les données très régulièrement sollicitées, il est composé de RAM et de SSD. Le niveau de performance apporté par le cache est très important. La fonctionnalité Inline Performance deduplication permet de réduire l’espace de stockage utilisé dans ce cache afin d’améliorer le taux de consolidation, donc le nombre de machines virtuelles par nœud, tout en améliorant les performances pour toutes ces machines virtuelles.
Lorsque la fonctionnalité Inline Performance Deduplication est activée, les données sont analysées dès l’écriture et une empreinte des données est créée grâce à un découpage de type SHA-1. Ce découpage est effectué en utilisant les fonctions spécifiques des processeurs Intel pour un minimum d’impact sur les performances. Le découpage des données permet au NDFS (Nutanix Distributed File System) d’identifier et supprimer les données redondantes. Cela permet également de réduire la quantité de RAM et de SSD nécessaire à cet espace de travail chaud.
L’Inline Performance Deduplication consiste à placer dynamiquement dans le cache les données très régulièrement sollicitées, ce cache est composé de RAM et de SSD, grâce à cela le niveau de performance apporté est très important. Cette fonctionnalité est particulièrement efficace lorsque plusieurs machines virtuelles identiques, ou avec des similarités fortes sur le disque de l’OS, démarrent simultanément. Les machines virtuelles issues d’une migration de type P2V (Physical to Virtual) ou V2V (Virtual to Virtual), ainsi que les machines virtuelles de type clone complet (full clone) vont tirer pleinement parti de l’Inline Performance Deduplication.

Le schéma suivant montre le gain sur le temps de démarrage de machines virtuelles identique avec l’option activée puis désactivée. Nous voyons que le temps de démarrage des machines virtuelles est divisé par un facteur de 2.

L’autre gain de l’Inline Performance Deduplication est la baisse de la latence du volume de stockage d’un facteur de 5, ce qui aura un impact très fort sur le ressenti utilisateur.

MapReduce Deduplication : cette fonctionnalité permet de libérer une volumétrie de stockage très importante. Contrairement à une baie de stockage traditionnelle, MapReduce Deduplication est une fonction distribuée sur tous les nœuds et se lance automatiquement en fonction du besoin. Les performances du MapReduce Deduplication évoluent proportionnellement avec l’ajout de nœuds supplémentaires.

Lors de l’écriture des données, celles-ci sont très rapidement analysées afin de créer une empreinte des données, grâce à un découpage de type SHA-1 utilisant les fonctions spécifiques des processeurs Intel pour un minimum d’impact sur les performances.

Grâce aux fonctions MapReduce, toutes les données redondantes sur le système de fichier sont éliminées libérant une volumétrie de stockage utilisable beaucoup plus importante. Les gains généralement observés vont de x3 pour des machines virtuelles de type serveur à x10 pour des postes de travail déployés avec des disques complets (full clone).

Le ratio de déduplication peut varier et les chiffres sont donnés pour un ratio de consolidation de 75-120 VM en VDI, et 30-60 VM
pour des machines virtuelles serveur.

Les bénéfices de la déduplication avec Nutanix sont :

aucun impact sur les performances lors des taches de déduplication
l’usage des clones avec des disques complets dans des environnements ou l’utilisation des clones liés peut être problématique
permet de convertir des machines physiques en virtuels sans occuper inutilement du stockage
la disponibilité de la fonctionnalité quelque soit l’hyperviseur (vSphere, Hyper-V, KVM)