Skip to content
Advertisement
2013/05/13 / vpourchet

VMware vCenter Operations Manager : Présentation des Badges secondaires

    Nous avons vu dans l’article précédent sur Operations Manager, que le Dashboard se composait de trois badges principaux qui pour rappel sont les suivants :

  • Health.
  • Risk.
  • Efficiency.


    Ces trois badges indiquent un score entre zéro et cent calculé d’après des indicateurs différents. Ces badges principaux sont plutôt destinés aux administrateurs Operations. Pour chaque badge il est possible d’afficher les différents indicateurs ayant servi au le calcul du score, il s’agit des badges secondaires qui sont eux, plutôt à destination des administrateurs Infrastructure. Pour afficher ces badges secondaires, il suffit de cliquer sur le lien Why is … ? de chaque badge
principal.

    Cet aperçu illustre le Dashboard avec chaque badge secondaire de chaque badge principal affiché.

    La structure est la suivante :

  • Health.
    • Workload.
    • Anomalies.
    • Faults
  • Risk.
    • Time Remaining.
    • Capacity Remaining.
    • Stress.
  • Efficiency.
    • Reclaimable Waste.
    • Density.

    Commençons par les badges secondaires au badge Health. Le premier d’entre eux est le badge Workload. Le score de ce badge affiche le ratio entre les ressources demandées par chaque objet et sa capacité effective. Il doit-être le moins élevé possible, en effet un workload qui obtiendrait un score de 100% signifierait que l’objet n’est plus en mesure d’obtenir des ressources suffisantes pour fonctionner de manière optimale (problèmes de performances notamment). Les paramètres pris en compte pour le calcul de ce badge sont les suivants : CPU, Mémoire, I/O Disques, I/O Réseau. Dans certains cas, il est possible que le score excède 100, ce qui signifie que l’objet essaye d’obtenir plus de ressources que ce qu’il est autorisé (overcommit). Le Dashboard présente le badge Workload de l’infrastructure complète et son évolution au cours des 6 dernières heures, le détail pour chaque objet peut également être affiché.

    Le badge secondaire suivant est le badge Anomalies. Ce badge affiche les Anomalies rencontrées par les objets selon des métriques relevées pour chaque objet. Les seuils de chaque métrique sont calculés par Operations Manager et les anomalies générées si l’objet a atteint l’un de ces seuils. Le score global correspond à la somme des anomalies calculées sur l’infrastructure. Plus bas est le nombre d’anomalies relevé, meilleure se porte l’infrastructure.

    Le dernier badge secondaire du badge Health est le badge Faults. Ce badge affiche la liste des problèmes rencontrés par un objet, ces problèmes sont extraits des Events du vCenter. Le score global correspond à la somme des Faults des objets subséquents. Il inclut des évènements tels que : la perte d’une redondance de NIC, de HBQ, des erreurs mémoires, des pertes de connexion, … Les Faults requièrent une attention immédiate de la part de l’administrateur vSphere, chaque Fault à son propre ‘poids‘ et le score global est calculé en additionnant ces poids. Plus un évènement est important/grave/critique, plus son poids est élevé.

    Passons maintenant aux badges secondaires au badge Risk. Le premier d’entre eux est le badge Time Remaining. Ce badge indique le temps restant avant épuisement des ressources. Le score est calculé selon différents compteurs tels que : l’utilisation CPU, utilisation mémoire, utilisation disque ou encore I/O réseau. L’évolution de ces compteurs dans le temps est alors calculée. Par défaut, un tampon de provisionnement d’une durée de 30 jours est créé. Si l’une des ressources atteint une capacité inférieure à celle de ce tampon, le temps restant devient alors de 0. Par exemple si le tampon de provisionnement est de 30 jours et que l’objet sélectionné à des ressources CPU de fonctionnement estimées à 80 jours et des ressources mémoires estimées à 10, le score sera de zéro car la quantité de mémoire disponible ne permettra de couvrir les besoins de l’objet qu’à 10 jours (moins de 30 donc). Le score de ce badge doit donc être le plus proche possible de 100.

    Le second badge secondaire au badge Risk est le badge Capacity Remaining. Ce badge permet de mesurer la capacité de l’infrastructure à recevoir de nouvelles VMs. Un compteur représente la capacité de l’objet à recevoir de nouvelles VMs et un nombre estimé de VMs pouvant être crées sur l’objet est indiqué, basé sur un slot moyen de VM calculé. Chaque objet à sa propre taille de slot (datastore, host, cluster …). Une capacité de 0 signifie que l’objet n’est plus en mesure d’héberger de nouvelles machines virtuelles, auquel cas le nombre de VMs responsables de cet overprovisioning sera affiché.

    Le dernier badge secondaire au badge Risk est le badge Stress. Ce badge affiche le degré de stress de l’objet sélectionné sous forme d’agenda et est calculé sur une longue période. Le score est calculé en fonction du ratio entre la demande en ressources et la capacité effective (comme le badge Workload) mais sur une plus longue période. Ce badge permet d’identifier les hosts/VMs/clusters qui n’ont pas assez de ressources allouées pour fonctionner de manière optimale sur une longue période. Il peut indiquer que trop de VMs sont exécutées sur un objet. Son score est compris entre 0 (bon) et 100 (mauvais).

    Passons maintenant aux badges secondaires au badge Efficiency, le premier d’entre eux étant le badge Reclaimable Waste. Ce badge représente l’overprovisionnement de l’infrastructure ou d’un objet. Il est calculé pour chaque ressource (CPU, mémoire, stockage) et pour chaque objet. Il permet d’identifier la quantité de ressources qui peuvent être réclamées et provisionnées par d’autres objets de l’environnement. Le score est compris entre zéro (bon) et cent (mauvais) et la couleur change selon les niveaux de contention définis par l’administrateur vCenter Operations Manager.

    Le deuxième et dernier badge secondaire au badge Efficiency est le badge Density. Ce badge montre la densité d’objets au sein de l’infrastructure ou de l’élément sélectionné. Il s’agit d’une représentation du ratio de consolidation, comparant le ratio actuel au ratio idéal calculé en fonction de la demande, de la capacité virtuelle et de la capacité physique de l’infrastructure. Ce badge permet d’établir la quantité de ressources qui peuvent encore être provisionnées avant que ne surviennent les contentions ou conflits entre les objets. Les ratios sont les suivants : VMs par hôte, nombre de vCPU par CPU physique, quantité de mémoire virtuelle par rapport à la quantité de mémoire physique. Pour chaque ratio, la valeur courante et la valeur optimale sont affichées.

wandelroutes

2 Comments

Leave a Comment
  1. Promosoft / May 15 2013 12:21

    Bonjour Valentin,
    Je viens de parcourir votre blog que je me suis empressé d’ajouter à mes favoris. Merci pour cet article et ces explications très claires, il y a peu d’explications sur ce sujet aussi détaillées.
    Bien cordialement,

    • vpourchet / May 19 2013 11:13

      Bonjour,

      Merci pour vos encouragements.

      Cordialement,

      V

Leave a Reply

Your email address will not be published.