Nous venons de constater plusieurs fausses alertes sur certains hosts.
Un exemple: sur certains host une alarm daté de 12 h 56 as apparue a 14 h 49.
D'autres hosts ont crée une alerte a 14 h 49 alors qu'il n'y a pas coupure.
L'investigation sur ce qui as pu causer ce problème est en cours.
Update(s):
Date: 2011-10-14 19:17:27 UTC Le service est up.
Date: 2011-10-14 18:40:51 UTC Il y a encore une erreur 503 sur le service. Nous investigeons.
Date: 2011-10-14 18:34:35 UTC Le service est up.
Date: 2011-10-14 18:22:20 UTC Après cette fausse resolution de ce problème, le support VMware est tombé sur le problème initial:
http://kb.vmware.com/kb/2001504
L'entité sur laquelle a été mise une alarme n'existe plus. Ca empêche le demarrage du vCenter en entier!
Après vérification à la main de chaque alarme, il semble y en avoir une.
Date: 2011-10-14 16:35:04 UTC Apparemment les tables task et event du SQL supportant le vCenter sont trop grosses. (!!!)
Nous sommes en train de les cleaner et nous allons l'appliquer sur tous les vCenter:
60 jours pour les events et 120 jours pour les tasks.
Aucun best-practice de VMware ne l'a defini jusque là...
Date: 2011-10-14 15:35:23 UTC Un ticket est en cours avec VMware.
Le support VMware investigue le problème avec notre équipe.
Date: 2011-10-14 13:58:56 UTC Nous allons effectuer un redémarrage des vcenters.