OVHcloud Private Cloud Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
Alertes 'Host connection and power state' .
Incident Report for Hosted Private Cloud
Resolved
Nous venons de constater plusieurs fausses alertes sur certains hosts.
Un exemple: sur certains host une alarm daté de 12 h 56 as apparue a 14 h 49.
D'autres hosts ont crée une alerte a 14 h 49 alors qu'il n'y a pas coupure.
L'investigation sur ce qui as pu causer ce problème est en cours.

Update(s):

Date: 2011-10-14 19:17:27 UTC
Le service est up.

Date: 2011-10-14 18:40:51 UTC
Il y a encore une erreur 503 sur le service. Nous investigeons.

Date: 2011-10-14 18:34:35 UTC
Le service est up.

Date: 2011-10-14 18:22:20 UTC
Après cette fausse resolution de ce problème, le support VMware est tombé sur le problème initial:
http://kb.vmware.com/kb/2001504

L'entité sur laquelle a été mise une alarme n'existe plus. Ca empêche le demarrage du vCenter en entier!

Après vérification à la main de chaque alarme, il semble y en avoir une.

Date: 2011-10-14 16:35:04 UTC
Apparemment les tables task et event du SQL supportant le vCenter sont trop grosses. (!!!)
Nous sommes en train de les cleaner et nous allons l'appliquer sur tous les vCenter:
60 jours pour les events et 120 jours pour les tasks.
Aucun best-practice de VMware ne l'a defini jusque là...


Date: 2011-10-14 15:35:23 UTC
Un ticket est en cours avec VMware.
Le support VMware investigue le problème avec notre équipe.

Date: 2011-10-14 13:58:56 UTC
Nous allons effectuer un redémarrage des vcenters.
Posted Oct 14, 2011 - 13:42 UTC