OVHcloud Web Hosting Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
Equipement principal
Incident Report for Web Cloud
Resolved
Un problème est en cours sur l’équipement principal.

Update(s):

Date: 2012-05-15 08:53:16 UTC
Les verifications sur la machine slave nous ont permis de detecter un autre soucis.
La machine a été remplacée par une neuve.

Le cluster actif/passif est rétabli.

Date: 2012-05-11 20:55:55 UTC
La bascule s'est correctement. La nouvelle machine est opérationnelle.
Les appels s'écoule correctement.

Nous verifions et réparons la machine slave.

Date: 2012-05-11 20:33:13 UTC
Nous démarrons les opérations.

Date: 2012-05-11 17:34:02 UTC
Le master a été vérifié et réparé avec des pieces neuves.
La machine est à nouveau opérationnelle et prete à reprendre du service.

Nous allons faire une bascule afin de remettre cet équipement en production.
L'opération est prévu vers 22h30. Les communications seront coupés.

Une interruption du service de 5 minutes est à prévoir.

Ensuite, par précaution, nous remplacons également les mêmes pieces sur le slave
afin d'éviter tout probleme futur.


Date: 2012-05-11 11:37:09 UTC
Nous allons installer très rapidement un systeme de repartition
de charge via un proxy et un nouveau systeme qui va gerer de
nouveaux comptes. De cette maniere nous n'allons plus surcharger
l'infrastructure actuelle avec les nouveaux comptes même si nous
sommes à 25% de la charge \"commerciale\" qu'on nous a vendu ..

Date: 2012-05-11 11:18:38 UTC
Ce matin l'équipement principal pour la téléphonie est tombé de manière
identique à la semaine dernière (http://travaux.ovh.net/?do=details&id=6672).

L'équipement secondaire a détecté la défaillance de l’équipement principal et a pris
à sa charge le service de téléphonie. La reprise des connexions a été difficile suite
au retard des requêtes a traiter. La partie SIP est revenu en première. La partie MGCP
(ST2030, TB30, LG) a eu plus de difficulté. Nous avons mis alors en place une limitation
de flux pour éviter de congestionner la reprise de tous les équipements. Progressivement
tous les téléphones ont repris un dialogue normal avec le serveur.

Concernant le problème hardware nous avions déjà remplacé une partie du matériel
et nous avons reçu les pièces additionnelles ce matin à Roubaix, au lieu de Paris …
Une équipe est partie sur Paris pour réaliser l'intervention dans l'après-midi.

Toutes nos excuses pour cette deuxième panne consécutive, nous mettons tout en œuvre
conjointement avec Cirpack pour améliorer la stabilité de notre système.

Date: 2012-05-11 10:34:04 UTC
Tous les postes MGCP se sont reconnectés.

Date: 2012-05-11 10:24:46 UTC
Tous les SIP se sont reconnecté correctement. Seul des postes MGCP n'arrivent pas encore à se reconnecter à l'équipement. Nous travaillons à leur remise en service rapide.

Date: 2012-05-11 09:47:18 UTC
L'équipement secondaire a pris le relai et réinitialise les connexions SIP.
Posted May 11, 2012 - 09:32 UTC
This incident affected: VoIP || Core Network.