OVHcloud Network Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
46.105.112.0/24
Incident Report for Network & Infrastructure
Resolved
La mise à jour ne se passe pas bien.
http://travaux.ovh.net/?do=details&id=8028

Install has failed. Return code 0x40930039 (aborting due to failed upgrade).
Please identify the cause of the failure, and try 'install all' again.


Update(s):

Date: 2013-02-11 00:22:21 UTC
tout va bien. le nouveau spare supporte
correctement le A et le B.

on pense que le premier spare a eu la procédure
de mise à jour qui s'est mal passé et du coup
il n'arrivait pas à s'allumer. on va le regarder
demain.

tout est UP.

désolé pour la panne.

Date: 2013-02-11 00:18:16 UTC
c'est UP sur le A. on va couper l'uplink B.

Date: 2013-02-11 00:17:24 UTC
tous les serveurs sont UP sur l'uplink B.

on va connecter l'uplink A

Date: 2013-02-11 00:07:14 UTC
nous avons changé le spare par un autre spare
et c'est pareil, on n'arrive pas à remonter
le service.

nous avons coupé l'uplink A, pareil
nous avons coupé l'uplink B, ça va mieux, le
FEX vient d'être détecté par le système.

on est en cours de reconnexion de tous les
serveurs EG qui sont sur 107 sur le nouveau
spare avec seulement l'uplink B. on va remettre
le service en place et après on va regarder
seulement pourquoi l'uplink A pose le problème.

Date: 2013-02-10 23:30:09 UTC
suite au remplacement par le spare, les uplinks
sont up à nouveau et le FEX se met à jour.
l'ancien a donc bien été mort. il faut compter
8 min pour la mise à jour software et 3 min de
plus pour le boot.

Date: 2013-02-10 23:12:18 UTC
On change le FEX par un spare.

Date: 2013-02-10 23:03:08 UTC
le FEX 107 est probablement mort. On le
reboot en hard et dans la foulé on prépare
le spare.

Date: 2013-02-10 23:00:19 UTC
02/10/2013 23:44:49.312663: Module register received
02/10/2013 23:44:49.313470: Image Version Mismatch
02/10/2013 23:44:49.313679: Registration response sent
02/10/2013 23:44:49.313858: Requesting satellite to download image
02/10/2013 23:50:18.23809: Image preload successful.
02/10/2013 23:50:19.149814: Deleting route to FEX
02/10/2013 23:50:19.156902: Module disconnected
02/10/2013 23:50:19.157457: Module Offline
02/10/2013 23:50:19.160406: Deleting route to FEX
02/10/2013 23:50:19.169426: Module disconnected
02/10/2013 23:50:19.170815: Offlining Module
02/10/2013 23:50:19.187956: Deleting route to FEX
02/10/2013 23:50:19.197621: Module disconnected
02/10/2013 23:50:19.199081: Offlining Module
02/10/2013 23:54:49.345669: Module timed out

Date: 2013-02-10 22:57:29 UTC
encore 1

Date: 2013-02-10 22:56:52 UTC
encore 2 FEX

Date: 2013-02-10 22:56:01 UTC
encore 3 FEX down.

Date: 2013-02-10 22:45:34 UTC
bon, on voulait faire mieux mais c'est pire.
on va faire à l'ancienne ce qui va générer
15 minutes de panne à partir de maintenant.

le A est UP et met à jour les FEX à froid.

Date: 2013-02-10 22:32:54 UTC
On retente le coup du rôle de la VPC

Date: 2013-02-10 22:16:34 UTC
Nous avons inversé le role au niveau de la VPC
pour passer primaire en secondaire et secondaire
en primaire. Ca a provoqué une coupure dans le
service.

On pense que ça nous permettra de diminuer la
durée de la panne dû à la mise à jour des FEX
Posted Feb 10, 2013 - 22:06 UTC