OVHcloud Network Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
vss-2-6k
Incident Report for Network & Infrastructure
Resolved
Nous avons des problèmes de charge CPU sur ce routeur. Le routage IPv6 est pour l'instant interrompu.

Update(s):

Date: 2010-03-16 09:40:30 UTC
Suites aux différentes mesures prises, nous sommes revenu dans un fonctionnement stable.

Date: 2010-03-09 18:48:20 UTC
C'était l'origine de certain pic en CPU.

On vient de virer l'IPv6 de vss-2 et on regarde.
Le routage IPv6 sera fera sur un autre routeur
pour ces clients là (2 routeurs au prix de 2 routeurs
pour faire le boulot d'1 routeur, bien bien).

Date: 2010-03-09 14:20:46 UTC
L'origine du probleme est ici
http://travaux.ovh.com/?do=details&id=3977

Date: 2010-03-08 13:49:50 UTC
on coupe BGP d'IPv6

Date: 2010-03-07 18:13:15 UTC
On a ajouté de filtres au niveau du BGP entre les routeurs sur
Roubaix afin de recuperer du CPU. Ca va mieux.

Les annonces de Bruxelles arrivent sur rbx-99 et se propagent
uniquement sur le vss-1 et vss-2. Pas plus. Et donc le reste
des packets passent par amsterdam.

Ca sera fixer avec la mise en place d'une infra de switching
interne à Roubaix ce qui nous permettra de monter les sessions
BGP entre toutes les routeurs avec les filtres.

Puis une fois qu'on aura reçu les 2 Nexus 7000, on mettra en
place 2 routes reflector pour tout le reseau de Roubaix ce
qui permettra de diminuer le nombre de sessions BGP entre
les routeurs et donc le CPU utilisé pour le BGP.

Puis il restera à fixer le CPU pris par les process ARP qui
est provoqué par les services IP failover et IP failover + MAC
virtuelle. Pour l'instant c'est stable mais il se peut qu'on
soit obligé de mettre en place 2 routeurs rien que pour ce
service là totalement independant de tout le reste du routage.
La reponse: sur les 2-3 semaines on va voir si le CPU pris
par ce process monte ou reste stable.

Date: 2010-03-07 16:20:43 UTC
depuis 3 jours nous avons un probleme \"assez bizarre\" qui n'impacte pas
les clients mais on sait jamais. entre 12h36 et 13h36 le routeur vss-2
est surchargé au niveau du CPU et tous les tasks software ont du mal
à se faire: par exemple repondre aux ping

Aujourd'hui nous avons rechangé la configuration BGP pour diminuer le
temps d'execution de process et liberer du CPU libre. On va voir demain.

Pendant ces opérations il y avait une petite coupure de 5 minutes au
niveau de certaines destinations vers les serveurs vss-2 (dû à la
la reconfiguration du BGP sur le routeur et le temps de timeout).

Date: 2010-03-05 13:22:38 UTC
Le routage IPv6 est rétabli.
Posted Mar 05, 2010 - 12:10 UTC