OVHcloud Network Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
th2-1-6k carte 7
Incident Report for Network & Infrastructure
Resolved
A 15h, nous voyons que le trafic est perturbé. Visiblement c'est dû
au trafic qui passe par th2-1-6k. Rien dans les logs.

Dans les logs de toute l'infra on voit un probleme sur p19-2 sur
l'utilisation de CPU. Aussi à 15h03.
%SYS-DFC5-3-CPUHOG: Task is running for (2000)msecs, more than (2000)msecs (16/12),process = FIB Control Queue Task.
Quel est le point commun entre p19-2 et th2-1 ? La session BGP saute.0

Peut -etre le probleme d'access-list ? http://travaux.ovh.com/?do=details&id=2662
On a enlevé toutes les access-list de tous les ports. Probleme continue.

Le CPU est bouffé par le process BGP Scanner. Pourquoi ? On coupe les
sessions BGP qui ont flappé. Toujours pareil. Le trafic passant par Neuf
connait un probleme à cause de la session BGP qui saute. On coupe la session
BGP avec Neuf. Le probleme continue. Mais le peering Ipv6 avec Free
est revenu. Hmmm ... on coupe le peering avec Free sur th2. Le CPU
respire. Quel est le point commun entre Neuf et Free sur th2 ? Le
port 10G de Neuf et l'un des ports 10G de Free sont sur la même carte.
Aussi un port avec p19-2 et gsw-2. Allez, on reboote la carte 10G. Elle
revient et on reactive le peering avec Free et Neuf. Le probleme est
resolu.

grrrr ... et si les routeurs pouvaient dire ce qui ne va pas ?

Désolé pour la durée de la resolution du probleme. Ca nous a pris du
temps pour savoir quel est l'origine du probleme exactement.
Posted Jan 24, 2009 - 17:13 UTC