rssLink RSS for all categories
 
icon_red
icon_green
icon_green
icon_red
icon_red
icon_green
icon_green
icon_red
icon_red
icon_red
icon_green
icon_green
icon_green
icon_orange
icon_green
icon_orange
icon_green
icon_blue
icon_red
icon_orange
icon_green
icon_orange
icon_green
icon_red
icon_orange
icon_green
icon_green
icon_green
icon_green
icon_green
icon_blue
icon_green
icon_red
 

FS#5393 — th2-1-6k

Attached to Project— Network and racks
Incident
Entire OVH Network
CLOSED
100%
Le routeur est offline. Nous recherchons l'origine du problème.
Date:  Tuesday, 03 May 2011, 02:13AM
Reason for closing:  Done
Comment by OVH - Saturday, 30 April 2011, 12:30PM

le routeur a redémarré:
System returned to ROM by s/w reset at 11:14:23 GMT Sat Apr 30 2011 (SP by bus error at PC 0x402DF924, address 0x0)


Comment by OVH - Saturday, 30 April 2011, 12:35PM

Le routeur est pour l'instant revenu dans un état stable. Le trafic vers free, sfr, numericable, google, sfinx ont notamment été impactés le temps que le routage bgp bascule. Les clients DSL sur le LNS de Paris et les clients chtix à th2 ont été coupé le temps que le routeur était offline.
Nous allons maintenant analyser les causes du crash.


Comment by OVH - Saturday, 30 April 2011, 13:26PM

TLB Modification exception, CPU signal 10, PC = 0x409A2F74^M
^M
^M
-Traceback= 409A2F74 409A30DC 409A3AA4 40461024 4105EAE4 4046F49C 41046754 41046740 ^M
$0 : 00000000, AT : 44AF0000, v0 : 409A3F1C, v1 : 409A30B4^M
a0 : 63FE2490, a1 : 6621D5A0, a2 : 407B88F0, a3 : 534DEB78^M
t0 : 6621D500, t1 : 45451260, t2 : 00000001, t3 : FFFF00FF^M
t4 : 41D7E978, t5 : 000098A9, t6 : 00000000, t7 : 00000000^M
s0 : 63FE2490, s1 : 456A900C, s2 : B2204CCD, s3 : 51911E90^M
s4 : FFFFFFFF, s5 : 50026A30, s6 : 00000001, s7 : 00000000^M
t8 : 41D7C15C, t9 : 4106AC70, k0 : 5A7EB5B0, k1 : 41D84D00^M
gp : 431011F0, sp : 61B59AF8, s8 : 00000000, ra : 409A30DC^M
EPC : 409A2F74, ErrorEPC : BFFFA454, SREG : 3400FF03^M
MDLO : 00000000, MDHI : 00000000, BadVaddr : 409A30BC^M
DATA_START : 0x42DDFAF0^M
Cause 00000004 (Code 0x1): TLB Modification exception^M


Comment by OVH - Saturday, 30 April 2011, 13:36PM

Suite au crash, les données affichées sur weathermap concernant th2 sont erronées bien que le trafic s'écoule normalement. Nous allons remettre à jour le schéma.


Comment by OVH - Monday, 02 May 2011, 19:23PM

Suite au redémarrage du routeur, certains clients chtix ont rencontré des problèmes de connectivité sur leur vlan. Après investiguations, nous avons finalement forcé un reset des vlans des clients concernés ce qui semble avoir fixé le problème.
Nous attendons les feedbacks pour confirmation.