OVHcloud Network Status

Current status
Legend
  • Operational
  • Degraded performance
  • Partial Outage
  • Major Outage
  • Under maintenance
gra-3a-a9
Incident Report for Network & Infrastructure
Resolved
Le routeur est innaccessible, il n'y a pas d'incidence sur le trafic.
les ajout/modification d'IP FO ou de mac virtuelle sont impactés.

Update(s):

Date: 2014-09-16 17:08:24 UTC
Le trafic est remis sur gra-3a-a9.
Nous ne constatons pas de CRC!


--
La Team Network (Toujours présente pour maintenir le réseau d'OVH).

Date: 2014-09-16 16:50:34 UTC
La carte est remplacé!


Nous remettons le trafic sur gra-3a-a9.

Date: 2014-09-16 11:58:54 UTC
La mise à jour est maintenant terminé.

Suite à cette mise à jour, nous avons une carte 24*10G en erreur:
LC/0/0/CPU0:Sep 16 11:25:20.760 : prm_server_ty[300]: %PLATFORM-NP-0-INIT_ERR : Device BST memory test failure 0x80001760 on NP channel 5 external search memory, memory ID 0
LC/0/0/CPU0:Sep 16 13:30:03.874 CEST: prm_server_ty[300]: %PLATFORM-NP-0-INIT_ERR : Device BST memory test failure 0x80001760 on NP channel 5 external search memory, memory ID 0
LC/0/0/CPU0:Sep 16 13:43:36.711 CEST: prm_server_ty[300]: %PLATFORM-NP-0-INIT_ERR : Device BST memory test failure 0x80001760 on NP channel 5 external search memory, memory ID 0

Nous organisons le remplacement de cette carte.

Date: 2014-09-16 11:09:56 UTC
Le routeur est isolé. Nous le mettons à jours.

Date: 2014-09-16 10:45:45 UTC
Afin de remettre en place la redondance entre les 2 RSPs nous allons mettre a jour la RSP1 en 5.1.3.

Durant la mise a jour, le traffic passera par gra-3b-a9.

Date: 2014-09-15 20:08:32 UTC
nous avons reloader la 1ere RSP, mais elle bloque sur la conf de l'interface de mgmt (sans raison apparente).
Details
--------
Current active rmf state: 4 (I_READY)
Reason for standby not ready
162 0/RSP0/CPU0 cfgmgr-rp Management interface configuration not yet applied
Not ready set Mon Sep 15 20:57:28 2014: 10 minutes ago

Current active rmf state for NSR: Ready
All standby not-ready NSR bits clear - standby should be NSR-ready

de ce fait, on ne peut pas commit les configurations.

Nous avons déclipsé la carte du chassis pour permettre au robot de travailler.
Nous allons investiguer avec Cisco.

Le problème de session collées et le problème de conf de l'interface de mgmt ne semble pas lié.

Date: 2014-09-15 19:11:53 UTC
La limite de conn sur le routeur a été atteinte, beaucoup de session étaient \"Collées\"
Nous avons fait un switchover sur la 2nd RSP.

Nous avons de nouveau access au routeur.
Posted Sep 15, 2014 - 18:34 UTC
This incident affected: Infrastructure || GRA (GRA1, GRA2, GRA3).