Get webhook notifications whenever Network & Infrastructure creates an incident, updates an incident, resolves an incident or changes a component status.
Le couple de n5 gérant ces 2 réseaux ont crashés.
%SYSMGR-2-HAP_FAILURE_SUP_RESET: System reset due to service \"eth_port_sec\" in vdc 1 has had a hap failure
Il viennent de finir le reboot à l'instant, les fex remontent
Nous investiguons
Update(s):
Date: 2014-10-15 11:52:18 UTC Conf okay sur les port, un shut/no shut a résolu le probleme pour les derniers serveurs.
Tout est de nouveau opérationnel pour 192.95.32.0/24 et 192.95.33.0/24
Date: 2014-10-15 11:32:44 UTC Tous les FEX sont de nouveau UP.
Il reste 8 serveurs partiellement non joignable, je regarde
Date: 2014-10-15 11:18:12 UTC les Fex reviennent peu à peu
Date: 2014-10-15 11:01:05 UTC La situation:
On est dans un état dégradé mais stable, seul les serveurs sur le fex 102 (baie T01C52) sont impactés.
les autre serveur sur les autre fex sont toujours joignable.
Nous avons eu un bug (en plus du bug port-security) lors de l'upgrade ISSU, qui a bloque le FEX 102 et la VPC
Eth1/31 vPC nodUpgrad trunk full 10G SFP-H10GB-C
Eth1/32 vPC nodUpgrad trunk full 10G SFP-H10GB-C
=> Ethernet1/32 is down (LC upgrade in progress)
actions en cours:
Nous allons mettre a jour le 2nd n5 puis reloader le 1er n5.
Les fex 100 et 101 vont basculer automatiquement sur le 2eme n5 car ils sont déjà à jour.
les fex103->111 vont reloader et cela rendra les serveur injoignable le temps du reboot du FEX.
Date: 2014-10-15 10:33:32 UTC 0% -- FAIL. Return code -1.
Remaining action::
\"Module(s) 103, 104, 105, 106, 107, 108, 109, 111 still need to be upgraded\".
Install has failed. Return code 0x40930020 (Non-disruptive upgrade of a module failed).
Please identify the cause of the failure, and try 'install all' again.
l'ISSU a planté sur le fex 102
et le 2nd n5 vient de crasher de nouveau (même erreur)
Date: 2014-10-15 09:55:55 UTC show install all status
There is an on-going installation...
Enter Ctrl-C to go back to the prompt.
Continuing with installation process, please wait.
The login will be disabled until the installation is completed.
Performing supervisor state verification.
SUCCESS
Supervisor non-disruptive upgrade successful.
Pre-loading modules.
les FEX sont en train de se mettre à jours
Date: 2014-10-15 09:43:04 UTC Compatibility check is done:
Module bootable Impact Install-type Reason
------ -------- -------------- ------------ ------
1 yes non-disruptive reset
3 yes non-disruptive rolling
100 yes non-disruptive rolling
101 yes non-disruptive rolling
102 yes non-disruptive rolling
103 yes non-disruptive rolling
104 yes non-disruptive rolling
105 yes non-disruptive rolling
106 yes non-disruptive rolling
107 yes non-disruptive rolling
108 yes non-disruptive rolling
109 yes non-disruptive rolling
111 yes non-disruptive rolling