Auteur Sujet: Incident voix Orange du 14/15 mai: L'élément déclencheur est un bug de QFabric ?  (Lu 11227 fois)

0 Membres et 1 Invité sur ce sujet

kgersen

  • Client Bouygues FTTH
  • Modérateur
  • *
  • Messages: 5 302
  • FTTH 1Gb/s sur Paris (75)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #24 le: 16 mai 2018 à 17:40:38 »
Comme dit Hugues, il y a surtout eu une réaction en chaine apparemment ;D

oui ca fait plus de sens. mais quand meme ouch quoi.

turold

  • La fibre idéal
  • ******
  • Messages: 1 655
  • essai: mp réouverts, sauf à mes ignorés (15)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #25 le: 16 mai 2018 à 17:51:50 »
Avec 3 routeurs mal paramétrés, interconnectés entre eux en triangle, et mis en cœur de réseau, je réussi à faire tomber tout un réseau local.
Pour que 2 switchs seulement face de même, j'ai du mal à voir ce qui peut provoquer ceci. Même si ce sont des switchs paramétrables, il en faut minimum 3, théoriquement, et avec les autres prérequis ci-dessus pour faire tomber tout un réseau.

Mais bon, il y a l'air d'y avoir un NDA sur cette histoire/affaire/panne.
Donc je pari qu'on n'aura jamais publiquement les détails.

Par contre, est-ce que l'ANSSI a ou aura toutes les infos? Il 'agit tout de même de la majorité des appels IP de France. C'est central en "sécurité numérique nationale".

eruditus

  • Client Orange adsl
  • Modérateur
  • *
  • Messages: 9 074
  • Montfort-l'Amaury (78)

ezivoco_163

  • Client Orange Fibre
  • *
  • Messages: 336
  • Toulouse (31)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #27 le: 16 mai 2018 à 17:58:57 »
Si je comprends bien, le seul qui connait le fin mot de l'histoire c'est ce "David Roy".

Vachement rassurant pour une aussi grosse boite qu'une seule personne soit au courant du pb réel...

thibault64

  • Expert
  • Client Bbox fibre FTTH
  • *
  • Messages: 198
  • FTTH 1000/250 - Albi (81)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #28 le: 16 mai 2018 à 18:04:48 »
Vachement rassurant pour une aussi grosse boite qu'une seule personne soit au courant du pb réel...
On a jamais dit ça. On dit juste que lui est relativement crédible du fait de son poste. Après, de chez Orange, il n'y a que lui qui s'est exprimé publiquement sur Twitter à ma connaissance donc bon..
Et puis vu le bordel généré, ils ont pas spécialement envie de gueuler les détails sur tous les toits non plus ;)

Delta22

  • Client SFR adsl
  • *
  • Messages: 23
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #29 le: 16 mai 2018 à 18:31:06 »
Sur ce genre d'incident, ce sont à minima des dizaines de personnes qui savent. Entre les équipes de l'opérateur et les équipes supports des équipements tiers, cela en fait du monde.

D'accord mais Source: un ami très bien informé chez Orange   ou  J'ai des sources internes concordantes

c'est digne de propos de comptoir d'autant qu'une personne relativement crédible du fait de son poste infirme  ;)

turold

  • La fibre idéal
  • ******
  • Messages: 1 655
  • essai: mp réouverts, sauf à mes ignorés (15)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #30 le: 16 mai 2018 à 18:45:34 »
D'accord mais Source: un ami très bien informé chez Orange   ou  J'ai des sources internes concordantes

c'est digne de propos de comptoir d'autant qu'une personne relativement crédible du fait de son poste infirme  ;)
Tu n'auras pourtant RIEN d'autres.
Si un gars qui y travaille le met en publique, et qu'on remonte jusqu'à lui en interne, cela va très mal se passer pour lui sans autorisation d'en parler publiquement...
Il y a un NDA (accord de non divulgation en français), ou équivalent (secret professionnel par exemple).
C'est bien la cause du bordel. Par contre la réaction en chaine, c'est autre chose, et pas le droit d'en parler :)
Donc dans ce genre de cas, que 2 possibilités:
- ce qui semble être la tendance dans ce sujet, on prend la chose comme vraie, mais en se doutant que ce n'est qu'une partie de la vérité. Tant pis pour des sources facilement interrogeables.
- ou comme NextInpact par exemple, on se contente de "cause inconnue", en espérant qu'il y ai un jour un communique officielle, publique et détaillée dessus. Mais c'est sans garantie que cela arrive.

vivien

  • Administrateur
  • *
  • Messages: 29 332
    • Twitter LaFibre.info
On saura la vérité.

Sur un incident aussi grave, qui a impacté des milliers de sociétés, Orange va communiquer, mais il faut laisser le temps de vérifier les choses avant de faire un rapport publique.

En 2012 on avait eu le droit à une explication détaillée :

Voici les explications de Stéphane Richard sur la panne de vendredi. Ceci est tiré de son audition devant la commission économique du parlement.

"D'où vient la panne ?

Tout d'abord, pour le patron d'Orange, « la réactivité technique de l'entreprise face au problème n'est pas critiquable ». L'opérateur, du fait du caractère nouveau et imprévisible de la panne et de la cause, ne pouvait résoudre plus rapidement l'incident a estimé Stéphane Richard.

La cause de la panne est bien d'origine logicielle a rapidement confirmé le PDG. Elle a affecté l'un des élèments principaux du réseau mobile, à savoir le coeur du réseau (le coeur du système), qui gère tous les abonnés, notamment leur localisation a t-il expliqué. Les autres opérateurs, dont Free Mobile, ne sont donc en rien responsables de la panne.
 
Techniquement, Orange dispose d'un HLR (Home Location Register) comprenant 27 machines. Plus précisèment, il y a deux types de machines : 6 machines dédiées à la base de données (back end), chacune d'entre elles étant triplée afin d'assurer le bon fonctionnement du réseau en cas de panne, soit 18 machines en tout. Enfin, il y a le "front end" comprenant 9 machines et qui n'est pas ici concerné par la panne.
 
Alcatel-Lucent est le fournisseur de ce HLR. Il s'agit d'un produit de dernière génération, mis en place en mai dernier a tenu à préciser Richard. Le matériel n'était donc pas obsolète. Néanmoins, une mise à jour du HLR a été réalisée 48h avant la panne. Il est ainsi fort probable que cette mise à jour soit la cause de ladite panne estime Stéphane Richard.
 
Et selon ce dernier, l'anomalie qui a été créée par cette mise à jour n'a créé aucune alerte. Peut-être s'agit-il d'un défaut de conception ou d'une défaillance humaine, le patron d'Orange n'en a aucune idée pour le moment. Le triplement des machines du back-end n'a donc pas servi puisque l'alerte automatique n'a pas été donnée."


Source: www.pcinpact.com


Enfin voici une vidéo explicative d'Orange :



Hugues

  • AS57199 MilkyWan
  • Expert
  • *
  • Messages: 6 323
  • Lyon & Paris
    • MilkyWan
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #32 le: 16 mai 2018 à 19:23:11 »
D'accord mais Source: un ami très bien informé chez Orange   ou  J'ai des sources internes concordantes

c'est digne de propos de comptoir d'autant qu'une personne relativement crédible du fait de son poste infirme  ;)

Super, un truc intéressant a ajouter ? J'vais pas balancer les noms des gens qui me filent des infos. A chacun de juger de ma crédibilité, mais si ça t'amuse, pense ce que tu veux.

Hugues

  • AS57199 MilkyWan
  • Expert
  • *
  • Messages: 6 323
  • Lyon & Paris
    • MilkyWan
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #33 le: 16 mai 2018 à 19:24:24 »
Tu n'auras pourtant RIEN d'autres.
Si un gars qui y travaille le met en publique, et qu'on remonte jusqu'à lui en interne, cela va très mal se passer pour lui sans autorisation d'en parler publiquement...
Il y a un NDA (accord de non divulgation en français), ou équivalent (secret professionnel par exemple).Donc dans ce genre de cas, que 2 possibilités:
- ce qui semble être la tendance dans ce sujet, on prend la chose comme vraie, mais en se doutant que ce n'est qu'une partie de la vérité. Tant pis pour des sources facilement interrogeables.
- ou comme NextInpact par exemple, on se contente de "cause inconnue", en espérant qu'il y ai un jour un communique officielle, publique et détaillée dessus. Mais c'est sans garantie que cela arrive.

C'est ça, moi j'ai pas tous les élèments, j'en ai quelques uns, pour le reste, étant client transit voix Orange, j'aurais le RFO quand il sortira :)

Nh3xus

  • Réseau Deux Sarres (57)
  • Client K-Net
  • *
  • Messages: 2 119
  • Sarrebourg (57)
Après, il faut voir quel genre de switch s'est emballé.

En switch de cœur, Orange utilise pas mal de Juniper EX8200, mais je doute que le soucis vienne de ce genre d'équipement.

Je penche plutôt pour un incident sur la QFabric de Juniper qu'Orange utilise également.

Elle est très sensible aux upgrades...


BadMax

  • Client Free adsl
  • Modérateur
  • *
  • Messages: 3 327
  • Malissard (26)
Je verrai bien un bug sur un LAG inter-chassis avec 1 serveur/service un peu critique : re-ordering de paquets à cause d'une (mauvaise) répartition de trafic entre les liens, lien inter-switch qui flappe/déconne (joli bug sur N7K en NX-OS  < 6.2.10 qui boucle s'il voit une @MAC à 0) ou simplement un LACP qui a décidé de stopper les négotiations pour avoir des frittes à la cantine.

Ca c'est pour le L2, en couche L3 on doit pouvoir faire un combo par-dessus, au choix: routage asymétrique, trafic blackholé par la couche L3 qui a raté sa résolution ARP à cause du bug en L2, un ASIC qui a ses tables pleines, etc.

Dans tous les cas, 3 jours pour trouver ce genre de problème ça me parait énorme et je pense que ce David Roy doit être le plus proche de la réalité: la VoIP s'est mise en vrac. Avec ou sans l'aide de Juniper.

 

Mobile View