Auteur Sujet: Incident voix Orange du 14/15 mai: L'élément déclencheur est un bug de QFabric ?  (Lu 37078 fois)

0 Membres et 1 Invité sur ce sujet

eruditus

  • Client Orange adsl
  • Modérateur
  • *
  • Messages: 11 015

ezivoco_163

  • Abonné Orange Fibre
  • *
  • Messages: 823
  • Toulouse (31)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #25 le: 16 mai 2018 à 17:58:57 »
Si je comprends bien, le seul qui connait le fin mot de l'histoire c'est ce "David Roy".

Vachement rassurant pour une aussi grosse boite qu'une seule personne soit au courant du pb réel...

thibault64

  • Expert
  • Abonné Bbox fibre
  • *
  • Messages: 363
  • FTTH 1Gbps/700Mbps - Albi (81)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #26 le: 16 mai 2018 à 18:04:48 »
Vachement rassurant pour une aussi grosse boite qu'une seule personne soit au courant du pb réel...
On a jamais dit ça. On dit juste que lui est relativement crédible du fait de son poste. Après, de chez Orange, il n'y a que lui qui s'est exprimé publiquement sur Twitter à ma connaissance donc bon..
Et puis vu le bordel généré, ils ont pas spécialement envie de gueuler les détails sur tous les toits non plus ;)

turold

  • Profil non complété
  • ******
  • Messages: 1 683
  • mp fermée (sauf admin et exceptions temporaires)
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #27 le: 16 mai 2018 à 18:45:34 »
D'accord mais Source: un ami très bien informé chez Orange   ou  J'ai des sources internes concordantes

c'est digne de propos de comptoir d'autant qu'une personne relativement crédible du fait de son poste infirme  ;)
Tu n'auras pourtant RIEN d'autres.
Si un gars qui y travaille le met en publique, et qu'on remonte jusqu'à lui en interne, cela va très mal se passer pour lui sans autorisation d'en parler publiquement...
Il y a un NDA (accord de non divulgation en français), ou équivalent (secret professionnel par exemple).
C'est bien la cause du bordel. Par contre la réaction en chaine, c'est autre chose, et pas le droit d'en parler :)
Donc dans ce genre de cas, que 2 possibilités:
- ce qui semble être la tendance dans ce sujet, on prend la chose comme vraie, mais en se doutant que ce n'est qu'une partie de la vérité. Tant pis pour des sources facilement interrogeables.
- ou comme NextInpact par exemple, on se contente de "cause inconnue", en espérant qu'il y ai un jour un communique officielle, publique et détaillée dessus. Mais c'est sans garantie que cela arrive.

vivien

  • Administrateur
  • *
  • Messages: 47 076
    • Twitter LaFibre.info
On saura la vérité.

Sur un incident aussi grave, qui a impacté des milliers de sociétés, Orange va communiquer, mais il faut laisser le temps de vérifier les choses avant de faire un rapport publique.

En 2012 on avait eu le droit à une explication détaillée :

Voici les explications de Stéphane Richard sur la panne de vendredi. Ceci est tiré de son audition devant la commission économique du parlement.

"D'où vient la panne ?

Tout d'abord, pour le patron d'Orange, « la réactivité technique de l'entreprise face au problème n'est pas critiquable ». L'opérateur, du fait du caractère nouveau et imprévisible de la panne et de la cause, ne pouvait résoudre plus rapidement l'incident a estimé Stéphane Richard.

La cause de la panne est bien d'origine logicielle a rapidement confirmé le PDG. Elle a affecté l'un des éléments principaux du réseau mobile, à savoir le coeur du réseau (le coeur du système), qui gère tous les abonnés, notamment leur localisation a t-il expliqué. Les autres opérateurs, dont Free Mobile, ne sont donc en rien responsables de la panne.
 
Techniquement, Orange dispose d'un HLR (Home Location Register) comprenant 27 machines. Plus précisèment, il y a deux types de machines : 6 machines dédiées à la base de données (back end), chacune d'entre elles étant triplée afin d'assurer le bon fonctionnement du réseau en cas de panne, soit 18 machines en tout. Enfin, il y a le "front end" comprenant 9 machines et qui n'est pas ici concerné par la panne.
 
Alcatel-Lucent est le fournisseur de ce HLR. Il s'agit d'un produit de dernière génération, mis en place en mai dernier a tenu à préciser Richard. Le matériel n'était donc pas obsolète. Néanmoins, une mise à jour du HLR a été réalisée 48h avant la panne. Il est ainsi fort probable que cette mise à jour soit la cause de ladite panne estime Stéphane Richard.
 
Et selon ce dernier, l'anomalie qui a été créée par cette mise à jour n'a créé aucune alerte. Peut-être s'agit-il d'un défaut de conception ou d'une défaillance humaine, le patron d'Orange n'en a aucune idée pour le moment. Le triplement des machines du back-end n'a donc pas servi puisque l'alerte automatique n'a pas été donnée."


Source: www.pcinpact.com


Enfin voici une vidéo explicative d'Orange :



Hugues

  • AS2027 MilkyWan
  • Modérateur
  • *
  • Messages: 12 423
  • Lyon (69) / St-Bernard (01)
    • Twitter
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #29 le: 16 mai 2018 à 19:23:11 »
D'accord mais Source: un ami très bien informé chez Orange   ou  J'ai des sources internes concordantes

c'est digne de propos de comptoir d'autant qu'une personne relativement crédible du fait de son poste infirme  ;)

Super, un truc intéressant a ajouter ? J'vais pas balancer les noms des gens qui me filent des infos. A chacun de juger de ma crédibilité, mais si ça t'amuse, pense ce que tu veux.

Hugues

  • AS2027 MilkyWan
  • Modérateur
  • *
  • Messages: 12 423
  • Lyon (69) / St-Bernard (01)
    • Twitter
Incident voix Orange du 14 et 15 mai: bug entre 2 switchs Juniper
« Réponse #30 le: 16 mai 2018 à 19:24:24 »
Tu n'auras pourtant RIEN d'autres.
Si un gars qui y travaille le met en publique, et qu'on remonte jusqu'à lui en interne, cela va très mal se passer pour lui sans autorisation d'en parler publiquement...
Il y a un NDA (accord de non divulgation en français), ou équivalent (secret professionnel par exemple).Donc dans ce genre de cas, que 2 possibilités:
- ce qui semble être la tendance dans ce sujet, on prend la chose comme vraie, mais en se doutant que ce n'est qu'une partie de la vérité. Tant pis pour des sources facilement interrogeables.
- ou comme NextInpact par exemple, on se contente de "cause inconnue", en espérant qu'il y ai un jour un communique officielle, publique et détaillée dessus. Mais c'est sans garantie que cela arrive.

C'est ça, moi j'ai pas tous les éléments, j'en ai quelques uns, pour le reste, étant client transit voix Orange, j'aurais le RFO quand il sortira :)

Nh3xus

  • Réseau Deux Sarres (57)
  • Abonné MilkyWan
  • *
  • Messages: 3 247
  • Sarrebourg (57)
Après, il faut voir quel genre de switch s'est emballé.

En switch de cœur, Orange utilise pas mal de Juniper EX8200, mais je doute que le soucis vienne de ce genre d'équipement.

Je penche plutôt pour un incident sur la QFabric de Juniper qu'Orange utilise également.

Elle est très sensible aux upgrades...


BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Je verrai bien un bug sur un LAG inter-chassis avec 1 serveur/service un peu critique : re-ordering de paquets à cause d'une (mauvaise) répartition de trafic entre les liens, lien inter-switch qui flappe/déconne (joli bug sur N7K en NX-OS  < 6.2.10 qui boucle s'il voit une @MAC à 0) ou simplement un LACP qui a décidé de stopper les négotiations pour avoir des frittes à la cantine.

Ca c'est pour le L2, en couche L3 on doit pouvoir faire un combo par-dessus, au choix: routage asymétrique, trafic blackholé par la couche L3 qui a raté sa résolution ARP à cause du bug en L2, un ASIC qui a ses tables pleines, etc.

Dans tous les cas, 3 jours pour trouver ce genre de problème ça me parait énorme et je pense que ce David Roy doit être le plus proche de la réalité: la VoIP s'est mise en vrac. Avec ou sans l'aide de Juniper.


turold

  • Profil non complété
  • ******
  • Messages: 1 683
  • mp fermée (sauf admin et exceptions temporaires)
Pour revenir au sujet, si on ne croit en rien dans ce sujet, le mieux est d'attendre une éventuelle info officielle.
On saura la vérité.

Sur un incident aussi grave, qui a impacté des milliers de sociétés, Orange va communiquer, mais il faut laisser le temps de vérifier les choses avant de faire un rapport publique.

En 2012 on avait eu le droit à une explication détaillée
Mouais, il a fallu attendre une commission pour cela.
On verra dans les prochains jours ou semaines.
S'il n'y a rien dans les tout prochains mois, je considère que ce sera mort.^^

vivien

  • Administrateur
  • *
  • Messages: 47 076
    • Twitter LaFibre.info
Note: J'ai du modérer quelques attaques personnelles entre deux membres du forum