Auteur Sujet: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...  (Lu 6717 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 302
    • Twitter LaFibre.info
Désolé,

Un petit problème technique a coupé les services de notre hébergeur aujourd'hui de 18h00 à 21h30.

Cela redémarre mais il y a des lenteurs réseaux.

Tout devrait rentrer dans l'ordre dans les prochaines minutes.

Vivien.

corrector

  • Invité
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #1 le: 26 août 2011 à 22:13:39 »
10    23 ms    23 ms    23 ms  th2-crs16-1-be1000.intf.routers.proxad.net [212.27.57.202]
11    23 ms    22 ms    25 ms  free-pni2.xe3-0-0.th2.par.as8218.eu [212.27.40.82]
12    23 ms    22 ms    21 ms  83.167.55.23
13    33 ms    29 ms    29 ms  xe0-0-0.tcr1.sfr.lyn.as8218.eu [83.167.63.149]
14    30 ms    30 ms    29 ms  adeli.gw.tcr1.sfr.lyn.neotelecoms.com [83.167.52.94]
15     *        *        *     Délai d'attente de la demande dépassé.
16     *        *        *     Délai d'attente de la demande dépassé.
17     *        *        *     Délai d'attente de la demande dépassé.
18     *        *        *     Délai d'attente de la demande dépassé.
19     *        *        *     Délai d'attente de la demande dépassé.
20     *        *        *     Délai d'attente de la demande dépassé.
21     *      118 ms   113 ms  195.200.217.68


Envoi d'une requête 'ping' sur lafibre.info [195.200.217.68] avec 32 octets de données :

Délai d'attente de la demande dépassé.
Réponse de 195.200.217.68 : octets=32 temps=696 ms TTL=49
Délai d'attente de la demande dépassé.
Réponse de 195.200.217.68 : octets=32 temps=658 ms TTL=49

Statistiques Ping pour 195.200.217.68:
    Paquets : envoyés = 4, reçus = 2, perdus = 2 (perte 50%),
Durée approximative des boucles en millisecondes :
    Minimum = 658ms, Maximum = 696ms, Moyenne = 677ms

JulFX

  • Expert.
  • Abonné Free adsl
  • *
  • Messages: 188
  • Fibre 300 Mbps
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #2 le: 26 août 2011 à 22:15:14 »
Coupure électrique suite aux orages?


vivien

  • Administrateur
  • *
  • Messages: 47 302
    • Twitter LaFibre.info
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #3 le: 26 août 2011 à 22:23:59 »
Je confirme une coupure électrique de courte durée à 18h00.
Les problèmes ont ensuite été réseau.

On parle sans doute du même data-center, le MaxNod situé près de Lyon.


Nico

  • Modérateur
  • *
  • Messages: 44 505
  • FTTH 1000/500 sur Paris 15ème (75)
    • @_GaLaK_
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #4 le: 26 août 2011 à 22:36:13 »
Tout à fait on avait notre site (et Nitroserv leurs serveurs) chez Maxnod aussi. Le tracert étant le même (et comme t'avais parlé de Lyon, Adeli et Azylog) j'en ai déduis que t'étais aussi chez eux.

Je voyais le réseau qui n'arrivait pas à remonter (on arrivait à pinger *.maxnod.com de temps en temps seulement).

vivien

  • Administrateur
  • *
  • Messages: 47 302
    • Twitter LaFibre.info
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #5 le: 26 août 2011 à 23:06:26 »
Voici la charge du serveur. On voit bien que la panne électrique a été de courte durée :


Voici la vue réseau, depuis Paris :

vivien

  • Administrateur
  • *
  • Messages: 47 302
    • Twitter LaFibre.info
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #6 le: 26 août 2011 à 23:23:12 »
Nico, je te confirme que http://www.somua.com/ est bien sur le MaxNod, voici le traceroute depuis lafibre.info :
# traceroute-nanog -A somua.com
traceroute to somua.com (109.239.145.243), 30 hops max, 60 byte packets
 1  195.200.217.253 (195.200.217.253) [AS41405]  0.902 ms  0.896 ms  0.956 ms
 2  porte.adeli.biz (91.194.96.2) [AS43142]  0.959 ms  0.877 ms  0.950 ms
 3  nitroserv.maxnod.com (91.194.96.127) [AS43142]  0.960 ms  0.921 ms  0.954 ms
 4  109.239.145.243 (109.239.145.243) [AS43142]  1.960 ms  1.904 ms  1.954 ms

Tu seras intéressé par les résultats du PingTest mis en place sur mon serveur... SFR, le seul FAI a peerer avec Adeli sur Lyon va gagner je pense.

Le serveur est directement sur [AS43142] alors que mon hébergeur Azylog a sa propre AS (AS41405) ce qui permet de changer d'opérateur en gardant les IP (Avant AZYLOG était sur un datacenter de Dijon relié à Internet uniquement par Cogent...). Le déménagement s'est fait en gardant les IP. Appréciable.

azylog

  • Invité
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #7 le: 27 août 2011 à 00:11:03 »
Alors je vais pouvoir me fendre de ma petite réponse :
C'est un incident 'à la con'. Les onduleurs de datacenter, c'est une machinerie assez complexe et tout en bout de la chaîne électrique. Tellement complexes d'ailleurs qu'ils embarquent tout un soft de gestion (firmware) et c'est la mise à jour de ce firmware qui a foiré.
Pour une raison qu'il va falloir reproduire (pas moi hein, les p'tits gars de Maxnod), les deux premiers onduleurs ont été mis à jour sans soucis et le 3ème à planter en entraînant les deux autres (je n'ai pas de détail exact là dessus, on verra demain).
Ca a créé une micro-coupure (quelques millisecondes) suffisant pour faire rebooter un maximum de monde dans le data.
Jusque là, rien de méchant, c'est juste dommage pour l'uptime, tout reboote et reprend la main. Ca c'est la théorie.

Dans la pratique, il y a toujours des vérifs de disques qui se passent mal, des secteurs de boot plus à jour, etc ...
Mais chez nous, on a eu un bonus : un problème de conf sur un routeur a fait que le trafic a été blacklisté (oui, tout) et le défaut n'a pas été assez franc pour faire jouer la redondance.
Avec le techos de Maxnod, nous n'avons pas pu faire repartir le routage ce qui m'a valu de me déplacer pour reconfigurer cette saleté. Au passage, j'ai mis en place la contre-mesure pour que ça n'arrive plus à la prochaine coupure de courant (hum). Du coup, la remise en route a prit un peu de temps mais c'est réglé définitivement (mais comme dirait Murphy, le problème ne ce serait jamais reproduit de toute façon).

Voilà un peu plus de détail sur l'épisode certes pas très agréable mais faisant partie des aléas de cet agglomération de technologie qu'est le net.

Julien Escario

Nico

  • Modérateur
  • *
  • Messages: 44 505
  • FTTH 1000/500 sur Paris 15ème (75)
    • @_GaLaK_
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #8 le: 27 août 2011 à 00:17:47 »
Merci beaucoup pour les précisions/explications !

azylog

  • Invité
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #9 le: 27 août 2011 à 00:18:10 »
Je vais rajouter en vitesse que dans l'histoire on s'en sort bien puisque sans casse de matériel.
J'y pense en voyant les techniciens dans le datacenter qui sont encore en train de se battre avec des RAID cassés (et ça, ce n'est vraiment pas agréable ...).

Julien

vivien

  • Administrateur
  • *
  • Messages: 47 302
    • Twitter LaFibre.info
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #10 le: 27 août 2011 à 08:42:20 »
Merci Julien pour tout !

Voici le graphe SmokePing depuis Paris pour montrer que la latence est revenu à la normale :

Mieszko

  • Expert.
  • Abonné Bbox fibre
  • *
  • Messages: 244
  • Wambrechies 59
Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
« Réponse #11 le: 27 août 2011 à 08:56:54 »
Je vais rajouter en vitesse que dans l'histoire on s'en sort bien puisque sans casse de matériel.
J'y pense en voyant les techniciens dans le datacenter qui sont encore en train de se battre avec des RAID cassés (et ça, ce n'est vraiment pas agréable ...).

Julien
Les joies d'etre technicien (en astreinte ou non) et devoir bosser apres un incident electrique dans les datacenters.
Par moment, il y a de grands moments de solitude.
Ca m'est d'ailleurs arrive pas plus tard que dimanche dernier.