La Fibre

Fonctionnement du forum => A lire avant de commencer... => profile Évolution de LaFibre.info, bugs et critiques => Discussion démarrée par: vivien le 26 août 2011 à 21:54:33

Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 26 août 2011 à 21:54:33
Désolé,

Un petit problème technique a coupé les services de notre hébergeur aujourd'hui de 18h00 à 21h30.

Cela redémarre mais il y a des lenteurs réseaux.

Tout devrait rentrer dans l'ordre dans les prochaines minutes.

Vivien.
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: le 26 août 2011 à 22:13:39
10    23 ms    23 ms    23 ms  th2-crs16-1-be1000.intf.routers.proxad.net [212.27.57.202]
11    23 ms    22 ms    25 ms  free-pni2.xe3-0-0.th2.par.as8218.eu [212.27.40.82]
12    23 ms    22 ms    21 ms  83.167.55.23
13    33 ms    29 ms    29 ms  xe0-0-0.tcr1.sfr.lyn.as8218.eu [83.167.63.149]
14    30 ms    30 ms    29 ms  adeli.gw.tcr1.sfr.lyn.neotelecoms.com [83.167.52.94]
15     *        *        *     Délai d'attente de la demande dépassé.
16     *        *        *     Délai d'attente de la demande dépassé.
17     *        *        *     Délai d'attente de la demande dépassé.
18     *        *        *     Délai d'attente de la demande dépassé.
19     *        *        *     Délai d'attente de la demande dépassé.
20     *        *        *     Délai d'attente de la demande dépassé.
21     *      118 ms   113 ms  195.200.217.68


Envoi d'une requête 'ping' sur lafibre.info [195.200.217.68] avec 32 octets de données :

Délai d'attente de la demande dépassé.
Réponse de 195.200.217.68 : octets=32 temps=696 ms TTL=49
Délai d'attente de la demande dépassé.
Réponse de 195.200.217.68 : octets=32 temps=658 ms TTL=49

Statistiques Ping pour 195.200.217.68:
    Paquets : envoyés = 4, reçus = 2, perdus = 2 (perte 50%),
Durée approximative des boucles en millisecondes :
    Minimum = 658ms, Maximum = 696ms, Moyenne = 677ms
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: JulFX le 26 août 2011 à 22:15:14
Coupure électrique suite aux orages?

(http://s3.noelshack.com/old/up/lyond0wn-ff54ecab33.png)
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 26 août 2011 à 22:23:59
Je confirme une coupure électrique de courte durée à 18h00.
Les problèmes ont ensuite été réseau.

On parle sans doute du même data-center, le MaxNod (http://www.maxnod.com/) situé près de Lyon.

https://www.youtube.com/watch?v=jU4PcgLvNOc#ws (https://www.youtube.com/watch?v=jU4PcgLvNOc#ws)
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: Nico le 26 août 2011 à 22:36:13
Tout à fait on avait notre site (et Nitroserv leurs serveurs) chez Maxnod aussi. Le tracert étant le même (et comme t'avais parlé de Lyon, Adeli et Azylog) j'en ai déduis que t'étais aussi chez eux.

Je voyais le réseau qui n'arrivait pas à remonter (on arrivait à pinger *.maxnod.com de temps en temps seulement).
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 26 août 2011 à 23:06:26
Voici la charge du serveur. On voit bien que la panne électrique a été de courte durée :
(https://lafibre.info/images/bistro/201108_charge_lafibreinfo.png)

Voici la vue réseau, depuis Paris :
(https://lafibre.info/images/bistro/201108_reseau_lafibreinfo.png)
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 26 août 2011 à 23:23:12
Nico, je te confirme que http://www.somua.com/ (http://www.somua.com/) est bien sur le MaxNod, voici le traceroute depuis lafibre.info :
# traceroute-nanog -A somua.com
traceroute to somua.com (109.239.145.243), 30 hops max, 60 byte packets
 1  195.200.217.253 (195.200.217.253) [AS41405]  0.902 ms  0.896 ms  0.956 ms
 2  porte.adeli.biz (91.194.96.2) [AS43142]  0.959 ms  0.877 ms  0.950 ms
 3  nitroserv.maxnod.com (91.194.96.127) [AS43142]  0.960 ms  0.921 ms  0.954 ms
 4  109.239.145.243 (109.239.145.243) [AS43142]  1.960 ms  1.904 ms  1.954 ms

Tu seras intéressé par les résultats du PingTest (https://lafibre.info/tester-son-debit/pingtest-net-tester-ping-et-packet-loss/) mis en place sur mon serveur... SFR, le seul FAI a peerer avec Adeli sur Lyon va gagner je pense.

Le serveur est directement sur [AS43142] alors que mon hébergeur Azylog a sa propre AS (AS41405) ce qui permet de changer d'opérateur en gardant les IP (Avant AZYLOG était sur un datacenter de Dijon relié à Internet uniquement par Cogent (https://lafibre.info/ftth-la-fibre-optique-gpon-ou-p2p/test-des-peering-du-fournisuer-de-cogent/)...). Le déménagement s'est fait en gardant les IP. Appréciable.
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: le 27 août 2011 à 00:11:03
Alors je vais pouvoir me fendre de ma petite réponse :
C'est un incident 'à la con'. Les onduleurs de datacenter, c'est une machinerie assez complexe et tout en bout de la chaîne électrique. Tellement complexes d'ailleurs qu'ils embarquent tout un soft de gestion (firmware) et c'est la mise à jour de ce firmware qui a foiré.
Pour une raison qu'il va falloir reproduire (pas moi hein, les p'tits gars de Maxnod), les deux premiers onduleurs ont été mis à jour sans soucis et le 3ème à planter en entraînant les deux autres (je n'ai pas de détail exact là dessus, on verra demain).
Ca a créé une micro-coupure (quelques millisecondes) suffisant pour faire rebooter un maximum de monde dans le data.
Jusque là, rien de méchant, c'est juste dommage pour l'uptime, tout reboote et reprend la main. Ca c'est la théorie.

Dans la pratique, il y a toujours des vérifs de disques qui se passent mal, des secteurs de boot plus à jour, etc ...
Mais chez nous, on a eu un bonus : un problème de conf sur un routeur a fait que le trafic a été blacklisté (oui, tout) et le défaut n'a pas été assez franc pour faire jouer la redondance.
Avec le techos de Maxnod, nous n'avons pas pu faire repartir le routage ce qui m'a valu de me déplacer pour reconfigurer cette saleté. Au passage, j'ai mis en place la contre-mesure pour que ça n'arrive plus à la prochaine coupure de courant (hum). Du coup, la remise en route a prit un peu de temps mais c'est réglé définitivement (mais comme dirait Murphy, le problème ne ce serait jamais reproduit de toute façon).

Voilà un peu plus de détail sur l'épisode certes pas très agréable mais faisant partie des aléas de cet agglomération de technologie qu'est le net.

Julien Escario
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: Nico le 27 août 2011 à 00:17:47
Merci beaucoup pour les précisions/explications !
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: le 27 août 2011 à 00:18:10
Je vais rajouter en vitesse que dans l'histoire on s'en sort bien puisque sans casse de matériel.
J'y pense en voyant les techniciens dans le datacenter qui sont encore en train de se battre avec des RAID cassés (et ça, ce n'est vraiment pas agréable ...).

Julien
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 27 août 2011 à 08:42:20
Merci Julien pour tout !

Voici le graphe SmokePing depuis Paris pour montrer que la latence est revenu à la normale :
(https://lafibre.info/images/bistro/201108_reseau_lafibreinfo2.png)
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: Mieszko le 27 août 2011 à 08:56:54
Je vais rajouter en vitesse que dans l'histoire on s'en sort bien puisque sans casse de matériel.
J'y pense en voyant les techniciens dans le datacenter qui sont encore en train de se battre avec des RAID cassés (et ça, ce n'est vraiment pas agréable ...).

Julien
Les joies d'etre technicien (en astreinte ou non) et devoir bosser apres un incident electrique dans les datacenters.
Par moment, il y a de grands moments de solitude.
Ca m'est d'ailleurs arrive pas plus tard que dimanche dernier.
Titre: AS
Posté par: le 27 août 2011 à 23:39:27
Le serveur est directement sur [AS43142] alors que mon hébergeur Azylog a sa propre AS (AS41405) ce qui permet de changer d'opérateur en gardant les IP (Avant AZYLOG était sur un datacenter de Dijon relié à Internet uniquement par Cogent (https://lafibre.info/ftth-la-fibre-optique-gpon-ou-p2p/test-des-peering-du-fournisuer-de-cogent/)...). Le déménagement s'est fait en gardant les IP. Appréciable.
Tu es sûr qu'il faut nécessairement un AS pour ça?

Je croyais que l'AS c'était pour échanger des routes en BGP.
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 28 août 2011 à 07:56:40
Si tu a ta propre plage d'adresse IP, il me semble qu'il te faut ton AS.

Il y a échange de route en BGP : AS43142 est l'unique transitaire de AS41405

Avant AS174 (Cogent) était l'unique transitaire de AS4140
Le site de HE n'est toujours pas à jour : http://bgp.he.net/AS41405#_asinfo (http://bgp.he.net/AS41405#_asinfo)
Titre: Plage d'IP Provider Independant
Posté par: Leon le 28 août 2011 à 13:31:34
Si tu a ta propre plage d'adresse IP, il me semble qu'il te faut ton AS.
Il me semble que non: tu peux très bien avoir ta propre plage IP, même "provider independant", et ne pas avoir d'AS. Dans ce cas, c'est ton opérateur qui s'occupe d'annoncer ta plage depuis son réseau.

Il faut noter que les petites plages d'adresse P.I. on un ENORME INCONVENIENT : elles ne sont pas forcèment visibles depuis partout sur Internet! Et c'est sans doute le cas d'AZYLOG avec ses 255 adresses IP seulement.
https://apps.db.ripe.net/dbweb/search/query.html?searchtext=195.200.217.68
En effet, beaucoup de routeurs essayent de simplifier les routes. Imaginez, pour router correctement vers TOUT internet, un routeur au Japon devrait apprendre spécifiquement la petite route vers Azylog! Si le routeur n'est pas assez puissant pour tout mémoriser, il va tout simplement ignorer ce genre de route trop petite et trop lointaine.

A mon avis, cet inconvénient est plus gênant que le petit avantage de ne pas avoir à changer d'IP 1 fois tous les 5 ans quand l'hébergeur change d'opérateur.

Du coup, je ne comprend pas le choix de nombreux hébergeur de vouloir ABSOLUMENT une plage P.I. C'est un choix assez égoïste, et qui complique les choses, rend Internet moins propre.
D'ailleurs, Vivien, tu dois pouvoir tester ça depuis ton serveur: essayer des routes lointaines (à l'autre bout de la terre) qui sont joignables depuis chez toi mais pas depuis ton serveur chez Azylog.

Leon.
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: vivien le 28 août 2011 à 14:14:11
Normalement les opérateurs ne filtrent pas à partir de /25 donc pas de souci pour des bloc de /24.

Sur mon SmokePing tu as quelques destinations étrangères.

Si tu as des idées de ping vers l'international, met ta liste je vérifierais avec plaisir et ferais un comparatif des temps de latence Azylog / OVH / OVH / Bouygues Telecom
Titre: Plage d'IP Provider Independant
Posté par: le 28 août 2011 à 19:56:46
Imaginez, pour router correctement vers TOUT internet, un routeur au Japon devrait apprendre spécifiquement la petite route vers Azylog! Si le routeur n'est pas assez puissant pour tout mémoriser, il va tout simplement ignorer ce genre de route trop petite et trop lointaine.
Et alors?
Titre: Plage d'IP Provider Independant
Posté par: tit91 le 28 août 2011 à 23:38:26
En effet, beaucoup de routeurs essayent de simplifier les routes. Imaginez, pour router correctement vers TOUT internet, un routeur au Japon devrait apprendre spécifiquement la petite route vers Azylog! Si le routeur n'est pas assez puissant pour tout mémoriser, il va tout simplement ignorer ce genre de route trop petite et trop lointaine.

Comme l'a dit Vivien en général on ne filtre que tout ce qui est plus long que /25. Et pour ceux que les poussières (très nombreuses) ennuient et qui filtrent donc à partir d'un peu moins que 25, on prendra soin de se faire annoncer une route par défaut par chacun de ses transits. On peut même imaginer ne garder que les routes peerings (si on pratique ce sport pas tout le temps amusant) et se contenter des routes par défaut pour le reste. Vu le nombre de /24 faramineux, il est inconcevable (ou irresponsable, si certains pratiquent) que l'on décide de simplement faire une croix sur ces destinations.
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: corrector le 29 août 2011 à 22:12:54
Zorro est arrivé
et il a routé
les paquets.

(Et agrégé les préfixes.)
Titre: Incident technique : lafibre hors ligne ce soir de 18h à 21h30...
Posté par: Leon le 23 décembre 2011 à 18:14:09
Je reviens là dessus.
Normalement les opérateurs ne filtrent pas à partir de /25 donc pas de souci pour des bloc de /24.

Voici ce qu'on peut lire aujourd'hui sur la mailing-liste FRNOG:
http://www.mail-archive.com/frnog@frnog.org/msg16955.html (http://www.mail-archive.com/frnog@frnog.org/msg16955.html)
Citer
Depuis la pénurie d'IPv4, la table BGP augmente chaque jours plus vite
qu'avant, aujourd'hui à 380000 routes les routeurs nous rappellent à
l'ordre.
Hormis la solution de filtrer les annoncent /24 et de poser une default gw
vers les transitaires, avez-vous d'autres solutions ?
Bref, êtes vous vraiment certains que tous les routeurs sensés avoir des "full view" BGP ne filtrent pas les /24? Même les routeurs un peu anciens, avec des capacités limitées?

Leon.