La Fibre
Télécom => Peering Transit (appairage) => Peering entre opérateurs => Discussion démarrée par: butler_fr le 08 juin 2021 à 12:24:01
-
Hello
Depuis quelques dizaines de minutes de nombreux sites internet ont de grosses difficultés
-leroymerlin.fr (erreur 503 de varnish)
-stackoverflow (io error)
-Down detector (rip ^^)
-...
et amazon.fr
ce qui me fait dire qu'il doit y avoir un soucis avec AWS
-
fastly plutôt non ?
Pas de souci avec Amazon de mon côté
-
fastly plutôt non ?
Il semblerait oui.
-
Il semblerait oui.
Yes https://status.fastly.com/
Update - We are continuing to investigate this issue.
Jun 8, 10:26 UTC
Update - We are continuing to investigate this issue.
Jun 8, 10:23 UTC
Update - We are continuing to investigate this issue.
Jun 8, 10:21 UTC
Update - We are continuing to investigate this issue.
Jun 8, 10:11 UTC
Update - We are continuing to investigate this issue.
Jun 8, 10:07 UTC
Investigating - We're currently investigating potential impact to performance with our CDN services.
-
Down detector est ok.
-
le site de fastly est HS mais sur google:
Fastly featured partners | Fastly
https://www.fastly.com › partners › f...
AWS offers a broad set of services that help organizations move faster, lower IT costs, and scale applications. Fastly works with you to configure and optimize
amazon est revenu mais il manquait bien la plupart de simages / css à un moment (testé avec des collègues sur plusieurs connexion)
-
Je sens c'est le panique chez Fastly.
-
Non, ils continuent d'investiguer c'est tout ;).
-
amazon.fr à l'instant (oui je cherche un chargeur pour mon canon ^^):
-
fastly plutôt non ?
Fortnite a tué Internet ;D
-
Mmmh sûrement ça les images qui chargent pas sur Twitter également. Je pensais c’était encore le DSI qui avait mis des règles sur certains domaines. J’avoue j’ai été mauvaise langue ^^
-
ou quand tout une partie du web mondial tombe a cause d'un seul fournisseur (fastly ou aws on sait pas encore trop...)
le nombre de gros site affecté est assez énorme:
paypal (revenu rapidement)
amazon (aléatoire)
twich
reddit
twitter
nytimes / cnn / lemonde / bbc
github
La Redoute
-
Vive le web centralisé ❤️
-
C'est en partie a cause des pages qui chargent des dizaines ou centaines d’objets situé sur des sites différents.
On est donc impacté (plus ou moins) dés qu'un hébergeur de ces objets est HS.
-
En particulier les pubs, il y en aura peut-être moins de chargées...
-
dans mon précédent taff on faisait la chasse aux appels web externe.
On demandait à tous nos clients de rapatrier le plus de ressources possible en local (genre les fichiers css js images...)
Sinon tu multiplie ton risque de pannes par le nombre de prestataire externe.
-
Normalement LaFibre.info ne fait pas d'appel externe, sauf pour des vidéos ou photos hébergées à l'extérieur.
Maintenant il y a des sites qui ont des contraintes de trackers, pub, et autre que je n'ai pas.
-
Après on peut se poser la question : est ce que le monde s’arrêter de tourner pour autant ?
Finalement, tant qu’on parle de sites dont la vie de personne ne dépend, la centralisation vers des acteurs toujours moins cher est logique, et pas forcément choquante.
C’est plutôt la liste des services critiques, si on en trouve, qui sera à suivre.
-
Pour des sites comme Amazon ou Paypal, qui ne vivent que du web, rester quelques heures inaccessibles, c'est critique, c'est beaucoup de commandes et de paiements perdus, donc une grosse perte de chiffre d'affaires.
-
dans mon précédent taff on faisait la chasse aux appels web externe.
On demandait à tous nos clients de rapatrier le plus de ressources possible en local (genre les fichiers css js images...)
Sinon tu multiplie ton risque de pannes par le nombre de prestataire externe.
OK mais tu résistes pas à un fort afflux de visiteurs si tu n'as pas de caching... si ?
-
tu serais étonné de voir la quantité de visiteurs possible avec une bonne infra bien optimisée.
quelques petite VM varnish devant tes serveurs web (faut juste bien sizer la quantité de ram) et tu te fais un CDN toi même pour 3 fois rien.
même avec un CDN ce qui te limitera en premier c'est souvent la capacité de la base de donnée pour tout ce qui est pas cachable (toutes les données dynamiques)
-
Post-mortem : https://www.fastly.com/blog/summary-of-june-8-outage
Seulement 24h après l'incident c'est propre.
-
Dommage de ne pas entrer dans les détails de ce qui a causé une panne globale...
-
Ça viendra, ici c’est maîtriser sa communication pour parler au commun des mortels.
-
Dommage de ne pas entrer dans les détails de ce qui a causé une panne globale...
Seulement 24h après l'incident c'est déjà pas mal, j'en connais pas beaucoup de boite cette taille qui en sont capables.
Ça viendra, ici c’est maîtriser sa communication pour parler au commun des mortels.
Exact et ils ont plutôt bien réussi l'exercice, les moldus peuvent comprendre.