Auteur Sujet: Enquête sur une possible attaque vers TVradioZap (Lu 49083 fois)

F6FLT · « **Réponse #48 le:** 01 juillet 2024 à 10:35:00 »

Citation de: vivien le 01 juillet 2024 à 07:50:35

...
Vous pourrez voir que le problème, ce n'est pas Google ou Bing (leur activité est faible), mais d'autres.

Je confirme en ce qui me concerne.

F6FLT · « **Réponse #49 le:** 01 juillet 2024 à 10:49:07 »

Citation de: Optix le 30 juin 2024 à 18:56:59

...
Je me répète :
Citer
C'est en rien une attaque.
Il fallait t'en douter : ton site circule et est partagé sur Facebook.
...

Tu te répètes sans prendre en compte ce qui a été montré ailleurs, à savoir par exemple le détournement des robots facebook par des API tiers.
Tu te répètes sans rien expliquer de points-clés essentiels, comme le fait que les adresses demandées soient systématiquement aberrantes, alors pour un "partage", tu repasseras.
Tu te répètes avec toujours des avis tranchés sur tous les sujets, à base de poncifs sans nuance ni argumentation circonstanciée en rapport avec les faits présentés ni preuve ni pertinence. Si tu pouvais prendre conscience de leur vacuité, tu gagnerais du temps et en ferais gagner aux autres en ne les produisant plus.

Optix · « **Réponse #50 le:** 01 juillet 2024 à 11:51:08 »

Hum, tu as une fonction "éditer" sur ton 1er message, ça évite d'en poster 50 et de remonter ton topic sans arrêt. Merci.

artemus24 · « **Réponse #51 le:** 01 juillet 2024 à 14:48:03 »

@ Buddy : je n'ai jamais entendu dire qu'une attaque pouvais être faite par des robots. ce n'est pas une attaque selon moi, mais une augmentation du trafic chez @F6FLT due à un bug dans son site.

Citation de: Buddy

Non, du crawl intensif du site (pour simplifier)

Merci pour l'information, mais cela reste un scan du site et ne doit pas provoquer un problème de trafic sur le site de @F6FLT, en principe.

Citation de: Buddy

Quel rapport entre référencement et IP ?

@F6FLT a un problème de référencement de son site, voilà tout. Il y a quelque chose de mal fait dans la hiérarchisation de ces liens url.
Si son site n'est pas référencé, le problème disparait de lui-même. Le mieux est de trouver ce qui ne va pas.

Citation de: Buddy

Il y a plein de bonnes raisons à vouloir héberger le site chez un professionnel plutôt que chez soi.

Je ne remets pas en cause l'hébergement vers l'excellent AlwaysData puisque je suis aussi chez eux avec une offre gratuite.

Citation de: F6FLT

Absolument certain.

Merci

pour ta réponse.

Si je regarde tes logs, on dirait qu'il boucle sur l'url qui est affiché. Pour visualiser cela dans mon Notepad++, j'ai coupé tes lignes sur "/tvrzperso", et je retrouve les mêmes séquences plusieurs fois et ce n'est pas normal. Aurais tu créer sans le vouloir une redirection ? D'où tes problèmes de référencements. Tu devrais te plonger dans les méandres du référencements et revoir ce que tu as déjà fait.

Citation de: Basilix

@F6FLT: Qu'en pense alwaysdata ? Pourquoi ne résolvent-ils pas eux-mêmes le problème ?

Parce que le référencement d'une site ne concerne pas AlwaysData mais bien @F6FLT.

Citation de: F6FLT

La suspension du compte indiquerait une mauvaise volonté de leur part mais ce n'est pas le cas pour le moment, l'affaire semble en rester là.

Il n'y a pas de mauvaise volonté de la part d'AlwaysData car le problème ne les concerne pas. AlwaysData n'a fait que signaler le problème concernant l'hébergement d'un site gratuit qui n'a pas vocation à faire du gros trafic. Peu importe l'origine du problème, même si ton site à un énorme succès, tu dois réduire ce trafic, soit en résolvant le problème ou en passant à une offre payante.

En ce qui me concerne, ce n'est pas une attaque mais un problème de référencement dû à une mauvaise déclaration dans les fichiers ".html" ou ".php" du site de @F6FLT.

F6FLT · « **Réponse #52 le:** 01 juillet 2024 à 16:34:14 »

Citation de: artemus24 le 01 juillet 2024 à 14:48:03

...
@F6FLT a un problème de référencement de son site, voilà tout. Il y a quelque chose de mal fait dans la hiérarchisation de ces liens url.

Ce n'est pas impossible. J'ai évoqué cette question dès mon 1er post :
"Donc ma question aux webmasters et aux férus des réseaux, est-ce que ces floppées de requêtes aberrantes peuvent avoir pour origine un dysfonctionnement, un paramétrage fait par un incompétent quelque part en lien avec Facebook ou pas, y compris moi dans la config du site, ou sont plus vraisemblablement le résultat d'une action malveillante ?"

Le constat, c'est que ça ne pose pas de problèmes à Bing, ni à Duckduckgo, ni à Qwant. A Google et Yahoo, peut-être, car je ne vois pas de référence à des liens internes, seulement à la page d'accueil.
Comme je n'aime pas les liens avec "query" http://... .php?truc=machin j'ai fait le choix qu'ils soient de la forme http://... .php/truc/machin, sauf quand on utilise le formulaire.
C'est peut-être ça qui pose problème aux mauvais robots, mauvais puisqu'à l'usage depuis un navigateur, ces liens ne pose aucun problème.

Citer

Si je regarde tes logs, on dirait qu'il boucle sur l'url qui est affiché. Pour visualiser cela dans mon Notepad++, j'ai coupé tes lignes sur "/tvrzperso", et je retrouve les mêmes séquences plusieurs fois et ce n'est pas normal. Aurais tu créer sans le vouloir une redirection ? D'où tes problèmes de référencements. Tu devrais te plonger dans les méandres du référencements et revoir ce que tu as déjà fait.

Non, ce n'est pas normal, et c'est ce que j'ai déjà dit 3 ou 4 fois. Je fais des redirections parfois, qui ne posent de problème à personne sauf sans doute à facebook, amazon et semrush (et peut-être à Google et Yahoo mais ceux-là s'en sortent quand même), qui sont nécessaires et n'aboutissent jamais à ces répétitions dans une utilisation normale (humaine) du site.

Citer

...
En ce qui me concerne, ce n'est pas une attaque mais un problème de référencement dû à une mauvaise déclaration dans les fichiers ".html" ou ".php" du site de @F6FLT.

"mauvaise déclaration", tu intervertis les rôles. Si les "déclarations" étaient mauvaises le site ne fonctionnerait pas ou dysfonctionnerait de temps en temps, or à l'utilisation on ne voit jamais d'url comme ces robots les requêtent.
Alors s'il y a moyen de corriger le site pour pallier le défaut, je suis prêt à le faire, mais le défaut est bien chez ces quelques robots (encore de l'"IA" sans doute, qui est à l'"IA" ce que le MacDo est à la gastronomie... ).

Bon, je vais tester le site avec l'outil de validation du W3C. Ca fait des mois que je ne l'avais pas fait, possible que ça se soit dégradé, on va voir.

C'est fait. Pas mal d'erreurs bégnines corrigées, celles qui restent sont voulues et sans rapport avec les liens <a> qui étaient sans erreur. J'ai vérifié les liens des menus et des listes, ils sont écrits en dur, pas de problème. Pas de javascript à part pour la liste courante des chaînes cochées mais pour celle-là on n'utilise pas d'url, on enregistre directement la liste de la page. Le mystère reste entier. Je regarde maintenant du côté des redirections.

Shadowra · « **Réponse #53 le:** 01 juillet 2024 à 19:26:10 »

Citation de: F6FLT le 27 juin 2024 à 11:16:50

Toutefois si ces IP génèrent des actions malveillantes, elles peuvent très bien chercher à nous tromper par la référence à ce lien. Comme les requêtes ne viennent pas d'adresses chez facebook, tout cela reste en effet très suspect.
Exemple typique d'une telle requête extraite du fichier log d'Alwaysdata :

Code: [Sélectionner]
tvradiozap.eu 2a03:2880:13ff:3::face:b00c - - [26/Jun/2024:04:05:09 +0200] "GET /index.php/j/permalinks_/f/0/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u HTTP/2.0" 200 96136 "-" "facebookexternalhit/1.1 (+http://www.facebook.com/externalhit_uatext.php)"

En 2 secondes, en plus, Optix te l'a gentiment dit....
Ton bloc IPv6 c'est Facebook.
Donc pas de DDoS... juste un robot Facebook.. Déstresses, t'es pas hacké

cruchot · « **Réponse #54 le:** 01 juillet 2024 à 21:24:27 »

Les gars découvrent Internet

artemus24 · « **Réponse #55 le:** 01 juillet 2024 à 21:35:00 »

@ F6FLT : il est fort possible que cela ne poser aucun problème aux autres robots, mais ceux de FaceBook n'apprécient pas du tout.

Il est inutile de répéter le nom du domaine dans les liens qui sont ceux de ton site. L'idée est que si tu viens à changer ton nom du domaine, tu ne modifies pas tous tes liens de ton site. Bien entendu, cela ne concerne pas les liens qui sont extérieurs à ton site.

Il ne faut pas mettre "https ://ton_nom_de domaine/index.php" mais "/index.php" car "index.php" se trouve dans le répertoire racine. C'est le "/" au début qui indique que c'est le répertoire racine.

Je te conseille de t'inscrire dans un forum spécialisé dans le référencement afin d'obtenir des conseilles sur comment les appliquer. Tu peux faire un tour chez Alsacréations. Ils sont spécialisés dans le développement des pages web, ainsi que chez Developpez.

Citation de: F6FLT

"mauvaise déclaration", tu intervertis les rôles.

Je te parle du référencement, pas du fonctionnement d'une page web que tu développes en local sur ton ordinateur en utilisant un seul navigateur, comme Google Chrome. Ce sont, entre autres, des balises <meta> que l'on place dans la balise <head> de toutes tes pages WEB qui sont en "html" ou en "php.

Il faut tester ton site sur plusieurs navigateurs comme Mozilla Firefox, Opera, Microsoft Edge et corriger les bugs d'affichages. Il en existe d'autres comme Safari, Qwant ...

Tu n'es pas dans le bon forum pour parler référencement ainsi que développement WEB.

basilix · « **Réponse #56 le:** 02 juillet 2024 à 07:37:18 »

Je ne suis pas compétent mais ce genre d'attaque semble exister.

F6FLT · « **Réponse #57 le:** 03 juillet 2024 à 12:49:24 »

Citation de: basilix le 02 juillet 2024 à 07:37:18

Je ne suis pas compétent mais ce genre d'attaque semble exister.

Tout à fait, et il semble que ce soit le cas.

Certains plus haut semblent débarquer, ils voient "facebook" dans les infos du fichier log que j'ai passées et en concluent donc que le robot de facebook fait juste un travail de référencement en balançant depuis des jours des url incorrectes jusqu'à toutes les 4 secondes

. Ils font d'inutiles remarques de néophytes. Si je ne suis pas un professionnel du développement, je n'en suis quand même pas à devoir apprendre le B.A.BA, et si c'était aussi simple qu'ils le disent, j'aurais résolu le truc depuis longtemps sans rien voir demandé à personne.

Après ré-analyse complète de mon code, à aucun moment il ne peut y avoir génération d'url telles que celles demandées par facebook ou semrush.
Tous les liens de la page d'url internes sont absolus (relatifs à la racine du site). Les url sont écrites en dur, notamment par le PHP, dans le code HTML fourni. Je n'utilise aucun outil pour le générer ni aucune bibliothèque HTML ou javascript, tout le code est tapé dans un simple éditeur de texte, et dans le HTML final tout est transparent et très lisible dans les outils pour développeur des navigateurs.

Les liens anormaux sont soit le fait d'outils déconnant des robots (peu probable), soit d'origine malveillante par manipulation des robots de service comme facebook ou semrush, c'est la piste la plus probable.
Je viens de voir par exemple ce matin que semrush utilise des url de type /index.php/g/ or le "g" n'est jamais utilisé par le site. Quant aux répétitions de séquences, elles ne peuvent pas être générées non plus par le code JS puisque qu'aucun code ne crée d'url en dynamique.

Je verrais bien les répétitions de séquences comme des copier/coller générés par facilité pour créer au départ des liens incorrects, et ensuite déclencher une activité chez facebook ou ailleurs.
Pourquoi ces malveillances ? Mystère. Une vengeance ?! Evidemment je récupère des liens un peu partout, tout le monde fait ça, même les utilisateurs de Github chez qui je m'approvisionne en partie, je ne les vois donc pas du tout s'en offusquer d'autant plus que je rends la pareille avec mes listes (à part peut-être callofliberty qui ne porte pas son nom si bien que ça). J'ai fait un scan d'1 ou 2 sites de streaming africain mais pas intensivement, sans créer de charge, là encore je ne vois pas de mobile. Mais bon, des nuisibles il y en a partout et leurs motivations de malades sont parfois difficiles à cerner.

Tick · « **Réponse #58 le:** 03 juillet 2024 à 22:45:54 »

Est-ce tvrzperso.tv est à toi ?

Si c'est n'est pas le cas, j'ai une hypothèse un peu tordu mais bon ..., peut-être que ton ndd était déjà utilisé auparavant, et qu'il y a pleins de liens qui trainent sur facebook ? Vu la tronche de la cible on dirait que le bot tombe sur une sorte de boucle.

Sinon si tu n'utilise pas de php, renomme l'index en .html peut être ? Le bot comprendra peut être un jour qu'il y a plus rien à cette page

Et peut être tu devrais stocker les images en local également, tu te retrouves à ton tour à faire pleins de requête à des sites qui ont rien demandé, pour récupérer des images

Sinon c'est quand même étonnant qu'un hébergeur gueule pour des robots... C'est la vie d'un site

F6FLT · « **Réponse #59 le:** 04 juillet 2024 à 11:47:29 »

Citation de: Tick le 03 juillet 2024 à 22:45:54

Est-ce tvrzperso.tv est à toi ?

Si c'est n'est pas le cas, j'ai une hypothèse un peu tordu mais bon ..., peut-être que ton ndd était déjà utilisé auparavant, et qu'il y a pleins de liens qui trainent sur facebook ? Vu la tronche de la cible on dirait que le bot tombe sur une sorte de boucle.

Sinon si tu n'utilise pas de php, renomme l'index en .html peut être ? Le bot comprendra peut être un jour qu'il y a plus rien à cette page

tvrzperso.tv est bien dans les liens de la page d'accueil, mais pas au niveau d'arborescence délirant des requêtes. Et le ndd est bien nouveau.
Si le bot tombait sur une boucle, on aurait bien plus de régularité. D'autre part on a des requêtes d'url avec un /g/ au début, et le /g/ n'existe nulle part sur le site.

Je viens d'analyser le début du log de la nuit. Extrait ici, le premier bloc est de facebook, le second de semrush :

Code: [Sélectionner]

/index.php/ty/ra/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv
/index.php/f/2/s/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u
/index.php/f/2/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv
/index.php/ty/tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u
/index.php/ty/tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv
/index.php/ty/tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u
/index.php/ty/tv/f/2/d/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv
/index.php/ty/tv/f/2/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv
/index.php/ty/tv/f/2/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv
/index.php/f/0/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u
/index.php/ty/ra/f/2/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u
/index.php/j/permalinks_/f/0/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.tv
/index.php/j/permalinks_/f/0/s/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u
/index.php/j/permalinks_/f/0/s/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.m3u
/index.php//f/1/ty/tvtop/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.tv


/index.php/ty/ra/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u
/index.php/ty/ra/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u
/index.php/ty/ra/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u
/index.php/ty/ra/s/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv
/index.php/ty/ra/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u
/index.php/ty/ra/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.tv
/index.php/ty/ra/d/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u
/index.php/ty/tv/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.m3u
/index.php/ty/tv/s/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.tv
/index.php/ty/tv/s/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u/s/tvrzperso.tv
/index.php/ty/tv/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u
/index.php/f/2/s/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.m3u/s/tvrzperso.tv/s/tvrzperso.m3u
/index.php/f/2/d/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u/s/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.m3u
/index.php/g/1/ty/ra/d/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.m3u
/index.php/g/3/ty/tv/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.tv/d/tvrzperso.tv/s/tvrzperso.m3u/d/tvrzperso.tv/d/tvrzperso.m3u
/index.php/j/permalinks_/f/0/s/tvrzperso.tv/s/tvrzperso.tv/s/tvrzperso.m3u/s/tvrzperso.tv/d/tvrzperso.tv/d/tvrzperso.m3u/d/tvrzperso.m3u

Si ces adresses à rallonge ont toutes un air de famille, étonnamment on n'a pas deux fois la même, ce qui est le signe d'une génération aléatoire qui ne me semble pas du tout naturelle et due au site, mais voulue. Et aucun autre robot ne demande ces adresses absurdes, ce qui rend peu vraisemblable un problème du site. A noter que si semrush demande parfois le fichier robots.txt, facebook jamais. Tout cela plaide pour une malveillance bien délibérée.

Citer

Et peut être tu devrais stocker les images en local également, tu te retrouves à ton tour à faire pleins de requête à des sites qui ont rien demandé, pour récupérer des images

Surtout pas. C'est un choix que le site n'héberge aucun contenu. De plus les logos changent, je ne pourrais plus savoir quand un logo est périmé, tandis qu'avec le fichier image au bout d'un lien, soit l'image est automatiquement mise à jour, soit le lien est remplacé auquel cas on s'en aperçoit tout de suite, on n'a plus le logo.
Les "sites qui ont rien demandé" sont ceux qui l'acceptent, c'est la situation par défaut de tout hyperlien d'être accessible de n'importe où. Il suffit de renvoyer les "bons" headers quand on ne le souhaite pas, ce que font d'ailleurs pas mal de sites, aussi bien pour les images que pour les adresses de stream.

Pour info, le fastidieux téléchargement des logos de toutes les chaînes quand on charge la page est un problème dont j'avais bien conscience et que je comptais résoudre. J'ai découvert récemment la directive "loading=lazy" qui permet aux images dans les tags HTML de n'être chargées qu'au moment où elles ont à être visualisées dans le navigateur. Je l'ai mise en place aussitôt tant c'est facile. Le chargement d'une page de la liste complète des chaînes devrait être plus rapide pour ceux qui n'ont pas déjà les logos dans le cache du navigateur, et les sites hébergeant ces logos seront moins sollicités.

Citer

Sinon c'est quand même étonnant qu'un hébergeur gueule pour des robots... C'est la vie d'un site

Oui. En plus les mesures seraient faciles contre les excès, comme bloquer pendant un certain temps tout robot qui ferait d'intenses salves de requêtes erronées. Ca ne gênerait pas les sites qui souhaitent être scrawlés par ces robots, mais éviterait les surcharges.