Auteur Sujet: infegy.com fait de milliers de requetes par jour sur lafibre.info  (Lu 5245 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 268
    • Twitter LaFibre.info
Salut !

Ton compteur de téléchargement de P.J. ne déconnerait pas un peu ? (peut-être parce que c'est un gros fichier)

Ex => https://lafibre.info/nas/sortie-nouveau-rpi-3/msg314433/#msg314433
Je suis déjà à 500 dl alors qu'il y a 3 personnes sur le topic^^

NBQG1304 8)

Voici la page en question : moins de 2 heures après avoir mis en ligne le PDF, il y a déjà 2350 téléchargements.


Le compteur n'est pas fou...

Il y a encore des petits malins qui font je ne sais quoi...

Voici les logs Apache2 des requêtes avec user-agent "Mozilla/5.0 (compatible) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.73 Safari/537.36 collection@infegy.com" ce sont elles qui ont 2341 téléchargements en 59 minutes, depuis une centaine d'adresse IP différentes, toutes situées toutes entre 74.87.163.20 et 74.87.163.159

Les logs => 201603_stats_pdf_magpi.ods
(fichier LibreOffice Calc, lisible également avec Excel et Open Office)

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
Stats de téléchargement d'un fichier PDF en pièce jointe
« Réponse #1 le: 06 mars 2016 à 19:51:57 »
Apparemment c'est une boîte de collecte de données lambda qui fait du crawling : http://infegy.com/

Le téléchargement du document est réparti avec Content-Range en blocs d'environ 4096 Ko, mais le total serait normalement de 18 Mo, l'addition de la colonne "Taille" dans ton document donne 9,2 Go (si je l'interprète bien !?). Est-ce qu'elle serait coupée avant ? Le compteur est peut-être aussi décuplé par la répartition entre différentes adresses sources.

vivien

  • Administrateur
  • *
  • Messages: 47 268
    • Twitter LaFibre.info
Stats de téléchargement d'un fichier PDF en pièce jointe
« Réponse #2 le: 06 mars 2016 à 20:00:23 »
C'est une bien une taille de 9,97 Go, soit 9,29 Gio qui a été téléchargé.

Stats Apache2 :


Stats sur l'interface réseau :


Le serveur héberge LaFibe.info et le serveur nPerf qui utilise le port 80 (Apache2) sur mobile et le port 8081 (serveur propriétaire) sur PC.
Ces tests sur le port 8081 expliquent pourquoi les deux courbes sont différentes.

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
Stats de téléchargement d'un fichier PDF en pièce jointe
« Réponse #3 le: 06 mars 2016 à 23:14:17 »
Dis, ces derniers jours je vois aussi beaucoup de connexions se créer quasi-immédiatement dans les secondes qui suivent l'envoi d'un message sur un sujet (des miens en tous cas...). Ça ne proviendrait pas également de ce robot ? Il doit y avoir un secteur occupé par des crawlers taillés spécifiquement pour récupérer en temps réel les gros logiciels de forums comme SMF.

Darklight

  • Abonné Free adsl
  • *
  • Messages: 648
  • Free non-dégroupé (77)
Stats de téléchargement d'un fichier PDF en pièce jointe
« Réponse #4 le: 06 mars 2016 à 23:29:57 »
Cela pourrait expliquer le nombre de visiteurs non inscrits qui lisent des sujets (relativement peu importants) lorsqu'il y une réponse (cf la petite discussion d'il y a quelques jours sur IRC, quand on m'a demandé si je n'avais pas linké un topic ailleurs) : environ une quarantaine de visiteurs à ce moment.

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
Stats de téléchargement d'un fichier PDF en pièce jointe
« Réponse #5 le: 06 mars 2016 à 23:34:09 »
C'est de cela dont je parle et j'étais l'interlocuteur. Cela a concerné par exemple mon dernier message dans la section IPv6 (https://lafibre.info/ipv6/script-perl-ipv4-ipv6/msg314517/#msg314517) et ceux dans la section Free 10G-EPON, mais vraisemblablement pas les plus récents messages toutes sections confondues ni les miens dans cette section non-indexée. Il serait peut-être intéressant de remonter les logs pour voir dans quels cas ça se manifeste.

vivien

  • Administrateur
  • *
  • Messages: 47 268
    • Twitter LaFibre.info
Stats de téléchargement d'un fichier PDF en pièce jointe
« Réponse #6 le: 07 mars 2016 à 03:56:24 »
39 personnes à 3h50 du matin dans le message Script pour récupérer l'IP et indiquer si c'est une IPv4 ou une IPv6 avec un total de 13867 vues, c'est effectivement bien suspect.

Je vais regarder les logs demain (enfin ce matin plus tard  :D)

Mon sujet en IPv6 Plages IP par FAI qui date de 2013 et que j'ai cit a de nombreuses reprises sur d'autres sujets et pu-être sur twitter, n'a que 10106 vues, ce qui est déjà pas mal.

vivien

  • Administrateur
  • *
  • Messages: 47 268
    • Twitter LaFibre.info
infegy.com fait de milliers de requetes par jour sur lafibre.info
« Réponse #7 le: 07 mars 2016 à 12:50:01 »
J'ai vérifié, ce sont des requêtes avec user-agent "Mozilla/5.0 (compatible) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/47.0.2526.73 Safari/537.36 collection@infegy.com" qui fait que le sujet était aussi consulté la nuit.

J'ai filtré les log Apache2 depuis début janvier sur "collection@infegy.com" et voici ce que je note :

- un seul user-agent (c'est le même début janvier et début mars)
- Il n'y a jamais de referer
- 434 requêtes "collection@infegy.com" en janvier 2016
- 83 679 requêtes "collection@infegy.com" en février 2016 (le rythme accélère beaucoup à  partir du 25 février)
- 362 708 requêtes "collection@infegy.com" les 6 premiers jours de mars (soit 1 800 000 requêtes attendues pour Mars, si on garde le même rythme.

Les 446 821 requêtes dans le fichier Libre office calc représentent 14,18 Go téléchargé, dont 9,97 uniquement pour le fichier du PDF du Raspberry Pi 3.
La taille moyenne des requête est de 32 Ko, la médiane est de 8,6 Ko.
Le max est à 7,5 Mo (PDF du Raspberry Pi 3)

=> 201603_stats_user-agent_infegy.ods
(fichier de 17 Mo, LibrOffice Calc, lisible avec Excel et OpenOffice)
J'ai supprimé la colonne user-agent (c'est le même début janvier et début mars), referer (inexistant) type de requête (c'est uniquement du HTTP 1.1) et j'ai séparé dans la requête ce qui est avant le "?" de ce qui est après (le PHPSESSID)

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
infegy.com fait de milliers de requetes par jour sur lafibre.info
« Réponse #8 le: 07 mars 2016 à 14:03:57 »
J'ai envoyé un résumé des observations faîtes ci-dessus aux adresses de contact spécifiées. Je vous tiens au courant si j'ai une réponse.
« Modifié: 08 mars 2016 à 08:40:12 par Marin »

Darklight

  • Abonné Free adsl
  • *
  • Messages: 648
  • Free non-dégroupé (77)
infegy.com fait de milliers de requetes par jour sur lafibre.info
« Réponse #9 le: 07 mars 2016 à 19:52:59 »
J'apporte une petite notification : le très célèbre topic  Remplacer sa Livebox par un routeur Ubiquiti Edgemax avait aux alentours de 19h45-50 ce jour (07/03) une trentaine de visiteurs pour 2 personnes connectées lisant le topic. ça me semble être pour les mêmes raisons.

vivien

  • Administrateur
  • *
  • Messages: 47 268
    • Twitter LaFibre.info
infegy.com fait de milliers de requetes par jour sur lafibre.info
« Réponse #10 le: 07 mars 2016 à 21:24:41 »
On dépasse largement les 200 000 pages vue pour aujourd'hui (cf https://lafibre.info/stats/)

En cause entre 7h et 21h aujourd'hui, "collection@infegy.com" qui s'est déchaîné et a fait 111 000 requêtes !

Je me demande si les requêtes RSS compte comme des pages vues pour SMF (c'est une partie importante des requêtes infegy)

vivien

  • Administrateur
  • *
  • Messages: 47 268
    • Twitter LaFibre.info
infegy.com fait de milliers de requetes par jour sur lafibre.info
« Réponse #11 le: 07 mars 2016 à 21:32:49 »
Les requêtes se sont vraiment amplifiées depuis hier et sont réalisées par période :

Nombre de requêtes Apache2 :


Requêtes My-SQL :


Fréquences du processeur :


Load average sur 5 minutes :



Si cela continue, la solution sera de filtrer les IP en questions.