Auteur Sujet: Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)  (Lu 5570 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 211
    • Twitter LaFibre.info
Je cherche un outil ou plug-in pour a récupérer la taille des pages sur Internet, afin de faire des statistiques sur l'évolution de la taille des pages web (en incluant les objets rajoutés sur la page, les pub ect...)

Idéalement, je pourrais automatiser la chose en introduisant une longue liste de page web (exemple : le top30 Alexa https://lafibre.info/images/stats/201511_top30_alexa.txt ) et en définissant un time-out (car certaines pages se chargent sans limite avec des vidéos)

Vous avez une idée de ce que je pourrais utiliser ? (30 pages web cela se fait a la main, mais je voudrais faire des stats sur bien plus que 30 pages web)

Sur Android, il y a Tasker qui sait automatiser n'importe quoi, y compris l'ouverture de pages web sur Google Chrome.

Sur un PC (Windows ou Linux peu importe, cela ne devrait pas jouer sur la taille des pages), je ne trouve pas.

Idéalement, si l'outil pourrait me donner le temps de chargement de la page web, ce serait top.

Citefibre (102 requêtes - 349Ko)
Declic Telecom (287 requêtes - 1784Ko)
https://1.testdebit.info/fichiers/5000Mo/5000Mo.iso
https://2.testdebit.info/fichiers/5000Mo/5000Mo.iso
https://ikoula.testdebit.info/fichiers/5000Mo.dat
https://ikoula.testdebit.info/fichiers/1000Mo.dat

4,41 Mb/s ATM avec Windows + Firefox : (sans timestamps)
- CiteFibre : 1,26sec => 4,3 sec (1 connexion) => 12sec (2 connexions) => 22sec (3 connexions)
- DeclicTelecom : 4,70sec => 11,6 sec (1 connexion) => 29sec (2 connexions) => 57sec (3 connexions)

4,41 Mb/s ATM avec Ubuntu + Firefox : (avec timestamps)
- CiteFibre : 1,30sec => 18,7 sec (1 connexion) => 19sec (2 connexions) => 21sec (3 connexions)
- DeclicTelecom : 4,15sec => 45,4 (1 connexion) => 49sec (2 connexions) => 60 sec (3 connexions)

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #1 le: 06 novembre 2015 à 18:01:32 »
Salut,

Il faudrait préciser le besoin. Tu voudrais effectuer ces mesures tous les x mois, tous les x jours de manière régularisée ? sur une base individuelle ? en remontant dans le passé avec Archive.org ? Tu admets la possibilité de scripter certaines actions (bash, Node.js, perl, autre) ?

Selon l'usage, je me serais sûrement dirigé vers une solution type PhantomJS, ou vers un bricolage sur la base d'un autre outil (type Scapy ?) pour mesurer la bande passante d'un vrai navigateur qui tournerait de manière automatisée et/ou confinée, + une tâche cron.

J'ai trouvé un article relativement récent qui traite d'une partie du sujet : https://mobiforge.com/design-development/measuring-page-weight

vivien

  • Administrateur
  • *
  • Messages: 47 211
    • Twitter LaFibre.info
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #2 le: 06 novembre 2015 à 18:18:17 »
Idéalement, je ferais tourner le script tous les jour, pour avoir des données fiables.
PhantomJS est une idée mais j'aurais préféré un vrai navigateur web pour ne pas avoir de biais de mesure.

Pas besoin de revenir en arrière.
Il faut que les données sortent pour chaque site

Ce que je souhaiterais sortir :
- Un graphe pour voir la taille moyenne évoluer dans le temps (peut être sortir la taille 5centile et 95centile dans le temps)
- Un graphe pour montrer la distribution de la taille des pages web.
- Le top des 10 sites les plus lourd
- Le temps de chargement en bonus, mais j'imagine que cela doit être galère d'avoir qq chose de fiable.

Exemple concret :


Phach

  • Abonné Orange Fibre
  • *
  • Messages: 1 031
  • Hérault (34) - Occitanie
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #4 le: 09 novembre 2015 à 15:14:52 »
je dirais qu'avec CURL y a moyen de s'amuser.
je vais regarder vite fait si je trouve une ligne de commandes qui ferait l'affaire.

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #5 le: 09 novembre 2015 à 15:18:05 »
bonjour,
ce n'est pas cela que tu cherches

Non, vivien parle d'une « longue liste de page web (exemple : le top30 Alexa) », pas juste de son site.

je dirais qu'avec CURL y a moyen de s'amuser.

Non, vivien dit « (avec les objets) » et parle de conditions réelles. curl est un client HTTP, pas HTML ni Flash très basique.

vivien

  • Administrateur
  • *
  • Messages: 47 211
    • Twitter LaFibre.info
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #6 le: 09 novembre 2015 à 15:19:34 »
Il y a également HTTrack Website Copier, mais ils n'aspire pas tout...

Je pense que le plus simple serait peut être de démarrer le navigateur et compter les octets pendant 1 minute puis fermer le navigateur.

Phach

  • Abonné Orange Fibre
  • *
  • Messages: 1 031
  • Hérault (34) - Occitanie
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #7 le: 09 novembre 2015 à 15:33:00 »
les outils intégré dans les navigateur le font mais ca implique le comptage à la main
exemple lefigaro.fr avec firefox

 

Marin

  • Client Bbox vdsl
  • Modérateur
  • *
  • Messages: 2 804
  • 73
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #8 le: 09 novembre 2015 à 15:45:17 »
Il y a également HTTrack Website Copier, mais ils n'aspire pas tout...

On est déjà un gros niveau en dessous de Phantom niveau « biais de mesure ».

Dans tous les cas un vrai navigateur semble préférable pour ce qui est des contenus Flash et vidéos, s'ils sont déterminants (sauf navigateur sans-tête convaincant).

- Le top des 10 sites les plus lourd

Cela dépendrait fortement de la taille de l'index.

- Un graphe pour voir la taille moyenne évoluer dans le temps (peut être sortir la taille 5centile et 95centile dans le temps)
- Un graphe pour montrer la distribution de la taille des pages web.

Si ça peut t'intéresser, j'ai trouvé un projet qui fait ce genre de graphes (de novembre 2010 à novembre 2015) :
http://httparchive.org/trends.php?s=All&minlabel=Nov+15+2010&maxlabel=Nov+1+2015
http://httparchive.org/interesting.php





L'explication de la méthodologie : http://httparchive.org/about.php#listofurls

- Le temps de chargement en bonus, mais j'imagine que cela doit être galère d'avoir qq chose de fiable.

Tout dépend de comment tu le définis, l'indicateur de chargement du navigateur devrait être facilement capturable dans le cas de figure idoine.

kgersen

  • Modérateur
  • Abonné Bbox fibre
  • *
  • Messages: 9 092
  • Paris (75)
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #9 le: 09 novembre 2015 à 15:51:06 »
http://www.webpagetest.org/ est pas mal connu et a une API pour faire des batchs. C'est fait par Google et on peut soit utiliser leur service soit l'utiliser en privé sur son propre serveur: https://sites.google.com/a/webpagetest.org/docs/private-instances


ici un test de lafibre.info: http://www.webpagetest.org/result/151109_T6_Q0C/ (click sur les entrées de la barre noire pour les details)

vivien

  • Administrateur
  • *
  • Messages: 47 211
    • Twitter LaFibre.info
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #10 le: 09 novembre 2015 à 18:04:33 »
Ce que j'aimerais bien mettre en base, c'est cette sortie de webpagetest.org ou récupérer celle de Firefox ou chrome.

Les 3 infos qui m'intéressent sont bien données par Firefox (attention il faut vider son cache avant de faire le test) :
- 65 requêtes
- 664,16 Ko
- 0,90 secondes


Je pensais qu'il y avait déjà dés utilitaires pour scripter le chargement d'une page et récupérer la donnée, puis passer au second site ect...

BadMax

  • Client Free adsl
  • Expert
  • *
  • Messages: 3 481
  • Malissard (26)
Cherche outil / plug-in pour mesurer la taille des pages web (avec les objets)
« Réponse #11 le: 09 novembre 2015 à 18:18:56 »
J'ai le même résultat avec wget et les options récursives:
$ wget -P /tmp/www -H -p --exclude-domains xiti.com,nexus.ensighten.com,doubleclick.net,webtrendslive.com,google-analytics.com https://lafibre.info
-snip-
Downloaded: 73 files, 566K in 1.1s (518 KB/s)