La Fibre
Fonctionnement du forum => A lire avant de commencer... => Évolution de LaFibre.info, bugs et critiques => Discussion démarrée par: corrector le 28 février 2012 à 08:22:04
-
Certaines pages contiennent :
<meta name="robots" content="noindex" />
d'autres pages similaires, non.
Quelle est la logique? Suis-je le seul à trouver cela étrange?
Quelle est l'intention?
-
Heu.....
https://www.google.ch/search?sourceid=chrome&ie=UTF-8&q=%3Cmeta+name%3D%22robots%22 (https://www.google.ch/search?sourceid=chrome&ie=UTF-8&q=%3Cmeta+name%3D%22robots%22)
retourne
http://www.annuaire-info.com/robots-txt/meta-robots/ (http://www.annuaire-info.com/robots-txt/meta-robots/)
en 2eme reponse...
C'est un robot.txt en html (avec bientot 2000 contributions sur ce forum je suppose que tu connais....)
D'autres questions??....
a moins que cette question porte sur un site en particulier....
-
On est dans la section "Les messages à lire, les bugs et critiques".
Les critiques sur ... lafibre.info!
-
ahh .. ok ... Bon .. Ok ...Je vais chercher la corde pour aller me pendre. :-(
A+
(Je me disais bien qu'une question aussi simple cachait quelque chose :-P )
-
Titre modifié pour éviter tout malentendu.
-
Pour répondre, c'est le code de SMF. Il me semble logique de ne pas indexer certaines pages où le contenu n'a aucun intérêt pour les robots (comme celle pour se connecter).
Tu n'as pas donné d'exemple de pages avec "noindex"...
-
La plupart apparemment, à commencer par celle-ci.
-
"où le contenu n'a aucun intérêt pour les robots"
Etonnant, y aurait-il une nouvelle espèce de robot plus évoluée qui s’instruirait, se cultiverait lors de ses passages sur les sites tout en collectant des adresses de pages à indexer pour leur propriétaires ?
-
Cette page est bel et bien indexée par Google : https://www.google.fr/search?q=inurl:https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/ (https://www.google.fr/search?q=inurl:https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/)
et consultable via le cache https://www.google.fr/search?q=cache:https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/ (https://www.google.fr/search?q=cache:https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/)
-
On voit bien que la page du cache Google n'a pas <meta name="robots" content="noindex" />
(Les autres déclarations semblent identiques.)
-
Cette page le "noindex" est dans le texte des messages et non dans les en-tête html. (j'ai fait une recherche dans le code source)
-
Oui, voilà, le noindex dans l'élèment meta comme je l'ai indiqué. Sur la page Google il n’apparaît pas.
Et donc?
-
J'ai cherché pour comprendre.
<meta name="robots" content="noindex" /> est rajouté sur les pages avec une URL spécifique pour ne lire qu'un message.
https://lafibre.info/tester-son-debit/ping-systeme-exploitation/ (https://lafibre.info/tester-son-debit/ping-systeme-exploitation/) => non présent
https://lafibre.info/tester-son-debit/ping-systeme-exploitation/msg34182/#msg34182 (https://lafibre.info/tester-son-debit/ping-systeme-exploitation/msg34182/#msg34182) => présent
-
Ah ouai donc c'est pour que les robot n'indexent pas deux fois la même pages qui a en fait 2 URLs differentes.
Seule l'URL principale est indexée. Google sait reconnaître les doublons (il faut cliquer sur "relancer la recherche en incluant les pages ignorées." pour pouvoir voir les doublons)
Les autres moteurs de recherche ne sont peut etre pas aussi intelligent...
A+
-
Ah, d'accord. En fait ce site est conçu pour assurer la stabilité des liens, ce qui est une très bonne chose. Il y a des URL "logiques" stables qu'il faut utiliser pour les hyperliens :
https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/msg45218/#msg45218 (https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/msg45218/#msg45218)
Le site génère autant d'adresses "logiques" que de messages, c'est à dire beaucoup d'adresses.
Cet objet contient un lien vers l'adresse "physique" du document :
<link rel="canonical" href="https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/12/" />
l'adresse "physique" du message est donc
https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/12/#msg45218 (https://lafibre.info/les-messages-a-lire-les-bugs-et-critiques/etrangete-ltmeta-namerobots-contentnoindex-gt/12/#msg45218)
Il faut éviter de mettre une adresse "physique" dans un hyperlien.
-
<meta name="robots" content="noindex" /> est rajouté sur les pages avec une URL spécifique pour ne lire qu'un message.
https://lafibre.info/tester-son-debit/ping-systeme-exploitation/ (https://lafibre.info/tester-son-debit/ping-systeme-exploitation/) => non présent
présent dans l'index :
inurl:https://lafibre.info/tester-son-debit/ping-systeme-exploitation/ (https://www.google.fr/search?q=inurl%3Ahttp%3A%2F%2Flafibre.info%2Ftester-son-debit%2Fping-systeme-exploitation%2F) 3 résultats
https://lafibre.info/tester-son-debit/ping-systeme-exploitation/msg34182/#msg34182 (https://lafibre.info/tester-son-debit/ping-systeme-exploitation/msg34182/#msg34182) => présent
Non présent dans l'index :
Aucun document ne correspond aux termes de recherche spécifiés (inurl:https://lafibre.info/tester-son-debit/ping-systeme-exploitation/msg34182/).
C'est bon.
-
À la réflexion, c'est un très mauvais système : aucun hyperlien vers un message du forum n'existe pour Google. Ce qui explique que https://lafibre.info/ (https://lafibre.info/) est PR 3 mais que les autres pages sont PR 0 ou 1.