La Fibre

Télécom => Télécom => télécom Veille technologique => Discussion démarrée par: Leon le 25 mai 2014 à 12:37:58

Titre: Intérêt des URL raccourcies
Posté par: Leon le 25 mai 2014 à 12:37:58
Bonjour à tous,

J'aimerai comprendre la mode des URL raccourcies que de plus en plus de gens utilisent en ce moment : tinyurl ou autre.
Je comprend l'intérêt dans le cas de twitter, vu le nombre limité de caractères, pas de problème.

Mais pourquoi les gens l'utilisent dans les e-mails, dans les forums, mailing-list, blogs?
Pour moi, le gros inconvénient de ce genre d'URL raccourcies, c'est qu'on ne sait absolument pas sur quel site on va aboutir : site fiable/officiel, ou alors site rempli de cochonneries (script pourri qui tenterai d'installer un virus).
En regardant une URL complète, on arrive à voir par exemple les liens vers les sites connus et/ou officiels.

Leon.
Titre: Intérêt des URL raccourcies
Posté par: NBQG1304 le 25 mai 2014 à 13:06:58
Si tu rajoutes un "+" à la fin de l'url et que tu fais entrée dans la barre d'adresses de ton navigateur, tu peux voir l'url au complet par moment (ça fonctionne avec bitly, goo.gl).
Titre: Intérêt des URL raccourcies
Posté par: Marin le 25 mai 2014 à 13:53:27
J'aimerai comprendre la mode des URL raccourcies que de plus en plus de gens utilisent en ce moment : tinyurl ou autre.

Je dirais que ça fait quelques années, je n'ai pas constaté d'amplification récente du phénomène.

Je comprend l'intérêt dans le cas de twitter, vu le nombre limité de caractères, pas de problème.

Ça n'a plus d'intérêt sur Twitter : depuis un bon moment, tous les liens comptent pour une vingtaine de caractères, quelle que soit leur longueur.

La plupart des gens qui utilisent toujours des URL raccourcies sur Twitter doivent le faire par habitude, éventuellement par esthétisme.

Mais pourquoi les gens l'utilisent dans les e-mails, dans les forums, mailing-list, blogs?

Pour le raccourcisseur t.co, entre autres, cela s'explique par le fait que Twitter y fait passer systématiquement tous les liens externes accessibles via le réseau social ; bien que ce soient les liens d'origine qui s'affichent dans les tweets, on obtiendra un lien t.co en faisant « Clic droit → Copier l'adresse du lien ». Cela leur permet d'afficher des avertissements pour les liens catégorisés comme malveillants, et probablement de faire des statistiques. Certaines personnes peuvent donc avoir copié-collé un lien raccourci sans forcèment le vouloir, mais parce qu'elles l'avaient trouvé sous forme raccourcie à un autre endroit.

Pour les autres raccourcisseurs, cela peut s'expliquer principalement par le fait que beaucoup de raccourcisseurs d'URL permettent également d'obtenir des statistiques sur les liens ; les liens raccourcis ne servent donc pas qu'à raccourcir.

Dans certains cas précis, les raccourcisseurs peuvent aussi permettre d'éviter de défigurer un message avec un lien trop volumineux, voire de plusieurs lignes.

En dehors des médias en ligne, les liens raccourcis ont un certain intérêt sur papier, car ils permettent au lecteur d'avoir à recopier moins de caractères.

Pour moi, le gros inconvénient de ce genre d'URL raccourcies, c'est qu'on ne sait absolument pas sur quel site on va aboutir : site fiable/officiel, ou alors site rempli de cochonneries (script pourri qui tenterai d'installer un virus).
En regardant une URL complète, on arrive à voir par exemple les liens vers les sites connus et/ou officiels.

Personnellement, j'ai l'habitude de faire un "curl -v" dans mon terminal quand je tombe sur un lien raccourci ou douteux.
Titre: Intérêt des URL raccourcies
Posté par: kgersen le 25 mai 2014 à 14:02:03
L’intérêt n°1 est qu'on peut saisir facilement 'a la main' l'url voir même s'en souvenir. On a pas toujours la possibilité de coupier/coller notamment lorsqu'on voit l'url sur un autre ecran (smartphone,tablette vers PC ou l'inverse par exemple) ou support (papier, video youtube, video projection lors d'une conférence,...).

Aussi, ca a un gros interet pour celui qui fournit l'url raccourcie car ca lui permet d'avoir plein de stats et d'infos sur l'utilisation qui est faite de l'url (combien de clicks, d'ou , avec quels navigateurs, quels OS, etc). Certains permettent a tout le monde de voir ces stats pas seulement le créateur du raccourci, notamment goo.gl, il suffit de mettre /info a la place du 3eme /  ( http://goo.gl/qwaBfT (http://goo.gl/qwaBfT) -> http://goo.gl/info/qwaBfT (http://goo.gl/info/qwaBfT) )

On peut aussi avoir plusieurs url raccourcies pour la meme url finale de facon a savoir comment une source d'information se propage par exemple. Typiquement on va donner une url courte a site/blog d'info et une autre url courte a un autre site/blog et apres quel temps on saura qui a amener plus de monde sur l'url finale qui peut etre une video Youtube par exemple ou un site web tiers qu'on ne controle pas et donc dont on a pas les stats de fréquentation).

Titre: Intérêt des URL raccourcies
Posté par: Polynesia le 25 mai 2014 à 14:59:45
intéressant tout çà :)

Moi j'utilise une extension firefox pour voir la vrai url : Long url please mod
Titre: Intérêt des URL raccourcies
Posté par: kgersen le 25 mai 2014 à 15:40:47
si on aime pas les extensions de navigateurs il y a aussi quelques sites qui proposent ca comme:

http://wheredoesthislinkgo.com (http://wheredoesthislinkgo.com)
et
http://urlex.org (http://urlex.org)

et plein d'autres dont certains a éviter car saturés de pubs ;)

Titre: Intérêt des URL raccourcies
Posté par: corrector le 09 juillet 2014 à 04:11:37
Certaines URL sont vraiment longues :

https://www.change.org/petitions/those-concerned-about-food-safety-and-gmos-motivate-dr-don-huber-to-release-his-gmo-and-glyphosate-enriched-pathogen-to-the-scientific-community-so-it-may-be-sequenced-and-studied-before-it-harms-others (https://www.change.org/petitions/those-concerned-about-food-safety-and-gmos-motivate-dr-don-huber-to-release-his-gmo-and-glyphosate-enriched-pathogen-to-the-scientific-community-so-it-may-be-sequenced-and-studied-before-it-harms-others)
Titre: Intérêt des URL raccourcies
Posté par: kgersen le 09 juillet 2014 à 08:07:57
http://thelongestlistofthelongeststuffatthelongestdomainnameatlonglast.com/wearejustdoingthistobestupidnowsincethiscangoonforeverandeverandeverbutitstilllookskindaneatinthebrowsereventhoughitsabigwasteoftimeandenergyandhasnorealpointbutwehadtodoitanyways.html (http://thelongestlistofthelongeststuffatthelongestdomainnameatlonglast.com/wearejustdoingthistobestupidnowsincethiscangoonforeverandeverandeverbutitstilllookskindaneatinthebrowsereventhoughitsabigwasteoftimeandenergyandhasnorealpointbutwehadtodoitanyways.html)
Titre: Intérêt des URL raccourcies
Posté par: corrector le 15 octobre 2014 à 11:07:24
Autre URL ridicule :

http://www.lanouvellerepublique.fr/Vienne/Actualite/24-Heures/n/Contenus/Articles/2014/10/15/Cette-insistance-d-une-certaine-droite-a-ne-pas-feminiser-deliberement-les-titres-denote-un-archaisme-et-un-sexisme-qui-s-abritent-indument-derriere-l-Academie-francaise-elle-dit-surtout-leur-refus-de-voir-des-femmes-acceder-aux-plus-haute-2082149 (http://www.lanouvellerepublique.fr/Vienne/Actualite/24-Heures/n/Contenus/Articles/2014/10/15/Cette-insistance-d-une-certaine-droite-a-ne-pas-feminiser-deliberement-les-titres-denote-un-archaisme-et-un-sexisme-qui-s-abritent-indument-derriere-l-Academie-francaise-elle-dit-surtout-leur-refus-de-voir-des-femmes-acceder-aux-plus-haute-2082149)
Titre: Intérêt des URL raccourcies
Posté par: corrector le 04 novembre 2014 à 21:53:03
Les URL de l'ARCEP contenaient jusqu'à présent des symboles [ et ] incompatibles avec le BBCode des blogs et logiciels de forum

http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1[uid]=1640&tx_gsactualite_pi1[backID]=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73
Ces symboles sont maintenant échappés :

http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73 (http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73)
Titre: Intérêt des URL raccourcies
Posté par: Marin le 04 novembre 2014 à 22:10:46
Les URL de l'ARCEP contenaient jusqu'à présent des symboles [ et ] incompatibles avec le BBCode des blogs et logiciels de forum

http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1[uid]=1640&tx_gsactualite_pi1[backID]=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73
Ces symboles sont maintenant échappés :

http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73 (http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73)
Il ne semble pas y avoir eu de changement à ce niveau. C'est ton navigateur qui choisit d'appliquer ou pas l'urlencoding (https://en.wikipedia.org/wiki/Percent-encoding) sur ces caractères quand tu copies l'URL (que ce soit depuis la barre d'adresse, ou via « Clic droit -> Copier l'adresse du lien »).
Titre: Intérêt des URL raccourcies
Posté par: corrector le 05 novembre 2014 à 00:12:30
Il ne semble pas y avoir eu de changement à ce niveau.
Si.

C'est ton navigateur qui choisit d'appliquer ou pas l'urlencoding (https://en.wikipedia.org/wiki/Percent-encoding) sur ces caractères quand tu copies l'URL (que ce soit depuis la barre d'adresse, ou via « Clic droit -> Copier l'adresse du lien »).
Non, le navigateur n'encode rien du tout il copie l'URL.

Il y a bien deux URL différentes qui permettent d'accéder au même document :

GET /index.php?id=8571&tx_gsactualite_pi1[uid]=1640&tx_gsactualite_pi1[backID]=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73 HTTP/1.1
Host: www.arcep.fr (http://www.arcep.fr)
Connection: keep-alive
Cache-Control: max-age=0

vs.

GET /index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73 HTTP/1.1
Host: www.arcep.fr (http://www.arcep.fr)
Connection: keep-alive
Cache-Control: max-age=0
Titre: Intérêt des URL raccourcies
Posté par: corrector le 05 novembre 2014 à 00:37:52
Est-ce que [ et ] ont une signification particulière dans les URL?
Titre: Intérêt des URL raccourcies
Posté par: Nico le 05 novembre 2014 à 07:46:42
Dans l'url de l'arcep j'ai l'impression que "[uid]=" remplace ce qui habituellement serait noté "&uid=".
Titre: Intérêt des URL raccourcies
Posté par: Marin le 05 novembre 2014 à 10:01:36
Est-ce que [ et ] ont une signification particulière dans les URL?
En PHP, cela permet de faire passer une variable POST/GET sous forme de tableau plutôt que de chaîne de caractères.

Demander cette URL : http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1[uid]=1640&tx_gsactualite_pi1[backID]=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73
Ou cette URL : http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73 (http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73)

Provoquera l'assignation des variables suivantes en interne :

$_GET['id'] = '8571';
$_GET['tx_gsactualite_pi1'] = array(
    'uid' => '1640',
    'backID' => '26',
    'cHash' => 'c5c83c0f3115509e9ffbc4d8a9377c73'
);

Si.
Les liens semblent être présents avec les crochets encodés par endroits sur le site de l'ARCEP, mais sans changement uniforme. Ils ne sont par exemple pas encodés dans la colonne de droite de la page d'accueil, et j'observe globalement plus de crochets décodés qu'encodés.

Non, le navigateur n'encode rien du tout il copie l'URL.
Firefox effectue bien un décodage, après chargement, au moment d'afficher l'URL dans la barre d'adresse, et un réencodage au moment où l'utilisateur copie l'URL depuis celle-ci.

Si je consulte une URL du site de l'ARCEP, même si les crochets dans l'URL d'origine sont encodés, Firefox les affichera décodés, et les copiera décodés si la copie est faîte depuis la barre d'adresse (donc si changement dans les liens il y a eu par endroits, ça ne porte qu'un intérêt limité, avec Firefox en tous cas).

Si je vais sur cette URL : http://perdu.com/?%C3%A9=%C3%A9 (http://perdu.com/?%C3%A9=%C3%A9)
Ou sur cette URL : http://perdu.com/?é=é (http://perdu.com/?é=é)
Dans les deux cas, Firefox affichera ceci après chargement : http://perdu.com/?é=é (http://perdu.com/?é=é)
Quand je copierai la totalité URL, Firefox effectuera un réencodage, qui ne sera pas visible au niveau de la barre mais sera présent dans le presse-papiers : http://perdu.com/?%C3%A9=%C3%A9 (http://perdu.com/?%C3%A9=%C3%A9)
Mais si je ne copie qu'une partie de l'URL, Firefox n'effectuera pas le réencodage : tp://perdu.com/?é=é

Le traitement est différent selon les caractères. Certains caractères, comme "=", "&" ou "?" quand eux ont été encodés dans l'URL de base, ou les caractères non-imprimables comme 0x00, seront systématiquement affichés encodés dans la barre d'adresse.

Je conçois que le comportement diffère avec Google Chrome.
Titre: Intérêt des URL raccourcies
Posté par: corrector le 05 novembre 2014 à 14:15:48
Si je vais sur cette URL : http://perdu.com/?%C3%A9=%C3%A9 (http://perdu.com/?%C3%A9=%C3%A9)
Ou sur cette URL : http://perdu.com/?é=é (http://perdu.com/?é=é)
Dans les deux cas, Firefox affichera ceci après chargement : http://perdu.com/?é=é (http://perdu.com/?é=é)
Quand je copierai la totalité URL, Firefox effectuera un réencodage, qui ne sera pas visible au niveau de la barre mais sera présent dans le presse-papiers : http://perdu.com/?%C3%A9=%C3%A9 (http://perdu.com/?%C3%A9=%C3%A9)
Mais si je ne copie qu'une partie de l'URL, Firefox n'effectuera pas le réencodage : tp://perdu.com/?é=é

()

Je conçois que le comportement diffère avec Google Chrome.
En l'occurrence, non.
Titre: Intérêt des URL raccourcies
Posté par: kgersen le 05 novembre 2014 à 14:57:33
La norme HTTP ne prévoit pas autre chose qu'une simple liste de valeurs : un nom de variable et sa valeur (key-value pairs).

Demander cette URL : http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1[uid]=1640&tx_gsactualite_pi1[backID]=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73
Ou cette URL : http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73 (http://www.arcep.fr/index.php?id=8571&tx_gsactualite_pi1%5Buid%5D=1640&tx_gsactualite_pi1%5BbackID%5D=26&cHash=c5c83c0f3115509e9ffbc4d8a9377c73)

Provoquera l'assignation des variables suivantes en interne :

$_GET['id'] = '8571';
$_GET['tx_gsactualite_pi1'] = array(
    'uid' => '1640',
    'backID' => '26',
    'cHash' => 'c5c83c0f3115509e9ffbc4d8a9377c73'
);
Le cHash n'est pas dans le tableau je pense.

Sous Chrome DevTools ca donne (F12, charger la page, onglet 'network', cliqueer la ligne du GET, puis onglet 'header'):

id:8571
tx_gsactualite_pi1[uid]:1640
tx_gsactualite_pi1[backID]:26
cHash:c5c83c0f3115509e9ffbc4d8a9377c73

donc 'coté' client c'est 4 variables et leur 4 valeurs. Les crochets étant admis dans le nom d'une variable (mais doivent être "url encodés".cf plus bas).

Une interprétation coté serveur du genre:
$_GET['id'] = '8571';
$_GET['tx_gsactualite_pi1'] = array(
    'uid' => '1640',
    'backID' => '26'
);
$_GET['cHash'] => 'c5c83c0f3115509e9ffbc4d8a9377c73';

est spécifique au serveur (PHP ici). Un autre serveur peut interpréter cela différemment.

Les crochets ("[" et "]") ont été ajouté au "reserved set" qui doit être encodé. Ils ont été introduit pour les adresses IPv6.
Citer
   A host identified by an Internet Protocol literal address, version 6
   [RFC3513] or later, is distinguished by enclosing the IP literal
   within square brackets ("[" and "]").  This is the only place where
   square bracket characters are allowed in the URI syntax
.
Pour bien préciser tout ca il faudrait lire a fond les 60 pages de la http://tools.ietf.org/html/rfc3986 (http://tools.ietf.org/html/rfc3986) ..;)

et certains aiment pinailler sur le fait que certaines URL ne sont pas des URI stricto sensu, souvent a cause des crochets d'ailleurs.
Titre: Intérêt des URL raccourcies
Posté par: Marin le 05 novembre 2014 à 15:07:06
Le cHash n'est pas dans le tableau je pense.

Effectivement, je n'y ai pas mis beaucoup d'attention.