La Fibre

Fonctionnement du forum => A lire avant de commencer... => profile Évolution de LaFibre.info, bugs et critiques => Discussion démarrée par: vivien le 26 mars 2017 à 17:28:51

Titre: Correction automatique de quelques fautes d'orthographe
Posté par: vivien le 26 mars 2017 à 17:28:51
Correction de quelques fautes d'orthographe, automatiquement, chaque nuit

J'ai réalisé un petit script qui change quelques sites http en https et quelques fautes d’orthographes courantes pour lequel il n'y a pas d’ambiguïté.

Seul le contenu des messages du forum est corrigé. Les titres ou les messages privés ne sont pas corrigés.

Concrètement c'est un script perl, avec des commandes SQL :
(https://lafibre.info/images/stats/201703_script_perl_correction_fautes.png)

Si vous avez des suggestions, n'hésitez pas à le faire, ici. Je ferai tous les trois mois une mise à jour du script pour intégrer les demandes qui n'ont pas été contestées.
Titre: Correction de quelques fautes orthographique automatique
Posté par: jayrem le 26 mars 2017 à 17:42:40
Je crois que l’ambiguïté persiste concernant "c'est la".
Exemples : "c'est la fête au village" , "c'est la faute à", "c'est la mairie qui doit"
Titre: Correction de quelques fautes orthographique automatique
Posté par: corrector le 26 mars 2017 à 18:17:33
Je crois que l’ambiguïté persiste concernant "c'est la".
Exemples : "c'est la fête au village" , "c'est la faute à", "c'est la mairie qui doit"
Il y a aussi

j'ai apporté les dés que j'ai achetés

qui deviendrait

j'ai apporté les dès que j'ai achetés

qui ne veut plus rien dire.

C'est la difficulté de la correction grammaticale; même si une modification est correcte dans 99% des cas, il peut rester des cas plus rares où elle est fausse, hors là elle se produirait automatiquement, sans avertissement et sans possibilité de l'empêcher. Si quelqu'un éditait un de ses messages pour retirer une correction automatique erronée, elle serait remise automatiquement!

C'est pourquoi je suis totalement opposé à des automatismes qui sont seulement dans la plupart des cas valides.

En plus ce script pourrait modifier même les copies d'articles, ce qui détruirait le caractère de citation authentique, en empêcherait de retrouver le passage dans l'original avec la fonction recherche du navigateur (gogol sait retrouver un texte en ayant une copie approximative, le C-f du navigateur non).
Titre: Correction de quelques fautes orthographique automatique
Posté par: buddy le 26 mars 2017 à 18:41:44
Personnellement j'enleverai le c'est la en c'est là. On peut dire c'est la box qui fait routeur. Il ne faut pas corriger dans ce cas là..
Titre: Correction de quelques fautes orthographique automatique
Posté par: corrector le 26 mars 2017 à 18:49:26
(https://lafibre.info/images/stats/201703_script_perl_correction_fautes.png)
vivien, pourquoi as-tu posté une image peu lisible? C'est déplaisant. J'ai réglé mon navigateur et mon système pour affiche les textes d'une certaines taille, qui convient à la résolution de mon écran et sa distance par rapport à moi.

Mais sans doute avais-tu réalisé l'absurdité Orwellienne que tu vas créer avec ton script qui empêchera de citer des morceaux de lui-même sur le forum.

Je dois faire attention, ai-je le droit d'utiliser ce terme? L'Immonde et ses acolytes tout aussi véreux et malhonnêtes ont dénoncé la navrante Natacha Polony pour son usage du nom de Orwell pour sa chaîne (probablement aussi navrante que ses éditoriaux aussi malhonnêtes que pitoyables sur une radio gocho-bobo à botte des différents pouvoirs), ce qui est assez Orwellien.
Titre: Correction de quelques fautes orthographique automatique
Posté par: jayrem le 26 mars 2017 à 18:53:27
Oui, il faut prendre en compte le contexte et alors,il me semble, utiliser un algorithme basé sur l'apprentissage profond et là ça a l'air coton.
J'ai cherché un article en anglais et j'ai trouvé ça pour les curieux : https://medium.com/@majortal/deep-spelling-9ffef96a24f6#.5tx1yq2sb
Titre: Correction de quelques fautes orthographique automatique
Posté par: corrector le 26 mars 2017 à 19:31:34
Je vote contre sauf :
- si les citations (sauf les citations de messages du forum eux-mêmes corrigés) sont détectées et non modifiées, qu'elles soient en "quote", en couleur, entre guillemets
- le fait de préciser "(sic)" évite la correction
- l'auteur du message est averti des corrections
- c'est désactivable
- les corrections incertaines mentionnées précédemment ne sont pas faites
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 26 mars 2017 à 21:03:34
Je crois que l’ambiguïté persiste concernant "c'est la".
Exemples : "c'est la fête au village" , "c'est la faute à", "c'est la mairie qui doit"
Personnellement j'enleverai le c'est la en c'est là. On peut dire c'est la box qui fait routeur. Il ne faut pas corriger dans ce cas là..
C'est supprimé de la liste des corrections automatiques.

Je n'avais pas pensé à ces phrases courantes.

Pour les "dés que" changé en "dès que", c'est aussi à supprimer ?

vivien, pourquoi as-tu posté une image peu lisible? C'est déplaisant.
Tu as compris qu'une image est nécessaire, sinon le texte serait modifié.

Là j'ai mis des guillemets pour "dés que" ce qui fait que cela ne sera pas supprimé (il faut un espace à la fin pour que le remplacement soit effectué)
Titre: Correction de quelques fautes orthographique automatique
Posté par: corrector le 30 mars 2017 à 19:23:23
Il faudrait que les corrections soient SUGGÉRÉES par le logiciel quand on poste!
Titre: "Ã partir"
Posté par: corrector le 26 mai 2017 à 03:04:59
Le message de vivien, qui comportait des "fautes" de grammaire (*), était le suivant (j'ai une sauvegarde du topic pour le prouver) :

Citation de: vivien
Précisions : beaucoup ne le savent pas, mais les données sont en clair et récupérables localement, par n'importe qui as un accès physique a votre machine logué.

Si votre PC est éteint, la protection de login de Windows ne sert à rien : l'accés a votre disque dur où la possibilité de booter sur une clé USB permet de récupérer les login / mot de passe, si votre disque dur n'est pas chiffré (fonctionnalité proposée uniquement a partir des éditions Pro de Windows).

s'est transformé en (https://lafibre.info/navigateurs/sondage-est-ce-que-vous-enregistrez-vos-mots-de-passe-dans-le-navigateur/msg445186/#msg445186)
Citer
Précisions : beaucoup ne le savent pas, mais les données sont en clair et récupérables localement, par n'importe qui as un accès physique a votre machine logué.

Si votre PC est éteint, la protection de login de Windows ne sert à rien : l'accés a votre disque dur où la possibilité de booter sur une clé USB permet de récupérer les login / mot de passe, si votre disque dur n'est pas chiffré (fonctionnalité proposée uniquement à partir des éditions Pro de Windows).

(*) Je préférerais qu'on dise "erreur" plutôt que "faute" d'orthographe ou de grammaire, mais ce n'est pas moi qui détermine le vocabulaire, pas plus que l'orthographe ni la grammaire

Ce n'est pas la première fois que je vois ce genre de soucis, mais en plus dans ce cas, j'avais encore le topic ouvert dans le navigateur, avec l'ancien contenu.

Comme quoi, la correction auto était une encore plus mauvaise idée que je ne le pensais...
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 26 mai 2017 à 06:47:45
J'ai désactivé la correction automatique, visiblement, mes commandes écrites en UTF8 ne semblent pas avoir se réaliser correctement (alors que si je rentre la même commande dans PHP My Admin je reste en UTF8).

Je pense que c'est le fait de ne pas avoir utilisé use Encode; en perl.

J'ai fait un rechercher / remplacer sur toute la base pour tout corriger, sauf ton message.
Titre: Correction de quelques fautes orthographique automatique
Posté par: corrector le 26 mai 2017 à 07:30:38
L'interprète doit supposer un jeu de caractère donné et tenter une transformation...
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 23 août 2017 à 22:09:56
Le script de correction automatiques des url http vers https et de quelques fautes est de retour.

=> Il a été testé : plus de pb avec les accents, tout est bien en UTF8 de bout en bout
=> Les corrections qui avaient une ambiguïté ont été supprimés
=> J'ai rajouté la modifications des copie d'écran SpeedTest pour qu'elles soient basculées en https (SpeedTest donne des url http mais ils gèrent https)

Voici la liste des corrections, qui sont effectuées chaque nuit à 1h49 du matin :
(https://lafibre.info/images/stats/201708_script_perl_correction_fautes.png)

Si vous avez des idées, notamment pour des sites d'hébergement d'image compatible https, mais qui donnent par défaut des url en http, je suis preneur.

L'idée est de réduire le contenu mixte (images http sur le site LaFibre.info qui est en https)
Titre: Correction de quelques fautes orthographique automatique
Posté par: turold le 24 août 2017 à 01:01:42
Beaucoup mettent maintenant des liens https pour hostingpics.net mais c'est assez récent.

Il faudra vérifier quelques anciens liens en http, en ajoutant que le "s" pour vérifier, car il y a eu une transition où le https était actif que dans un sous-domaine spécial (alt). Mais cela à l'air d'avoir évolué.
Et je pense, à vérifier, qu'ils donnent aussi encore des liens http, avec ceux en https. En tout cas, une recherche Google envoie uniquement sur leur site http, mais le https fonctionne (mais eux-même en contenu mixte^^).
Titre: Correction de quelques fautes orthographique automatique
Posté par: buddy le 07 avril 2020 à 22:10:13
Correction de quelques fautes d'orthographes, automatiquement, chaque nuit

Si vous avez des suggestions, n'hésitez pas à le faire, ici. Je ferai tous les trois mois une mise à jour du script pour intégrer les demandes qui n'ont pas été contestées.[/size]

Il y en a de plus en plus qui écrivent R=D au lieu de Red (de SFR).
Je pense que tu peux l'ajouter à ton script de correction automatique ;)
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 07 avril 2020 à 22:11:21
Enfin ça c'est volontaire...

Je me demande d'où vient cette idée.
Titre: Correction de quelques fautes orthographique automatique
Posté par: buddy le 07 avril 2020 à 22:14:18
Je sais bien que c'est volontaire, mais pour le "pauvre nouveau" qui fait une recherche sur le forum , beh le moteur de recherche ne trouve pas ...
Sans compter qu'il faut comprendre que R=D et RED c'est le même marque...

ça vient de la "stylisation" du logo, sur la page d'accueil de https://www.red-by-sfr.fr/  le R et le D sont en blanc et le E en vert (sur fond vert) donc en haut, au milieu de la page en "blanc" tu vois R=D et du coup il pense que c'est le nouveau nom de la marque ...

Bref, on pourrait l'ajouter quand même, ils déforment le nom d'une marque ;)
Titre: Correction de quelques fautes orthographique automatique
Posté par: kazyor le 13 septembre 2020 à 17:23:40
Nouvelle suggestion car j'en vois de plus en plus ...
FFTH -> FTTH
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 13 septembre 2020 à 20:48:10
C'est mis en place (modification à partir de cette nuit) mais pour limiter les risques je ne prend FTTH que si il y a un espace devant, car je pense que l'on commence peu de phrases par FTTH.
Titre: Correction de quelques fautes orthographique automatique
Posté par: kazyor le 15 septembre 2020 à 10:46:27
Sensible à la casse ?
Posté hier, mais non mis à jour.

https://lafibre.info/raccordement-immeuble/information-ffth/msg791737/#msg791737
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 15 septembre 2020 à 11:49:25
Oui, je n'ai mis que les majuscules.

Je remplace [ffth] par [ftth] ou [FTTH] ?

Idem je ne remplacerais que si il y a un espace devant pour éviter des effets de bords (comme on a eu quelques souci au début, j'y vais doucement).
Titre: Correction de quelques fautes orthographique automatique
Posté par: Nico le 15 septembre 2020 à 11:59:24
Plutôt [FTTH] je dirais.
Titre: Correction de quelques fautes orthographique automatique
Posté par: kazyor le 15 septembre 2020 à 12:03:02
Idem partisan du FTTH.
La langue française ne s'en portera que mieux :)

Sans aller jusqu'à me traiter de grammar nazi, sur les sujets 10Gbps, on a aussi les inversions spf(+)/sfp(+). La correction logique serait SFP(+).
Titre: Correction de quelques fautes orthographique automatique
Posté par: buddy le 15 septembre 2020 à 12:09:33

Idem je ne remplacerais que si il y a un espace devant pour éviter des effets de bords (comme on a eu quelques souci au début, j'y vais doucement).
Dans le cas de FTTH les effets de bords seront moins probables. Il y a peu de chance qu'il y ait des lettres directement collées devant FTTH.
Titre: Correction de quelques fautes orthographique automatique
Posté par: Cochonou le 16 septembre 2020 à 23:57:49
J'ose demander: Correction de quelques fautes orthographique automatique -> Correction de quelques fautes orthographiques automatique, ou même correction de quelques fautes d'orthographe automatique

Merci :)
Titre: Correction de quelques fautes orthographique automatique
Posté par: gillejeu le 20 septembre 2020 à 18:05:43
J'ose demander: Correction de quelques fautes orthographique automatique -> Correction de quelques fautes orthographiques automatiques, ou même correction de quelques fautes d'orthographe automatiques

Merci :)

Corrigé ou alors il faut écrire: Correction automatique de quelques fautes d'orthographe  :D
Titre: Correction de quelques fautes orthographique automatique
Posté par: vivien le 22 septembre 2020 à 09:15:41
Fait.

Le script remplace également [ffth] par [FTTH] (c'est en place depuis cette nuit)
Titre: Correction automatique de quelques fautes d'orthographe
Posté par: buddy le 22 septembre 2020 à 13:09:13
ça corrige les contenus des post mais pas les titres, c'est voulu ? trop de risques d'erreur ?
https://lafibre.info/raccordement-immeuble/information-ffth/msg791737/#msg791737
Titre: Correction de quelques fautes orthographique automatique
Posté par: butler_fr le 22 septembre 2020 à 13:42:05
Idem partisan du FTTH.
La langue française ne s'en portera que mieux :)

Sans aller jusqu'à me traiter de grammar nazi, sur les sujets 10Gbps, on a aussi les inversions spf(+)/sfp(+). La correction logique serait SFP(+).

Sauf que SPF c'est aussi un mécanisme antispam
Donc non ce n'est pas à corriger sauf si tu conditionnes aux + ;)
Titre: Correction de quelques fautes orthographique automatique
Posté par: kazyor le 22 septembre 2020 à 13:47:27
Sauf que SPF c'est aussi un mécanisme antispam
Donc non ce n'est pas à corriger sauf si tu conditionnes aux + ;)

Bien vu ...
Titre: Correction automatique de quelques fautes d'orthographe
Posté par: joel19 le 06 mars 2021 à 17:40:33
Correction de quelques fautes d'orthographe, automatiquement, chaque nuit


box ne prend pas de S même au pluriel : une box, des box.

un souci, des soucis