Auteur Sujet: Correction automatique de quelques fautes d'orthographe  (Lu 9573 fois)

0 Membres et 1 Invité sur ce sujet

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Correction automatique de quelques fautes d'orthographe
« le: 26 mars 2017 à 17:28:51 »
Correction de quelques fautes d'orthographe, automatiquement, chaque nuit

J'ai réalisé un petit script qui change quelques sites http en https et quelques fautes d’orthographes courantes pour lequel il n'y a pas d’ambiguïté.

Seul le contenu des messages du forum est corrigé. Les titres ou les messages privés ne sont pas corrigés.

Concrètement c'est un script perl, avec des commandes SQL :


Si vous avez des suggestions, n'hésitez pas à le faire, ici. Je ferai tous les trois mois une mise à jour du script pour intégrer les demandes qui n'ont pas été contestées.

jayrem

  • Abonné K-Net
  • *
  • Messages: 88
  • Tomblaine (54)
Correction de quelques fautes orthographique automatique
« Réponse #1 le: 26 mars 2017 à 17:42:40 »
Je crois que l’ambiguïté persiste concernant "c'est la".
Exemples : "c'est la fête au village" , "c'est la faute à", "c'est la mairie qui doit"

corrector

  • Invité
Correction de quelques fautes orthographique automatique
« Réponse #2 le: 26 mars 2017 à 18:17:33 »
Je crois que l’ambiguïté persiste concernant "c'est la".
Exemples : "c'est la fête au village" , "c'est la faute à", "c'est la mairie qui doit"
Il y a aussi

j'ai apporté les dés que j'ai achetés

qui deviendrait

j'ai apporté les dès que j'ai achetés

qui ne veut plus rien dire.

C'est la difficulté de la correction grammaticale; même si une modification est correcte dans 99% des cas, il peut rester des cas plus rares où elle est fausse, hors là elle se produirait automatiquement, sans avertissement et sans possibilité de l'empêcher. Si quelqu'un éditait un de ses messages pour retirer une correction automatique erronée, elle serait remise automatiquement!

C'est pourquoi je suis totalement opposé à des automatismes qui sont seulement dans la plupart des cas valides.

En plus ce script pourrait modifier même les copies d'articles, ce qui détruirait le caractère de citation authentique, en empêcherait de retrouver le passage dans l'original avec la fonction recherche du navigateur (gogol sait retrouver un texte en ayant une copie approximative, le C-f du navigateur non).

buddy

  • Expert
  • Abonné Free fibre
  • *
  • Messages: 15 098
  • Alpes Maritimes (06)
Correction de quelques fautes orthographique automatique
« Réponse #3 le: 26 mars 2017 à 18:41:44 »
Personnellement j'enleverai le c'est la en c'est là. On peut dire c'est la box qui fait routeur. Il ne faut pas corriger dans ce cas là..

corrector

  • Invité
Correction de quelques fautes orthographique automatique
« Réponse #4 le: 26 mars 2017 à 18:49:26 »

vivien, pourquoi as-tu posté une image peu lisible? C'est déplaisant. J'ai réglé mon navigateur et mon système pour affiche les textes d'une certaines taille, qui convient à la résolution de mon écran et sa distance par rapport à moi.

Mais sans doute avais-tu réalisé l'absurdité Orwellienne que tu vas créer avec ton script qui empêchera de citer des morceaux de lui-même sur le forum.

Je dois faire attention, ai-je le droit d'utiliser ce terme? L'Immonde et ses acolytes tout aussi véreux et malhonnêtes ont dénoncé la navrante Natacha Polony pour son usage du nom de Orwell pour sa chaîne (probablement aussi navrante que ses éditoriaux aussi malhonnêtes que pitoyables sur une radio gocho-bobo à botte des différents pouvoirs), ce qui est assez Orwellien.

jayrem

  • Abonné K-Net
  • *
  • Messages: 88
  • Tomblaine (54)
Correction de quelques fautes orthographique automatique
« Réponse #5 le: 26 mars 2017 à 18:53:27 »
Oui, il faut prendre en compte le contexte et alors,il me semble, utiliser un algorithme basé sur l'apprentissage profond et là ça a l'air coton.
J'ai cherché un article en anglais et j'ai trouvé ça pour les curieux : https://medium.com/@majortal/deep-spelling-9ffef96a24f6#.5tx1yq2sb

corrector

  • Invité
Correction de quelques fautes orthographique automatique
« Réponse #6 le: 26 mars 2017 à 19:31:34 »
Je vote contre sauf :
- si les citations (sauf les citations de messages du forum eux-mêmes corrigés) sont détectées et non modifiées, qu'elles soient en "quote", en couleur, entre guillemets
- le fait de préciser "(sic)" évite la correction
- l'auteur du message est averti des corrections
- c'est désactivable
- les corrections incertaines mentionnées précédemment ne sont pas faites
« Modifié: 26 mars 2017 à 19:52:37 par corrector »

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Correction de quelques fautes orthographique automatique
« Réponse #7 le: 26 mars 2017 à 21:03:34 »
Je crois que l’ambiguïté persiste concernant "c'est la".
Exemples : "c'est la fête au village" , "c'est la faute à", "c'est la mairie qui doit"
Personnellement j'enleverai le c'est la en c'est là. On peut dire c'est la box qui fait routeur. Il ne faut pas corriger dans ce cas là..
C'est supprimé de la liste des corrections automatiques.

Je n'avais pas pensé à ces phrases courantes.

Pour les "dés que" changé en "dès que", c'est aussi à supprimer ?

vivien, pourquoi as-tu posté une image peu lisible? C'est déplaisant.
Tu as compris qu'une image est nécessaire, sinon le texte serait modifié.

Là j'ai mis des guillemets pour "dés que" ce qui fait que cela ne sera pas supprimé (il faut un espace à la fin pour que le remplacement soit effectué)

corrector

  • Invité
Correction de quelques fautes orthographique automatique
« Réponse #8 le: 30 mars 2017 à 19:23:23 »
Il faudrait que les corrections soient SUGGÉRÉES par le logiciel quand on poste!

corrector

  • Invité
"Ã partir"
« Réponse #9 le: 26 mai 2017 à 03:04:59 »
Le message de vivien, qui comportait des "fautes" de grammaire (*), était le suivant (j'ai une sauvegarde du topic pour le prouver) :

Citation de: vivien
Précisions : beaucoup ne le savent pas, mais les données sont en clair et récupérables localement, par n'importe qui as un accès physique a votre machine logué.

Si votre PC est éteint, la protection de login de Windows ne sert à rien : l'accés a votre disque dur où la possibilité de booter sur une clé USB permet de récupérer les login / mot de passe, si votre disque dur n'est pas chiffré (fonctionnalité proposée uniquement a partir des éditions Pro de Windows).

s'est transformé en
Citer
Précisions : beaucoup ne le savent pas, mais les données sont en clair et récupérables localement, par n'importe qui as un accès physique a votre machine logué.

Si votre PC est éteint, la protection de login de Windows ne sert à rien : l'accés a votre disque dur où la possibilité de booter sur une clé USB permet de récupérer les login / mot de passe, si votre disque dur n'est pas chiffré (fonctionnalité proposée uniquement à partir des éditions Pro de Windows).

(*) Je préférerais qu'on dise "erreur" plutôt que "faute" d'orthographe ou de grammaire, mais ce n'est pas moi qui détermine le vocabulaire, pas plus que l'orthographe ni la grammaire

Ce n'est pas la première fois que je vois ce genre de soucis, mais en plus dans ce cas, j'avais encore le topic ouvert dans le navigateur, avec l'ancien contenu.

Comme quoi, la correction auto était une encore plus mauvaise idée que je ne le pensais...

vivien

  • Administrateur
  • *
  • Messages: 47 085
    • Twitter LaFibre.info
Correction de quelques fautes orthographique automatique
« Réponse #10 le: 26 mai 2017 à 06:47:45 »
J'ai désactivé la correction automatique, visiblement, mes commandes écrites en UTF8 ne semblent pas avoir se réaliser correctement (alors que si je rentre la même commande dans PHP My Admin je reste en UTF8).

Je pense que c'est le fait de ne pas avoir utilisé use Encode; en perl.

J'ai fait un rechercher / remplacer sur toute la base pour tout corriger, sauf ton message.

corrector

  • Invité
Correction de quelques fautes orthographique automatique
« Réponse #11 le: 26 mai 2017 à 07:30:38 »
L'interprète doit supposer un jeu de caractère donné et tenter une transformation...