La Fibre
Télécom => Logiciels et systèmes d'exploitation => Linux => Discussion démarrée par: vivien le 30 janvier 2017 à 15:51:21
-
J'ai deux fichiers CSV de plus de 1 Go, avec des données presque identiques.
Je cherche un outil de changelog (journal des modifications) qui permet de sortir un fichier des seules lignes qui ont été modifiées.
Je dépasse les 1 millions de lignes, donc il est impossible de les traiter avec Calc / Excel.
Une idée ?
-
diff ?
OK, je sors.
-
j'allais dire la même chose :-X
-
Tu peux essayer Beyond Compare. Je ne l'ai jamais utilisé pour du .csv mais il semble gérer ce type de fichier.
-
"diff" et si ca ne passe pas tu peux envoyer les 2 csv dans une base sql (mysql par exemple) puis faire une query.
-
pour les gros fichiers: meld (http://meldmerge.org/)
-
pour les gros fichiers: meld (http://meldmerge.org/)
bien ca je ne connaissait pas. Sur Windows j'utilise WinMerge.
mais ce n'est pas en ligne de commande donc pas forcement adapté a son usage.
ps: diff a une option "--speed-large-files" pour accélérer le traitement des gros fichiers.
-
Meld et WinMerge ont parfois du mal sur les très gros fichiers.