La Fibre
Télécom => Logiciels et systèmes d'exploitation =>
Logiciels => Discussion démarrée par: rooot le 22 mai 2024 à 20:40:05
-
Salut,
je partage avec vous un super outil gratuit, opensource, qui permet de manipuler vos PDF. C'est très simple a utiliser, l'interface est très conviale et convient très bien aux séniors qui sont un peu allergiques à l'informatique. ;D
A télécharger ici : https://github.com/Stirling-Tools/Stirling-PDF
traduction du Github :
Voici une robuste application web de manipulation de PDF hébergée localement utilisant Docker. Elle vous permet d'effectuer diverses opérations sur les fichiers PDF, telles que le découpage, la fusion, la conversion, la réorganisation, l'ajout d'images, la rotation, la compression, et bien plus encore. Cette application web hébergée localement a évolué pour offrir un ensemble complet de fonctionnalités, répondant à tous vos besoins en matière de PDF.
Stirling PDF n'effectue pas d'appels sortants à des fins d'enregistrement ou de suivi.
Tous les fichiers et PDF existent soit exclusivement du côté client, soit résident uniquement dans la mémoire du serveur pendant l'exécution de la tâche, soit résident temporairement dans un fichier uniquement pour l'exécution de la tâche. Tout fichier téléchargé par l'utilisateur aura été supprimé du serveur à ce stade.
Donc on peut faire touner le logiciel sous docker, mais ca marche très bien en local aussi sous windows, il y a un executable qui après démarrage ouvre l'application dans une page web.
Je poste une image écran de toutes les tuiles disponibles dans l'appli pour montrer tout ce qu'il est possible de réaliser.
(https://lafibre.info/testdebit/linux/202405_docker_stirling-pdf.webp)
-
C'est vraiment un très bon programme, en effet !
-
Une version démo est disponible ici : https://pdf.adminforge.de/?lang=fr_FR
Sur la démo il y a 55 tuiles...contrairement à ma version qui tourne sous windows, par défaut. je vois qu'il y a des outils d'OCR et de convertion de PDF vers plein de formats, que je n'ai pas.
-
Intéressant, je vais tester. La gestion et la modification des PDF est tout un sujet, surtout depuis qu'Adobe a changé sa politique de vente, et ne fait plus que de la location.
-
je viens de tester ce matin avec une installation sous docker, et là on a bien toutes les tuiles qui concernent la conversion.
Convertir un PDF en doc/docx ne fonctionne pas bien, je pense que le PDF source ne doit être en fait composé que de texte pour que cela fonctionne.
Par contre convertir un PDF qui contient du texte, des images, des tableaux etc...ce qui marche très bien c'est PDF vers du PowerPoint PPT/PPTX. Le résultat est bien fidel à la source.
J'envisage de le mettre a dispo dans ma boite, ca evitera au moins d'aller exposer des PDF confidentiels sur https://www.ilovepdf.com/fr ;D
Il me manque plus qu'un clone de https://www.iloveimg.com/fr et je suis bon ;D
-
Salut,
je partage avec vous un super outil gratuit, opensource, qui permet de manipuler vos PDF. C'est très simple a utiliser, l'interface est très conviale et convient très bien aux séniors qui sont un peu allergiques à l'informatique. ;D
A télécharger ici : https://github.com/Stirling-Tools/Stirling-PDF
traduction du Github :
Donc on peut faire touner le logiciel sous docker, mais ca marche très bien en local aussi sous windows, il y a un executable qui après démarrage ouvre l'application dans une page web.
Je poste une image écran de toutes les tuiles disponibles dans l'appli pour montrer tout ce qu'il est possible de réaliser.
à voir..
pour la modif de pdf, soit je passe par gimp, diablement efficace, ou libreoffice
pour "juste" changer au niveau des pages : pdftk, diablement efficace aussi
enfin, tant que ca tourne sous unix...
-
et convient très bien aux séniors qui sont un peu allergiques à l'informatique. ;D
y a des seniors allergiques a l'informatique qui s'interessent a ce que c'est qu'un pdf ?
Ceux que je connais en tout cas ne s'occupent pas de ce genre de conneries, ils deleguent ;)
-
y a des seniors allergiques a l'informatique qui s'interessent a ce que c'est qu'un pdf ?
Ceux que je connais en tout cas ne s'occupent pas de ce genre de conneries, ils deleguent ;)
Ben oui, dans ma boite il y a pas mal de personnes de +50 ans qui sont secretaires de directions, assistantes commerciales, commerciaux, et meme chefs de services et qui sont amenés bien souvent a bricoler des PDF. Et justement quand ils délèguent c'est moi qui hérite de la tâche, parce que pdftk, inkscape ou autres gimp c'est pas leur truc. Et je prefere que tout cela soit fait en local plutot qu'utiliser des services en lignes, dont le but et de vous faire payer un abo premium.
-
Ben oui, dans ma boite il y a pas mal de personnes de +50 ans qui sont secretaires de directions, assistantes commerciales, commerciaux, et meme chefs de services et qui sont amenés bien souvent a bricoler des PDF. Et justement quand ils délèguent c'est moi qui hérite de la tâche, parce que pdftk, inkscape ou autres gimp c'est pas leur truc.
hmm hmm
et donc tu penses, sans trembler, qu'ils vont continuer à te demander ou que clairement ils vont installer une merde en plus et essayer de voir comment ca marche ? ;)
-
hmm hmm
et donc tu penses, sans trembler, qu'ils vont continuer à te demander ou que clairement ils vont installer une merde en plus et essayer de voir comment ca marche ? ;)
un nouveau système, au lieu de "déléguer gratos à l'informaticien du 3ème", leur exigera de :
-se former au logiciel, avec l'arrachage de cheveux que cela comporte
-les décevoir que telle ou telle possibilité n'est pas intégrée
-que cela leur coute 10eur/mois/utilisateur
-que leurs données peuvent être piquées
-qu'ils récupèrent des fichiers filigranés ou générés par un outil pouvant être un peu touchy?
-que le jour où camachpu, ils reviendront pas voir l'informaticien du 3ème?
-
hmm hmm
et donc tu penses, sans trembler, qu'ils vont continuer à te demander ou que clairement ils vont installer une merde en plus et essayer de voir comment ca marche ? ;)
oui, car je connais mieux que toi le personnel de mon entreprise.
Si cette application ne te plait pas c'est ton droit, je ne suis pas là pour en débattre. Je partage juste ce que je trouve interessant à mettre en place dans la boite où je bosse. Etant donné que déjà on utilise le site ilovepdf, ça ne peut être que mieux d'avoir l'équivalent en local et de ne pas envoyer nos PDF hors de notre réseau. Ca c'est l'interêt qui a tout un sens quand on veut etre conforme à la RGPD par exemple.
Moi je ne vois que des avantages, si toi tu ne vois que des inconvénient, tant mieux pour toi.
-
un nouveau système, au lieu de "déléguer gratos à l'informaticien du 3ème", leur exigera de :
Mais comment sais-tu que je suis au 3eme ? ;D
-
j'avais fait une pdf modifiable pour l'assurance avec Mpdf et les données qui venait de notre site
disoons que c"était lourd surtout quand il fallait faire des tableaux et des cases à cocher ::)
il fallait les placer une par une il y avait une 10 de produits différents
-
Sur la version Docker, pour ajouter le package de langue en Francais (pour permettre l'utilisation des outils OCR) :
Dans Portainer, il suffit de se connecter à la console du container stirling
(https://i.imgur.com/L1zmb9W.png)
Et de taper les commandes suivantes pour récupérer la package FR de Tesseract.
cd /usr/share/tessdata
wget https://github.com/tesseract-ocr/tessdata/blob/main/fra.traineddata
Ensuite on relance le container, et à partir de maintenant les tuiles qui utilisent l'OCR doivent proposer la langue FR pour la reconnaissance du texte.
(https://i.imgur.com/IroDWPy.png)
Pour ajouter d'autres langues, il suffit d'aller piocher son fichier dans cette liste : https://github.com/tesseract-ocr/tessdata
-
Un reproche que je ferais quand même c'est l'interface un peu trop chargée avec beaucoup trop d'options, pour facilement retrouver celle voulue, pour un néophyte. Je ne sais pas si on peut limiter le nombre d'options visibles, ou les regrouper ?
-
Un reproche que je ferais quand même c'est l'interface un peu trop chargée avec beaucoup trop d'options, pour facilement retrouver celle voulue, pour un néophyte. Je ne sais pas si on peut limiter le nombre d'options visibles, ou les regrouper ?
oui tu peux !
tu es sur docker ou l'executable windows ?
Sur windows dans dossier configs\settings.yml la ou se trouve l'executable, tu as cette section :
endpoints:
toRemove: [] # List endpoints to disable (e.g. ['img-to-pdf', 'remove-pages'])
groupsToRemove: [] # List groups to disable (e.g. ['LibreOffice'])
si tu veux supprimer un Endpoint, par exemple img-to-pdf et remove-pages il suffira de mettre :
endpoints:
toRemove: ['img-to-pdf', 'remove-pages']
groupsToRemove: [] # List groups to disable (e.g. ['LibreOffice'])
Pour retirer tout un groupe c'est le même principe.
La liste des Endpoints et des groupes se trouve dans ce tableau : https://github.com/Stirling-Tools/Stirling-PDF/blob/main/Endpoint-groups.md
(https://i.imgur.com/K6UkvR1.png)
Sinon quand tu cliques sur le menu "OUTILS" chaque outil se retrouve bien groupé, il y a 6 groupes.
(https://i.imgur.com/RYg26VW.png)
-
Je suis étonné de voir que pour convertir un PDF en un PDF/A-2b, il indique "Ce service utilise OCRmyPDF pour la conversion en PDF/A."
J'ai testé sur la démo, mais cette conversion me fait perdre l'accessibilité de mon PDF : J'avais mis du texte de remplacement à l'endroit où il y a des images et ce n'est plus présent.
À l'inverse, l'outil de conversion de https://www.ilovepdf.com/fr conserve l'accessibilité lors de la conversion en PDF/A.
-
C'est une bonne trouvaille, dans ma boite nous utilisons pdfSAM et PDF-XChange Editor (celle qui est là : https://www.pdf-xchange.com/product/pdf-xchange-editor pour que ça marche sous windows 11) dans leur version gratuite avec aussi pour certains Acrobat Reader en version pro pour l'export en doc/docx/xls/xlsx. J'ai certains utilisateurs qui n'arrivent pas à faire la découpe de pdf avec pdfsam .ça permettra d'avoir un seul outil qui fasse tout
C'est quoi la différence entre Stirling-PDF.exe et Stirling-PDF-with-login.exe ?
-
C'est quoi la différence entre Stirling-PDF.exe et Stirling-PDF-with-login.exe ?
dans la version .exe je ne comprends pas l'interet d'utiliser un login au lancement...quoi qu'il en soit quand j'ai testé, ca ne m'a pas demandé de login.
En fait le login sur la version docker, donc avec une url partagée par tous, a un intéret si un utilisateur veux créer des favoris. Les favoris se retouvent en début de liste dans les tuiles. et accessibles depuis le menu "favoris". Du coup chaque utilisateur peut avoir sa propre disposition.
Edit:
j'ai trouvé.
dans le fichier configs/settings.yml il faut décommenter certains parametres pour activer le login. sans oublier de mettre enablelogin sur "true".
security:
enableLogin: true # set to 'true' to enable login
csrfDisabled: true # Set to 'true' to disable CSRF protection (not recommended for production)
loginAttemptCount: 5 # lock user account after 5 tries
loginResetTimeMinutes: 120 # lock account for 2 hours after x attempts
initialLogin:
username: "admin" # Initial username for the first login
password: "stirling" # Initial password for the first login
-
D'accord merci pour l'info
Quand je veux utiliser la fonction "compresser" j'ai une erreur, j'ai un autre problème je l'ai installé das une VM après avoir arrêté la VM et l'avoir redémarré je n'arrive plus à lancer Stirling. Dans le fichier log qu'il crée il indique des erreurs "java.lang.RuntimeException: Failed to initialize application configuration". Je vais soumettre sur github les 2 problèmes :
-
je partage avec vous un super outil gratuit, opensource, qui permet de manipuler vos PDF.
Merci rooot, je viens d'installer Stirling PDF en container (podman) sur mon laptop Fedora, ça pourrait remplacer plusieurs outils que j'utilise régulièrement ...
-
D'accord merci pour l'info
Quand je veux utiliser la fonction "compresser" j'ai une erreur, j'ai un autre problème je l'ai installé das une VM après avoir arrêté la VM et l'avoir redémarré je n'arrive plus à lancer Stirling. Dans le fichier log qu'il crée il indique des erreurs "java.lang.RuntimeException: Failed to initialize application configuration". Je vais soumettre sur github les 2 problèmes :
Si tu es sur la version .exe la fonctionnalité a été désactivée, je viens de tester j'ai le même message.
Compress PDFs to decrease their filesize (Using OCRMyPDF).
OCR on PDF (Using OCRMyPDF).
PDF/A conversion (Using OCRMyPDF).
On dirait bien que tout ce qui utilise OCRMyPDF n'est pas implémenté dans le .exe
-
En supprimant les répertoires logs, configs, pipeline et customFiles; qu'il créé lui-même; j'arrive de nouveau à le lancer
Dommage que la fonction de compression ne soit pas implémenté dans le .exe
-
Je suis étonné de voir que pour convertir un PDF en un PDF/A-2b, il indique "Ce service utilise OCRmyPDF pour la conversion en PDF/A."
J'ai testé sur la démo, mais cette conversion me fait perdre l'accessibilité de mon PDF : J'avais mis du texte de remplacement à l'endroit où il y a des images et ce n'est plus présent.
À l'inverse, l'outil de conversion de https://www.ilovepdf.com/fr conserve l'accessibilité lors de la conversion en PDF/A.
qu'entends-tu par "l'accessibilité de mon PDF" ?
je viens de faire une conversion sur un fichier de mon côté, je ne vois rien d'anormal...
-
Dommage que la fonction de compression ne soit pas implémenté dans le .exe
https://github.com/Stirling-Tools/Stirling-PDF/blob/main/LocalRunGuide.md
To run the application without Docker/Podman, you will need to manually install all dependencies and build the necessary components.
ca voudrait dire qu'il faut manuellement installer les autres composants, libre office, etc...
...For Windows, you might need to use Windows Subsystem for Linux (WSL) for certain steps
A partir de là ca commence a devenir une usine a gaz...
Autant installer docker desktop sur son windows, et faire tourner l'appli dans docker.
-
qu'entends-tu par "l'accessibilité de mon PDF" ?
je viens de faire une conversion sur un fichier de mon côté, je ne vois rien d'anormal...
J'ai essayé, pour le Référentiel général de l’écoconception des services numériques, de faire un beau document avec Word.
Certaines parties du document sont des images (par exemple, toute la première page est une image).
J'ai donc mis un texte alternatif, afin que ce PDF soit lisible par les non-voyants.
(cliquez sur la miniature ci-dessous - le document est au format PDF)
(https://lafibre.info/images/environnement/202405_referentiel_general_ecoconception_des_services_numeriques_version_2024.avif) (https://lafibre.info/images/environnement/202405_referentiel_general_ecoconception_des_services_numeriques_version_2024.pdf)
Problème, Word 2019 est très mauvais en génération de PDF et il ne sait pas faire de PDF/A qui gère la transparence par exemple (si on a des images avec de la transparence, le transparent est remplacé par du noir, on a également des pb quand on met du texte sur une image). Bref, la bonne solution pour avoir un PDF/A qui gère la transparence avec Word 2019 est donc de faire un PDF normal puis de le convertir en PDF/A.
Sauf que là, je perds l'accessibilité du PDF.
Dans un PDF accessible, chaque image non décorative a un texte associé qui est bien lisible avec Adobe Acrobat Reader :
Exemple en page 1 :
(https://lafibre.info/images/doc/202405_pdf_accessible_1.webp)
Exemple en page 20 :
(https://lafibre.info/images/doc/202405_pdf_accessible_2.webp)
Voici les deux versions générées par Word 2019 directement :
- PDF/A - 3a sans gestion de la transparence (https://lafibre.info/images/environnement/202405_referentiel_general_ecoconception_des_services_numeriques_version_2024.pdf)
- PDF-1.7 (https://lafibre.info/images/environnement/202405_referentiel_general_ecoconception_des_services_numeriques_version_2024_pdf-1.7.pdf) (gère la transparence, mais pas PDF/A)
Des outils comme i love PDF, vont permettre de convertir ce PDF 1.7 en PDF/A en gardant l'accessibilité, ce qui ne semble pas le cas de Stirling-PDF.
Au passage, LibreOffice est bien meilleur que Microsoft Office pour la génération de PDF. Dommage que Microsoft mette si peu de moyen dans la génération de PDF.
-
@vivien
j'utilise PDF-XChange Editor (gratuit) pour visualiser les PDF.
J'ai converti ton PDF v1.7 vers PDF/A 2b avec stirling.
Quand j'ouvre l'original en 1.7 et celui en PDF/A je ne vois strictement aucune différence sur la page 1 et la page 20...
Comment fais-tu pour visualiser le texte associé a l'image ? PDF-XChange Editor ne gere pas cette fonctionalité ??
-
Dans la doc de ocrmypdf : https://ocrmypdf.readthedocs.io/en/latest/introduction.html
Regarding OCRmyPDF itself:
PDFs using transparency are not currently represented in the test suite
est-ce que le problème ne viendrait pas de là...
-
Au passage, LibreOffice est bien meilleur que Microsoft Office pour la génération de PDF. Dommage que Microsoft mette si peu de moyen dans la génération de PDF.
C'est surtout que MS Office est très mauvais pour générer les PDF.
Voici un petit exemple, celui d'un simple fichier Word qui ne contient que "Hello world." et l'impression PDF à partir de Word, de LibreOffice et de Stirling PDF.
$ wc -c hello*pdf
6255 hello-libre.pdf
4315 hello-stirling.pdf
184050 hello-word.pdf
194620 total
$ file hello*pdf
hello-libre.pdf: PDF document, version 1.7, 1 page(s) (zip deflate encoded)
hello-stirling.pdf: PDF document, version 1.7, 1 page(s) (zip deflate encoded)
hello-word.pdf: PDF document, version 1.7, 1 page(s)
Certes, le format n'est pas exactement le même ...
-
Word va transformer des images PNG (sans perte, de petite taille) et des images Jpeg (compression avec une perte visible, pour une taille plus grance).
Libre Office permet de demander de ne pas toucher aux images : C'est toi qui optimises en amont tes images (compression avec ou sans perte, définition) et Libre Office n'y toucher pas.
Voici les paramètres Libre Office à utiliser : (cela permet d'avoir des PDF plus petit et de meilleure qualité que si les images PNG étaient recompressées en JPEG)
(https://lafibre.info/images/doc/202405_libreoffice_export_pdf.webp)
Microsoft, merci de copier ces bonnes idées !
-
https://github.com/Stirling-Tools/Stirling-PDF/blob/main/LocalRunGuide.mdca voudrait dire qu'il faut manuellement installer les autres composants, libre office, etc...
A partir de là ca commence a devenir une usine a gaz...
Autant installer docker desktop sur son windows, et faire tourner l'appli dans docker.
Du coup je l'ai installé avec docker sur un NAS QNAP, la il tourne et accessible. docker desktop a besoin des droits administrateurs pour fonctionner dans mon cas ça ne vas pas
-
Comment fais-tu pour visualiser le texte associé a l'image ? PDF-XChange Editor ne gere pas cette fonctionalité ??
Tous les lecteurs PDF ne permettent pas de voir le texte associé à une image.
Adobe Acrobat Reader et les lecteurs de PDF utilisés par les personnes privées du sens de la vue l'utilisent.
-
je lisais ca ce matin : https://www.phonandroid.com/cest-lun-des-formats-de-fichiers-les-plus-populaire-de-la-planete-mais-microsoft-sapprete-a-le-tuer.html
-
Sur docker quand on a la version 0.25.0, comment faire pour mettre à jour vers la 0.25.3 ?
-
Sur docker quand on a la version 0.25.0, comment faire pour mettre à jour vers la 0.25.3 ?
docker stop nomducontainer
docker rm nomducontainer
docker pull frooodle/s-pdf:latest
docker run
-
docker stop nomducontainer
docker rm nomducontainer
docker pull frooodle/s-pdf:latest
docker run
c'est curieux je reste en 0.25.2 :o
et au passage, un tuto très récent pour une installation sur Synology : https://www.it-connect.fr/nas-synology-stirling-pdf-boite-a-outils-pdf-gratuite/
-
c'est curieux je reste en 0.25.2 :o
et au passage, un tuto très récent pour une installation sur Synology : https://www.it-connect.fr/nas-synology-stirling-pdf-boite-a-outils-pdf-gratuite/
Refait Last pushed 9 minutes ago by frooodle
-
Refait Last pushed 9 minutes ago by frooodle
mais lol...comme par hasard ;D c'est bon je suis bien passé en 0.25.3
-
on passe en 0.26 et il y a une nouvelle page de demo officielle : https://stirlingpdf.io/
-
Quelqu'un arrive t'il a transformer un PDF dans lequel il y a un tableau, vers du CSV (car pas de pdf2excel) ? Le but étant de récupérer le tableau dans un excel.
De mon coté sur un document de ce type, ca ne fonctionne pas du tout, par contre avec ilovepdf, en mode "PDF vers Excel" ca marche très bien.
(https://i.imgur.com/JXV2SWw.png)
-
tien voilà un exemple du pourquoi utiliser un outil en local :
https://www.clubic.com/actualite-532263-attention-des-fuites-de-donnees-touchent-ces-deux-outils-pdf-en-ligne.html
Deux convertisseurs PDF en ligne, PDF Pro et Help PDF, ont exposé plus de 89 000 documents confidentiels d'utilisateurs. Des passeports, permis de conduire et autres informations sensibles sont accessibles via des buckets Amazon S3 mal sécurisés.
-
Il existe d'autres outils de gestion de PDF en local, avec moins de fonctionnalités que Stirling-PDF, mais plus simple à installer :
- PDF Arranger est un logiciel libre multiplateforme : https://github.com/pdfarranger/pdfarranger
- PDFsam Basic ou PDF Split and Merge est un logiciel libre multiplateforme pour diviser, fusionner, extraire des pages, faire pivoter et associer des documents PDF. Il n'a que les fonctionnalités de base : https://pdfsam.org/fr/downloads/
Je préfère largement PDF Arranger à PDFsam Basic qui est limité en termes de fonctionnalités.
-
on utilisait pdfsam avant (pour automatiser de la découpe de pdf), je ne connaissais pas pdf arranger.
-
Il existe d'autres outils de gestion de PDF en local, avec moins de fonctionnalités que Stirling-PDF, mais plus simple à installer :
En plus de PDF Arranger (et de Stirling PDF maintenant), j'utilise parfois PDF Mix Tool : https://scarpetta.eu/pdfmixtool/