Logiciels pour convertir du PDF en texte

Aller en bas

Logiciels pour convertir du PDF en texte Empty Logiciels pour convertir du PDF en texte

Message  Gus le Sam 9 Avr - 11:30

Il peut être tentant de vouloir extraire des données à partir d'un PDF texte. L'idée est de convertir les fichiers PDF en fichiers texte qui peuvent être ensuite exploités pour importer des données dans une base de données par exemple.

L'API en Java qui semble la plus adaptée pour extraire du texte à partir d'un PDF n'est pas iText ou JPedal mais PDFBox
http://pdfbox.apache.org/
Une piste à approfondir...

En attendant, voici quelques outils gratuits disponibles sur Internet.

La société A-PDF http://www.a-pdf.com/ propose un certain nombre d'outils pour gérer le format PDF payants ou gratuits. Leur petit extracteur de texte est notamment gratuit !

Pour les PDF en forme de tableau dont l'extraction texte doit prendre en compte l'arrangement des cellules, il faut mieux transformer préalablement le PDF en fichier Excel puis reconvertir le fichier Excel en texte. Pour cela, on pourra utiliser le service en ligne gratuit : http://www.pdftoexcelonline.com/fr/ dont le principe est d'envoyer le résultat à une adresse mail qu'on indique.
Gus
Gus
Admin

Messages : 249
Date d'inscription : 01/09/2009

Voir le profil de l'utilisateur http://www.gus05.com

Revenir en haut Aller en bas

Revenir en haut


 
Permission de ce forum:
Vous ne pouvez pas répondre aux sujets dans ce forum