/ / Convertir un fichier PDF spécifique en HTML en PHP - php, html, analyse, pdf

Convertir un fichier PDF spécifique en HTML en PHP - php, html, analyse, pdf

existe-t-il un moyen de convertir un fichier PDF en HTML? J'ai besoin d'un texte du fichier et quand j'ai essayé la bibliothèque PDFtoText, j'ai obtenu le texte, mais non trié et sans aucune règle pour l'analyse. J'ai remarqué que certains services en ligne PDFtoHTML fonctionnent parfaitement avec le fichier. Alors, des conseils s'il vous plaît? Voici le fichier PDF et j'ai besoin d'une seule ligne spécifique dans la colonne de droite.

Réponses:

0 pour la réponse № 1

Essayez d’intégrer PDFtoHTML à partir du projet poppler; cela devrait supporter la reconnaissance de table.


0 pour la réponse № 2

pdftohtml fonctionne bien: rapide, stable mais le résultat en html est au mieux moche. Je l’utilise depuis un certain temps pour un site Web qui contient de nombreux CV.

C'est une bonne solution pour extraire du contenu textuel cependant.

Je voudrais essayer l'API Scribd

http://www.scribd.com/developers/api

ou l'API de document Google Apps. GOogle fait un travail remarquable en affichant et en convertissant des fichiers pdf