info:pdf

No renderer 'odt' found for mode 'odt'

PDF

Tout d'abord, se souvernir que PDF sur internet a une et une seule fonction: proposer un format de document imprimable, quelque soit la plateforme (windows, mac, *nix etc.). Toute autre utilisation de PDF est abusive! Donc, dans la mesure du possible, préférer des formats plus simples et ne proposer le PDF que pour l'impression.

Note: souvent on croit que le fait de “pdfiser” un document le rend intransformable, et on l'utilise donc pour des documents qu'on ne veut pas voir éditer par d'autres. C'est faux. Il est très aisé de modifier un document pdf, donc gare gare!

Openoffice, gratuit et excellent ersatz pour word, excel, access, propose un générateur pdf, efficace et générant des documents beaucoups plus légers que l'infernal couple word + adobe distiller; et comme openoffice sait ouvrir des documents word (et excel)…

http://fr.openoffice.org/

FPDF est une classe PHP qui permet de générer des fichiers PDF en pur PHP, c'est-à-dire sans utiliser la librairie PDFlib. Le F de FPDF signifie Free : vous êtes libre de l'utiliser et de la modifier comme vous le souhaitez.

http://www.fpdf.org/

concaténation d'exemples d'utilisation de fpdf

Si le document PDF est destiné au web, dans la mesure du possible, il est souhaitable de mettre sur le serveur (p. ex. dans le même répertoire) systématiquement à côté du PDF la version originale (p. ex. le .doc word), très utile si plus tard on doit corriger quelque chose (p. ex. une faute de frappe).

Si on a pas ce fichier d'origine, il reste poppler-utils ou xpdf et xpdf-utils qui comprennent tous deux plusieurs utilitaires bien pratiques, je cite (poppler-utils):

“This package contains pdftops (PDF to PostScript converter), pdfinfo (PDF document information extractor), pdfimages (PDF image extractor), pdftohtml (PDF to HTML converter), pdftotext (PDF to text converter), and pdffonts (PDF font analyzer).”

Ensuite il suffit de faire en ligne de commande un

pdftotext votreFichier.pdf

et vous aurez un votreFichier.txt éditable…

si vous voulez de l'html, rien de plus simple:

pdftohtml votreFichier.pdf

créera les fichier votreFichierA-Z.html avec un fichier par page

par contre s'il y a des images il faudra utiliser gimp (cf. supra) pour les récupérer et les intégrer

Vous avez plusieurs (dizaines, centaines, milliers…) documents en pdf et vous voulez avoir une version texte, mais vous ne voulez pas vous faire une épicondylite avec X millions de click de souris?

  sudo apt-get poppler-utils
find . -name "*.pdf"  | while read i
do
  pdftotext $i
done

Le document PDF fait plusieurs pages et vous voulez éviter de faire une édition avec Gimp (qui vous permet d'ouvrir un document pdf multipage page par page)?

      dftoppm manyPages.pdf outputname -png

mettre les documents dans un répertoire, numérotés dans le bon ordre puis

  pdfmerge -d ./

le résultat sera dans un fichier output.pdf

autre solution

concaténer les deux fichiers test.pdf et test1.pdf dans out.pdf

  gs -q -sPAPERSIZE=letter -dNOPAUSE -dBATCH -sDEVICE=pdfwrite -sOutputFile=out.pdf test.pdf test1.pdf 

Split and merge pdf documents, it's free, open source and platform independent.

http://www.pdfsam.org/

note Fred: avec un GUI, marche nickel

sam2p pour convertir des jpg (ou autres fichiers images) en ps / pdf

 gs -dBATCH -dNOPAUSE -q -sDEVICE=pdfwrite -sOutputFile=output.pdf input.pdf 

ou

 ps2pfd input.pdf output.pdf.

source: http://blog.kmelia.net/news/reduire-le-poids-dun-fichier-pdf-rapidement-avec-ghostscript/757

outil capable de gérer les tableaux PDF, en général la génération de texte fait un monstrueux désordre, le logiciel étant incapable de comprendre la logique ligne / colonnes: à ma connaissance le seul est pstotext

sudo apt-get install pstotext

puis

pstotext -bboxes test.pdf

Voir aussi

  • info/pdf.txt
  • Dernière modification : 2024/03/16 06:52
  • de radeff