Commons:Extraction d'images depuis un document PDF

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Extracting images from PDF and the translation is 88% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Extracting images from PDF and have to be approved by a translation administrator.
Outdated translations are marked like this.

Cette page explique comment extraire les images d'un document PDF. Certains documents PDF files ont leurs pages entières constituées chacune d'une seule image, alors que d'autres possèdent des images distinctes.

Extraction de pages PDF en tant qu'images

Les pages d'un document PDF sont souvent stockées sous la forme d'images, par exemple dans les livres numérisés.

  • Utilisez les outils en ligne de commande XPdf pdfimages, pdftopng, pdftoppm, pdftops ou XPdf Reader (Fichier->Enregistrer l'image).
  • Utilisez des programmes disponibles gratuitement PDF-XChange_Viewer (Fichier -> Exporter -> Exporter en tant qu'image) ou STDU Viewer (Fichier -> Exporter -> Image).
  • Vers le format SVG : utilisez pdf2svg (Linux : pdf2svg) pour convertir le fichier PDF en SVG s'il devait être utilisé en tant qu'une seule image, par exemple s'il s'agit d'un schéma généré par un programme.
  • PDFCreator peut exporter des éléments en PDF vers plusieurs formats bitmap.
  • La commande convert d'ImageMagick peut découper un fichier PDF en plusieurs images à raison d'une par page ; il s'agit d'un outil libre.

Extraction d'images depuis un document PDF

Les fichiers PDF peuvent contenir des images qui possèdent en réalité une résolution supérieure à “100%” de la taille du document. Parmi les manières d'extraire des images depuis un document PDF possibles, il existe :

  • CropTool (https://croptool.toolforge.org/) peut extraite et téléverser des images à partir des PDF déja présents dans Commons
  • Extracteur d'images PDF Semadox – extracteur d'images gratuit en ligne
  • outil en ligne de commande pdfimages du paquet poppler-utils (et avant xpdf).
    • Utilisez l'option -j afin d'extraire sans perte des images compressées en JPEG, ou l'option -all pour extraire sans perte toutes les images dans leur format d'origine. Par exemple : pdfimages -all '/path/to/your.pdf' ./output-filename-prefix
  • Nitro PDF dispose d'une fonction pour extraire toutes les images d'un fichier PDF en pleine résolution et vous pouvez choisir le format de sortie (jpg, png, etc). Cependant, cela ne fonctionnera pas si le document PDF est protégé par un mot de passe.
  • Evince, le lecteur PDF le plus courant sous Linux, vous permet d'effectuer un simple clic droit sur l'image et de l'enregistrer.
  • PDF Candy peut être utilisé pour extraire des images en ligne. La taille du fichier est limitée à 50 MO
  • Obtenez des parties via PrintScreen et rassemblez-les avec Microsoft Paint, GIMP ou un autre programme similaire.
  • GIMP peut aussi ouvrir des pages d'un document PDF sous la forme d'une image à la résolution que vous souhaitez. Ce n'est pas tout à fait la même chose que d'extraire les images. Il n'y a pas d'indication sur la résolution idéale pour une image donnée et cela prépare un rendu de toute la page avant de convertir quoi que ce soit en une image. Pour faire court, c'est un équivalent de l'approche par capture d'écran, mais demandant moins de travail.
  • Avec Inkscape, décochez simplement la case "Intégrer (toutes) les images" dans la boîte de dialogue qui s'ouvre. Toutes les images sont alors automatiquement extraites (en tant que PNG) dans le dossier. Vous pouvez aussi simplement faire un clic droit sur une image donnée et sélectionner "Extraire l'image…".


Problèmes de résolution

Certaines visionneuses de fichiers PDF peuvent vous renseigner sur la résolution ; pour les documents créés en utilisant les réglages usuels de “qualité d'impression“, 300 ppp constitue probablement la bonne valeur (attention cependant, lorsque les originaux ont une résolution entre 300 et 450 ppp, il ne sont pas souvent sous-échantillonnés en 300 ppp, et de plus, pour les images constituées de traits en noir et blanc, avec un seul bit de couleur, restent souvent à une résolution de 1200 ppp ou plus).

Contourner la protection par mot de passe

Si le document PDF est protégé par mot de passe pour éviter les modifications ou l'extraction de son contenu, vous pouvez peut-être contourner cette protection en extrayant la page avec Inkscape, l'enregistrer dans un fichier non protégé, puis ouvrir ce dernier avec Adobe Acrobat et éditer l'image avec Photoshop ou l'ouvrir avec Nitro PDF et l'éditer avec GIMP.