Commons:Bilder aus PDF extrahieren

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Commons:Extracting images from PDF and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Commons:Extracting images from PDF and have to be approved by a translation administrator.

Diese Seite erklärt, wie man Bilder aus PDF-Dateien extrahiert. Einige PDF-Dateien haben ganze Seiten als Bilder, einige haben Bilder separat.

PDF-Seiten als Bilder extrahieren

Seiten in einer PDF-Datei werden oft als Bilder gespeichert, z. B. in gescannten Büchern.

  • Verwende die XPdf-Befehlszeilen-Tools pdfimages, pdftopng, pdftoppm, pdftops oder XPdf Reader (Datei->Bild speichern).
  • Verwendung frei verfügbarer Programme PDF-XChange_Viewer (Datei -> Exportieren -> In Bild exportieren) oder STDU Viewer (Datei -> Exportieren -> zu Bild).
  • In SVG: Verwende pdf2svg (Linux: pdf2svg) zur Konvertierung in ein SVG, wenn die gesamte PDF-Datei als Bild verwendet werden soll, z.B. wenn es sich um ein von einem Programm erzeugtes Diagramm handelt.
  • PDFCreator kann PDF in verschiedene Bitmap-Formate exportieren.
  • ImageMagicks convert kann ein PDF in einzelne Bilder der Seiten zerlegen; es ist kostenlos.

Bilder aus PDF extrahieren

PDF-Dateien können Bilder enthalten, die in Wirklichkeit eine höhere Auflösung als die „100 %“-Größe des Dokuments haben. Mögliche Wege zum Extrahieren von Bildern aus PDFs sind unter anderem:

  • Das CropTool (https://croptool.toolforge.org/) kann Bilder aus bereits auf Commons hochgeladenen PDFs extrahieren und hochladen
  • Semadox PDF Image Extractor - kostenloser Online-Bildextraktor erzeugt png-Bilder, die in jpg umgewandelt werden sollten, damit sie in unseren Projekten gemäß phab:T192744 scharf dargestellt werden können
  • pdfimages Kommandozeilen-Tool im poppler-utils (zuvor xpdf)-Paket.
    • Verwende die Option -j, um JPEG-komprimierte Bilder verlustfrei zu extrahieren, oder -all, um alle Bilder in ihrem ursprünglichen Dateityp verlustfrei zu extrahieren. Zum Beispiel: pdfimages -all '/path/to/your.pdf' ./output-filename-prefix
  • Nitro PDF hat eine Funktion, mit der alle Bilder aus einer PDF-Datei in voller Auflösung herausgezogen werden können und du kannst das Ausgabeformat (jpg, png usw.) wählen. Es funktioniert jedoch nicht, wenn die PDF-Datei kennwortgeschützt ist. Benutzer können eine kostenlose 14-tägige Testversion von Nitro PDF Pro erhalten, für die keine Kreditkarte erforderlich ist. Name, E-Mail-Adresse und Land sind erforderlich.
  • Evince, der gebräuchlichste Linux-PDF-Reader, lässt dich einfach mit der rechten Maustaste auf ein Bild klicken und es speichern.
  • PDF Candy kann verwendet werden, um Bilder online zu extrahieren. Die Dateigröße ist auf 50 MB begrenzt. Die kostenlose Web-Version liefert jpg-Bilder (besser für die scharfe Darstellung in unseren Projekten gemäß phab:T192744). PDF Candy Desktop 2.94 für Windows ist 138 MB groß und digital signiert; es extrahiert alle Bilder in diesem Format standardmäßig in einen Unterordner, oder du kannst einen Seitenbereich oder einen anderen Ordner angeben. Die PRO-Webversion ist dafür nicht erforderlich; sie kostet 6 US$/Monat oder 48 $/Jahr, die monatlich abgerechnet werden. Die PRO-Desktop-Version ist hierfür nicht erforderlich; sie kostet 99 US-Dollar.
  • Hole Teile über PrintScreen und füge sie in Microsoft Paint, GIMP oder einem ähnlichen Programm eines Drittanbieters zusammen.
  • GIMP kann auch Seiten aus einer PDF-Datei als Bild in der von dir angegebenen Auflösung öffnen. Dies ist nicht ganz dasselbe wie das Extrahieren der Bilder. Es bietet keine Anleitung zur idealen Auflösung für ein bestimmtes Bild und es rendert im Wesentlichen die gesamte Seite, bevor es alles in ein Bild umwandelt. Kurz gesagt, es entspricht dem Screenshot-Ansatz, aber mit weniger Arbeitsaufwand.
  • Inkscape, deaktiviere einfach die Option „(alle) Bilder einbetten“ im Eröffnungsdialog. Alle Bilder werden nun automatisch in den Ordner extrahiert. Du kannst auch einfach mit der rechten Maustaste auf ein einzelnes Bild klicken und „Bild extrahieren …“ wählen.


Hinweise zur Auflösung

Einige PDF-Reader können die Auflösung mitteilen; für Dokumente, die mit typischen „Druckqualität“-Einstellungen erstellt wurden, sind 300 ppi wahrscheinlich die beste Schätzung. (Vorbehalt: wenn die Originale zwischen 300 und 450 ppi liegen, werden sie oft „nicht“ auf das 300-Ziel heruntergerechnet, und darüber hinaus werden Schwarzweiß-„Strichbilder“, mit einer Tiefe von 1 Bit, oft bei 1200 ppi oder mehr gehalten.)

Umgehung des Passwortschutzes

Wenn die PDF-Datei kennwortgeschützt ist, um eine Änderung oder Extraktion des Inhalts zu verhindern, kannst du dies möglicherweise umgehen, indem du die Seite mit Inkscape extrahierst, als ungeschützte Datei speicherst, dann in Adobe Acrobat öffnest und das Bild an Photoshop übergibst oder in Nitro PDF öffnest und an GIMP übergibst.