Βοήθεια: Μετατροπή

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Converting and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Help:Converting and have to be approved by a translation administrator.

Η μετατροπή ενός εγγράφου από μια μορφή σε μια άλλη για τα Commons μπορεί να είναι χρήσιμη

  • προκειμένου να δημιουργηθούν παράγωγα που είναι πιο εύκολα προσβάσιμα,
  • επειδή κάθε μορφή έχει τα δικά της πλεονεκτήματα,
  • αν χρειάζεται να έχετε 2 ή περισσότερα βιβλία ανοιχτά ταυτόχρονα, σε διαφορετικούς προβολείς.

Έτσι, μπορεί να είναι καλή ιδέα να έχετε βιβλία σε περισσότερες από μία μορφές.

Μετατροπή PDF

  • Παρόλο που τα έγγραφα PDF γίνονται αποδεκτά από τα Commons, η πρόσβαση σε αυτά μπορεί να είναι δύσκολη.

Μετατροπή PDF σε DJVU

Δείτε τη σελίδα Μετατροπή PDF σε DjVu.

Μετατροπή PDF σε εικόνες

Δείτε τη σελίδα Commons: Εξαγωγή εικόνων από PDF#Εξαγωγή σελίδων_ως_εικόνες.

Εξαγωγή εικόνων από PDF

Εάν το PDF περιέχει το κείμενο σε μορφή που να μπορεί να εξαχθεί εύκολα, τότε χρησιμοποιήστε κάποιο από τα ακόλουθα:

  • "Αποθήκευση ως κείμενο" του προγράμματος προβολής Adobe Acrobat
  • GSview's "Επεξεργασία" / "Εξαγωγή κειμένου..."
  • Το στοιχείο μενού του STDUViewer Αρχείο -> Εξαγωγή -> σε κείμενο
  • XPdf εργαλεία γραμμής εντολών pdftotext, pdftohtml.

Διαφορετικά, εάν το PDF έχει κείμενο ως εικόνες:

  • Ακολουθήστε τις συμβουλές στην ενότητα "Μετατροπή PDF σε εικόνες" παραπάνω, και στη συνέχεια ακολουθήστε τις συμβουλές στην ενότητα "Μετατροπή από μορφές εικόνας σε κείμενο (OCR)" παρακάτω.

Μετατροπή DjVu

Η μετατροπή του DjVu σε άλλες μορφές είναι χρήσιμη επειδή κάποιος μπορεί να μην έχει εγκατεστημένο ένα πρόγραμμα προβολής DjVu και άλλες μορφές μπορούν να προβληθούν εύκολα στο πρόγραμμα περιήγησης.

Μετατροπή DjVu σε PDF

Δείτε τη σελίδαΒοήθεια:Μετατροπή DjVu σε PDF

Μετατροπή του DjVu σε εικόνες

Χρησιμοποιήστε τα βοηθητικά προγράμματα γραμμής εντολών DjVuLibre ddjvu (αποκωδικοποιητής DjVu) ή djvups (για μετατροπή σε PostScript).

Εξαγωγή κειμένου από το DjVu

Αυτό, μπορεί να το κάνει το WinDjView ή το εργαλείο γραμμής εντολών DjVuLibre djvutxt.

Μετατροπή εικόνων

Μετατροπή μεταξύ μορφών εικόνας

  • Χρησιμοποιήστε το (δωρεάν για προσωπική χρήση) shareware IrfanView ή XnView (και το εργαλείο γραμμής εντολών NConvert), jpegcrop ή το δωρεάν λογισμικό ImageMagick για προχωρημένες μετατροπές.

Επεξεργασία εικόνων που προέρχονται από σαρωτή

Οι εικόνες που προέρχονται από σαρωτή απαιτούν συνήθως κάποια επεξεργασία πριν τις μετατρέψετε σε PDF ή DJVU: περικοπή, περιστροφή, διαίρεση, μείωση του μεγέθους, μετατροπή σε TIFF κ.λπ. Η εφαρμογή ανοιχτού κώδικα ScanTailor-Universal έχει σχεδιαστεί για το σκοπό αυτό. Μπορείτε να την κατεβάσετε από τη σελίδα releases page του project.

Δημιουργία PDF από εικόνες

  • img2pdf, ένα πρόγραμμα γραμμής εντολών ανοιχτού κώδικα, έχει σχεδιαστεί για να μετατρέπει εικόνες χωρίς απώλειες σε PDF. Μπορεί επίσης να ορίσει μεταδεδομένα (όπως ο τίτλος και ο συγγραφέας) και τον τρόπο με τον οποίο το προκύπτον αρχείο PDF θα πρέπει να παρουσιάζεται από ένα πρόγραμμα προβολής PDF.

Η ακόλουθη εντολή θα πάρει όλα τα αρχεία από τον τρέχοντα φάκελο και θα τα μετατρέψει σε ένα ενιαίο PDF με όνομα test.pdf με μεταδεδομένα τίτλου και συγγραφέα:

img2pdf --title " Το πρώτο μου PDF " --author " Παράδειγμα Jack " --output test.pdf *

Σημειώστε ότι κάτι τέτοιο προϋποθέτει ότι ο τρέχων κατάλογος δεν περιέχει μη-εικονικά στοιχεία ή υποφακέλους. Αν όλα τα αρχεία προέλευσης είναι ενός μόνο τύπου, όπως JPEG, μπορείτε να ορίσετε το *.jpg ως δεδομένο εισόδου. Μπορείτε επιπλέον να καθορίσετε πολλαπλά δεδομένα εισόδου για τα αρχεία ξεχωριστά.

Δείτε img2pdf --help για όλα όσα μπορεί να κάνει το img2pdf.

Το img2pdf είναι διαθέσιμο από το Python Package Index και περιλαμβάνεται επίσης στα αποθετήρια πολλών εκδόσεων Linux. Ένα εκτελέσιμο αρχείο για Windows είναι επίσης διαθέσιμο μέσω του Appveyor του project.

  • Το ImageMagick και το GraphicsMagick μπορούν επίσης να χρησιμοποιηθούν για τη μετατροπή εικόνων σε αρχεία PDF, εάν είναι εγκατεστημένο το GhostScript.

Η ακόλουθη εντολή θα χρησιμοποιήσει το εργαλείο mogrify του ImageMagick για να μετατρέψει όλα τα αρχεία JPEG σε μεμονωμένα αρχεία PDF και να τα τοποθετήσει σε έναν υποφάκελο με όνομα "pdf":

mogrify -format pdf -path pdf/ *.jpg

Σε ορισμένες εκδόσεις Linux, η προεπιλεγμένη πολιτική ασφαλείας του ImageMagick εμποδίζει το πρόγραμμα να χειρίζεται αρχεία PDF. Ανατρέξτε στο this StackOverflow question για το πώς να αλλάξετε την πολιτική προστασίας.

Δημιουργία PDF από διτονικές(bitonal) εικόνες

Οι διτονικές εικόνες (δηλαδή οι εικόνες που περιέχουν μόνο μία απόχρωση του ασπρόμαυρου) είναι ένας πολύ αποτελεσματικός τρόπος αποθήκευσης σαρωμένων εγγράφων που περιέχουν μόνο κείμενο ή άλλα απλά στοιχεία που χρειάζονται μόνο δύο χρώματα για να αναπαρασταθούν με σαφήνεια. Μια σελίδα κειμένου υψηλής ποιότητας σε μορφή bitonal έχει συνήθως μέγεθος μόνο δεκάδων kilobytes.

Υπάρχουν δύο μέθοδοι διτονικής συμπίεσης που χρησιμοποιούνται στα αρχεία PDF, και συγκεκριμένα η CCITT Group 4 Fax compression και η JBIG2 συμπίεση. Η τελευταία είναι πιο αποδοτική, αλλά έχει κάποια αντιληπτά ζητήματα "πατέντας" που σχετίζονται με αυτήν, με αποτέλεσμα η λειτουργία κωδικοποίησης JBIG2 συχνά να απουσιάζει ή να απενεργοποιείται στο λογισμικό δημιουργίας PDF. Ωστόσο, μερικές φορές είναι δυνατό να ενεργοποιήσετε την εν λόγω λειτουργικότητα εγκαθιστώντας μόνοι σας τον κωδικοποιητή.

Υπάρχουν πολλά εργαλεία για τη μετατροπή εικόνων σε εικόνες που χρησιμοποιούν συμπίεση bitonal. Το ScanTailor-Universal είναι ένα εργαλείο ανοιχτού κώδικα για την επεξεργασία σαρωμένων σελίδων που μπορεί να παράγει εικόνες διτονικής μορφής. Το ImageMagick και το GraphicsMagick είναι επίσης σε θέση να το κάνουν αυτό με την επιλογή -threshold.

Η ακόλουθη εντολή ImageMagick μετατρέπει όλα τα αρχεία .jpg ενός φακέλου σε αρχεία bitonal TIF χρησιμοποιώντας συμπίεση Group 4 και τα τοποθετεί σε ένα φάκελο με όνομα "bitonal":

mogrify -format tif -compress Group4 -path bitonal/ -threshold 50% *.jpg

Παίξτε με την τιμή του -threshold για να βρείτε αυτή που παράγει ικανοποιητικά αποτελέσματα με το περιεχόμενό σας.

Μετατροπή JBIG2

Το OCRmyPDF είναι ένα πρόγραμμα γραμμής εντολών ανοιχτού κώδικα που έχει σχεδιαστεί κυρίως για να προσθέτει ένα επίπεδο κειμένου OCR σε σαρωμένα αρχεία PDF. Ένα από τα πρόσθετα χαρακτηριστικά του είναι η ικανότητά του να βελτιστοποιεί αρχεία PDF, η οποία περιλαμβάνει τη μετατροπή άλλων bitonal μορφών εικόνας σε JBIG2. Αυτό απαιτεί την εγκατάσταση του κωδικοποιητή jbig2enc. Οδηγίες μεταγλώττισης και εγκατάστασης για χρήστες Linux είναι διαθέσιμες εδώ, ενώ ένα εκτελέσιμο πρόγραμμα για Windows τρίτου μέρους είναι διαθέσιμο εδώ. Η έκδοση για MacOS που βρίσκεται στο Homebrew περιλαμβάνει ήδη το jbig2enc.

Δείτε εδώ για το πώς να εγκαταστήσετε το OCRmyPDF στα Windows. Πολλές εκδόσεις Linux διαθέτουν ένα πακέτο OCRmyPDF που περιλαμβάνεται στα αποθετήρια, αν και ενδεχομένως να είναι ξεπερασμένο. Το OCRmyPDF είναι επίσης διαθέσιμο στο pip.

Η ακόλουθη εντολή χρησιμοποιεί το OCRmyPDF για να προσθέσει ένα επίπεδο κειμένου OCR σε ένα PDF και να τακτοποιήσει το PDF με τρόπο που να επιτρέπει σε ένα πρόγραμμα περιήγησης ιστού να αρχίσει να το εμφανίζει πριν από την πλήρη λήψη του:

ocrmypdf --output-type pdf --fast-web-view 0 test.pdf test-OCR.pdf

Το OCRmyPDF από προεπιλογή βελτιστοποιεί χωρίς απώλειες το PDF, έτσι ώστε οι bitonal εικόνες να μετατρέπονται αυτόματα σε JBIG2 εάν είναι εγκατεστημένο το jbig2enc.

Αν θέλετε να παραλείψετε τη διαδικασία OCR επειδή δεν χρειάζεται να κάνετε OCR στο PDF, χρησιμοποιήστε το --tesseract-timeout 0 για να παραλείψετε εντελώς το OCR.

Δείτε το OCRmyPDF's documentation για περαιτέρω παραδείγματα χρήσης.

Δημιουργία DjVu από εικόνες

Χρησιμοποιήστε τα εργαλεία γραμμής εντολών DjVuLibre c44 (για έγχρωμες εικόνες) και cjb2 (για διτονικές εικόνες) για να μετατρέψετε εικόνες σε μονοσέλιδα αρχεία DjVu, και στη συνέχεια ένωση με το djvm.

Παράδειγμα γραμμής εντολών c44: c44 [options] pnm-or-jpeg-file [djvufile]
Οι σημαντικές επιλογές είναι -slice, -dpi and -mask. -slice όπου ορίζουν τον αριθμό των "τεμαχίων (slices)" σε κάθε "chuck" (που είναι κάποιοι περίπλοκοι όροι του DjVu). Δίνοντας τρεις αριθμούς σημαλινει ότι θα υπάρχουν τρία "chunks" και το νούμερο τέσσερα θα οδηγήσει σε 4 chunks. Αυτά τα νούμερα πραγματικά επηρεάζουν την ποιότητα και το μέγεθος - πειραματιστείτε και δείτε την τεκμηρίωση
c44 -slice -slice 74+13+10 -dpi 150 pnm-or-jpeg-file [djvufile]


Από την επεξηγηματική βοήθεια του cjb2 bitonal encoder:

Usage: cjb2 [options] <input-pbm-or-tiff> <output-djvu>
Options are:
 -verbose        Display additional messages.
 -dpi <n>        Specify image resolution (default 300).
 -clean          Cleanup image by removing small flyspecks.
 -lossy          Lossy compression (implies -clean as well)
 -losslevel <n>  Loss factor (implies -lossy, default 100)
Encoding is lossless unless a lossy options is selected.

Σε πολλές περιπτώσεις, το -losslevel μπορεί να ρυθμιστεί χωρίς πρόβλημα τόσο χαμηλά όσο το 50.

Για λεπτομέρειες, ανατρέξτε στην DjVuLibre τεκμηρίωση.

Το Minidjvu επιτρέπει τη μετατροπή ασπρόμαυρων μονοσέλιδων και πολυσέλιδων TIFF, BMP και PBM σε DjVu και αντίστροφα. Διαθέτει ένα απλό γραφικό κέλυφος. Η υποστήριξή του για πολυσέλιδα αρχεία TIFF είναι ένα αξιοσημείωτο πλεονέκτημα έναντι των εργαλείων DjVuLibre.

minidjvu 0.8 - encode/decode bitonal DjVu files
Usage:
single page encoding/decoding:
    minidjvu [options] <input file> <output file>
multiple pages encoding:
    minidjvu [options] <input file> ... <output file>
Formats supported:
    DjVu (single-page bitonal), PBM, Windows BMP, TIFF.
Options:
    -A, --Averaging:               compute "average" representatives
    -a <n>, --aggression <n>:      set aggression level (default 100)
    -c, --clean                    remove small black pieces
    -d <n> --dpi <n>:              set resolution in dots per inch
    -e, --erosion                  sacrifice quality to gain in size
    -i, --indirect:                generate an indirect multipage document
    -l, --lossy:                   use all lossy options (-s -c -m -e -A)
    -m, --match:                   match and substitute patterns
    -n, --no-prototypes:           do not search for prototypes
    -p <n>, --pages-per-dict <n>:  pages per dictionary (default 10)
    -r, --report:                  report multipage coding progress
    -s, --smooth:                  remove some badly looking pixels
  • DjVuSolo έχει τη δυνατότητα να δημιουργεί αρχεία DjVu.
  • Ορισμένα advanced scripts είναι διαθέσιμα για την εκτέλεση της εργασίας.

Μετατροπή από μορφές εικόνας σε κείμενο (οπτική αναγνώριση χαρακτήρων)

gImageReader

  • Η gImageReader είναι μια εφαρμογή ανοιχτού κώδικα για την εξαγωγή κειμένου από εικόνες και έγγραφα PDF με βάση τις εικόνες. Είναι σε θέση να ανιχνεύει αυτόματα τη διάταξη του κειμένου και τη μετα-επεξεργασία του αναγνωρισμένου κειμένου, συμπεριλαμβανομένων του ορθογραφικού ελέγχου και της αφαίρεσης των αλλαγών γραμμής. Χρησιμοποιεί το Tesseract για την αναγνώριση κειμένου και ως εκ τούτου υποστηρίζει οποιαδήποτε γλώσσα που υποστηρίζει το Tesseract.

IrfanView

  • Χρησιμοποιήστε το πρόσθετο "Start OCR" του μενού επιλογών του IrfanView (το OCR είναι Optical character recognition) για να εξαγάγετε το κείμενο. Από τις 20-02-2010 το πρόσθετο KADMOS OCR για το Irfanview περιορίζεται σε περίπου έξι σελίδες, ανάλογα με την ελεύθερη μνήμη του υπολογιστή σας (περίπου ένα gigabyte απαιτείται για 10 σελίδες).

Pdf X-Change Viewer

  • Χρησιμοποιήστε τη λειτουργία OCR του PDF-XChange Viewer: Έγγραφο -> Σελίδες OCR.

Μηχανή Tesseract

  • Χρησιμοποιήστε το δωρεάν Ανοιχτού Κώδικα Tesseract λογισμικό (Linux, Mac OS X ή Windows):
  • κατεβάστε και το λογισμικό "tessract" και τα πακέτα γλώσσας "tessdata" σχετικά με τη γλώσσα/-ες ή τα scripts που εμφανίζονται στο σαρωμένο αρχείο. Αποσυμπιέστε τα στον ίδιο φάκελο - δεν απαιτείται εγκατάσταση για το εκτελέσιμο αρχείο των Windows.
  • ανακτήστε την υψηλότερη δυνατή ανάλυση σάρωσης και, εάν είναι απαραίτητο, μεγεθύνετε περαιτέρω την εικόνα σάρωσης (χρησιμοποιήστε γρήγορη αλλαγή μεγέθους, αποφύγετε τα φίλτρα resample) μέχρι οι χαρακτήρες να έχουν ύψος πάνω από 20 pixels (πειραματιστείτε για καλύτερα αποτελέσματα) και αποθηκεύστε την (χρησιμοποιήστε το ImageMagick ή το IrfanView).
  • χρησιμοποιήστε την εντολή tesseract IMAGEFILE OUTPUT

eScriptorium

  • Χρησιμοποιήστε το δωρεάν λογισμικό ανοικτού κώδικα eScriptorium με το Kraken. Το στοιχείο server μπορεί να εγκατασταθεί σε Linux, macOS ή Windows (με WSL). Η πλευρά του πελάτη (client-side) είναι μια διαδικτυακή εφαρμογή που λειτουργεί σε οποιοδήποτε σύγχρονο πρόγραμμα περιήγησης στο διαδίκτυο. Επιτρέπει την κατάτμηση περιοχών και γραμμών κειμένου και την αναγνώριση τυπωμένου κειμένου και γραφής. Τόσο η τμηματοποίηση όσο και η αναγνώριση μπορούν να εκπαιδευθούν.

Google

Η Google έχει OCR. Δείτε:

Σε όλες τις περιπτώσεις, μπορεί να χρειαστεί να μετατρέψετε σε τμήματα. Θα χρειαστεί να διορθώσετε χειροκίνητα το παραγόμενο κείμενο, επειδή η μετατροπή δεν θα είναι άριστη.

Μετατροπή βίντεο

Δείτε Βοήθεια:Μετατροπή βίντεο.

Περαιτέρω βοήθεια

Μπορείτε να ζητήσετε βοήθεια στο Commons:Help desk.

Δείτε επίσης