Aide:Conversion de PDF en DjVu

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Converting PDF to DjVu and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Help:Converting PDF to DjVu and have to be approved by a translation administrator.

La conversion de fichiers PDF en DjVu n'est pas toujours nécessaire, mais peut s'avérer utile en raison des avantages du format DjVu et des problèmes que comportent certains fichiers PDF (par exemple, une disposition incompatible entre du texte et une image, des images JPEG embarquées, des polices de caractères ou autres). Chaque fichier PDF devrait faire l'objet d'une évaluation au cas par cas avant de prendre la décision de le convertir. Les fichiers PDF vectoriels (par exemple, ceux qui ont été créés par la conversion d'un original numérique, comme un document créé avec Libre Office ou avec Microsoft Word) ne devraient normalement pas être convertis ; ces derniers sont courants parmi les documents récents créés par des gouvernements. Disposer d'une version DjVu d'un livre en PDF a des avantages car :

  • les fichiers DjVu ont une taille inférieure, ce qui est l'idée principale à la base du format DjVu ;
  • le rendu des documents DjVu est plus facile à générer et il est plus simple de s'y déplacer en le faisant défiler. Vous pouvez remarquer que dans les visionneuses de PDF et de DjVu, le DjVu dispose d'un meilleur temps de réponse ;
  • le format DjVu ne nécessite pas de polices de caractères ;
  • le DjVu peut comporter un plan indexé sur lequel il est possible d'effectuer des recherches avec WinDjView. Voir Aide:Créer un sommaire pour les fichiers PDF et DjVu.

Cependant, une telle conversion a tendance à réduire le niveau de qualité, il faut donc faire au mieux pour conserver une qualité acceptable.

Améliorer l'interpréteur de commandes de Windows

La conversion peut nécessiter des outils en ligne de commande. L'interpréteur de commandes standard de Windows suffit à la tâche, mais peut être amélioré pour le rendre plus facile à utiliser. Voir Aide:Améliorer l'interpréteur de commandes de Windows.

Avec un logiciel standard prêt à l'emploi

  • pdf2djvu peut facilement convertir un fichier PDF en un fichier DjVu. Vous pouvez utiliser cette ligne de commande pour cela :
    pdf2djvu -o p.djvu --dpi=900 p.pdf
  • D'autres logiciels existent pour convertir du PDF en DjVu, comme Celartem pdftodjvu. Cependant, il est connu pour planter sur certains fichiers sous certaines conditions.

Utilisation : pdftodjvu book.pdf [-o book.djvu] [-mode:Document|Bitonal] [autres paramètres...]

Paramètres :

-o book.djvu
Fichier djvu produit. Si -о n'est pas spécifié, pdftodjvu utilise le nom du fichier PDF avec l'extension '.djvu'.
-mode SegmentationMode
Définit le « mode de segmentation », qui peut prendre l'une de ces valeurs : Document, Bitonal, PhotoIfFGEmpty, SegmentAlways, PhotoAlways.

Des résultats acceptables ne sont généralement obtenus qu'avec les modes Document ou Bitonal.

-dpi DPI
Définit la résolution en ppp.

Les paramètres sont expliqués en détail lorsqu'on lance simplement ce programme.

  • Certains logiciels ne peuvent pas convertir directement les fichiers de Google Livres en raison de leur compression. Dans ce cas, la conversion peut être réalisée en extrayant les pages sous un format raster (bitmap) et les assembler dans un fichier DjVu (voir plus bas). Suggestion aux développeurs : il serait intéressant que quelqu'un écrive un convertisseur capable de convertir des fichiers PDF de Google Livres en DjVu.


Découpage en images et assemblage de celles-ci en DjVu

Si des résultats satisfaisants ne sont pas atteints avec les convertisseurs existants, la seule méthode fonctionnant peut être d'extraire toutes les pages du fichier original sous la forme d'images et de créer un DjVu à partir d'elles. Différentes approches doivent être suivies pour les fichiers PDF en deux tons ou colorés.

Étape 1 : extraction des pages sous la forme d'images

La première étape consiste à extraire les pages du fichier PDF sous la forme d'images. Le format des images est important, car les programmes qui vont les convertir en DjVu ont besoin de fichiers JPEG ou PNM pour les documents en couleurs et de TIFF ou de PBM pour les documents en deux tons.

  • Le programme PDF-XChange Viewer, disposant d'une IHM, peut réaliser l'extraction vers les formats JPG, TIFF ou PBM requis ; de plus, STDU Viewer gère l'extraction de JPG.
  • L'avantage de PDF-XChange Viewer est qu'il peut aussi lisser des pages entières de manière graphique et extraire les images lissées, ce qui peut être utile car le texte de certains livres numérisés peut paraître brut (le lissage est activé via le menu Préférences → Rendu → Lisser les images).
  • Un autre avantage est sa capacité à extraire le livre entier vers un fichier TIFF bitonal multi-pages, pouvant ensuite être converti avec minidjvu (étape 3, plus bas).
  • Si le format visé est le TIFF, il faudra le paramétrer comme bitonal : vous devrez ouvrir la fenêtre d'export (Fichier → Export → Exporter vers une image...), puis sélectionner Options → Type d'image → 1 (noir et blanc).
  • Pour obtenir un fichier TIFF multi-page, le mode d'export doit être paramétré en conséquence dans la fenêtre "Exporter vers une image".
  • L'outil en ligne de commande pdfimages peut produire du PBM/PPM et, dans le cas où les images sont stockées en interne au format JPEG, il peut les extraire sous la forme de fichiers JPEG.

Étape 2 : conversion (modification) des images

Les images sont extraites dans le cadre de la création d'un fichier DjVu à partir d'elles. Le problème est qu'il y a de grandes chances qu'il faudra les convertir vers un format accepté par le programme chargé de créer le fichier DjVu à partir des images, à savoir le JPEG ou le PNM pour les documents en couleurs et le TIFF ou le PBM pour les documents en deux tons. Voir Help:Converting images pour les détails.

  • Si le convertisseur d'ImageMagick est utilisé pour la conversion, les images peuvent aussi être modifiées en option en parallèle de la conversion.
  • Lissage du texte. L'option convert -blur d'ImageMagick, avec une valeur d'environ 0,05 à 0,3 peut être utilisée pour lisser le texte. Voir Help:Smoothing text in PDF or DjVu scanned books/fr.
  • Réduction des dimensions des images pour obtenir un DjVu moins gros. Ceci peut être réalisé avec l'option convert -resize d'ImageMagick.

Étape 3 : assemblage des images en DjVu

Avec des services en ligne

  • Any2DjVu Server permet de convertir directement un fichier PDF.
  • Les fichiers PDF issus de la riche bibliothèque en ligne française Gallica peuvent être récupérés facilement en donnant leur adresse FTP à Any2DjVu Server. Cependant, il est souvent utile de recadrer le fichier PDF afin d'obtenir un meilleur positionnement de la page dans le cadre. Ceci peut s'avérer assez difficile. Toute personne connaissant ce sujet est invitée à modifier cet article pour décrire le procédé.
  • Il existe d'autres services en ligne affirmant leur capacité à réaliser la conversion de PDF en DjVu, mais ils ont des limitations et ne produisent pas toujours les résultats attendus. Vous pouvez les trouver facilement en recherchant les termes 'convert pdf to djvu online' ou 'convertir pdf en djvu en ligne' (ou d'autres termes équivalents).

Transfert du sommaire

Utilisez HandyOutliner ou Pdf & DjVu Bookmarker pour transférer le sommaire (la table des matières) vers le fichier converti. Voir Aide:Créer un sommaire pour les fichiers PDF et DjVu.

Effectuer des demandes

Si vous désirez qu'un certain document de Commons soit converti, mais que vous ne pouvez pas effectuer la conversion vous-même, vous pouvez poster une demande sur la page de catégorie "Commons requests".

Voir aussi