Aide:Conversion de DjVu en PDF

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Converting DjVu to PDF and the translation is 100% complete. Changes to the translation template, respectively the source language can be submitted through Help:Converting DjVu to PDF and have to be approved by a translation administrator.

Cette page explique comment convertir des documents numérisés au format djvu vers le format pdf.

La conversion des fichiers djvu en pdf peut être intéressante car le format pdf est plus accessible :

  • certaines personnes préfèrent gérer le format pdf et ne disposent pas d'un lecteur installé
  • le format pdf peut être affiché directement dans la plupart des navigateurs
  • quelques sites disposant de lecteurs en ligne ne peuvent afficher que du pdf, pas du djvu
  • le format PDF est plus simple à manipuler, il existe plus de logiciels permettant de travailler avec le PDF qu'avec le DjVu

Ainsi, disposer de versions en pdf de livres intéressants en djvu est souhaitable.

Améliorer l'interpréteur de commandes de Windows

Comme pour d'autres tâches, les outils en ligne de commande sont plus susceptibles d'être utilisés pour ce type de conversion. Bien que l'interpréteur de commande standard de Windows convienne pour la tâche, il peut être amélioré avec des fonctionnalités utiles supplémentaires le rendant plus facile à utiliser. Voir Aide:Améliorer l'interpréteur de commandes de Windows.

Avec un logiciel standard prêt à l'emploi

Avec un logiciel disposant d'une interface graphique

L'utilitaire STDU Converter permet de convertir des fichiers DjVu en PDF. Il dispose d'une interface utilisateur conviviale avec des fonctionnalités utiles. Il gère l'encodage efficace JBIG2 pour les documents bitonaux (noir et blanc).

Avec des outils en ligne de commande

L'outil en ligne de commande ddjvu de DjVuLibre dispose d'une option pour convertir des djvu en pdf (voir la documentation).

ddjvu -format=pdf -mode=black input.djvu output.pdf

Cependant, le problème est que si le document est en couleurs, le fichier PDF résultant sera souvent d'une très grande taille, il y a donc un besoin pour des outils permettant d'obtenir des fichiers PDF d'une taille plus facile à gérer. C'est pour cela que le mode sombre a été défini dans l'exemple donné plus haut. Dans le cas de fichiers DjVu bitonaux (noir et blanc), la taille des documents PDF produits est acceptable, mais ils utilisent la compression Fax (groupe 4 du CCITT). Il existe une autre méthode de compression pour les fichiers PDF appelée JBIG2, qui produit des résultats environ deux fois plus petits. Heureusement, il existe des méthodes de conversion utilisant cette compression bitonale optimale. L'outil STDU Converter signalé plus haut en gère certaines.

Avec des imprimantes virtuelles PDF

Les documents DjVu peuvent être convertis en PDF via les imprimantes dites virtuelles. Une imprimante virtuelle est un logiciel qui apparaît comme une imprimante dans la liste des imprimantes de la boîte de dialogue d'impression. Lorsqu'on 'imprime' avec cette imprimante, le résultat est un fichier sur votre ordinateur.

Avec une imprimante virtuelle, tout document imprimable, dans n'importe quel format, peut être converti en PDF, mais les résultats ne sont pas toujours satisfaisants.

Conversion manuelle

Documents en couleurs

Pour obtenir un fichier PDF en couleurs d'une taille raisonnable, les étapes suivantes peuvent fonctionner :

Conversion du seul calque contenant le texte

La conversion directe de documents DjVu en couleurs vers le format PDF résulte souvent en des fichiers d'une taille inutilement élevée. Le format DjVu utilise un astucieux système de calques qui permettent de séparer le texte des fonds et les compresse selon des approches différentes, tandis que le format PDF utilise simplement la compression JPEG. Lors de la conversion, tous ces calques de page dans DjVu sont réunis en une seule image, qui pour certaines raisons s'avère telle que la compression JPEG ne fonctionne pas bien sur elles et que le résultat, le fichier en sortie, se révèle plusieurs fois plus gros que l'original.

Une chose que l'on peut faire est de n'extraire que le calque qui contient le texte (et potentiellement avec lui, quelques autres informations de premier plan significatives) et de créer le fichier PDF à partir de celui-ci. Cette approche convient pour les livres numérisés au format DjVu et disposant d'un fond polychrome issu du scanner, ce qui occuperait beaucoup de place dans un fichier PDF. Il n'est pas strictement nécessaire que le document ait toujours une apparence parfaite. Si les calques ayant du sens restants s'avèrent être bitonaux (en noir et blanc), alors la compression optimale JBIG2 peut être utilisée. Selon la manière dont le fichier DjVu a été encodé, les informations significatives peuvent se trouver au premier plan, à l'arrière-plan ou sur le calque de masquage. Dans certains cas, les images extraites à partir du calque de masquage peuvent être bien plus petites en taille, tout en continuant à contenir une bonne représentation du texte.

Pour n'extraire qu'un seul calque d'une page DjVu sous la forme d'images avec l'utilitaire ddjvu de DjVuLibre, les commandes suivantes peuvent être utilisées (essayez de voir laquelle d'entre elles produit le meilleur résultat) :

ddjvu -format=tif -eachpage -mode=foreground book.djvu pageimage%d.tif

ddjvu -format=tif -eachpage -mode=mask book.djvu pageimage%d.tif

ddjvu -format=tif -eachpage -mode=background book.djvu pageimage%d.tif

Après avoir déterminé la valeur nécessaire pour le paramètre "mode", la conversion peut être réalisée comme ceci :

ddjvu -format=pdf -mode=<value> book.djvu book.pdf

De cette manière, vous obtiendrez un document ne possédant que le texte ou que les images, ou que la partie de ce qui se trouvant dans l'original, en fonction de sa disposition.

Pour une conversion manuelle, les étapes restantes son les mêmes que celles décrites plus haut, sauf si les images sont bitonales, cas auquel vous devriez utilise l'encodage JBIG2, plus efficace. Pour éviter de mettre en place un encodeur spécifique nécessaire à cette tâche, il peut être intéressant d'assembler les images obtenues vers un nouveau document DjVu puis d'utiliser simplement l'outil STDU Converter pour en faire un document PDF avec les réglages appropriés.

Documents en noir et blanc (bitonaux)

À moins d'avoir besoin de convertir un grand nombre de documents, modifiez les images des pages ou utilisez quelques réglages spécifiques pour le résultat, STDU Converter est normalement suffisant, dans la mesure où il peut réaliser la conversion pour vous en quelques clics et rend le passage par un processus manuel assez inutile. Ce processus peut être le même que pour les documents en couleurs, sauf si vous désirez utiliser l'encodage JBIG2, plus efficace, la conversion des images au format PDF est réalisée avec un encodeur spécial.

Avec des services en ligne

Le projet Internet Archive convertit en fait automatiquement tous les fichiers djvu téléversés en pdf, sous le nom de derive. Vous devez créer un élément (ou ajouter des fichiers djvu à un élément existant) puis attendre, tout simplement. Après un certain temps, les versions en pdf devraient apparaître. djvu2pdf.com peut convertir des fichiers djvu en pdf, malgré quelques limites.

  • D'autres services en ligne existent et prétendent avoir la capacité de convertir des documents PDF en DjVu, mais ils possèdent des limitations et ne produisent pas toujours les résultats attendus. Vous pouvez facilement les trouver en effectuant une recherche avec les termes 'convertir pdf vers djvu en ligne' (ou 'convert pdf to djvu online' en anglais).

Vérification du résultat

  • Le fichier PDF devrait avoir un aspect similaire à l'original au format DjVu, il devrait être bien lisible et ne pas avoir une taille excessive.
  • Inspection des fichiers PDF. PDFXplorer peut être utilisé pour inspecter la structure des fichiers PDF en détail, pour vérifier quelles ont été les méthodes de compression utilisées, voire même pour extraire des flux de données.

Transfert des sommaires

  • HandyOutliner est capable de transférer le sommaire (la table des matières) depuis un document au format DjVu/PDF vers un autre. Voir Aide:Créer un sommaire pour les fichiers PDF et DjVu.
  • STDU Converter transfère les sommaires en même temps qu'il effectue la conversion et permet même de les modifier avant la conversion ainsi que d'appliquer d'autres réglages.

Défis en termes de programmation

  • Le grand défi qu'il reste est de créer des fichiers PDF de qualité en couleurs dont la taille ne soit pas excessive par rapport à celle des fichiers DjVu. Cuminas prétend détenir une technologie qui crée des fichiers PDF approchant le DjVu en termes de qualité et de taille. Une application en Ruby nommée PDFBeads essaye d'appliquer l'approche utilisée pour passer du format DjVu au PDF, mais parvenir à le faire fonctionner est difficile.
  • Pour automatiser la conversion manuelle décrite plus bas avec des scripts.

Effectuer des demandes

Si vous désirez convertir certains fichiers de Commons mais que vous ne pouvez pas le faire vous-même, vous pouvez effectuer une demande sur la page des demandes pour Commons.

Voir aussi