Помощь:Преобразование из PDF в DjVu

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Converting PDF to DjVu and the translation is 47% complete. Changes to the translation template, respectively the source language can be submitted through Help:Converting PDF to DjVu and have to be approved by a translation administrator.
Outdated translations are marked like this.

Преобразование файлов pdf в формат djvu не всегда необходимо, но может быть полезно по причине преимуществ формата djvu и недостатков pdf-книги. Однако такое преобразование может уменьшить качество, поэтому следует стремиться к тому, чтобы по возможности сохранять приемлемое качество.

Однако, иметь djvu-версии pdf-книг полезно, потому что:

  • DjVu-файлы меньше по размеру, что было главной идеей при создании этого формата;
  • DjVu-документы легче и быстрее отображаются и перелистываются. Вы можете заметить это в программах-просмотрщиках pdf и djvu: последним требуется меньше времени для прорисовки страниц, они быстрее откликаются, тогда как работа просмотрщиков pdf может заметно замедляться;
  • DjVu-формат не требует шрифтов;
  • Программа WinDjView поддерживает особые, удобные оглавления (индексы) для DjVu с возможностью поиска по первым буквам. Посмотрите Help:Создание оглавлений (добавление закладок) для PDF и DjVu.

Тем не менее, такое преобразование, как правило, снижает качество, поэтому следует сделать всё возможное, чтобы сохранить приемлемое качество.

Улучшение командной строки Windows

The conversion may require command line tools. The standard Windows command shell is enough for the task, but it can be improved to make it easier to use. See Help:Improving the Windows command shell.

Использование готовых программных решений

  • Djvu-Spec Pdf 2 Djvu Converter для Windows преобразует pdf-файлы через свой командный или графический интерфейс. Требуется однако быть осторожным с настройками, чтобы не потерять качество.

Руководство пользователя на русском языке: [1]

  • pdf2djvu может легко преобразовывать pdf в djvu. Можно использовать, к примеру, такую команду для этого:
    pdf2djvu -o p.djvu --dpi=900 p.pdf
  • pdf2djvu -o p.djvu --dpi=900 p.pdf
  • Существуют и иные программы для преобразования pdf в djvu, например, Celartem pdftodjvu.

Правда, известно, что эта программа не всегда справляется со своей задачей: на некоторых файлах она завершается аварийно.

Способ вызова и основные параметры.

pdftodjvu pdf-файл.pdf [-o djvu-файл.djvu] [-mode:Document|Bitonal] [другие параметры...]

Параметры

 -o djvu-файл.djvu
   Выходной djvu-файл. Если -о не задано, pdftodjvu использует имя входного PDF-файла с расширением '.djvu' в качестве выходного.
-mode задаёт т.н. режим сегментации
     Режим сегментации может быть:
Document, Bitonal, PhotoIfFGEmpty,       SegmentAlways, PhotoAlways.   

 -dpi DPI
   Указывает разрешение в точках-на-дюйм.

Приемлемые результаты получаются, как правило, только при параметре -mode Document или Bitonal.

Другие параметры объясняются при простом запуске программы.

Использование: pdftodjvu book.pdf [-o book.djvu] [-mode:Document|Bitonal] [другие параметры…]

Параметры:

-o book.djvu

:Output djvu file. If -о is not specified, pdftodjvu uses the name of the input PDF-file with the '.djvu' extension.

-mode SegmentationMode

:Sets the so-called segmentation mode, which can be one of: Document, Bitonal, PhotoIfFGEmpty, SegmentAlways, PhotoAlways.

Acceptable results are typically only obtained with Document or Bitonal values for mode.

-dpi DPI

:Sets the DPI.

The parameters are explained in detail upon a simple launch of this program.

Некоторые программы не могут работать с книгами Google Books (по причине их сжатия). Если не удаётся преобразовать такие книги с помощью программ, тогда это возможно сделать путём извлечения страниц в виде изображений и создания djvu из них.


Разбивка на изображения и собирание их в DjVu

If the satisfactory results can't be achieved with the existing converters, the only working method may be to extract all pages of the original file as images and create a DjVu out of them. Different approaches are required for coloured and bitonal PDF files.

Шаг 1: Извлечение страниц как изображений

The first step is to extract PDF pages as images. The format of the images is important, because the programs that will convert them to DjVu require JPEG or PNM for coloured documents, and TIFF or PBM for bitonal documents.

  • The GUI program PDF-XChange Viewer can extract into the required JPG, TIFF or PBM formats, and STDU Viewer supports JPG extraction.
  • The advantage of PDF-XChange Viewer is that it can also smooth the whole pages graphically and extract the smoothed images, which may be useful because in some scanned books the text looks rough. (The smoothing is enabled in Preferences → Rendering → Smooth images.)
  • Another advantage is that it can extract the whole book into one multi-page bitonal TIFF file, which can be later converted with minidjvu (step 3 below).
  • If the desired format is TIFF, it needs to be set to bitonal: you need to open the export window (File → Export → Export to image...), then select Options → Image type → 1 (Black & white).
  • To get a multi-page TIFF, Export mode in the "Export to image" window needs to be set accordingly.
  • The command line tool pdfimages can give PBM/PPM and, in case the images are internally stored in the JPEG format, it can extract them as JPEG files.

Шаг 2: Преобразование (редактирование) изображений

The images are extracted with the scope of creating a DjVu out of them. The problem is there will likely be a need to convert them to the format that is accepted by the program that creates DjVu out of images, which is JPEG or PNM for coloured documents, and TIFF or PBM for bitonal documents. See Help:Converting images for details.

  • If ImageMagick convert is used for conversion, images can also optionally be edited along with the conversion.
  • Smoothing the text. ImageMagick convert -blur option with a value of about 0.05 to 0.3 can be used to smooth the text. See Help:Smoothing text in PDF or DjVu scanned books.
  • Reducing the dimensions of the images to obtain smaller DjVu size. This may be done with Imagemagick convert -resize option.

Шаг 3: Сборка изображений в DjVu

Используя онлайн-сервисы

  • Any2DjVu Server позволяет напрямую преобразовывать pdf-файлы в djvu.
  • Pdf-файлы из французской онлайн-библиотеки Gallica могут браться сервером Any2Djvu по их FTP-адресу. Но часто бывает желательно предварительно отредактировать pdf-файл, чтобы получить лучшее расположение страниц в рамках (см. особенности формата pdf). Для этого придётся извлечь все страницы в изображения (см. выше), и обрезать их программами XnView, ImageMagick convert или подобными.
  • Существует и другие сайты, на которых заявлена возможность преобразования pdf в djvu, но они могут иметь ограничения и не всегда доставлять ожидаемый результат.

Их легко найти по поисковым запросам convert pdf to djvu online, конвертирование pdf в djvu и подобным.

Перенос оглавления

Можно использовать HandyOutliner для перенесения оглавлений из pdf-книги в djvu. См. также: https://ru.scribd.com/document/447579769/Создание-оглавлений-для-PDF-и-DjVu-книг

Создание запросов на преобразование

If you wish that some document on Commons was converted, but can't do it yourself, you may leave a request in the "Commons requests" category page.

См. также