Help:PDF形式からDjVu形式に変換

From Wikimedia Commons, the free media repository
Jump to navigation Jump to search
This page is a translated version of a page Help:Converting PDF to DjVu and the translation is 89% complete. Changes to the translation template, respectively the source language can be submitted through Help:Converting PDF to DjVu and have to be approved by a translation administrator.
Outdated translations are marked like this.

ファイル形式をpdfからdjvuに変換することは必然ではありませんが、DjVuには高度な機能がありPDFファイルにときおり見られる問題 (例:画像レイヤーや埋め込みJPEG画像、フォントその他の要素の互換性) を回避できることから有益ではあります。 それぞれのpdfファイルは、先に変換の効果がどれだけあるかを検討してください。通常、ベクターpdfファイル (たとえばもともとOpen OfficeあるいはMicrosoft Wordで作成されたデジタル素材から変換した場合) は変換すべきではありません。これらは、最近の政府系の文書によく見られます。 PDF 形式のブックにDjVu版を用意する利点は以下の通りです。

  • DjVuファイルはサイズを軽くするために考案され、実際にファイルがけいりょうかできます。
  • DjVu 文書は表示処理も、画面表示を上下左右にスクロールするのも楽です。ビュワーを使った場合に、PDFとDjVuの差をはっきり感じるはずです。DjVuのほうが反応時間が短いはずです。
  • DjVu 形式にはフォントが不要です。
  • DjVu には索引と検索を設けた概要をWinDjViewで提供できます。詳細はHelp:PDF と DjVu の大要を書くをご参照ください。

しかしながr、そのような変換はともすると画質が劣化しがちであり、なんとか閲覧に適した画質を保つため、工夫をする必要があります。

Windows のコマンド行を改善

変換作業には、コマンドラインのツールが必要な場合があります。Windowsの標準的なコマンドシェルで充分ですが、使いやすくする改良を施すこともできます。詳細はHelp:Improving the Windows command shellをご参照ください。

既存のソフトウェア解決法を使う

  • Windows対応のDjvu-Spec Pdf 2 Djvu ConverterはPDF変換をコマンドライン経由もしくは画像インターフェイス経由で処理します。
  • pdf2djvuを使うとPDFファイルを簡単にDjVuファイルに変換できます。コマンドラインから、次の手順に従います。
    pdf2djvu -o p.djvu --dpi=900 p.pdf
  • その他のソフトウェアでこの種の変換に使えるのはCelartem pdftodjvuです。しかしながらなにがしかの条件下では、特定のファイルでクラッシュすることがわかりました。

使用法: pdftodjvu book.pdf [-o book.djvu] [-mode:Document|Bitonal] [その他のパラメータ……]

パラメータ:

-o book.djvu
djvu形式に出力。-о属性を指定しない場合、pdftodjvu は入力されたPDFファイルの名称に拡張子「.djvu」を付けます。
-mode SegmentationMode
いわゆる分割モードを設定し、値は次のどれかを採用:Document, Bitonal, PhotoIfFGEmpty, SegmentAlways, PhotoAlways。

使用可能な変換結果は、モードにDocument(文書)もしくはBitonal(ビット)値のみ使って出力されます。

-dpi DPI
DPI値を設定。

このプログラムを立ち上げると、パラメータの詳細な説明を表示します。

  • ソフトウェアによってはGoogleブックの圧縮が原因で、直接、変換することができません。その場合、ページをビットマップ形式で抽出し、それを次にDjVu形式に加工する方法で変換ができます (以下をご参照)。ここではプログラムがネックになりがちです。もしも誰かがGoobleブックのPDF形式からDjVu形式へも取り扱い可能な変換機能を書いてくれたら、最適の対処です。


複数の画像ファイルに切り分け、DjVu形式に再構成

現行の変換機能で満足のいく結果を得られない場合は、唯一の対処法として元ファイルの全ページを画像ファイルとして取り出し、それを素材にDjVu形式を作成することができます。ただしPDFファイルでもカラーとモノクロでは手順が異なります。

ステップ1:ページを画像として抽出

まず最初のステップはPDFファイルを画像として抽出することです。 画像の形式が重要ポイントで、DjVu形式に変換するプログラムの要件があり、カラー画像はJPEGもしくはPNM、モノクロ画像はTIFFもしくはPBMとされています。 PDF-XChangeビューアやSTDUビューアなどのGUIプログラムを使い、PDFファイルから要件どおりの画像形式JPG、TIFF、PBMで画像を取り出します。コマンドラインのツールpdfimagesで得られる形式はPBM/PPM、またPDF内の画像がJPEG形式の場合は、そのままJPEG形式で抽出します。

ステップ2:画像を変換 (編集)

画像の取り出しは、DjVuを再構成するという目的に沿って実施します。ここで課題となるのは多くの場合、画像をDjVuファイルに再構成するプログラムに要件があり、それに一致するファイル形式で画像を抽出することで、カラー画像はJPEGかPNM、モノクロ画像はTIFFかPBMです。詳細はHelp:Converting imagesをご参照ください。

  • 変換に使うプログラムがImageMagickの場合、変換作業と同時に画像の編集も行えます。
  • 文字のギザギザを滑らかにする。ImageMagickconvert -blur 選択肢を0.05–0.3前後に設定すると、文字の輪郭が滑らかになります。詳細はHelp:Smoothing text in PDF or DjVu scanned booksをご参照ください。
  • 最終的なDjVuファイルを縮小するには、画像ファイルの寸法を小さくします。使うソフトウェアはImagemagickでconvert -resizeオプションを利用します。

ステップ3:複数の画像をDjVu形式に合成

オンラインサービスを活用

  • Any2DjVu ServerはPDFファイルを直接、変換することができます。
  • フランス本拠の内容豊富なオンライン・ライブラリGallicaからPDFファイルを取得するには、画像のFTPアドレスをAny2DjVuサーバに渡すだけで実施できます。しかしながら、PDFファイルが示す広めの画面から、多くの場合は実際に使いたい部分のみ切り出すほうが使いやすいです。その分、難易度は少し上がると感じるかもしれません。 そこでこの話題に詳しい人にお願いなのですが、手順の説明を編集して改善してもらえませんか。
  • その他のオンラインサービスで、PDF形式からDjVu形式に変換できるというものはいくつかあっても、制限があったり予想外の結果を出力することがあります。たとえば検索エンジンで「オンラインでpdfからdjvuに変換」と「入力すると、いくつかみつかるはずです (英語でならconvert pdf to djvu online。)

まとめを移入する

HandyOutlinerを使うと、変換した形式にまとめ (目次) を移入できます。詳細はHelp:PDF と DjVu の大要を書くをご参照ください。

依頼の提出

コモンズの特定の文書を変換したいけれど自力ではできない場合、「Commons 依頼」カテゴリで依頼を提出できます。

関連項目