Редактирование PDF-файлов в Linux: различия между версиями

Материал из Викиучебника — открытых книг для открытого мира
Содержимое удалено Содержимое добавлено
оформление
Строка 3: Строка 3:
== Программное обеспечение ==
== Программное обеспечение ==
# '''PDFShuffler''' ([[w:Графический интерфейс пользователя|GUI]] для ''Python-pyPdf'') — извлечение, добавление, удаление, поворот, обрезка PDF страниц.
# '''PDFShuffler''' ([[w:Графический интерфейс пользователя|GUI]] для ''Python-pyPdf'') — извлечение, добавление, удаление, поворот, обрезка PDF страниц.
# '''{{w |Poppler}}-utils'''
# '''{{w|Poppler}}-utils'''
# '''{{w |Cairo}}''' — используется для Poppler-utils (pdftocairo).
# '''{{w|Cairo}}''' — используется для Poppler-utils (pdftocairo).
# '''{{w |Pdftk}}'''
# '''{{w|Pdftk}}'''


== Команды ==
== Команды ==


=== Сохранение отдельных страниц ===
=== Сохранение отдельных страниц ===
{{Cmdl |$ |pdfseparate Kniga.pdf %d.pdf }}
<source lang="bash">pdfseparate Kniga.pdf %d.pdf</source>


=== Объединение отдельных страниц ===
=== Объединение отдельных страниц ===
Перед объединением необходимо проверить именование PDF страниц в виде нумерации 000.pdf, 001,pdf… для их правильной последовательности в итоговом документе.
Перед объединением необходимо проверить именование PDF страниц в виде нумерации 000.pdf, 001,pdf… для их правильной последовательности в итоговом документе.
{{Cmdl |$ |pdfunite *.pdf Kniga.pdf }}
<source lang="bash">pdfunite *.pdf Kniga.pdf</source>


=== Конвертирование в другие форматы ===
=== Конвертирование в другие форматы ===
Строка 20: Строка 20:
==== Векторные ====
==== Векторные ====
Переконвертация в PDF после объединения {{Unix man |pdfunite|1}} может существенно уменьшить размер файла. Другие форматы: PS, EPS, SVG.
Переконвертация в PDF после объединения {{Unix man |pdfunite|1}} может существенно уменьшить размер файла. Другие форматы: PS, EPS, SVG.
{{Cmdl |$ |pdftocairo -pdf Kniga.pdf Kniga2.pdf }}
<source lang="bash">pdftocairo -pdf Kniga.pdf Kniga2.pdf</source>


==== Растровые ====
==== Растровые ====
Разрешение получаемых изображений — 600 dpi. Форматы: [[w:Portable anymap|PNM]] (PPM, PGM, PBM), TIF, PNG, JPEG. Для справки наберите {{Cmdl |$ |pdftoppm -h}}, или см. {{Unix man |pdftoppm|1}}. Конвертирование всех PDF страниц:
Разрешение получаемых изображений — 600 dpi. Форматы: [[w:Portable anymap|PNM]] (PPM, PGM, PBM), TIF, PNG, JPEG. Для справки наберите <code>pdftoppm -h</code>, или см. {{Unix man |pdftoppm|1}}. Конвертирование всех PDF страниц:
; '''PPM'''
; '''PPM'''
{{Cmdl |$ |pdftoppm -r 600 Kniga.pdf page }}
<source lang="bash">pdftoppm -r 600 Kniga.pdf page</source>
; '''TIF'''
; '''TIF'''
{{Cmdl |$ |pdftoppm -tiff -tiffcompression lzw -r 600 Kniga.pdf page }}
<source lang="bash">pdftoppm -tiff -tiffcompression lzw -r 600 Kniga.pdf page</source>


==== Извлечение изображений ====
==== Извлечение изображений ====
Извлечение JPG изображений (параметр <code>-j</code>). Извлечение без параметра <code>-j</code> и изображений в других форматах — сохранение в PNM (PPM, PGM, PBM).
Извлечение JPG изображений (параметр <code>-j</code>). Извлечение без параметра <code>-j</code> и изображений в других форматах — сохранение в PNM (PPM, PGM, PBM).
{{Cmdl |$ |pdfimages -j Kniga.pdf img }}
<source lang="bash">pdfimages -j Kniga.pdf img</source>


=== Работа с оглавлением ===
=== Работа с оглавлением ===
Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл:
Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл:
{{Cmdl |$ |pdftk Kniga.pdf dump_data_utf8 > Oglavlenie }}
<source lang="bash">pdftk Kniga.pdf dump_data_utf8 > Oglavlenie</source>
Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF:
Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF:
{{Cmdl |$ |pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf }}
<source lang="bash">pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf</source>


== См. также ==
== См. также ==

* [[Создание электронной копии книги в формате DjVu в Linux]]
* [[Создание электронной копии книги в формате DjVu в Linux]]
* [[Мультимедиа в командной строке]]
* [[Мультимедиа в командной строке]]

Версия от 10:45, 3 мая 2015

Эта статья посвящена краткому описанию примеров редактирования PDF файлов в операционной системе Linux.

Программное обеспечение

  1. PDFShuffler (GUI для Python-pyPdf) — извлечение, добавление, удаление, поворот, обрезка PDF страниц.
  2. Poppler-utils
  3. Cairo — используется для Poppler-utils (pdftocairo).
  4. Pdftk

Команды

Сохранение отдельных страниц

pdfseparate Kniga.pdf %d.pdf

Объединение отдельных страниц

Перед объединением необходимо проверить именование PDF страниц в виде нумерации 000.pdf, 001,pdf… для их правильной последовательности в итоговом документе.

pdfunite *.pdf Kniga.pdf

Конвертирование в другие форматы

Векторные

Переконвертация в PDF после объединения pdfunite(1) может существенно уменьшить размер файла. Другие форматы: PS, EPS, SVG.

pdftocairo -pdf Kniga.pdf Kniga2.pdf

Растровые

Разрешение получаемых изображений — 600 dpi. Форматы: PNM (PPM, PGM, PBM), TIF, PNG, JPEG. Для справки наберите pdftoppm -h, или см. pdftoppm(1). Конвертирование всех PDF страниц:

PPM
pdftoppm -r 600 Kniga.pdf page
TIF
pdftoppm -tiff -tiffcompression lzw -r 600 Kniga.pdf page

Извлечение изображений

Извлечение JPG изображений (параметр -j). Извлечение без параметра -j и изображений в других форматах — сохранение в PNM (PPM, PGM, PBM).

pdfimages -j Kniga.pdf img

Работа с оглавлением

Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл:

pdftk Kniga.pdf dump_data_utf8 > Oglavlenie

Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF:

pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf

См. также