Редактирование PDF-файлов в Linux: различия между версиями

Материал из Викиучебника — открытых книг для открытого мира
Содержимое удалено Содержимое добавлено
Отмена двух ошибочных изменений в Special:Diff/116351.
Строка 2: Строка 2:


== Программное обеспечение ==
== Программное обеспечение ==
# '''PDFShuffler''' — извлечение, добавление, удаление, поворот, обрезка PDF страниц.
# '''PDFShuffler''' — извлечение, добавление, удаление, поворот, обрезка PDF страниц. Это графический интерфейс к ''Python-pyPdf''.
# '''{{w |Poppler}}-utils'''
# '''{{w |Poppler}}-utils'''
# '''{{w |Cairo}}''' — используется для Poppler-utils (pdftocairo).
# '''{{w |Cairo}}''' — используется для Poppler-utils (pdftocairo).

Версия от 09:47, 3 мая 2015

Эта статья посвящена краткому описанию примеров редактирования PDF файлов в операционной системе Linux.

Программное обеспечение

  1. PDFShuffler — извлечение, добавление, удаление, поворот, обрезка PDF страниц. Это графический интерфейс к Python-pyPdf.
  2. Poppler-utils
  3. Cairo — используется для Poppler-utils (pdftocairo).
  4. Pdftk

Команды

Сохранение отдельных страниц

$ pdfseparate Kniga.pdf %d.pdf 

Объединение отдельных страниц

Перед объединением необходимо проверить именование PDF страниц в виде нумерации 000.pdf, 001,pdf… для их правильной последовательности в итоговом документе.

$ pdfunite *.pdf Kniga.pdf 

Конвертирование в другие форматы

Векторные

Переконвертация в PDF после объединения pdfunite(1) может существенно уменьшить размер файла. Другие форматы: PS, EPS, SVG.

$ pdftocairo -pdf Kniga.pdf Kniga2.pdf 

Растровые

Разрешение получаемых изображений — 600 dpi. Форматы: PNM (PPM, PGM, PBM), TIF, PNG, JPEG. Для справки наберите $ pdftoppm -h, или см. pdftoppm(1). Конвертирование всех PDF страниц:

PPM
$ pdftoppm -r 600 Kniga.pdf page 
TIF
$ pdftoppm -tiff -tiffcompression lzw -r 600 Kniga.pdf page 

Извлечение изображений

Извлечение JPG изображений (параметр -j). Извлечение без параметра -j и изображений в других форматах — сохранение в PNM (PPM, PGM, PBM).

$ pdfimages -j Kniga.pdf img 

Работа с оглавлением

Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл:

$ pdftk Kniga.pdf dump_data_utf8 > Oglavlenie 

Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF:

$ pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf 

См. также