Редактирование PDF-файлов в Linux: различия между версиями
оформление |
→Работа с оглавлением: дополнение |
||
Строка 33: | Строка 33: | ||
<source lang="bash">pdfimages -j Kniga.pdf img</source> |
<source lang="bash">pdfimages -j Kniga.pdf img</source> |
||
=== Оглавление === |
|||
=== Работа с оглавлением === |
|||
; Извлечение |
|||
Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл: |
Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл: |
||
<source lang="bash">pdftk Kniga.pdf dump_data_utf8 > Oglavlenie</source> |
<source lang="bash">pdftk Kniga.pdf dump_data_utf8 > Oglavlenie</source> |
||
; Редактирование <code>Oglavlenie</code> |
|||
Пункт оглавления состоит из четырёх параметров, пример с двумя пунктами: |
|||
<pre>... |
|||
NumberOfPages: 100 |
|||
BookmarkBegin |
|||
BookmarkTitle: Название 1 пункта оглавления |
|||
BookmarkLevel: 1 |
|||
BookmarkPageNumber: 4 |
|||
BookmarkBegin |
|||
BookmarkTitle: Название 2 пункта оглавления |
|||
BookmarkLevel: 1 |
|||
BookmarkPageNumber: 7 |
|||
PageMediaBegin |
|||
...</pre> |
|||
, где <code>BookmarkLevel</code> — уровень пункта оглавления, <code>BookmarkPageNumber</code> — порядковый номер страницы в PDF файле. |
|||
; Внедрение |
|||
Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF: |
Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF: |
||
<source lang="bash">pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf</source> |
<source lang="bash">pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf</source> |
Версия от 14:46, 3 мая 2015
Эта статья посвящена краткому описанию примеров редактирования PDF файлов в операционной системе Linux.
Программное обеспечение
- PDFShuffler (GUI для Python-pyPdf) — извлечение, добавление, удаление, поворот, обрезка PDF страниц.
- Poppler-utils
- Cairo — используется для Poppler-utils (pdftocairo).
- Pdftk
Команды
Сохранение отдельных страниц
pdfseparate Kniga.pdf %d.pdf
Объединение отдельных страниц
Перед объединением необходимо проверить именование PDF страниц в виде нумерации 000.pdf, 001,pdf… для их правильной последовательности в итоговом документе.
pdfunite *.pdf Kniga.pdf
Конвертирование в другие форматы
Векторные
Переконвертация в PDF после объединения pdfunite(1) может существенно уменьшить размер файла. Другие форматы: PS, EPS, SVG.
pdftocairo -pdf Kniga.pdf Kniga2.pdf
Растровые
Разрешение получаемых изображений — 600 dpi. Форматы: PNM (PPM, PGM, PBM), TIF, PNG, JPEG. Для справки наберите pdftoppm -h
, или см. pdftoppm(1). Конвертирование всех PDF страниц:
- PPM
pdftoppm -r 600 Kniga.pdf page
- TIF
pdftoppm -tiff -tiffcompression lzw -r 600 Kniga.pdf page
Извлечение изображений
Извлечение JPG изображений (параметр -j
). Извлечение без параметра -j
и изображений в других форматах — сохранение в PNM (PPM, PGM, PBM).
pdfimages -j Kniga.pdf img
Оглавление
- Извлечение
Извлечение служебной информации, содержащей оглавление, с записью в текстовый файл:
pdftk Kniga.pdf dump_data_utf8 > Oglavlenie
- Редактирование
Oglavlenie
Пункт оглавления состоит из четырёх параметров, пример с двумя пунктами:
... NumberOfPages: 100 BookmarkBegin BookmarkTitle: Название 1 пункта оглавления BookmarkLevel: 1 BookmarkPageNumber: 4 BookmarkBegin BookmarkTitle: Название 2 пункта оглавления BookmarkLevel: 1 BookmarkPageNumber: 7 PageMediaBegin ...
, где BookmarkLevel
— уровень пункта оглавления, BookmarkPageNumber
— порядковый номер страницы в PDF файле.
- Внедрение
Внедрение содержимого текстового файла со служебной информацией в отдельный файл PDF:
pdftk Kniga.pdf update_info_utf8 Oglavlenie output Output.pdf
См. также