Operare sui PDF da terminale su Linux con Poppler Utils

Operare sui PDF da terminale su Linux con Poppler Utils

Su Linux ci sono diversi programmi per elaborare i PDF, ma la maggior parte sono strumenti grafici.

Se volessimo operare sui PDF da terminale come potremmo fare?

Semplicemente usando Poppler Utils!

Questa è una suite di programmi composta da:

  • pdffonts - strumento per analizzatore tipi di font presenti in un PDF
  • pdfimages - estrattore di immagini da PDF
  • pdfinfo - informazioni su documenti,
  • pdfseparate - strumento di estrazione di pagine,
  • pdftocairo - convertitore da PDF a PNG/JPEG/PDF/PS/EPS/SVG
  • pdftohtml - convertitore da PDF a HTML,
  • pdftoppm - convertitore di PDF in immagini PPM/PNG/JPEG,
  • pdftops - convertitore da PDF a PostScript (PS),
  • pdftotext - estrattore testo
  • pdfunite - strumento per unione di documenti

Come potete vedere le operazioni che possiamo fare sono parecchie.

Prima di tutto installiamo la suite.

Su Debian e Ubuntu:

# aptitude install poppler-utils

Su Ubuntu dovrebbe comunque essere già installata.

Su Fedora:

# yum install poppler-utils

Su Archlinux:

# pacman -Sy poppler

Vediamo qualche esempio.

Per unire più file PDF:

$ pdfunite file_1.pdf file_2.pdf file_3.pdf file_completo.pdf

Per ultimo va indicato il nome del file finale.

Se vogliamo dividerlo in più file:

$ pdfseparate -f 2 -l 4 file_da_dividere.pdf pagina%d.pdf

Dove -f indica il numero della pagina dalla quale cominciare a dividere, e -l la pagina finale.

Per convertire un PDF in HTML:

$ pdftohtml file_pdf.pdf file_html.html

Non penso ci sia da commentare su questo esempio.

Sostanzialmente è un ottimo programma; se si riuscisse ad includere in programmi propri sarebbe il top!