Operare sui PDF da terminale su Linux con Poppler Utils

Mattepuffo's logo
Operare sui PDF da terminale su Linux con Poppler Utils

Operare sui PDF da terminale su Linux con Poppler Utils

Su Linux ci sono diversi programmi per elaborare i PDF, ma la maggior parte sono strumenti grafici.

Se volessimo operare sui PDF da terminale come potremmo fare?

Semplicemente usando Poppler Utils!

Questa è una suite di programmi composta da:

  • pdffonts - strumento per analizzatore tipi di font presenti in un PDF
  • pdfimages - estrattore di immagini da PDF
  • pdfinfo - informazioni su documenti,
  • pdfseparate - strumento di estrazione di pagine,
  • pdftocairo - convertitore da PDF a PNG/JPEG/PDF/PS/EPS/SVG
  • pdftohtml - convertitore da PDF a HTML,
  • pdftoppm - convertitore di PDF in immagini PPM/PNG/JPEG,
  • pdftops - convertitore da PDF a PostScript (PS),
  • pdftotext - estrattore testo
  • pdfunite - strumento per unione di documenti

Come potete vedere le operazioni che possiamo fare sono parecchie.

Prima di tutto installiamo la suite.

Su Debian e Ubuntu:

# aptitude install poppler-utils

Su Ubuntu dovrebbe comunque essere già installata.

Su Fedora:

# yum install poppler-utils

Su Archlinux:

# pacman -Sy poppler

Vediamo qualche esempio.

Per unire più file PDF:

$ pdfunite file_1.pdf file_2.pdf file_3.pdf file_completo.pdf

Per ultimo va indicato il nome del file finale.

Se vogliamo dividerlo in più file:

$ pdfseparate -f 2 -l 4 file_da_dividere.pdf pagina%d.pdf

Dove -f indica il numero della pagina dalla quale cominciare a dividere, e -l la pagina finale.

Per convertire un PDF in HTML:

$ pdftohtml file_pdf.pdf file_html.html

Non penso ci sia da commentare su questo esempio.

Sostanzialmente è un ottimo programma; se si riuscisse ad includere in programmi propri sarebbe il top!


Condividi

Commentami!