PDF to audio in Python

Mattepuffo's logo
PDF to audio in Python

PDF to audio in Python

In questo articolo vediamo come usare due librerie, PyPDF2 e pyttsx3, per leggere un file PDF e trasformarlo in audio usando Python.

Attenzione però che non mi ha funzionato su tutti i pc; su alcune distro Linux mi dava errori su dipendenze a livello di sistema non soddisfatte ad esempio.

Solo che non ho avuto tempo per sistemare tutto, quindi mi sono limitato al test sul pc in cui ha funzionato.

Detto ciò, possiamo installare le librerie con pip:

pip install PyPDF2 pyttsx3

Qui sotto un esempio di codice:

import PyPDF2
import pyttsx3

file = open('test.pdf', 'rb')
pdf_reader = PyPDF2.PdfFileReader(file)
speak = pyttsx3.init()

for page in range(pdf_reader.numPages):
    text = pdf_reader.getPage(page).extractText()
    speak.say(text)
    speak.runAndWait()

speak.stop()

Enjoy!


Condividi su Facebook

Commentami!