Contare parole e caratteri in un PDF in Python
Mi è capitato di dover fare delle analisi su vari PDF, e per farlo ho scelto Python (per diverse ragioni).
In questo articolo vediamo come leggere un PDF e contare parole e caratteri.
Mi è capitato di dover fare delle analisi su vari PDF, e per farlo ho scelto Python (per diverse ragioni).
In questo articolo vediamo come leggere un PDF e contare parole e caratteri.
Ovviamente in Python per fare questa operazione abbiamo Nmila modi, anche troppi.
Se usiamo una versione di Python dalla 3.3 in poi, possiamo usare shutil.
pdf2docx è una libreria per Python che ci consente di convertire un file PDF in DOCX.
In questo articolo vediamo come usarla.
YOGA è una utility da riga di comando, scritta in Python, per l'ottimizzazione delle immagini.
E' facile da usare, in quanto non ha tantissime opzioni, se non le essenziali.
E' anche possibile usarla come libreria all'interno dei nostri script, cosa che faremo.
Infine, esiste anche già una GUI ufficiale se vi interessa.
In questo articolo vediamo come eseguire script Python direttamente dentro le nostre pagina HTML usando PyScript.
Noi useremo degli script semplici, ma è possibile anche eseguire script complessi usando librerie esterne.
Ovviamente tali librerie dovranno essere installate sul server.
imagededup è una libreria per Python che ci consente di trovare immagini duplicate.
E' abbastanza veloce, solo che scarica un bel pò di dipendenze.