Contare parole e caratteri in un PDF in Python
Mi è capitato di dover fare delle analisi su vari PDF, e per farlo ho scelto Python (per diverse ragioni).
In questo articolo vediamo come leggere un PDF e contare parole e caratteri.
Mi è capitato di dover fare delle analisi su vari PDF, e per farlo ho scelto Python (per diverse ragioni).
In questo articolo vediamo come leggere un PDF e contare parole e caratteri.
YOGA è una utility da riga di comando, scritta in Python, per l'ottimizzazione delle immagini.
E' facile da usare, in quanto non ha tantissime opzioni, se non le essenziali.
E' anche possibile usarla come libreria all'interno dei nostri script, cosa che faremo.
Infine, esiste anche già una GUI ufficiale se vi interessa.
imagededup è una libreria per Python che ci consente di trovare immagini duplicate.
E' abbastanza veloce, solo che scarica un bel pò di dipendenze.
rembg è un software scritto in Python per rimuovere il background dalle immagini.
Può essere usato sia in modalità standalone da riga di comando, che come libreria.
In questo articolo vedremo come usarlo come libreria.
Pillow è una libreria per Python per la manipolazione di immagini molto usata e apprezzata.
In questo articolo vediamo come usarla per convertire una JPEG in Webp.
Magika è una libreria creata da Google, da quello che ho capito molto nuova, che identifica in maniera veloce il tipo di file che gli viene indicato.
Da quello che ho capito alla base c'è l'AI (strano), e per questo risulta molto più veloce di altre librerie.
In questo articolo vediamo la versione Python (ce ne è una anche per Javascript).
Possiamo sia installarla globalmente ed usarla standalone, che come libreria interna; cose che faremo noi.