Cercare o estrarre testo in Python con FlashText
In Python abbiamo diversi modi/librerie per cercare delle parole all'interno di un testo.
Una delle possibilità è usare FlashText.
Impariamo a programmare in maniera facile e veloce
In Python abbiamo diversi modi/librerie per cercare delle parole all'interno di un testo.
Una delle possibilità è usare FlashText.
Altair è una libreria per Python per il data-visualization.
In pratica ci consente di visulizzare in maniera grafica i dati presi da fonti tipo pandas.
In questo articolo vediamo un esempio basico.
pendulum è una libreria per Python che ci aiuta nella gestione delle date, dei periodi, ecc.
Rispetto alle librerie standard ha diverse funzioni che ci facilitano i calcoli.
difflib è una funzione built-in di Python che ci consente di confrontare dei testi/sequenze di caratteri.
Non c'è da installare nulla, e contiene diverse funzioni interessanti.
In questo articolo vediamo qualche esempio.
Nella programmazione in generale, una funzione ritorna o void (quindi non ritorna nulla) o un valore.
E se invece avessimo bisogno di ritornare più valori?
In questo articolo vediamo un esempio usando Python; ma in verità possiamo riportare questi esempi anche in altri linguaggi.
Pydantic è una libreria per Python che ci aiuta nella validazione dei dati.
Ad esempio, vi arriva un JSON e volete validare i dati e lo schema rispetto ad un oggetto.
Quindi può essere utile in molti casi, anche integrandola con web framework che gestiscono dati in formato JSON.
PyOCR è un wrapper OCR per Python.
Il che vuol dire che nel sistema è necessario avere un OCR installato.
Quelli compatibili sono (da documentazione):
EasyOCR è una libreria per Python per l'estrazione del testo da immagini.
In realtà può essere usato anche standalone come programma da riga di comando.
Noi vediamo come usarlo all'interno di uno script.
Tesseract è uno degli OCR Engine più utilizzati.
Per Python esiste una libreria apposita che si chiama Python-tesseract.
In questo articolo vediamo come usarli!
Mi è capitato di dover fare delle analisi su vari PDF, e per farlo ho scelto Python (per diverse ragioni).
In questo articolo vediamo come leggere un PDF e contare parole e caratteri.