Raggruppare i dati in Python pandas
Pandas è una libreria per Python per l'analisi dei dati.
Ne abbiamo già parlato in varie occasioni.
In questo articolo vediamo come usarlo per raggruppare i dati.
Come al solito è un esempio basico!
Possiamo installarlo tramite pip:
pip install pandas
Questo il CSV di esempio da cui prendiamo i dati:
Paese,Continente
Algeria,AFRICA
Tunisia,AFRICA
Italia,EUROPA
Germania,EUROPA
Francia,EUROPA
Giappone,ASIA
Australia,OCEANIA
Usa,AMERICA DEL NORD
Canada,AMERICA DEL NORD
Brasile,AMERCIA DEL SUD
Argentina,AMERCIA DEL SUD
Cile,AMERCIA DEL SUD
Perù,AMERCIA DEL SUD
Bolivia,AMERCIA DEL SUD
Quello che vogliamo ottenere è il numero di paesi per continente:
import pandas as pd
paesi = pd.read_csv('paesi.csv', names=['Paese', 'Continente'], header=1)
print(paesi.groupby(['Continente']).count())
Qui abbiamo usato la funzione count per contare le voci in base alla colonna del CSV che ci serve:
Paese
Continente
AFRICA 1
AMERCIA DEL SUD 5
AMERICA DEL NORD 2
ASIA 1
EUROPA 3
OCEANIA 1
Enjoy!
python pip pandas groupby csv
Commentami!