Raggruppare i dati in Python pandas

Mattepuffo's logo
Raggruppare i dati in Python pandas

Raggruppare i dati in Python pandas

Pandas è una libreria per Python per l'analisi dei dati.

Ne abbiamo già parlato in varie occasioni.

In questo articolo vediamo come usarlo per raggruppare i dati.

Come al solito è un esempio basico!

Possiamo installarlo tramite pip:

pip install pandas

Questo il CSV di esempio da cui prendiamo i dati:

Paese,Continente
Algeria,AFRICA
Tunisia,AFRICA
Italia,EUROPA
Germania,EUROPA
Francia,EUROPA
Giappone,ASIA
Australia,OCEANIA
Usa,AMERICA DEL NORD
Canada,AMERICA DEL NORD
Brasile,AMERCIA DEL SUD
Argentina,AMERCIA DEL SUD
Cile,AMERCIA DEL SUD
Perù,AMERCIA DEL SUD
Bolivia,AMERCIA DEL SUD

Quello che vogliamo ottenere è il numero di paesi per continente:

import pandas as pd

paesi = pd.read_csv('paesi.csv', names=['Paese', 'Continente'], header=1)
print(paesi.groupby(['Continente']).count())

Qui abbiamo usato la funzione count per contare le voci in base alla colonna del CSV che ci serve:

                  Paese
Continente             
AFRICA                1
AMERCIA DEL SUD       5
AMERICA DEL NORD      2
ASIA                  1
EUROPA                3
OCEANIA               1

Enjoy!


Condividi

Commentami!