Identificare il tipo di file in Python con Magik

Mattepuffo's logo
Identificare il tipo di file in Python con Magik

Identificare il tipo di file in Python con Magik

Magika è una libreria creata da Google, da quello che ho capito molto nuova, che identifica in maniera veloce il tipo di file che gli viene indicato.

Da quello che ho capito alla base c'è l'AI (strano), e per questo risulta molto più veloce di altre librerie.

In questo articolo vediamo la versione Python (ce ne è una anche per Javascript).

Possiamo sia installarla globalmente ed usarla standalone, che come libreria interna; cose che faremo noi.

Cominciamo ad installarla con pip:

pip install magika

Qui sotto un esempio:

from pathlib import Path

from magika import Magika

magika = Magika()
result = magika.identify_paths([
    Path("/home/fermat/TEST/Snow Leopard 1.jpg"),
    Path("/home/fermat/TEST/merged.pdf"),
    Path("/home/fermat/TEST/FORNITORI.xlsx"),
    Path("/home/fermat/TEST/file.stl"),
])

for x in result:
    print(x.output.ct_label)

L'unico file che non ha riconosciuto è l'ultimo, per il quale mi indica PNG; però parliamo anche di un file abbastanza particolare.

Enjoy!


Condividi

Commentami!