Identificare il tipo di file in Python con Magik
Magika è una libreria creata da Google, da quello che ho capito molto nuova, che identifica in maniera veloce il tipo di file che gli viene indicato.
Da quello che ho capito alla base c'è l'AI (strano), e per questo risulta molto più veloce di altre librerie.
In questo articolo vediamo la versione Python (ce ne è una anche per Javascript).
Possiamo sia installarla globalmente ed usarla standalone, che come libreria interna; cose che faremo noi.
Cominciamo ad installarla con pip:
pip install magika
Qui sotto un esempio:
from pathlib import Path
from magika import Magika
magika = Magika()
result = magika.identify_paths([
Path("/home/fermat/TEST/Snow Leopard 1.jpg"),
Path("/home/fermat/TEST/merged.pdf"),
Path("/home/fermat/TEST/FORNITORI.xlsx"),
Path("/home/fermat/TEST/file.stl"),
])
for x in result:
print(x.output.ct_label)
L'unico file che non ha riconosciuto è l'ultimo, per il quale mi indica PNG; però parliamo anche di un file abbastanza particolare.
Enjoy!
python pip google magika
Commentami!