In un piccolo progettimo di web scraping in PHP, avevo la necessità di identificare il titolo di una pagina web partendo dal suo url.

Usando le funzioni file_get_contents e preg_match è abbastanza facile.

La prima funzione si occupa di recuperare il contenuto di quello che gli viene passato in argomento.

La seconda esegue una ricerca con le espresisoni regolari.

Su un servizio VPS dove ho Debian 8, guardando i log, ho scoperto che l'orario era decisamente sbagliato.

Infatti avevo una timezone piuttosto esotica per me che abito in Italia: quella americana!

Apache POI è un'ottima libreria per visualizzare e manipolare file di MS Office.

Oggi vediamo come leggere file Word (DOC e DOCX).

Li specifico entrambi perchè richiedono parti di libreria e classi differenti.

Se usate Maven aggiungete queste dipendenze al pom.xml:

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>3.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-scratchpad</artifactId>
            <version>3.17</version>
        </dependency>

Ho creato un piccolo programma da riga di comando in Java, che consente di applicare un watermark alle immagini in maniera massiva.

L'unica opazione è il path delle immagini, e l'unico watermark applicabile è il nome dell'immagine stessa.

Javascript nasce come un linguaggio lato client, e quindi non può accedere ed eseguire operazioni lato server (a meno di non usare framework specifici ovviamente, ma non è il nostro caso).

La mia necessità è quella di far scaricare agli utenti un file tramite AJAX.

Questo perchè il file, prima di essere creato, richiede un pò di elaborazione.

Usando un linguaggio lato server (nel nostro caso PHP) è possibile eseguire questa operazione.

Non sono solito usare la riga di comando in Windows, ma ogni tanto scoprire qualche comando utile può solo che far bene.

Vediamo come identificare il seril number degli hard disk (o in generale degli hard drive), sia il volume serial number che l'hard drive serial number.

E' la prima volta che tratto il formato YAML, perchè in genere cerco di usare JSON (o XML al limite).

Però ho dovuto mettermi in pari anche su questo formato.

Al link postato sopra potete avere una panoramica e qualche esemppio.

Qui invece potete vedere una lista di librerie per svariati linguaggi.

Qualche giorno fa ho scoperto le magic SysRq key, combinazioni di tasti in Linux, che operano a basso livello.

Sono combinazioni che vengono recepite direttamente dal Kernel, e sono delle vere e proprie System Request (da cui SysReq).

Molto spesso sono usate per uscire dai freeze / blocchi di sistema, che non sono in grado di recepire i normali input da tastiera e mouse.

Possono, quindi, essere comodi in molte situazioni.

In sostanza, consistono in una combinazione così fatta: ALT + SYSRQ + KEY.

Tra le varie librerie che fino ad ora ho testato per fare il parsing della riga di comando in Java, Argparse4j è una di quelle che consiglio.

Se usate Maven aggiungete questa dipendenza al vostro pom.xml:

        <dependency>
            <groupId>net.sourceforge.argparse4j</groupId>
            <artifactId>argparse4j</artifactId>
            <version>0.7.0</version>
        </dependency>

grep è sicuramente uno dei comandi più usati in ambito Linux.

Questo perchè ha una flessibilità incredibili sulle operazioni che può svolgere.

Oggi vediamo un esempio semplice, e cioè contare le occorrenze di una parola in un testo.