Apache POI è un'ottima libreria per visualizzare e manipolare file di MS Office.

Oggi vediamo come leggere file Word (DOC e DOCX).

Li specifico entrambi perchè richiedono parti di libreria e classi differenti.

Se usate Maven aggiungete queste dipendenze al pom.xml:

        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi</artifactId>
            <version>3.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-ooxml</artifactId>
            <version>3.17</version>
        </dependency>
        <dependency>
            <groupId>org.apache.poi</groupId>
            <artifactId>poi-scratchpad</artifactId>
            <version>3.17</version>
        </dependency>

Dalla descrizione, sembra che unoconv faccia parte della suite LibreOffice.

Comunque dovrebbe essere disponibile in tutti i repo, quindi potete installarlo facilmente.

Questo programma permette di convertire da XLS / XLSX a CSV e viceversa.

Anche se uso da tanto PHPExcel (varie versioni comprese), ancora oggi ogni tanto mi esce qualcosa che non ho mai fatto.

Ad esempio impostare il formato di una cella.

Nel mio caso, dovevo forzare la cella al formato numerico.

Dalla versione 5.3 è possibile usare l'interfaccia Ribbon anche in LibreOffice.

La Ribbon UI, per chi non lo sapesse, è quella impostata in MS Office dalla versione 2007.

Su questa UI ognuno dice la sua, ma vale la pena provarla.

L'altro giorno, sul mio pc con 8 GB di RAM, mi è comparso questo errore aprendo un file Excel:

Memoria o spazio su disco insufficiente. Impossibile aprire o salvare ulteriori documenti

Ovviamente non avevo finito la RAM, e il disco era stravuoto, e la CPU a posto.

Si tratta di una spece di bug che si può risolvere facilmente.