Home / Programmazione / PHP / Identificare i link in una pagina web con PHP
Mattepuffo

Identificare i link in una pagina web con PHP

Identificare i link in una pagina web con PHP

Piccolo tip per PHP: come identificare tutti i link di una pagina web.

Per farlo esistono diversi modi; noi useremo DOMDocument senza andare a sbatterci con espressioni regolari e simili.

Inoltre vedremo come dentificare sia il titolo che la pagina a cui rimanda il link.

Ecco qua:

<?php

$html = file_get_contents('http://www.sito.com');
$dom = new DOMDocument();
$dom->loadHTML($html);
foreach ($dom->getElementsByTagName('a') as $l) {
    echo $l->nodeValue . ': ' . $l->getAttribute("href") . "<br>";
}

Con la funzione file_get_contents prendiamo tutto il contenuto della pagina web che ci ineteressa.

Poi sotto carichiamo l'HTML della pagina con la funzione loadHTML dell'oggetto DOMDocument.

Infine usiamo un ciclo foreach per identificare il "valore" del link (o nome o titolo, fate voi) e la pagina a cui indirizza.

Ciao!