Una pagina web è detta pagina di spam se non aggiunge contenuti, ma è stata creata ad arte per redirigere (in genere surretiziamente) gli utenti verso pagine opportune. Caratteristica tipica delle pagine spam è quella di fare leva sui meccanismi di posizionamento dei motori di ricerca per apparire più in alto (nella lista dei risultati) di quanto non sarebbe normalmente concesso dal motore stesso.
La rilevazione delle pagine spam è un processo estremamente difficoltoso a causa dell'abilità (sempre più affinata) di chi le crea. Metodi elementari, quali la rilevazione della frequenza di certi termini, non sono ormai più efficaci.
La ricerca si propone di studiare come rilevare le pagine di spam utilizzando delle tecniche esogene, e cioè basate sulla struttura di grafo del web. In particolare, si vuole studiare se la variazione dei meccanismi di posizionamento al variare dei loro parametri può essere utilizzata come marcatore per la rilevazione delle pagine spam.