Traffico fantasma o Referral Spam. Vediamo come filtrare i dati non reali nelle statistiche Google Analytics.
Che cosa è lo SPAM da Referral all’interno dei dati in Google Analytics?
Sicuramente tanti di voi che gestiscono un account per l’analisi delle statistiche di traffico Google Analytics, avranno notato da diverso tempo nei propri report un cospicuo aumento di traffico proveniente da siti sospetti (Acquizione -> Tutto il traffico -> Referral).
Peccato che buona parte di questo traffico non sia traffico reale, bensì traffico proveniente da spambot che generano, appunto, del traffico fantasma. Questo traffico non reale sporca i nostri dati statistici sfruttando quasi sempre il codice delle Analytics presente all’interno delle nostre pagine web senza portare veri visitatori.
Lo scopo di questi “spammer” è quello principalmente di generare curiosità presso coloro che visualizzano i dati in Google Analytics, che, cliccando questi indirizzi di provenienza, verranno ridirezionati verso altri siti, in buona parte di e-commerce.
Il traffico fantasma non comporta danni al nostro sito come malware o virus, però peggiora i dati statistici in quanto quasi tutte queste visite sono caratterizzate da 0 secondi di permanenza sul nostro sito e frequenza di rimbalzo del 100%. Diminuendo le pagine visitate sul nostro sito insieme al tempo trascorso e aumentando, invece, la frequenza di rimbalzo, stiamo comunicando dati negativi agli occhi di Google che alla lunga potrebbe anche tenerne conto per il posizionamento delle nostre pagine. Se dobbiamo mostrare, poi, i nostri dati ad un cliente, questo potrebbe pensare che non stiamo facendo un buon lavoro.
Come si può bloccare lo SPAM da Referral?
Andiamo per punti:
1- Bloccare il traffico fantasma impostando un filtro sul hostname
Per una verifica: da Google Analytics andate su Acquisizione -> Tutto il traffico -> Referral. Poi da Dimensione secondaria scrivete nome host. Facendo così potete vedere i nomi host usati dai visitatori “ghost” per accedere al sito.
E’ necessario creare un filtro che escluda il traffico dove l’hostname è diverso da quello del nostro sito web:
- Amministrazione
- Colonna vista -> Filtri
- Nuovo filtro
- Dare un nome al filtro
- Tipo di filtro -> Personalizzato
- Includi -> Campo filtro selezionare Nome Host
- In pattern filtro scrivere l’indirizzo del nostro sito in questa maniera: .*tuosito\.it.*
- Salva

2- Bloccare il traffico fantasma impostando un filtro sul referral
Individuato il traffico fantasma andremo ora ad escluderlo dai nostri risultati tramite un ulteriore filtro
- Amministrazione
- Colonna vista -> Filtri
- Nuovo filtro
- Dare un nome al filtro
- Tipo di filtro -> Personalizzato
- Escludi -> Campo filtro selezionare Referral
- In pattern filtro scrivere l’elenco dei siti SPAM in questa maniera: generalporn\.org|Get-Free-Traffic-Now\.com|googlsucks\.com|guardlink\.org
- Salva

Nota: Il campo pattern filtro può contenere al massimo 255 caratteri quindi sarà necessario creare più filtri contenenti più liste di siti.
3- Impostare il filtro bot di Google Analytics
Questa opzione recente di Google di default è disabilitata. La sua reale efficacia è ancora un tema dibattuto, sicuramente il fatto che Google l’abbia predisposta fa presagire futuri sviluppi e migliorie. Si abilita da:
- Amministrazione
- Colonna vista -> Impostazioni vista
- Filtro bot
- Escludi tutti gli hit da bot e spider noti
Una volta impostati i filtri come ripulire i dati passati?
Ora che abbiamo impostato i filtri vediamo come ripulire i dati ormai già acquisiti.
- Rapporti di Google Analytics
- Aggiungi segmento
- Nuovo segmento
- Condizioni
- Selezionare Sessioni
- Selezionare Escludi
- Nei campi sotto selezionare: Sorgente che corrisponde a RegEx
- Nel campo di testo inserire la stessa lista di siti SPAM utilizzata per i filtri. ESEMPIO: generalporn\.org|Get-Free-Traffic-Now\.com|googlsucks\.com|guardlink\.org ECC…. (In questo campo non c’è il limite di 255 caratteri quindi si può incollare una lista unica)
- Salva

Applicando il segmento possiamo vedere nel grafico risultante il confronto tra i dati di traffico totali e quelli senza il traffico fantasma.
