Cómo filrar referral spam en GA4

Filtrar Referral Spam en GA4

Tiempo de lectura estimado: 6 minutos

Si has observado una inusual crecida de tráfico en los informes de adquisición del tráfico en tu cuenta de Google Analytics 4 esto te interesa. Aunque en un principio Google argumentaba que no iba a ser necesario aplicar filtros para evitar la medición del tráfico referido considerado Spam, el tiempo le ha llevado la contraria y aquel molesto tráfico que recibíamos en Universal Analytics se ha vuelto a hacer presente en GA4.

En este artículo explicaré en qué consiste el referral spam, así como alguna técnica para evitarlo y un consejo: no apliques exclusión de referencias. ¿Quieres saber por qué? Sigue leyendo…

¿Qué es el referrer spam?

El referral spam (o referrer spam, spam de referencia) es un tráfico que identifica la herramienta de Analítica Web (en este caso, Google Analytics 4) y que muestra como si se hubieran recibido datos de visitas que no son reales.

Se trata de falsas visitas, provocadas por bots, que disparan el tráfico de referencia hasta alcanzar unas cotas elevadas que no hacen sino desdibujar el análisis real de la información del tráfico a la web.

Pero, ¿por qué alguien va a estar interesado en enviar visitas falsas a mi web? La respuesta no es sencilla. Puede ser que el creador del script que envía tráfico fraudulento a tu sitio web esté interesado en que visites sus propios sitios web, o simplemente que pretenda manipular tus datos de analítica para hacerte creer que tienes más tráfico del que realmente recibes. Sea como fuere el caso es que este tráfico spam de referencia puede distorsionar tus datos de analítica web, haciendo que sea más difícil entender el comportamiento real de tus visitantes.

¿Cómo solucionar el problema del referral spam en GA4?

Vale, tengo claro qué es el tráfico spam de referencia… ¿Cómo puedo evitar recibirlo o, al menos, minimizar sus daños en GA4? Veamos…

Accediendo a los informes de Adquisición del tráfico en GA4 podemos ver la distribución del tráfico por los diferentes canales en el periodo de tiempo seleccionado. Como se observa en la imagen anterior, el tráfico de referencia ha alcanzado unos volúmenes puntuales de tráfico que le hacen destacar sobre el resto de canales. Para analizar este tráfico podemos segmentar de forma rápida sobre el buscador que se muestra encima de la dimensión. Insertando Referral mostrará únicamente aquella agrupación de canales de la sesión que coincida don Referral.

El tráfico referral spam desdibuja la realidad de la adquisición de tráfico, lo que convierte a la analítica web en un verdadero quebradero de cabeza.

Podremos aplicar entonces una segunda dimensión, pulsando sobre el símbolo «+» y escogiendo la métrica fuente o source. La tabla de datos de referencia se segmentará ahora por cada una de las fuentes de tráfico.

Para identificar las fuentes de referral spam debemos segmentar por tráfico Referral y añadir la dimensión secundaria fuente adecuada al informe (adquisición de usuarios o de tráfico)

Como se observa en la imagen anterior, muchas de las fuentes de tráfico ofrecen muchas visitas únicas que, atendiendo a otras métricas, como el porcentaje de interacción o la tasa de rebote, son de baja calidad. Lógico, tratándose de una visita fantasma provocada por un bot que nunca llegó a visitarnos realmente.

Podríamos pensar, en un primer momento, en aplicar un filtro de exclusión con una expresión regular (Regex) que excluyera todo el tráfico procedente de las fuentes detectadas. Aquí te dejo las fuentes de referencia spam que he detectado hasta el momento en todas las páginas de mis clientes. La expresión regular quedaría:

news.grets.store|static.seders.website|rida.tokyo|info.seders.website| kar.razas.site|trast.mantero.online|game.fertuk.site|ofer.bartikus.site| garold.dertus.site

Lamentablemente, GA4 no permite crear filtros de exclusión de tráfico para este tipo de fuentes… al menos de momento.

Especificación de Referencias No Deseadas

Si estás pensando en indicar a GA4 que estas fuentes de tráfico son referencias no deseadas no lo hagas. No es una buena idea. Te explico por qué.

Cuando especificamos una referencia como no deseada no estamos evitando que GA4 excluya la visita proviniente de dicha fuente de información. Sólo estamos indicando a la herramienta que no tenga en cuenta dicha fuente de información, atribuyéndole la visita al último canal conocido por el que nos visitó. En otras palabras, estamos convirtiendo la visita provocada por una fuente cuyo canal es Referral en una visita que nos llegó de forma Directa, con lo que incrementaremos el tráfico Direct sin saber por dónde realmente llegó el usuario.

La exclusión de referencias no es una buena opción para filtrar el tráfico de referencia spam

¿Cómo excluir el Referral Spam en GA4?

La solución para evitar tráfico procedente de news.great.store, static.seders.website y resto de fuentes spam en GA4 requiere el uso de Google Tag Manager. La idea es de James Gray y pasa por definir las fuentes de tráfico spam detectadas en una variable para crear un activador que excluya el disparo de la etiqueta de configuración de Google si identifica el dominio de referencia y coincide con alguno de los indicados. Vamos a ver el paso a paso:

1- Crear la variable que identificará el dominio de referencia:

En primer lugar debemos identificar las fuentes desde las que nos visitan los usuarios a la web, almacenando el nombre del dominio en una variable

2- Crear el activador que identifique si el nombre del dominio está en la lista del tráfico spam de referencia.

3- Configurar la etiqueta de Google para excluir dichas fuentes aplicando la excepción donde añadiremos el activador que acabamos de crear.

Cuando inicialice la etiqueta de Google debemos añadir como excepción el activador que reconoce las fuentes de tráfico spam

Hasta que Google ofrezca una alternativa más sencilla, como aplicar un filtro de exclusión, esta puede ser una buena alternativa fácil de implementar para no volver loco al analista web.

¿Has encontrado otras fuentes diferentes a las que he indicado? Déjamelas en comentarios y actualizaremos el listado para facilitar el trabajo a otras personas que se hayan encontrado con este problema.