Blog

Evitando las visitas falsas en Google Analytics

Para quienes manejáis Google Analytics con frecuencia, os habréis dado cuenta de que es habitual recibir visitas directas de sitios inesperados (por ejemplo de Rusia para un blog en español) y que no duran nada. Indagando un poco es fácil percatarse de que el origen de la mayoría de estas visitas es sospechosamente ilógico y, por tanto, deben ser falsas.

Estas visitas no se deben a que tu web se esté poniendo de moda en Rusia (o en USA, o en Islas Caimán,...), sino que se trata de "referer spam". El referer spam es un tipo de spam (mensajes masivos no deseados) que provoca visitas falsas en tu web y que surge con la intención de obtener tráfico en otros sitios web ajenos a ti. Consiguen ese tráfico porque muchos usuarios de Google Analytics entran por curiosidad en los sitios de donde llegan sus "extrañas" visitas.

El referer spam trae consigo 2 grandes problemas:

  1. Las páginas web de donde llega pueden incluir contenido malicioso. Y si por curiosidad las visitamos podríamos vernos afectados (timos, virus, robo de información, publicidad invasiva,...).
  2. Las visitas son falsas. Y por eso las estadísticas que Google Analytics nos reporta se desvirtúan (sube el porcentaje de rebote, baja el promedio de tiempos, aumenta el número de sesiones y usuarios,...)

Podemos ver cláramente si estamos sufriendo referer spam yendo en nuestro Google Analytics a "Adquisición -> Todo el tráfico -> Referencias". Allí se listan las páginas desde donde ha llegado el tráfico referenciado a nuestra web (tráfico llegado desde otras webs). Aquellas páginas que traen numerosas visitas manteniendo el porcentaje de rebote al 100% y la duración media de sesión a "00:00:00" son falsas.

Que no hayamos encontrado páginas sospechosas haciendo lo anterior no implica que estemos libres de referer spam. Vamos ahora a  "Adquisición -> Todo el tráfico -> Canales" y seleccionamos "Organic Search" en el cuadro de la derecha. Aquí verás las búsquedas realizadas en Google que han dado lugar a visitas en tu web. Aquellas cuyo porcentaje de rebote esté en 100%, duración media de sesión a "00:00:00" y contienen una dirección web entre las palabras de la búsqueda, puede que sean referer spam camuflado como tráfico orgánico (es decir, camuflan las falsas visitas a través de busquedas en Google).

Ahora que ya sabes lo que es, si lo sufres querras quitártelo de en medio. Vamos a ver cómo hacerlo.

Lo primero será entender como funciona Google Analytics y qué debilidad de éste aprovechan los spameadores para generar el referer spam. Google Analytics obtiene la información de cada visitante de tu web porque cuando el visitante accede a tu página, en su navegador se ejecuta el código que hay en ella y en el mismo hay una pequeña porción de código que envía la información a Google Analytics. Quienes generan el referer spam lo que hacen es ejecutar esa pequeña porción de codigo sin visitar tu web; de ese modo Google Analytics contabiliza la visita, pero en realidad no se produjo.

Como ya has visto, el referer spam llega a Google Analytics sin pasar por tu web, por lo que cualquier medida que tomes en la misma no servirá de nada. Para evitarlo tienes que filtrar los sitios de origen del spam directamente en tu Google Analytics. Para hacerlo vamos a crear 2 filtros; el primero filtrará el referer spam directo, y el segundo filtrará el referer spam que se camufla tras búsquedas orgánicas:

  1. Dedica unos instantes en Google Analytics a detectar todas las direcciones que te han producido referer spam hasta ahora (tal y como lo explicamos antes) y apúntalas (las necesitarás después). Por ejemplo son habituales direcciones de referer spam las siguientes:
  • simple-share-buttons.com
  • semalt.semalt.com
  • buttons-for-website.com
  • ilovevitaly.co
  • econom.co
  • shopping.ilovevitaly.com
  • ilovevitaly.com
  • iedit.ilovevitaly.com
  • forum.topic52901864.darodar.com
  • priceg.com
  • blackhatworth.com
  • hulfingtonpost.com
  • ...
  1. En Google Analytics ve a "Administrador" (está en el menú superior), y selecciona la Cuenta y Propiedad para la cual quieres filtrar el spam.
  2. Luego ve a "Ver -> Filtros". Y das a "+ Filtro nuevo".
  3. Das un nombre a tu primer filtro (por ejemplo "Referer spam").
  4. Seleccionas el tipo de filtro "Personalizado" y en las configuraciones siguientes seleccionas tipo de filtro "Excluir" por "Fuente de la campaña" e indicas en "Patrón del filtro" una expresión regular que englobe a todas las direcciones tóxicas (si necesitas más información sobre cómo crear expresiones regulares mira aquí). Por ejemplo, puedes usar la siguiente expresión regular para evitar las direcciones indicadas en el punto 1 ("|" se usa para añadir un nuevo sitio y "\" se utiliza ante caracteres especiales como "." o "-" para que sean interpretados correctamente):

simple\-share\-buttons\.com|buttons\-for\-website\.com|semal\.com|ilovevitaly\.co|econom\.co|shopping\.ilovevitaly\.com|ilovevitaly\.com|iedit\.ilovevitaly\.com|forum\.topic52901864\.darodar.com

  1. Tras guardar el filtro anterior, creamos otro dando a "+ Filtro nuevo".
  2. Das un nombre a tu segundo filtro (por ejemplo "Organic spam").
  3. Seleccionas el tipo de filtro "Personalizado" y en las configuraciones siguientes seleccionas tipo de filtro "Excluir" por "Nombre del Host" e indicas en "Patrón del filtro" una expresión regular que englobe a todas las direcciones tóxicas. Por ejemplo, puedes usar la misma expresión regular del filtro anterior.

Con esto debes quedar libre del falso tráfico que estabas recibiendo. Recuerda ir actualizando de vez en cuando tus filtros con los nuevos spameadores que te vayan surgiendo.

Por último, te habrás dado cuenta de que esto elimina el falso tráfico que llegará a partir de ahora, pero ¿qué hacer para que las estadísticas anteriores no estén desvirtuadas?. No puedes eliminar las falsas visitas que ya llegaron a tu web, pero puedes crear y aplicar un segmento que excluya estas visitas de tus estadísticas. Veamos como hacerlo:

  1. En Google Analytics ve a "Administrador" (está en el menú superior), y selecciona la Cuenta y Propiedad para cual quieres crear el segmento.
  2. Luego ve a "Ver -> Segmentos". Y das a "+ Nuevo segmento".
  3. Das un nombre a tu segmento (por ejemplo "Sesiones sin spam").
  4. Seleccionamos en "Opciones avanzadas" la seccion "Condiciones" y agregamos un filtro de tipo "Sesiones" y "Excluir" con:
  • "Fuente/medio", "Contiene" DIRECCIÓN TÓXICA 1  (O BIEN)
  • "Fuente/medio", "Contiene" DIRECCIÓN TÓXICA 2  (O BIEN)
  • "Fuente/medio", "Contiene" DIRECCIÓN TÓXICA 3  (O BIEN)
  • ...

Tal y como se ve en la imagen:

  1. Una vez acabemos, damos a "Guardar" y vamos a aplicar el Segmento.
  2. Ve a "Informes" (está en el menú superior), y pincha sobre el segmento actual, que normalmente es “Todas las sesiones”.
  3. Te aparecerá una pantalla como la mostrada en la siguiente imagen. Deselecciona el segmento “Todas las visitas” y pincha en el grupo de segmentos “Personalizados”.

  1. Te aparecerá una pantalla con todos los segmentos que hayas creado, entre los que se encontrará el segmento que has creado para excluir las visitas spam. Selecciónalo y pincha en el botón “Aplicar”. Y con esto tus estadísticas ya estaran limpias de spam.

Espero que el post te haya ayudado a eliminar todas esas falsas visitas que te aparecían en Google Analytis. Si tienes alguna duda o sugerencia exponla en los comentarios ;)

Comentarios

Visitas directas/none

Buenas,

Muchas gracias por la información aportada.

Tengo una duda,¿ con las visitas que parecen como direct / none que también generan porcentaje de rebote 100% como las filtramos?¿Hay alguna manera?

Gracias.

Un saludo.

 

Imagen de Patricio J. Martínez

Hola Fer.

Hola Fer.

puedes crear un nuevo filtro de la misma manera y modificando las opciones en "Tipo de filtro". Pero debes tener en cuenta que no todo el tráfico relegado a "(Direct)/(None)" es falso o despreciable.

Se supone que se trata de aquel tráfico cuyo origen Google no conoce (o no nos "quiere/puede" indicar) y cuyo modo de llegar a tu web también es desconocido (eso es lo que significa la tupla "(direct)/(none)": "Direct"=Origen del tráfico y "None"=Modo de llegar).

Por tanto en este grupo habrá tráfico despreciable (generado, por ejemplo, por bots que escanean tu página para indexarla) y tráfico totalmente válido (generado, por ejemplo, por gente que oculta parte de su navegación mediante plugins en sus navegadores).

 

Solución definitiva

Hola Patricio, inicialmente apliqué la solución que explicas, pero tiene el problema de que hay que estar continuamente actualizando el filtro y el segmento para añadir los nuevos sitios spam que surgen.

Finalmente opté por otra solución que es más sencilla y definitiva, ya que no es necesario estar actualizando ni el filtro ni el segmento. Lo cuento en http://www.jarfer.com/solucion-definitiva-para-evitar-el-trafico-spam-en...

Saludos.

Imagen de Patricio J. Martínez

Solución defiinita

Muchas gracias por el aporte Jarfer ;)

Añadir nuevo comentario

No permitir HTML en comentario

  • No se permiten etiquetas HTML.
  • Las direcciones de las páginas web y las de correo se convierten en enlaces automáticamente.
  • Saltos automáticos de líneas y de párrafos.
CAPTCHA
Esta pregunta es para comprobar si usted es un visitante humano y prevenir envíos de spam automatizado.