contenido duplicado guía avanzada

Contenido Duplicado SEO: Guía avanzada

1020 680 Consultor SEO

La mayoría de los SEO están muy familiarizados con los temas de contenido duplicado, y probablemente ya utilizan alguna herramienta para identificar páginas con contenido duplicado, títulos y descripciones.

Pero cuando empiezas a pensar en lo que realmente significa la duplicación, las cosas  se complican.
Aquí encontrarás una guía de técnicas avanzadas para detectar, medir y resolver problemas de contenido duplicado utilizando técnicas avanzadas.

¿Qué es el contenido duplicado?

La definición de Google de contenido duplicado:

“El contenido duplicado generalmente se refiere a bloques sustantivos de contenido dentro o entre dominios que coinciden completamente con otros contenidos o son sensiblemente similares.”

Como se puede entender por la definición de Google, este identifica dos tipos de contenido duplicado: el primer tipo que ocurre en el mismo dominio y el otro tipo que ocurre en varios dominios.

La duplicación no es realmente un concepto simple, ya que ninguna persona lo define igual. Cada uno tiene su propia definición. Podemos resumir el contenido duplicado como:

  • Caracteres exactos en páginas diferentes
  • Contenido casi idéntico en páginas diferentes
  • Títulos y descripciones duplicados
  • Contenido del cuerpo de la página similar o idéntico
  • Duplicidad en  los resultados de la búsqueda por páginas (ordenadas y sin ordenar, incluyendo paginación)
  • Duplicación internacional/local
  • Contenido compartido
  • Jerarquía, categorización indistinta.
  • Arquitectura en plataformas compartidas

Importa tanto la cantidad de contenido duplicado como la  cantidad de contenido único en una página. El contenido duplicado puede duplicar el valor de una página

Diferentes tipos de contenido duplicado

¿Cómo duplica el valor el contenido duplicado?

Una página con contenido duplicado puede clasificarse para un término de búsqueda que contenga palabras en el contenido, o en el contenido duplicado. Ejemplos de esto podrían ser: una descripción duplicada del producto más un texto único que enumera los colores, permite a la página clasificar para ambos términos de producto + color.
Enfócate en los aspectos únicos del contenido de las páginas cuando estés buscando contenido duplicado.

A menos que tengas la fuente original del contenido, no puedes esperar clasificar el contenido duplicado por separado.

¿Donde se produce la duplicidad de contenido?

El contenido duplicado por lo general existe dentro de un solo sitio web, o bien, se extiende a través de múltiples sitios web.
La detección de contenidos duplicados en cualquier lugar de Internet requiere una base de datos global de todo el contenido web. El contenido duplicado en un sitio interno es a menudo mucho más fácil de encontrar.

Cual es la versión original

No hay ningún caso específico de duplicación que sea el primario.
Google intenta establecer la fuente original del contenido, que presumiblemente se basa al menos parcialmente en la fecha de descubrimiento.
Esto no es posible cuando se ejecuta un rastreo limitado en su sitio que no tiene el historial completo de todas las páginas.

Métodos avanzados para descubrir el contenido duplicado

Encontrar la cantidad de texto único en una página, y cualquier otra copia en la web, requiere un rastreo completo de la web.
La mejor herramienta para hacerlo es CopyScape probablemente. Sin embargo, también puedes intentar buscar cadenas de texto dentro de comillas  en Google.

A veces las páginas tienen diferentes títulos y migas de pan, pero los resultados de búsqueda son idénticos. Éstos no aparecerían en muchos informes duplicados porque contienen alguna variación.

El sistema de duplicación de DeepCrawl permite algunas variaciones y aún detecta e informa de páginas duplicadas. Sin embargo, es impredecible dependiendo del nivel de variación y la configuración de duplicación.

Un buen método para detectar es combinar todos los IDs del contenido que se muestra, por ejemplo identificadores de producto en el caso de una página de listado de resultados de producto.

A veces el contenido se duplica a través de varias páginas paginadas, a veces se devuelve el mismo contenido, pero en un orden diferente. Estos casos son mucho más difíciles de detectar.

A veces, un sitio puede tener una categoría de contenido duplicada, o páginas de etiquetas, que apuntan al mismo tema de contenido – sin compartir realmente ningún contenido. Están luchando por las mismas palabras clave. Por lo general, éstas deberían consolidarse, reorientando las versiones más débiles hacia las más fuertes.

Baja indexación

Otro signo de contenido duplicado, es que no está indexado por Google.
Si envías Sitemaps detallados de cada página, desglosados en tantos detalles como sea posible, puedes encontrar patrones de baja indexación, que pueden ser causados por la duplicación.

Prevenir la duplicidad de contenido

El contenido duplicado puede ser devastador para el tráfico orgánico y la clasificación del sitio. El monitoreo de la estructura y contenido de su sitio web con una herramienta como DeepCrawl, por ejemplo, te permite  identificar rápidamente áreas de problemas de contenido duplicado como páginas, títulos y descripciones.

Contenido duplicado en el mismo dominio

Como se puede saber, este tipo de contenido duplicado ocurre en tu sitio de comercio electrónico, publicaciones en el blog o sitio web.

Piensa en contenido duplicado como el mismo contenido que aparece en diferentes páginas web de su sitio.

Podría ser que:

Este contenido está presente en tu sitio en diferentes lugares (URLs).
O, tal vez es accesible a través de diferentes maneras (de ahí resultando en diferentes parámetros de URL).

Echemos un vistazo a algunos ejemplos de diferentes tipos de contenido duplicado en el mismo sitio.

Contenido de boilerplate:

Puesto simplemente, el contenido boilerplate está disponible en diversas secciones o páginas web en su sitio.

Ann Smarty clasifica el contenido de Boilerplate como:

(En todo el sitio) navegación global (inicio, sobre nosotros, etc)
Ciertas áreas especiales, especialmente si incluye enlaces (blogroll, navbar)
Marcado (javascript, nombres de CC id / class como encabezado, pie de página)
Cuando los bots de búsqueda rastrean tu sitio, verán que este contenido está presente varias veces en tu sitio, y por lo tanto, es de hecho contenido duplicado.  Si observas un sitio estándar, usualmente tendrá un encabezado, un pie de página y una barra lateral. Además de estos elementos, la mayoría de CMS  te permiten mostrar sus publicaciones más recientes o sus publicaciones más populares en su página de inicio también.

Pero este tipo de contenido duplicado no daña tu SEO . Los robots de búsqueda son lo suficientemente sofisticados para entender que la intención detrás de esta duplicación de contenido no es maliciosa. Así que, estás a salvo.

 

Estructuras de URL incoherentes:

Mira las siguientes URL:

www.yoursite.com/
yoursite.com
http://yoursite.com
http://yoursite.com/
https://www.yoursite.com
https://yoursite.com
¿Parecen lo mismo, verdad?

Sí, tienes razón, la URL de destino es la misma. Así que, para nosotros, significan lo mismo. Desafortunadamente, los robots de los motores de búsqueda los leen como URLs diferentes.

Pero, cuando los motores de búsqueda o bots se encuentran con el mismo contenido en dos URL diferentes : http://yoursite.com y https://yoursite.com , lo consideran como contenido duplicado.

Este problema se aplica a los parámetros de URL generados para fines de seguimiento también:

http://yoursite.com/?utm_source=newsletter4&utm_medium=email&utm_campaign=holidays

Los parámetros de URL con seguimiento también pueden causar problemas de contenido duplicados.

Dominios localizados:

Supongamos que tienes una web que atiende a diferentes países y has creado dominios localizados para cada país al que sirve.

Por ejemplo, es posible que tengas una versión .de de su sitio para Alemania y una versión .au para Australia.Es natural que el contenido se superponga en ambos sitios. A menos que traduzcas tu contenido para el dominio .de, los motores de búsqueda encontrarán tu contenido duplicado en ambos sitios.

En estos casos, cuando un buscador busca su empresa, Google mostrará cualquiera de estas dos URL.

Google a menudo ve el estado del buscador. Supongamos que el buscador estuviera presente en Alemania. De forma predeterminada, Google mostraría sólo su dominio .de. Sin embargo, Google podría no hacerlo bien.

Lo que no se considera como contenido duplicado

Contenido traducido:

El contenido traducido no es contenido DUPLICADO. Si tienes un sitio y lo ha localizado para diferentes países y has traducido su contenido principal a los idiomas locales, no tendrás problemas de duplicación de contenido.

Pero, este ejemplo no es tan sencillo. Si utilizas algún software, herramientas para webmasters o incluso el traductor de Google para la traducción, la calidad de la traducción no será perfecta.

Y, cuando la traducción no tiene sentido natural y carece de una revisión personal, Google podría mirar el contenido como spam, contenido duplicado.

Dicho contenido puede ser fácilmente identificado como generado por software y puede generar banderas con Google.

La mejor manera de evitar este problema es conseguir que un traductor humano haga el trabajo. O, hacer un trabajo decente con algún buen software y luego tenerlo revisado por un traductor profesional.

Al revisar el contenido traducido, te asegurarás de que la calidad del contenido sea de primera categoría y Google no lo considere como contenido duplicado.

Pero, si por alguna razón no lo puedes hacer, entonces debes bloquear el contenido traducido por el software utilizando robots.txt.

Contenido del sitio para móviles:

Es posible que hayas desarrollado una versión móvil independiente para yu sitio principal.

Por lo tanto, tendrás diferentes URL que sirven el mismo contenido, como:

http: yoursite.com –  web

http.m.yoursite.com –  móviles

Tener el mismo contenido en las versiones web y para sitios móviles no cuenta como contenido duplicado. Además, debes saber que Google tiene diferentes bots de búsqueda que rastrean sitios móviles, por lo que no tienes que preocuparse por este caso.

Google puede identificar instancias de contenido duplicado que se realizan con intenciones malintencionadas. Nunca estás en riesgo si no estás intentando jugar el sistema.

Cómo el contenido duplicado perjudica a tu SEO

Gastas recursos del motor de búsqueda

Si entiendes cómo funcionan los rastreadores, sabrás que Google envía sus meta robots de búsqueda para rastrear tu sitio en función de tu frecuencia de publicación de contenido nuevo.

Ahora, imaginate que los rastreadores de Google visitan su sitio y rastreen cinco URL sólo para encontrar que todos ellos que ofrecen el mismo contenido.

Cuando los bots de búsqueda descubren e indexan el mismo contenido en diferentes lugares de su sitio, pierden ciclos de rastreador. Al comprender el contenido duplicado, los robots de búsqueda no irán sobre su nuevo contenido.

Estos ciclos de rastreador podrían haberse utilizado de otra manera para rastrear e indexar cualquier contenido recién publicado que pudieras haber añadido a tu sitio. Esto no solo desperdiciará recursos de rastreadores, sino que también perjudicará a su SEO.

Mostrará URL desagradables

Cuando Google se encuentra con dos recursos idénticos o  similares en la web, elige mostrar uno de ellos al buscador. En la mayoría de los casos, Google seleccionará la versión más apropiada de tu contenido. Pero, no lo hace siempre bien.

Puede suceder que para una consulta de búsqueda concreta, Google pueda mostrar una versión de URL que no es la adecuada.

Por ejemplo, si un buscador buscaba tu empresa, cuál de las siguientes opciones de parámetro de URL desea mostrarle a su visitante:

http://yoursite.com

o http://yoursite.com/overview.html

Lo correcto sería la primera

Pero, Google podría mostrar la segunda.

Podría ser que:

Este contenido está presente en su sitio en diferentes lugares (URLs).
O, tal vez es accesible a través de diferentes maneras (de ahí resultando en diferentes parámetros de URL). Por ejemplo, estos pueden ser los mismos puestos que se muestran cuando se realiza una búsqueda en función de las diferentes categorías y etiquetas de su sitio.

Baja la popularidad

Cuando no estableces una estructura de URL coherente para tu sitio, terminas creando y distribuyendo versiones diferentes de los enlaces de sitio.

Para entender mejor esto, imagina que has creado un recurso épico que ha producido una gran cantidad de enlaces entrantes y tráfico.

Sin embargo,  la autoridad de página no aumenta como esperas.

Tal vez no lo hizo porque hay diferentes enlaces vinculados de nuevo al recurso utilizando diferentes versiones de la URL de recursos.

Por ejemplo:

  • http://www.yoursite.com/resource
  • http://yoursite.com/resource
  • http://yoursite.com/resource

Identificar el contenido duplicado

Busca bloques de contenido

Esto como se suele decir es a pedal, pero si piensas que puedes tener contenido duplicado vale la pena probarlo.

Copia un bloque de texto cualquiera de tu contenido y realiza una búsqueda simple en Google. No uses párrafos largos porque dará error.

Elija un párrafo de dos o tres oraciones y busca en Google.

Si los resultados de la búsqueda muestran diferentes sitios que publican tu contenido, probablemente seas víctima de plagio.

Screaming Frog

Screaming Frog es una herramienta  de auditoría de SEO para el escritorio que rastrea tu sitio al igual que los motores de búsqueda.  Puedes encontrar diferentes tipos de contenido duplicado y problemas de parámetros de URL

Buscar contenido duplicado en Screming Frog

Abre el programa una vez instalado y pega  la URL de su sitio. Haz clic en Inicio.

Comienza a rastrearse el  sitio, puede hacer clic en el campo que quieres comprobar el contenido duplicado, como URL, títulos de página, texto de anclaje, descripciones meta y así sucesivamente.

Después selecciona el campo,  el filtro duplicado. Mediante este método, puedes detectar todas los tipos de contenido duplicado en tu sitio.

Search Console

Las métricas de search console muestran el número de páginas que los rastreadores de Google han rastreado en su sitio.

Si ves que los  rastreadores están rastreando cientos de páginas cuando solo tienes unas pocas  tal vez es porque estés utilizando URL inconsistentes , no uses las canonical, y por lo tanto están rastreando a lo bestia. URL.

Para ver las métricas , accede a su cuenta de Google Webmasters, haz clic en la opción Rastrear en el panel izquierdo. En el menú ampliado, haz clic en la opción Estadísticas de rastreo .

Busca alertas en Google Webmaster

Webmaster de Google Search Console también te alerta de forma proactiva sobre contenido duplicado en tu sitio.

Para encontrar las alertas de Google sobre el contenido duplicado, solo tienes que iniciar sesión y ver las alertas.

Continuaremos este post, con las soluciones al contenido duplicado

 

 

 

 

 

 

 

Dejar una Respuesta

Tu dirección de correo electrónico no será publicada.