¿QUÉ ES EL CONTENIDO DUPLICADO Y POR QUÉ AFECTA AL SEO?

Una óptima estrategia SEO implica entre otras cosas una planificación, en la cual debe destacar evitar los contenidos duplicados para evitar las penalizaciones de google a nuestro sitio, es por esto que a continuación te mostraremos como detectar contenido duplicado web.

Indice De Contenidos

1 Contenido duplicado
- 1.1 Tipos de contenido duplicado
- 1.2 Manifestaciones de contenido duplicado
2 Importancia del contenido duplicado
- 2.1 Para buscadores
- 2.2 Para propietarios del sitio

Contenido duplicado

Se considera contenido duplicado a aquella información que se encuentra en la red en más de un sitio web. Se considera un sitio web a la dirección de la página web (URL) única.

El contenido duplicado a veces puede afectar las clasificaciones de los motores de búsqueda. Cuando hay varias piezas de contenido muy similar en más de una ubicación en Internet, como lo llama Google, puede ser difícil para los motores de búsqueda decidir qué versión es más relevante para una consulta de búsqueda determinada.

Tipos de contenido duplicado

Existen dos tipos de contenido duplicado ellos son:

Contenido duplicado interno

El contenido duplicado interno es cuando un dominio crea contenido a través de múltiples URL internas (en el mismo sitio web).

Herramientas para detectar contenido duplicado interno

Las siguientes son las herramientas que te pueden ayudar a detectar contenido duplicado interno:

Siteliner
Google Search Console.
Screamingfrog

Contenido duplicado externo

El contenido duplicado externo se manifiesta cuando 2 o más dominios distintos poseen idéntica copia de página indexada por los buscadores.

Herramientas para detectar contenido duplicado externo

Las siguientes son las herramientas que te pueden ayudar a detectar el contenido duplicado externo:

Copyscape.
Plagiarisma.
Plagium.

Manifestaciones de contenido duplicado

Las siguientes situaciones son las formas en que se puede detectar el contenido duplicado:

Canonicalización de la URL

Es una forma de indicarle a los buscadores que una URL específica representa la copia maestra de una página. El uso de la etiqueta canónica evita problemas causados por contenido duplicado que aparece en múltiples URL.

En términos prácticos, la canonicalización le indica a los motores de búsqueda que versión de una URL desea que aparezca en los resultados de búsqueda. Ejemplo:

com
seo.com
com/index.html
seo.com/index.html

Todas estas direcciones web dirigen al mismo sitio web con una misma información, poseerlas sin otra reubicación produce que el buscador no reconozca a la dirección a la que deseas direccionar a tus usuarios.

Una manera de solucionar esta situación es realizando una reubicación en el servidor para certificar que solo una dirección web es la que visualizan los internautas. Otra manera es determinar el subdominio que se desea designar como el principal en Google Webmaster Tools.

Etiquetas y categorías

Esta situación se presenta cuando en los sitios webs (especialmente blogs) se etiquetan o categorizan a muchas páginas que poseen información similar, esta situación suele ser común en la comunidad de blogs. Esto lo podemos visualizar con el siguiente ejemplo:

Un blog con 3 entradas que poseen las siguientes etiquetas y categorías:

Título: Cómo conseguir enlaces dofollow.
Etiquetas: Enlaces dofollow, SEO, consejos.
Categorías: SEO, consejos, enlaces.
Título: Conseguir enlaces dofollow fácilmente.
Etiquetas: Enlaces dofollow, SEO, contenido.
Categorías: SEO, enlaces.
Título: Consejos para obtener enlaces dofollow.
Etiquetas: enlaces, contenido, enlaces dofollow.
Categorías: SEO, enlaces, consejos.

De esta manera se establecerían las entradas en cada página de etiquetas y contenidos.

Podemos observar que las siguientes páginas tienen las mismas publicaciones:

Las etiquetas SEO y enlaces dofollow.
Las categorías SEO y enlaces
La categoría consejos y la etiqueta consejos.

Como solución a esta situación va a depender en la forma en que se empleen las categorías y las etiquetas y el número que haya en cada publicación.

Si se emplean un bajo número de categorías y un gran número de etiquetas (es lo habitual en los usuarios) lo recomendable es añadir meta-etiquetas noindex, follow a tus páginas de etiquetas, en esta situación tus categorías serán las que te ubiquen en los resultados de búsqueda.

Si empleas muchas categorías y un bajo número de etiquetas, la situación cambiaría agregando las meta-etiquetas noindex, follow a tus páginas de categorías.

Versiones para Dispositivos móviles

Esta es otra de las formas de generar contenido duplicado, incrementándose esta situación en el tiempo, pues cada vez es mayor el tráfico de internet desde los dispositivos inteligentes en los últimos años.

En este caso se pueden visualizar dos URL de un sitio web para cada una de las páginas del mismo. Ejemplo:

SEO.com/pagina.html
SEO.com/pagina.html

Una manera de detectar contenido duplicado y corregir esta situación, es que la dirección del sitio web para dispositivos móviles sea diferente a la de un ordenador normal.

De esta manera con las páginas con distintos URL y distintos diseños que muestran el contenido, según el equipo móvil con el que se esté navegando en internet.

Sin embargo, debemos entender que una acción de este tipo demande de recursos humanos y de tiempo, por lo tanto en caso de poder realizar la recomendación anterior, se puede elaborar un diseño responsive que se adecúe activamente al diseño de la página web en virtud de la calidad de la pantalla del internauta.

Otra opción puede ser agregar etiquetas canonical a todas las páginas del sitio web móvil a las del sitio web normal.

Parámetros en la URL

Los parámetros de URL, como el seguimiento de clics y algunos códigos analíticos, pueden causar problemas de contenido duplicado. Esto puede ser un problema causado no solo por los parámetros en sí, sino también por el orden en que esos parámetros aparecen en la propia URL.

Del mismo modo, las ID de sesión son un creador de contenido duplicado común. Esto ocurre cuando a cada usuario que visita un sitio web se le asigna una ID de sesión diferente que se almacena en la URL.

Ejemplo

ropa.com/vestidos?color=azul&precio-desde=30&precio-hasta=100

Podemos observar tres elementos: color, precio bajo y precio alto.

Una forma de solucionar esta situación con los parámetros URL es agregar una etiqueta rel=canonical dirigida a la página original, con esto sencillamente se puede impedir cualquier idea de equivocación por parte de Google con la página original.

Otra posible resolución de esta manifestación de contenido duplicado es mediante Google Webmaster Tools, siguiendo la siguiente ruta: Configuración > Parámetros de URL que parámetros debe ignorar a la hora de indexar páginas en tu web

Paginación

La paginación consiste al momento en el que una publicación, lista de productos o páginas de etiquetas y categorías poseen más de una página. Y es que pesar que tengan información distinta, todas se basan en un mismo tema.

Esta situación representa un inconveniente mayor en los sitios de e-commerce pues poseen muchos artículos clasificados con la misma categoría.

Una posible solución se presentan con las etiquetas rel=next y rel=prev las cuales admiten a los buscadores conocer que todas las paginas corresponden a la misma categoría/publicación, no indexando todas las páginas y basando toda la fortaleza de posicionamiento en la primera página.

Otra forma de solucionar este contenido duplicado es conseguir el parámetro de buscar el parámetro de paginación en la URL e introducirlo en Google Webmaster Tools para que no se indexe.

Estas son las causas más comunes de contenido no intencionado que tienen una solución factible y fácil de lograr. El contenido duplicado es algo a lo que se debe estar muy atento, pues si su número es bajo puede tener una resolución rápida, pero si el número del mismo es alto puede llegar a convertirse en una tarea muy compleja.

Importancia del contenido duplicado

La importancia del contenido duplicado es la siguiente:

Para buscadores

El contenido duplicado puede presentar tres problemas principales para los motores de búsqueda:

No saben que versión incluir o excluir de sus índices.
No saben si dirigir las métricas del enlace a una página o mantenerlo separado entre varias versiones.
No saben qué versiones clasificar para los resultados de la consulta.

Para propietarios del sitio

Cuando hay contenido duplicado, los propietarios de sitios pueden sufrir clasificaciones y pérdidas de tráfico. Estas pérdidas a menudo provienen de dos problemas principales:

Para proporcionar la mejor experiencia de búsqueda, los motores de búsqueda rara vez mostrarán varias versiones del mismo contenido y, por lo tanto, se verán obligados a elegir qué versión es más probable que sea el mejor resultado. Esto diluye la visibilidad de cada uno de los duplicados.

La equidad de enlaces puede diluirse aún más porque otros sitios también tienen que elegir entre los duplicados, en lugar de que todos los enlaces entrantes apunten a una sola pieza de contenido, se enlazan a varias piezas, extendiendo la equidad del enlace entre los duplicados.
Debido a que los enlaces entrantes son un factor de clasificación, esto puede afectar la visibilidad de búsqueda de un contenido.

Sabemos que esta información ha sido de tu interés, así que no dudes en compartirlo con tus amistades y familiares. Asimismo, te invitamos a visitar los siguientes enlaces:

¿Qué es una estrategia de contenidos y cuál es su función?

Mejor acortador de URL para viralizar tus contenidos

¿Cómo hacer la descripción de un producto correctamente?

¿Qué es el contenido duplicado y por qué afecta al SEO?