¿Cómo evitar el problema del contenido duplicado para Google?
Publicado: 2021-11-01El contenido duplicado en una página tiene mucho en común con un exceso de presupuesto. Solo en este caso, estamos hablando de la disminución del “Presupuesto de Confianza” en el sitio del robot de búsqueda. Este problema preocupa a muchos propietarios de sitios, ya que puede aparecer incluso a sus espaldas. Habiendo leído algo sobre el problema del contenido duplicado, su sitio se convirtió en una bomba de tiempo. Tic tac en el reloj y las sanciones de Google te están esperando.
Triste pero cierto, hay alrededor del 25-30% de contenido duplicado en la Web. El ex Googler Matt Cutts tiene esta opinión. Aunque el contenido duplicado puede causarle un mundo de problemas con la optimización de motores de búsqueda, no es tan dramático. Hay una solución: lea este artículo y sepa cómo evitar problemas de contenido duplicado para Google.
- ¿Qué es el contenido duplicado?
- Datos sobre el contenido duplicado
- ¿Qué tipo de contenido hay?
- ¿Cual es el codigo?
- páginas HTTPS
- Sistemas de gestión de contenido que crean contenido duplicado
- Páginas para imprimir o múltiples opciones de clasificación
- Contenido duplicado en blogs y sistemas de archivo
- Contenido duplicado generado por el usuario (publicaciones repetidas, etc.)
- Conclusión
¿Qué es el contenido duplicado?
Hay 3 tipos principales de contenido duplicado.
- Duplicado exacto: dos URL tienen un contenido completamente idéntico;
- Contenido con ligeras diferencias: como el orden de las oraciones, algunas imágenes diferentes, etc.;
- Duplicados entre dominios: existe una copia exacta o ligeramente modificada en muchos dominios.
Además, existen dos conceptos relacionados que Google no considera como contenido duplicado. Pero los editores no tan experimentados y los especialistas en SEO pueden confundirlos fácilmente con contenido duplicado.
- Thin content: Son páginas con muy poco contenido. Conjunto de páginas construidas sobre una lista de direcciones de organizaciones, que tienen 6 000 direcciones, pero cada página contiene solo una dirección: solo unas pocas líneas.
- Segmentar contenido: páginas que difieren ligeramente entre sí. El sitio vende zapatos Timberland que vienen en tallas 38, 38.5, 39, 40, 41, 42, etc. Si el sitio tiene una página separada para cada talla de zapato, habrá una pequeña diferencia entre todas esas páginas. Tal efecto, Google lo percibe como contenido de corte.
A Google no le gusta el contenido igualmente delgado y rebanado. Cualquiera de estos efectos puede ser detectado por Google Panda. Es por eso que los editores deben evitar crear este tipo de páginas.
El contenido duplicado puede ocurrir por varias razones:
- licenciamiento del contenido de su sitio;
- defectos en la arquitectura del sitio debido a un sistema de gestión de contenido no optimizado para motores de búsqueda;
- existencia de plagio.
Durante los últimos cinco años, los spammers, con una extraordinaria necesidad de contenido, han comenzado a "saquear" contenido de fuentes legítimas, transponiendo palabras mediante el uso de una variedad de procesos complejos y colocando el texto resultante en sus páginas para atraer operaciones de búsqueda de "cola larga". y mostrar la publicidad contextual y otros fines deshonestos. Entonces, hoy en día las personas viven en un mundo de "problemas de contenido duplicado" y "sanciones por contenido duplicado".
Recomendado para usted: 5 formas en que un buen contenido puede acelerar sus esfuerzos de marketing.
Datos sobre el contenido duplicado
Ubicación de contenido duplicado
Si todo el contenido determinado está en su sitio, ¿es contenido duplicado?
Sí, porque el contenido duplicado puede ocurrir tanto en el mismo como en diferentes sitios.
Porcentaje de contenido duplicado
¿Qué porcentaje de una página debe estar duplicada para caer bajo un filtro de contenido duplicado? Desafortunadamente, los motores de búsqueda nunca hacen pública esta información porque afectaría su capacidad para prevenir el problema en sí. Este porcentaje cambia constantemente para todos los motores. La conclusión es que las páginas no tienen que ser idénticas para ser consideradas duplicadas.
La proporción de código a texto
¿Qué sucede si su código es muy grande, pero hay algunos elementos HTML únicos en la página? ¿No pensará Google que todas las páginas son duplicados entre sí?
No. A los motores de búsqueda no les importa tu código, sino el contenido de tus páginas. El tamaño del código solo se convierte en un problema cuando crece fuera de proporción.
Los elementos de navegación a la proporción de contenido único
Todas las páginas de su sitio tienen una gran barra de navegación, muchos encabezados y pies de página, pero muy poco contenido. ¿Google no considerará que todas estas páginas están duplicadas?
No. Google considera los elementos de navegación incluso antes de evaluar las páginas en busca de duplicación.
contenido con licencia
Desea evitar el problema del contenido duplicado. Pero, ¿qué hacer si tiene contenido de otras fuentes web para las que tiene licencia para mostrar a sus visitantes?
Use meta name = "robots" content = "noindex, siga". Póngalo en el encabezado de su página y los motores de búsqueda sabrán que este contenido no es para ellos. Otra opción es obtener derechos exclusivos para poseer y publicar ese contenido.
¿Qué tipo de contenido hay?
- El contenido único está escrito por una persona. Es completamente diferente de cualquier otra combinación de letras, símbolos y palabras en la web y no se ha visto afectado por los algoritmos de procesamiento de texto de la computadora.
- Los fragmentos son pequeños fragmentos de contenido (p. ej., citas) que se copian y utilizan una y otra vez. Rara vez plantean un problema para los motores de búsqueda, especialmente cuando se incluyen en un documento más grande con mucho contenido único.
- Herpes. Los motores de búsqueda buscan segmentos relativamente pequeños de frases (de cinco a seis palabras) en otras páginas web. Si dos documentos tienen demasiadas tejas, los motores de búsqueda pueden interpretar esos documentos como contenido duplicado.
¿Cual es el codigo?
Hay muchas formas de crear contenido duplicado. Esto explica por qué hay más que suficiente en la web. El contenido duplicado interno necesita tácticas específicas para obtener los mejores resultados en términos de optimización. Hablando con franqueza, las páginas duplicadas son páginas sin valor tanto para los usuarios como para los motores de búsqueda. Entonces trate de evitar este problema por completo. Asegúrese de que solo una URL se refiera a cada página. Además, realice una redirección 301 para las URL antiguas a las URL restantes. Ayuda a los robots de búsqueda a ver los cambios que ha realizado lo más rápido posible y mantener el "jugo de enlace" que tenían las páginas eliminadas.
Si esto no es posible, hay muchas otras opciones. Aquí hay un resumen de las soluciones más fáciles para varios escenarios:
- Puede utilizar el archivo robots.txt para impedir que las arañas de los motores de búsqueda rastreen las versiones duplicadas de las páginas de su sitio;
- utilice el elemento rel=”canonical”, que es la segunda mejor solución para eliminar páginas duplicadas;
- utilice CÓDIGO <meta name=”robots” content=”noindex”> para indicar a los motores de BÚSQUEDA que no muestren páginas duplicadas.
Sin embargo, tenga en cuenta: si usa robots.txt para evitar la visualización de la página, no tiene sentido aplicar noindex o nofollow en la página. Como una araña no puede leer la página, nunca verá las metaetiquetas noindex o nofollow. Con estas herramientas en mente, considere algunas situaciones específicas de contenido duplicado.
Te puede interesar: ¿ Por qué la redacción de contenidos es importante para las marcas y las empresas?
páginas HTTPS
Si usa el protocolo SSL (intercambio de datos cifrados entre el navegador y el servidor web, que a menudo se usa para el comercio electrónico), su sitio tiene páginas que comienzan con HTTPS: (en lugar de HTTP:). El problema surge cuando los enlaces en sus páginas HTTPS apuntan a otras páginas del sitio utilizando enlaces relativos en lugar de absolutos. Por ejemplo, el enlace a su página de inicio se convierte en https://www.YourDomain.com en lugar de http://www.YourDomain.com).
Si su sitio tiene este problema, puede usar rel=”canonical” o redireccionamientos 301 para solucionarlo. Una solución alternativa es cambiar los enlaces a absolutos: http://www.YourDomain.com/content.html en lugar de /contenthtml), lo que también hace la vida un poco más difícil para aquellos que roban tu contenido.
Sistemas de gestión de contenido que crean contenido duplicado
A veces, un sitio puede tener muchas versiones de páginas idénticas. Ocurre con limitaciones en algunos sistemas de administración de contenido que se refieren al mismo contenido con más de una URL. Por lo general, es una duplicación completamente adicional que no tiene ningún valor para los usuarios. La mejor decisión es eliminar las páginas duplicadas y hacer una redirección 301 de las páginas eliminadas al resto. Si no funciona, pruebe con otros métodos.
Páginas para imprimir o múltiples opciones de clasificación
Muchos sitios ofrecen páginas para imprimir que brindan al usuario el mismo contenido en un formato adaptado a la impresora. Algunos sitios de comercio electrónico proporcionan listas de sus productos con múltiples clasificaciones (por tamaño, color, marca y precio). Estas páginas son valiosas para el usuario pero no tienen ningún valor para los motores de búsqueda. Por lo tanto, piensan que es contenido duplicado. En tal situación, puede crear una hoja de cálculo CSS para imprimir.
Contenido duplicado en blogs y sistemas de archivo
Los blogs tienen la forma de una variante interesante sobre el problema del contenido duplicado. Una publicación de blog puede aparecer en varias páginas diferentes:
- la página de inicio del blog;
- la página de enlace permanente para esa publicación;
- las páginas del archivo;
- las páginas de categoría.
Cada copia de publicación es un duplicado de las otras copias. Muy rara vez los editores intentan lidiar con el problema de la presencia de una publicación tanto en la página de inicio del blog como en la página de enlaces permanentes. Y los motores de búsqueda parecen hacer frente a este problema bastante bien. Sin embargo, podría tener sentido mostrar solo fragmentos de publicaciones en las páginas de categoría y archivo.
Contenido duplicado generado por el usuario (publicaciones repetidas, etc.)
Una variedad de sitios usan estructuras para obtener contenido generado por el usuario, como blogs, foros o tableros de mensajes. Estas pueden ser excelentes formas de desarrollar una gran cantidad de contenido a un costo muy bajo. El problema es que un usuario puede publicar el mismo contenido tanto en su sitio como en varios otros sitios al mismo tiempo, lo que genera problemas de contenido duplicado. Es difícil de controlar, pero para reducir el problema se puede proceder de la siguiente manera:
- Debe tener una política clara que notifique a los usuarios que el contenido que proporcionan a su sitio debe ser único y no se puede publicar en otros sitios. Sin duda, es difícil conseguir esto, pero te ayudará a cumplir tus expectativas;
- Mejora tu foro de una manera única que necesitará contenido diferente. Además de los campos de entrada de datos estándar, también agregue algunos campos únicos (diferentes de otros sitios) que serán útiles para los visitantes de su sitio.
También te puede interesar: ¿ Cómo amplificar tu SEO con contenido de video?
Conclusión
No se preocupe demasiado por el contenido duplicado. Por lo general, no es gran cosa. En su mayoría, Google mismo sabe cómo lidiar con problemas como páginas maestras o citas de contenido. Además, mucha gente se enfrenta al problema del contenido duplicado. A veces, los duplicados no aparecen donde nadie espera que aparezcan, por lo que siempre debe consultar el sitio en busca de ellos. Para evitarlos, debe crear contenido único para cada página.
Este artículo está escrito por Isabelle Jordan. Isabelle es periodista de negocios y marketing en la compañía de seguros ektatraveling.com. Escribe para diferentes portales de noticias y blogs temáticos que la ayudan a mantenerse en el corazón de las noticias de viajes y seguros. Tal trabajo le da la oportunidad de escribir artículos sobre los temas más relevantes de la actualidad.