Como evitar o problema de conteúdo duplicado para o Google?

Publicados: 2021-11-01

O conteúdo duplicado em uma página tem muito em comum com o estouro do orçamento. Só que neste caso estamos falando da diminuição do “Trust Budget” no site do robô de busca. Esse problema preocupa muitos proprietários de sites, pois pode aparecer mesmo pelas costas. Depois de ler algo sobre o problema de conteúdo duplicado, seu site se transformou em uma bomba-relógio. Tick ​​Tock no relógio e as sanções do Google estão esperando por você.

Triste, mas é verdade, há cerca de 25-30% de conteúdo duplicado na web. O ex-Googler Matt Cutts tem essa opinião. Embora o conteúdo duplicado possa colocá-lo em um mundo de problemas com a otimização do mecanismo de pesquisa, não é tão dramático assim. Existe solução — leia este artigo e saiba como evitar problemas de conteúdo duplicado para o Google.

Índice mostra
  • O que é conteúdo duplicado?
  • Fatos sobre conteúdo duplicado
  • Que tipo de conteúdo existe?
  • Qual é o código?
    • páginas HTTPS
    • Sistemas de gerenciamento de conteúdo criando conteúdo duplicado
    • Páginas para impressão ou várias opções de classificação
    • Conteúdo duplicado em blogs e sistemas de arquivamento
    • Conteúdo duplicado gerado pelo usuário (postagens repetidas, etc.)
  • Conclusão

O que é conteúdo duplicado?

conteúdo-marketing-desk-laptop-note-trabalho-escrever-artigo-blog
Existem 3 tipos principais de conteúdo duplicado.
  • Duplicata exata: duas URLs têm conteúdo completamente idêntico;
  • Conteúdo com pequenas diferenças: como ordem das frases, imagens um pouco diferentes, etc;
  • Duplicatas entre domínios: uma cópia exata ou ligeiramente alterada existe em muitos domínios.

Além disso, existem dois conceitos relacionados que o Google não considera como conteúdo duplicado. Mas editores não tão experientes e especialistas em SEO podem facilmente misturá-los com conteúdo duplicado.

  • Conteúdo fino: são páginas com muito pouco conteúdo. Conjunto de páginas construídas sobre uma lista de endereços de organizações, que possuem 6.000 endereços, mas cada página contém apenas um endereço: apenas algumas linhas.
  • Conteúdo da fatia: páginas que diferem ligeiramente umas das outras. O site vende sapatos Timberland nos tamanhos 38, 38,5, 39, 40, 41, 42, etc. Se o site tiver uma página separada para cada tamanho de sapato, haverá uma pequena diferença entre todas essas páginas. Tal efeito que o Google percebe como conteúdo fatiado.

O Google não gosta de conteúdo igualmente fino e fatiado. Qualquer um desses efeitos pode ser detectado pelo Google Panda. É por isso que os editores devem evitar criar esses tipos de páginas.

O conteúdo duplicado pode acontecer por vários motivos:
  • licenciamento do conteúdo do seu site;
  • defeitos na arquitetura do site devido a um sistema de gerenciamento de conteúdo não otimizado para mecanismos de busca;
  • existência de plágio.

Nos últimos cinco anos, spammers, com uma necessidade extraordinária de conteúdo, começaram a “roubar” conteúdo de fontes legítimas, transpondo palavras usando uma variedade de processos complexos e colocando o texto resultante em suas páginas para atrair operações de busca de “cauda longa”. e mostrar a publicidade contextual e outros objetivos desonestos. Então, hoje em dia as pessoas vivem em um mundo de “problemas de conteúdo duplicado” e “penalidades de conteúdo duplicado”.

Recomendado para você: 5 maneiras pelas quais um bom conteúdo pode acelerar seus esforços de marketing.

Fatos sobre conteúdo duplicado

perguntas-respostas-faq-consulta-ajuda
Local de conteúdo duplicado

Se todo o conteúdo específico estiver em seu site, é um conteúdo duplicado?

Sim, porque o conteúdo duplicado pode acontecer tanto no mesmo quanto em sites diferentes.

Porcentagem de conteúdo duplicado

Que porcentagem de uma página deve ser duplicada para cair em um filtro de conteúdo duplicado? Infelizmente, os mecanismos de pesquisa nunca tornam essas informações públicas porque isso afetaria sua capacidade de prevenir o próprio problema. Essa porcentagem muda constantemente para todos os motores. O resultado final é que as páginas não precisam ser idênticas para serem consideradas duplicatas.

A proporção de código para texto

E se o seu código for muito grande, mas houver alguns elementos HTML exclusivos na página? O Google não vai pensar que todas as páginas são duplicatas umas das outras?

Não. Os motores de busca não se preocupam com o seu código, mas sim com o conteúdo das suas páginas. O tamanho do código só se torna um problema quando cresce fora de proporção.

Os elementos de navegação para proporção de conteúdo exclusivo

Todas as páginas do seu site têm uma grande barra de navegação, muitos cabeçalhos e rodapés, mas muito pouco conteúdo. O Google não considerará todas essas páginas duplicadas?

Não. O Google considera os elementos de navegação antes mesmo de avaliar as páginas para duplicação.

conteúdo licenciado

Você deseja evitar o problema de conteúdo duplicado. Mas o que fazer se você tiver conteúdo de outras fontes da web licenciadas para mostrar aos seus visitantes?

Use meta name = “robots” content = “noindex, follow”. Coloque-o no cabeçalho da sua página e os mecanismos de pesquisa saberão que esse conteúdo não é para eles. Outra opção é obter direitos exclusivos de propriedade e publicação desse conteúdo.

Que tipo de conteúdo existe?

computador-laptop-mesa-trabalho-escritório-conteúdo-escrita-note-pesquisa
  • Conteúdo exclusivo é escrito por uma pessoa. É completamente diferente de qualquer outra combinação de letras, símbolos e palavras na web e não foi afetado por algoritmos de processamento de texto de computador.
  • Fragmentos são pequenos pedaços de conteúdo (por exemplo, citações) que são copiados e usados ​​continuamente. Eles raramente representam um problema para os mecanismos de pesquisa, especialmente quando incluídos em um documento maior com muito conteúdo exclusivo.
  • Cobreiro. Os mecanismos de pesquisa procuram segmentos relativamente pequenos de frases (cinco a seis palavras) em outras páginas da web. Se dois documentos tiverem muitos shingles, os mecanismos de pesquisa poderão interpretar esses documentos como conteúdo duplicado.

Qual é o código?

código de programação desenvolvimento web

Existem muitas maneiras de criar conteúdo duplicado. Isso explica por que há mais do que o suficiente na web. O conteúdo duplicado interno precisa de táticas específicas para obter os melhores resultados em termos de otimização. Francamente falando, páginas duplicadas são páginas sem valor para usuários e mecanismos de pesquisa. Em seguida, tente evitar esse problema completamente. Certifique-se de que apenas um URL se refira a cada página. Além disso, faça um redirecionamento 301 das URLs antigas para as URLs restantes. Ele ajuda os robôs de busca a ver as mudanças que você fez o mais rápido possível e a manter o “link juice” que as páginas apagadas tinham.

Se isso não for possível, existem muitas outras opções. Aqui está um resumo das soluções mais fáceis para vários cenários:

  • Você pode usar o arquivo robots.txt para impedir que os spiders dos mecanismos de pesquisa rastreiem versões duplicadas das páginas do seu site;
  • use o elemento rel=”canonical”, que é a segunda melhor solução para remover páginas duplicadas;
  • use CODE <meta name=”robots” content=”noindex”> para instruir os mecanismos de PESQUISA a não mostrar páginas duplicadas.

No entanto, observe: se você usar o robots.txt para impedir a visualização da página, aplicar noindex ou nofollow na página não faz sentido. Como um spider não pode ler a página, ele nunca verá meta-tags noindex ou nofollow. Com essas ferramentas em mente, considere algumas situações específicas de conteúdo duplicado.

Você pode gostar: Por que escrever conteúdo é importante para marcas e empresas?

páginas HTTPS

Se você estiver usando o protocolo SSL (troca de dados criptografados entre o navegador e o servidor da Web, que é frequentemente usado para comércio eletrônico), seu site terá páginas que começam com HTTPS: (em vez de HTTP:). O problema surge quando os links em suas páginas HTTPS apontam para outras páginas no site usando links relativos em vez de absolutos. Por exemplo, o link para sua página inicial torna-se https://www.YourDomain.com em vez de http://www.YourDomain.com).

Se o seu site tiver esse problema, você pode usar redirecionamentos rel=”canonical” ou 301 para corrigi-lo. Uma solução alternativa é alterar os links para absoluto: http://www.YourDomain.com/content.html em vez de /contenthtml), o que também dificulta um pouco a vida de quem rouba seu conteúdo.

Sistemas de gerenciamento de conteúdo criando conteúdo duplicado

Às vezes, um site pode ter muitas versões de páginas idênticas. Isso acontece devido a limitações em alguns sistemas de gerenciamento de conteúdo que se referem ao mesmo conteúdo com mais de uma URL. Geralmente é uma duplicação completamente extra que não tem valor para os usuários. A melhor decisão é remover as páginas duplicadas e fazer um redirecionamento 301 das páginas removidas para as restantes. Se não funcionar, tente outros métodos.

Páginas para impressão ou várias opções de classificação

Muitos sites oferecem páginas para impressão que fornecem ao usuário o mesmo conteúdo em um formato adaptado à impressora. Alguns sites de comércio eletrônico fornecem listas de seus produtos com várias classificações (por tamanho, cor, marca e preço). Essas páginas têm valor para o usuário, mas não têm valor para os mecanismos de pesquisa. Portanto, eles pensam que é um conteúdo duplicado. Em tal situação, você pode criar uma planilha CSS para impressão.

Conteúdo duplicado em blogs e sistemas de arquivamento

Os blogs têm a forma de uma variante interessante na questão do conteúdo duplicado. Uma postagem de blog pode aparecer em várias páginas diferentes:

  • a página inicial do blog;
  • a página de link permanente dessa postagem;
  • as páginas de arquivo;
  • as páginas da categoria.

Cada cópia de postagem é uma duplicata das outras cópias. Muito raramente os editores tentam lidar com o problema da presença de uma postagem tanto na página inicial do blog quanto na página de links permanentes. E os mecanismos de busca parecem lidar muito bem com esse problema. No entanto, pode fazer sentido mostrar apenas trechos de postagem em páginas de categoria e arquivo.

Conteúdo duplicado gerado pelo usuário (postagens repetidas, etc.)

Uma variedade de sites usa estruturas para obter conteúdo gerado pelo usuário, como blogs, fóruns ou quadros de mensagens. Essas podem ser ótimas maneiras de desenvolver muito conteúdo a um custo muito baixo. O problema é que um usuário pode publicar o mesmo conteúdo em seu site e em vários outros sites ao mesmo tempo, o que leva a problemas de conteúdo duplicado. É difícil de controlar, mas para reduzir o problema você pode proceder da seguinte forma:

  • Você precisa ter uma política clara que notifique os usuários de que o conteúdo que eles fornecem ao seu site deve ser exclusivo e não pode ser postado em outros sites. Sem dúvida, é difícil conseguir isso, mas ajudará a realizar suas expectativas;
  • Melhore seu fórum de uma maneira única que precisará de conteúdo diferente. Além dos campos de entrada de dados padrão, adicione também alguns campos exclusivos (diferentes de outros sites) que serão úteis para os visitantes do seu site.
Você também pode gostar: Como amplificar seu SEO com conteúdo de vídeo?

Conclusão

placas-aviso-rua-de-mão-única-duplicada-motivação-emprego

Não se preocupe muito com conteúdo duplicado. Geralmente não é grande coisa. Principalmente o próprio Google sabe como lidar com questões como páginas mestras ou citações de conteúdo. Além disso, muitas pessoas enfrentam o problema de conteúdo duplicado. Às vezes, as duplicatas não aparecem para ninguém onde elas esperam, portanto, você deve sempre verificar o site em busca delas. Para evitá-los, você precisa criar conteúdo exclusivo para cada página.

Autor-Imagem-Isabelle-Jordan Este artigo foi escrito por Isabelle Jordan. Isabelle é jornalista de negócios e marketing da seguradora ektatraveling.com. Ela escreve para diferentes portais de notícias e blogs temáticos que a ajudam a ficar no centro das notícias de viagens e seguros. Tal trabalho lhe dá a oportunidade de escrever artigos sobre os temas mais relevantes da atualidade.