O que é Conteúdo Duplicado e Como Identificar

O que é Conteúdo Duplicado e Como Identificar

A internet é como se fosse um arquivo infinito de diversos temas e assuntos do mundo todo. Assim, a web é capaz de aglomerar muitas informações que estão interconectadas umas às outras.

Além disso, é comum nos depararmos com situações em que o conteúdo de uma página pode ser um conteúdo repetido de outro endereço (URL). Isso é definido como conteúdo duplicado, ou seja, toda vez que se encontram páginas que possuem o mesmo conteúdo e que apresentam apenas mudança nos endereços (URLs), o conteúdo acessado está sendo duplicado.

Quando isso ocorre, os buscadores como Google, Yahoo e Bing, normalmente aplicam mecanismos para limpar as duplicadas, eliminando-as de seus resultados de busca. Contudo, detectar e saber se um conteúdo é ou não duplicado, não é uma tarefa simples e se o erro não for corrigido, é possível que a “página oficial” caia no ranking dos buscadores.

Como surgem os famigerados conteúdos duplicados? E como resolver?

Entre os erros mais comuns que resultam na duplicação de conteúdo, estão os múltiplos domínios, domínios com www versus domínios sem www, páginas com URLs diferentes mas com conteúdo igual e títulos e meta tags iguais.

Algumas empresas, com a ideia equivocada de proteger a sua marca, compram diversos domínios. No entanto, ao acessar os endereços, o conteúdo é o mesmo, sendo impossível fugir do conteúdo duplicado. Normalmente, vários domínios também provocam confusão entre os usuários na hora de acessar o site.

Além disso, cada vez que o cliente acessa determinado domínio, cria-se uma linkagem e isso faz com que os buscadores identifiquem os domínios como concorrentes, o que prejudica a sua aparição nos resultados de busca. A solução para esse problema é acionar um redirecionamento 301 de todos os domínios somente para um. Para saber mais, você pode ler o artigo sobre redirecionamentos da MestreSeo.

Outro cuidado para não gerar conteúdo duplicado é não criar diversas páginas com URLs diferentes e conteúdos iguais. Esse tipo de problema costuma acontecer muito em sites e-commerce, onde é possível acessar o mesmo conteúdo em mais de uma página com caminhos diferentes.

Isso ocorre, por exemplo, quando um cliente que busca uma televisão, procura por televisores 42” LG e com essa busca ele obtém uma página. Mas se ele resolver fazer a busca por televisores LG 42” e obtiver outra página, com o mesmo conteúdo da anterior, então esse também é um conteúdo duplicado. A solução é fazer o uso da Canonical Tag. Dessa forma, os buscadores não irão caracterizar as páginas como iguais e identificar apenas uma como a original. (Se quiser outras informações, leia este artigo)

Algumas vezes o conteúdo duplicado também pode ser gerado acidentalmente, devido ao fato do desenvolvedor do site não ter conhecimento de que as URLs são case sensitive, ou seja, as letras maiúsculas e minúsculas são levadas em conta. Por exemplo, as URLs www.seusite.com.br/Celuar e www.seusite.com.br/celular, mesmo que façam referência à mesma página e de certa forma são a mesma URL, para os buscadores são páginas diferentes unicamente em função da letra maiúscula e minúscula. Por isso, ao criar e desenvolver um site, o ideal é seguir um padrão, usando a mesma caixa para todas as URLs.

Outro cuidado para não gerar conteúdo duplicado é não deixar as tittle tags e meta description iguais para páginas diferentes. Os buscadores decifram essa ação como conteúdo duplicado e ainda podem gerar uma competição desnecessária entre páginas de um mesmo site. A solução é criar title tags e meta description específicas para cada página, mesmo que o conteúdo seja semelhante.

E o que não é conteúdo duplicado?

O conteúdo duplicado pode surgir quando alguém copia o conteúdo que já existe em uma página, ou quando o webmaster publica o mesmo conteúdo em mais de uma URL. Contudo, existem alguns itens e tipos de páginas que os buscadores não consideram duplicado.

Quando o mesmo conteúdo é publicado em idiomas diferentes dentro de uma mesma página, o conteúdo não é considerado duplicado pelo buscador. Mas considere a possibilidade de lançar um site e aplicar a TLD correta do país que fala o idioma, por exemplo, fr para França, br para Brasil, etc.

Os subdomínios, como, por exemplo, “https://agenciaenlink.com.br/en/”, para dividir os idiomas devem ser evitados. Eles só valem quando parte do conteúdo original do site é traduzido para garantir acesso a internautas que falam diferentes idiomas.

Ao usar trechos de conteúdos retirados de outros sites ou outros endereços de URL, é necessário usar a tag < blockquote > entre aspas, já que o conteúdo é literalmente copiado de outro endereço. Isso evita que um documento seja acusado pelo buscador como conteúdo duplicado.

Se os trechos copiados de outros endereços forem pequenos e o usuário acrescentar bastante conteúdo original, basta criar um link para o site de origem da citação, que o conteúdo não será filtrado como duplicado.

Ferramentas úteis para detectar conteúdo duplicado

Mas e afinal como saber se o seu site possui ou não conteúdo duplicado? Existem algumas ferramentas capazes informar a duplicidade de conteúdos. A saber:

Dent tool: o uso dessa ferramenta é gratuito, sendo necessário apenas fazer um cadastro. Ela verifica se há existência de versões com www e sem www da sua página, analisa o cachê do Google e o nível de similaridade entre as páginas do site.

 

Xenu: é uma ferramenta muito prática e eficiente, capaz de verificar o site e colocar em uma tabela todas as URLs disponíveis no mesmo. A partir disso, basta analisar as meta tags e ver se não há alguma duplicada.

 

Google Webmaster Tools: muito utilizadas por quem quer otimizar sites, as ferramentas do Google são úteis também para identificar títulos e meta tags duplicadas.

Copyscape: essa tool é muito útil para quem quer descobrir se seu conteúdo está sendo plagiado. É, portanto, um verificador de conteúdo duplicado e pode ser usado para encontrar ‘infratores’, que podem ser denunciados e, mais tarde, punidos para que as suas páginas sejam consideradas originais pelos buscadores.

 

Quer saber mais sobre conteúdo duplicado? No site do MestreSeo, há uma seção exclusiva sobre o assunto.

 

Comments

comments