Tag noindex: o que é e como usar em SEO?

A tag noindex é usada para informar que os buscadores não devem indexar uma página. Essa página não será exibida nos resultados de busca, mesmo que seja rastreada. A tag é usada para ocultar tipos específicos de páginas, como áreas internas de um site.

Existem duas formas de implementá-la: inserindo uma meta tag ou em uma instrução no cabeçalho HTTP do site. Ambas têm o mesmo resultado.

O código para inserir a tag no <head> de uma página é:

<meta name=”robots” content=”noindex”>

Já no cabeçalho, fica assim:

HTTP/1.1 200 OK

(…)

X-Robots-Tag: noindex

(…)

Qual a relevância da tag noindex em SEO?

A tag noindex é um recurso importante para controlar a visibilidade do seu site no Google ou em outros buscadores. Por meio dela, você informa quais páginas são realmente relevantes para SEO e quais não devem fazer parte do índice do Google.

Existem vários tipos de páginas que são importantes para o site, mas não para os mecanismos de busca. Por exemplo:

  • Páginas criadas especificamente para campanhas de mídia paga;
  • Páginas de recursos para download, como um e-book ou checklist que o visitante precisa baixar;
  • Páginas internas, que requerem login para acesso.

Na maioria dos casos, não faz sentido essas páginas aparecerem em mecanismos de busca. Elas não são otimizadas e têm outros objetivos. A tag noindex permite controlar essa exibição. 

Quando aplicar a tag noindex?

É recomendável usar a tag noindex em qualquer página que não agrega valor a quem pesquisa algo na internet. Além dos exemplos acima, é comum nos seguintes casos:

  • Páginas usadas em testes A/B com mídia paga;
  • Páginas de confirmação de contato;
  • Páginas de arquivos;
  • Páginas de checkout em e-commerces;
  • Páginas de tags e de categorias em blogs;
  • Sites ou páginas em versão de teste. 

Exemplo de uso da Forbes

Um exemplo recente (e viral) de uso de tag noindex é a Forbes, que impediu a indexação de todo o seu diretório de cupons. 

A informação foi publicada no Twitter pela profissional de SEO Laura Chiocciora, junto com um gráfico mostrando a queda de visibilidade no Google. Lily Ray também apresentou alguns detalhes sobre tráfego, visibilidade e palavras-chaves perdidas.

A decisão faz parte da preparação do portal para o update de abuso de reputação do site. A partir de 5 de maio o Google pune portais que recebem conteúdo de baixa qualidade produzido por terceiros.

Como os cupons poderiam se encaixar nessa descrição, a Forbes adicionou uma diretiva noindex ao cabeçalho HTTP. Assim, as páginas não aparecem no Google e nem violam as diretrizes de spam.

Como implementar a tag no index?

Existem dois métodos de implementar. O mais comum em projetos de SEO é adicionar a tag ao campo <head> das páginas. Se não for possível, adicione a diretiva ao cabeçalho HTTP. 

Plugins de SEO para WordPress, como Yoast ou RankMath, costumam ter ferramentas que facilitam a configuração das tags.

Adicionando a tag ao <head>

Edite o campo <head> da página e insira a seguinte tag:

<meta name=”robots” content=”noindex”>

Também é possível impedir o rastreamento apenas em determinados buscadores. Por exemplo, para proibir a página de aparecer apenas no Google, a tag é:

<meta name=”googlebot” content=”noindex”>

Depois é só salvar as alterações. Vale lembrar que o Google só reconhecerá o noindex da próxima vez que rastrear a página, o que pode levar meses. Se quiser fazer uma solicitação manual de rastreamento, use a ferramenta de inspeção de URL.

Adicionando a tag em cabeçalho HTTP

Este método é usado quando não há elementos HTML disponíveis, como documentos ou arquivos, já que nestes casos não há um campo <head> para editar.

Basta inserir uma X-Robots-Tag com o valor noindex ou none. Veja abaixo: 

HTTP/1.1 200 OK

Date: Tue, 25 May 2010 21:42:43 GMT

(…)

X-Robots-Tag: noindex

(…)

É possível configurar a tag de várias formas diferentes. Por exemplo, você pode permitir a indexação no Google, mas não em outros buscadores:

HTTP/1.1 200 OK

Date: Tue, 25 May 2010 21:42:43 GMT

(…)

X-Robots-Tag: googlebot: nofollow

X-Robots-Tag: otherbot: noindex, nofollow

(…)

Para editar o cabeçalho HTTP, é necessário acessar arquivos de .php do header, .htaccess, ou a configuração do servidor. Recomendamos fazer com cautela, apenas se você tiver apoio técnico ou o conhecimento necessário.

Quais são as melhores práticas para gerenciar tags noindex?

Siga as recomendações abaixo para garantir o funcionamento correto das tags e evitar problemas de indexação:

Não bloqueie acesso ao robots.txt

Se você impedir acesso ao robots.txt, a página pode continuar aparecendo no Google, mesmo com a tag noindex implementada. 

Isso acontece porque o Google precisa rastrear a página novamente para reconhecer o noindex. Se o Google não conseguir fazer isso por causa de uma diretiva no robots.txt, isso não é possível. 

Não use noindex em conteúdo duplicado

O melhor jeito de lidar com conteúdo duplicado é usando a canonical tag. Essa tag informa ao Google qual é a versão principal da página.

Existem situações específicas em que o Google pode exibir versões que não sejam a canônica, caso elas atendam perfeitamente à intenção de busca. Se você adicionar noindex a estas versões, isto não acontece e você perde visibilidade. 

Retire a tag de versões teste das páginas

É uma prática recomendada impedir o Google de rastrear as páginas enquanto elas ainda estão em construção. No entanto, é comum esquecer de tirar a tag quando elas ficam prontas.

Quando estiver tudo pronto para lançar o site ou finalizar a migração, retire o noindex e solicite um novo rastreamento.

Monitore o SEO do seu site com frequência

As situações abaixo são mais normais do que parecem:

  • Seções inteiras de um site serem marcadas como noindex sem querer;
  • Marcar páginas que deveriam estar disponíveis no Google;
  • Esquecer o noindex em páginas que deveriam estar restritas.

Monitorar indicadores-chave de SEO, como o tráfego das páginas, permite detectar e corrigir esses problemas com agilidade.

Por exemplo, se páginas noindex estiverem recebendo tráfego de pesquisa orgânica, precisa revisar se a tag está funcionando. Se o tráfego de uma página cair para zero, também é sinal de que algo está errado.