Eu escrevi um post para o saudoso SEO Dicas sobre como esconder conteúdo dos buscadores. E como eu disse no post, não se trata de fazer black hat, definitivamente esse não é o objetivo.
Naquele post, eu apresentei algumas dicas de como evitar que um determinado conteúdo que não se deseja indexado nas páginas de resposta de buscas, que de fato não fosse indexado.
O que eu venho trazer aqui é um complemento: um vídeo do Matt Cutts citando algumas formas de remover conteúdo do seu site das páginas do google. Ele não passa por detalhes técnicos, mas cita algumas opções certas e erradas.
Video: Remove Your URLs from Google
Alternativas fracas para a Remoção
No vídeo, o Matt Cutts menciona que usar nofollow nos links é uma tática bem fraca e ilustra (desenhando mesmo) o por quê.
Em uma segunda opção, ele comenta que simplesmente não fazer um link para a página não resolve, pois outras pessoas podem fazer esse link. Essa é bem óbvia, mas valia mencionar.
A página pode ainda aparecer como “referrer” (o site de origem da visita a um outro site) e então o Google encontraria a página que era para ficar fora dos resultados de busca.
Alternativas médias: Robots.txt e Noindex
Ele classifica o uso do robots.txt como médio. Se não feito corretamente pode causar problemas e, ainda, as diferentes search engines podem interpretá-lo de modo diferente. O Google, em particular, não percorre o conteúdo da página, mas indica o link nas suas páginas de resposta.
Um ponto que gerou assunto foi o uso da meta tag robots com o atributo content setado para “noindex”.
Dia 24 de fevereiro, o Matt Cutts propôs uma votação para que todos expressassem a sua opinião a respeito do que deveria ser feito no uso o noindex: (1) não mostrar nada; (2) mostrar uma referência sem rastrear o conteúdo da página; ou (3) um meio termo.
O fim das contas é que o noindex segue como uma boa opção, o Google não indexa a página, mas rastreia o conteúdo.
Melhores opções: .htaccess e URL Removal Tool
Na lista de melhores opções, ele coloca como pontos fortes o uso do arquivo .htaccess e a URL Removal Tool (ferramenta de remoção de url) que fica no próprio Google Search Console.
A ideia com o .htaccess é bloquear páginas com usuário e senha. Como o Googlebot não ficaria tentando usuários e senhas até conseguir acesso, a página não seria indexada.
A URL Removal Tool é para dizer ao Google diretamente que uma URL não deve ser indexada. Atualmente ela está bem dinâmica, com a possibilidade de você bloquear e desbloquear URLs sem grandes problemas ou espera – pelo menos para o Google.com.
Qual é o seu método preferido para remover página do Google? É um desses? É uma outra opção? Comente abaixo!
Deixe um comentário