Códigos de Resposta HTTP do Servidor e SEO

Em termos simples, a navegação online de site em site, de página em página, envolve uma troca de mensagens entre o seu navegador e o servidor de um site.

Em um resumo bastante resumido, quando você digita um endereço no navegador ou clica em um link, o seu navegador pede para o servidor enviar a aquela determinada página para apresentar para você. E o servidor, ao receber um pedido desse responde, primeiro, informando se tem a página, não tem, ou se aconteceu alguma outra coisa.

E essa resposta carrega os códigos de retorno HTTP, ou códigos de resposta HTTP, status HTTP, ou, de forma simples, a resposta do servidor.

Mesmo um site dinâmico, ou seja, que tem as páginas oferecidas com consulta a banco de dados ou uso de parâmetros nas URLs, no fim das contas, todas passam por esse mesmo processo de troca de mensagens e códigos.

Códigos de Resposta HTTP

Um desses códigos de resposta deve ser bem familiar a você, o 404, exibido quando o servidor não consegue encontrar o endereço solicitado (a página) e aí ele informa essa situação através do “código HTTP 404 error:”

erro 404

Se de primeira isso parece que não tem nada a ver com SEO, saiba que tem tudo a ver com SEO, pois cada situação que leva cada código HTTP pode modificar como o Google indexa e classifica o seu site nos resultados de busca.

Antes de seguir para explicar sobre os códigos em si, saiba que o Search Console tem a ferramenta ideal para você testar o retorno HTTP das páginas do seu site. Eu falo sobre a ferramenta no post Hacks com o Google Search Console.

200 OK x SEO

O status 200 é o código informado quando o servidor interpreta que ele tem a página solicitada. Aí ele ativa a transferência do código HTML da página e o seu navegador faz o download do HTML e demais arquivos necessários para renderizar a página (imagens, CSS, javascript).

Na perspectiva de SEO, esse é o código que todas as páginas importantes do seu site devem retornar sempre. Cada vez que o Google solicitar a página, ela vai estar disponível, bem como cada vez que uma pessoa tentar acessar a página, ela vai estar disponível.

Para cada solicitação de arquivo esse processo acontece: javascript, imagens e CSS. E quando o servidor interpreta que não tem um dos arquivos solicitados seja a página em si ou os demais arquivos complementares, ele retorna o código 404.

404 error x SEO

O código 404 é o representativo do “Não encontrado” – como disse antes, acontece quando o servidor não consegue encontrar o arquivo (ou conteúdo dinâmico respectivo ao endereço) para iniciar a transferência.

Este é um retorno importante para se prestar atenção, o Google Search Console tem até um relatório específico para listar as páginas que retornaram erro.

Você pode usar outras ferramentas para procurar os erros 404 também, como a Screaming Frog ou outras.

O Google não indexa endereços que retornaram 404, obviamente, e no caso de uma página que existia (ou existe) e passou a retornar 404, ele usa um intervalo de 1 ou 2 dias de paciência aguardando a página voltar a retornar 200. Depois desse prazo, ele vai diminuindo a visibilidade da página até removê-la do índice.

Por isso, é importante prestar atenção ao relatório, para não perder nenhuma página importante por acidente. E eles acontecem.

Um problema que vejo de vez em quando nos cursos, ou na consultoria, é o site ter uma página de erro 404 amigável, porém retornar o código 200 para essa página.

Isso é um erro perigoso, pois pode fazer o site ficar centenas ou milhares de páginas duplicadas.

Um segundo erro que acontece com certa frequência é fazer um endereço que não existe ser redirecionado para uma página de erro que retorna o código 404, ou até mesmo o 200. Se o endereço não existe, o código 404 deve ser retornado diretamente aí.

301/302 Redirect x SEO

Outro código de retorno importante de se acompanhar na visão de SEO é o código em um redirecionamento. Geralmente, em um redirecionamento, ou seja, quando você tenta acessar um endereço e é automaticamente levado a outro, o servidor retorna:

  • 301 redirecionamento permanente; ou
  • 302 redirecionamento temporário.

Até o momento em que escrevo este post, o Google interpreta cada tipo de redirecionamento, entre esses 2, de forma diferente. Porém, nesse momento, ele está também avaliando a possibilidade de migrar para usar a interpretação do 301 para todo tipo de redirecionamento.

É muito provável que isso aconteça mesmo, mas aprenda as diferenças mesmo assim, que vão além dos nomes permanente ou temporário.

O redirecionamento 301, como é mais conhecido, tem o efeito de transferir o PageRank do endereço antigo para o novo. Também em uma primeira fase, essa transferência de autoridade era parcial, uma pequena parte era simplesmente perdida.

Em tempos mais recentes, o Google teria mudado para a transferência completa de autoridade. Isso também é seguido de substituição da URL antiga, pela nova nos resultados de busca. Assim, o novo endereço assume por completo a posição do antigo.

O redirecionamento 302, por ter a premissa de ser usado apenas para um redirecionamento temporário, ou seja, ele não ficará ativo depois de algum tempo, esse redirecionamento faz com que o Google não transfira a autoridade da antiga para a nova, nem substitua nos índices. Ele fica aguardando que a situação volte ao quadro anterior, quando não havia redirecionamento.

Assim sendo, torna-se crucial usar cada um em sua respectiva aplicação. Se é um redirecionamento definitivo e vai durar “para sempre,” é vital usar o 301. Se é uma situação temporária, usa-se o 302 como status do redirecionamento.

500 internal server error x SEO

Os erros da família 500 (502 e 503 são os principais) significam que houve algum erro no servidor.

Alguma configuração no servidor ficou errada, ele tentou executar alguma operação não classificada, um código de programação gerou um resultado imprevisto e, no fim, o servidor ficou sem saber se a página solicitada existe, ou não existe, ou foi redirecionada.

É mais ou menos a tela azul do windows, um bug que trava o computador, o software ou aplicação que você está usando. Os servidores de sites também podem sofrer com isso e o resultado é um erro 500.

Estes são perigosos para SEO, no sentido do erro 404. O Google vai ter um pequeno intervalo de espera para que o site volte a funcionar, mas passado esse tempo, pode dizer adeus aos rankings.

Seja qual for o caso, é sempre difícil recuperar o site depois que o Google “perde a fé” nele.

HTTP Status 20x, 30x, 40x, 50x

Os códigos acima – 200, 301, 302, 404, 502 e 503 – são apenas os mais frequentes e, por consequência, os mais conhecidos. Se você pesquisar a respeito do status HTTP você vai encontrar muitas referências aos códigos 20x, 30x e os demais, pois na verdade eles não são os únicos.

Existem ainda os códigos 201, 202, 303, 307, 403, 410 e vários outros que moram na mesma família, por isso a ideia de representação da “família de códigos” com o X (20x, 30x; às vezes, 4xx). Geralmente, esses todos tem significados próximos.

E o SEO?

Conhecer esses códigos ajuda a refinar análises em casos mais difíceis ou estranhos. Por que o Google não indexa uma página? Por que não atualiza o título ou conteúdo? Por que as páginas estão sumindo?

Conhece alguém que precisa dessas informações? Indique este conteúdo: