O Google possui algumas diretrizes técnicas e de qualidade que devem ser seguidas pelos desenvolvedores de sites para que se possa ter as páginas catalogadas nas pesquisas. O não cumprimento destas diretrizes pode fazer seu site ser expulso do Google.
Fonte: Google
Diretrizes de conteúdo e design
- Construa um site com uma hierarquia clara e links de texto. Cada página deve ser acessada de pelo menos um link de texto estático.
- Mostre aos usuários um mapa do site que relacione o tópico às partes importantes do seu site. Se o mapa do site tiver mais de 100 links, pode ser aconselhável dividir o mapa em páginas separadas.
- Crie um site útil, com muitas informações e páginas que descrevam de forma clara e precisa o seu conteúdo.
- Pense nas palavras que os usuários digitariam para encontrar as páginas e verifique se elas aparecem no seu site.
- Tente usar texto, em vez de imagens, para exibir nomes, conteúdo ou links importantes. O crawler do Google não reconhece texto contido em imagens.
- Verifique se as tags TITLE e ALT são descritivas e precisas.
- Verifique se há links quebrados e corrija o HTML.
- Se você decidir usar páginas dinâmicas (aquelas em que o URL contém um caractere "?"), saiba que nem todo spider do mecanismo de pesquisa rastreia as páginas dinâmicas tão bem quanto as estáticas. É aconselhável que os parâmetros sejam poucos e curtos.
- Utilize um número razoável de links por página (menos de 100).
Diretrizes técnicas
- Examine seu site com um navegador de texto (por exemplo, o Lynx) porque a maioria dos spiders do mecanismo de pesquisa vê seu site da mesma forma que o Lynx veria. Se recursos especiais como JavaScript, cookies, IDs de sessão, frames, DHTML ou Flash não permitirem que você veja todo o site em um navegador de texto, os spiders do mecanismo de pesquisa poderão ter dificuldade em rastrear seu site.
- Deixe que os bots de pesquisa rastreiem o site sem que IDs de sessão ou argumentos acompanhem suas trajetórias no site. Essas técnicas são úteis para monitorar um determinado comportamento do usuário, mas o padrão de acesso dos bots é completamente diferente. Se você usar essas técnicas, a indexação do site poderá ser incompleta, já que os bots talvez não consigam eliminar os URLs que têm aspecto diferente, mas que apontam para a mesma página.
- Certifique-se de que seu servidor da web suporta o cabeçalho If-Modified-Since HTTP. Esse recurso permite que seu servidor da web informe ao Google se houve alteração no conteúdo desde o último rastreamento do site. A utilização desse recurso lhe permite economizar a transmissão de informações e despesas gerais.
- Use o arquivo robots.txt no seu servidor da web. Esse arquivo informa aos crawlers os diretórios que podem ou não ser rastreados. Certifique-se de que ele esteja disponível no site para que você não bloqueie acidentalmente o crawler do Googlebot. Visite http://www.robotstxt.org/wc/faq.html para saber como instruir os robôs quando visitarem o site. Você pode testar o nosso arquivo robots.txt para ter certeza de que está utilizando-o de maneira correta com a ferramenta de análise do robots.txt, disponível no Google Sitemaps.
- Se sua empresa comprar um sistema de gerenciamento de conteúdo, verifique se ele permite exportar o conteúdo para que os spiders do mecanismo de pesquisa consigam rastrear o site.
Diretrizes de qualidade
As presentes diretrizes de qualidade tratam das formas mais comuns de comportamento fraudulento ou manipulador, mas o Google pode responder de forma negativa a outras práticas enganosas que não estejam listadas aqui (por exemplo, registrar sites com nomes semelhantes aos de sites conhecidos, mas que diferem por um erro de ortografia). O fato de que uma determinada técnica fraudulenta não conste nesta página não significa que ela seja aprovada pelo Google. Os webmasters que se esforçam para manter o espírito dos princípios básicos certamente proporcionarão uma melhor experiência os usuários e, conseqüentemente, obterão melhores classificações que aqueles que passam o tempo à procura de brechas nos programas.
Se você considerar que este site está violando as diretrizes de qualidade do Google, envie um Relatório de Spam em http://www.google.com/contact/spamreport.html. O Google prefere resolver os problemas de forma automatizada e em larga escala, por isso tentamos evitar conflitos pessoais em relação a spams. Os relatórios de spam que recebemos são usados para criar algoritmos de larga escala para reconhecer e bloquear as futuras tentativas de spam.
Diretrizes de qualidade - princípios básicos
- Crie as páginas pensando nos usuários, e não nos mecanismos de pesquisa. Não engane os seus usuários nem apresente aos mecanismos de pesquisa um conteúdo diferente daquele que você exibe aos usuários, o que normalmente é chamado de "cloaking" (camuflagem do conteúdo real da página).
- Evite o uso de truques que visem melhorar a classificação nos mecanismos de pesquisa. Um questionamento importante é: você se sentiria à vontade se tivesse que explicar para um site concorrente aquilo que você fez? Outro teste útil é perguntar a si mesmo: "Isso vai ajudar os meus usuários? Eu faria isso se os mecanismos de pesquisa não existissem?"
- Não participe de esquemas em que os links são usados para aumentar a classificação do seu site ou das páginas com o PageRank. Principalmente, evite links para autores de spam ou para "más vizinhanças" na Web, já que estes tipos de links podem prejudicar a classificação do seu site.
- Não use programas não-autorizados para enviar páginas, verificar classificações, etc. Tais programas consomem recursos de computação e violam os nossos Termos de serviço. O Google não recomenda a utilização de produtos como WebPosition Gold™, que enviam consultas automáticas ou programadas ao Google.
Diretrizes de qualidade - diretrizes específicas
- Evite usar texto ou links ocultos.
- Não utilize técnicas de cloaking (camuflagem do conteúdo real da página) nem faça redirecionamentos não-autorizados.
- Não envie consultas automáticas ao Google.
- Não carregue páginas com palavras irrelevantes.
- Não crie múltiplas páginas, subdomínios ou domínios com conteúdo muito duplicado.
- Não crie páginas que instalem vírus, cavalos de tróia.
- Evite usar páginas "de entrada", criadas apenas em função dos mecanismos de pesquisa, e outras técnicas "pré-fabricadas", como programas de afiliação, que têm pouco ou nenhum conteúdo original.
- Se o seu site participa de um programa de afiliação, certifique-se de que ele agrega valor. Forneça um conteúdo único e relevante, que dê aos usuários um motivo para visitar o seu site primeiro.
|