domingo, 13 de abril de 2008

Google vai começar a indexar páginas escondidas em formulários

Depois de começar a indexar conteúdo de arquivos em formato PDF, JavaScripts, e até mesmo conteúdos em Flash a equipa do Google está a trabalhar em algoritmos que pesquisa conteúdo escondido em formulários.

In the past few months we have been exploring some HTML forms to try to discover new web pages and URLs that we otherwise couldn't find and index for users who search on Google. Specifically, when we encounter a
element on a high-quality site, we might choose to do a small number of queries using the form.

in Google Webmaster Central

Os algoritmos seleccionam palavras do conteúdo do site e testam-as em caixas de texto (input) e escolhem diversos valores disponíveis para caixas select, check boxes e radio buttons. Se a página apresentada apresentar conteúdo válido, relevante e que ainda não esteja indexado, a indexação será possível.

Mas nem todos os formulários serão alvo desta indexação. Apenas formulários que utilizem o método GET e que não estejam relacionados com Logins, Contactos, Passwords ou qualquer tipo de conteúdo relacionado com dados pessoais de utilizador é que serão alvo desta indexação.

Por outro lado podem-se sempre usar o robots.txt para restringir o acesso ao site aos crawlers dos motores de busca.

Link: http://googlewebmastercentral.blogspot.com

Sem comentários:

Related Posts with Thumbnails