Curiosidade: robots.txt da Casa Branca

Estava procurando algumas informações sobre o arquivo robots.txt, que serve para você controlar o acesso que os robôs dos mecanismos de busca têm a seu site - indicando assim o que eles devem ou não indexar - e sem querer encontrei o robots.txt da Casa Branca, do governo dos Estados Unidos da América.

Alguém com mais tempo talvez encontre alguma coisa interessante por ali.

Não deve ser importante. Apenas achei curioso e que aqueles que já tem um pouco mais de conhecimento sobre o uso do robots.txt para melhorar os resultados do blog nas pesquisas gostariam de dar uma boa olhada.

Atualização: o robots.txt do Governo Brasileiro e o da presidência do Brasil

Atualização 2: veja também o robots.txt do site Governo Americano (só para ficar claro, o site da Casa Branca é uma coisa e o do do governo é outro)

5 comentários ↓

#1 Thássius V' em 18.3.2008 às 3:01 pm

Bloquearam praticamente tudo.

#2 Thássius V' em 18.3.2008 às 3:02 pm

E também não sabem usar os *’s. Várias linhas poderiam ter sido suprimidas se eles tivessem usado o ‘coringa’ para bloquear diretório e subdiretórios inteiros.

#3 Alessandro Martins em 18.3.2008 às 3:06 pm

E você viu a do governo brasileiro? Está tudo bloqueado para indexação… no entanto, ainda assim, se você procurar o site está indexado… curioso.

#4 Diego em 20.3.2008 às 6:45 pm

Que medo do Google hein…

#5 Alessandro Martins em 24.3.2008 às 11:34 am

Acho que é mais uma estratégia para não ter conteúdo duplamente indexado ou algo assim, Diego…

Deixe um comentário