Podľa môjho názoru nie je múdre.
napr. skontroluj to:
http://edition.cnn.com/robots.txt
http://www.bbc.co.uk/robots.txt
http://www.guardian.co.uk/robots.txt
podľa toho:
http://www.joomla.org/robots.txt
Joomla.org nezmenil predvolený priečinok pre správu: D
Napr. stránka prestashp obsahuje prázdny súbor robots.txt, ktorý nie je dokonalý, ale podľa môjho názoru aspoň lepší:
http://www.prestashop.com/robots.txt
Sú títo ľudia hlúpi alebo si myslia, že je v poriadku vedieť, ako vyzerá webová štruktúra?
Prečo nepoužívajú htaccess na odmietnutie prístupu robotom atď.?
odpovede:
1 pre odpoveď č. 1Problém je, že .htaccess
nedokážu intuitívne povedať, že návštevník je robot vyhľadávacieho nástroja.
Väčšina robotov sa identifikuje v reťazci user-agent, ale niektorí nevyhrajú.
Robots.txt je prístupný všetkým robotom, ktorí sa snažia indexovať web, a bezohľadní roboti sa nezúčastnia
- Identifikujte sa ako robot
- Venujte zvýšenú pozornosť súboru robots.txt (alebo ho úmyselne neposlúchajú).