/ / Помилка Nutch Немає агентів, зазначених у "http.agent.name" - apache, веб-сканер, гайка

Помилка Nutch Немає агенцій, перелічених у "http.agent.name" - apache, веб-сканер, nutch

Я використовую горіх2.2.1. Файл журналу генерує наступну помилку

Протокол ERROR.RobotRulesParser - агент, який ми рекламуємо (nutch-spider-2.2.1), не вказаний першим у власності "http.robots.agents"!

Мій горіх-site.xml (для вищевказаного властивості)

<property>
<name>http.agent.name</name>
<value>nutch-spider-2.2.1</value>
</property>

мій горіх-default.xml є

<property>
<name>http.agent.name</name>
<value></value>
</property>

Де актуальна проблема? Будь ласка, керуйтеся ним чітко (правильно пояснення). Це питання розміщено тут але я мушу охарактеризувати це запитання (за потреби), що тому опублікувати його ще раз.

Відповіді:

3 для відповіді № 1

Ви повинні додати властивість "http.robots.agents" і вказати значення http.agent.name як ім'я першого агента, а зберегти за замовчуванням * в кінці list.just як:

<property>
<name>http.robots.agents</name>
<value>nutch-spider-2.2.1,*</value>
</property>