/ / Как да анализираме и извлечем XML гайка за карта на сайта - xml, уеб-търсачка, sitemap, nutch

Как да анализирам и извличам XML Sitemap nutch - xml, web-crawler, карта на сайта, nutch

Когато Nutch извади карта на сайта, тя не отива напред до получаване на всички връзки в маркера в сайта.

Каква опция за конфигуриране да настроя, за да накарам гайка и да извлека всички връзки, споменати в Sitemap.

Отговори:

1 за отговор № 1

Намерих тази връзка в Nutch Wiki
https://wiki.apache.org/nutch/SitemapFeature


0 за отговор № 2

Можете да видите въпрос на гайка.

Има работа за анализатор на сайта за орехови карти тук