/ / Wie XML XML sitemap analysiert und abgerufen wird - XML, Web-Crawler, Sitemap, Deutsch

Wie zu analysieren und zu holen XML Sitemap nutch - XML, Web-Crawler, Sitemap, nutch

Wenn Nutch eine Sitemap abruft, werden nicht alle Links in dem Tag in der Sitemap abgerufen.

Welche Konfigurationsoption kann ich festlegen, um alle in der Sitemap genannten Links abzurufen und abzurufen.

Antworten:

1 für die Antwort № 1

Ich habe diesen Link im Nutch Wiki gefunden
https://wiki.apache.org/nutch/SitemapFeature


0 für die Antwort № 2

Du kannst das ... sehen niederländische Ausgabe.

Es gibt einen für holländische Sitemap arbeitenden Parser Hier