/ / Comment analyser et récupérer le sitemap XML nutch - xml, web-crawler, sitemap, nutch

Comment analyser et récupérer XML sitemap nutch - xml, web-crawler, sitemap, nutch

Lorsque Nutch récupère un sitemap, il ne va pas chercher tous les liens dans la balise du sitemap.

Quelle option de configuration dois-je définir pour que Nutch explore et récupère tous les liens mentionnés dans le plan du site?

Réponses:

1 pour la réponse № 1

J'ai trouvé ce lien sur le Wiki Nutch
https://wiki.apache.org/nutch/SitemapFeature


0 pour la réponse № 2

Tu peux voir le question néerlandaise.

Il existe un analyseur de sitemap travaillant pour nutch ici