Lorsque Nutch récupère un sitemap, il ne va pas chercher tous les liens dans la balise du sitemap.
Quelle option de configuration dois-je définir pour que Nutch explore et récupère tous les liens mentionnés dans le plan du site?
Réponses:
1 pour la réponse № 1J'ai trouvé ce lien sur le Wiki Nutch
https://wiki.apache.org/nutch/SitemapFeature
0 pour la réponse № 2
Tu peux voir le question néerlandaise.
Il existe un analyseur de sitemap travaillant pour nutch ici