/ / Cómo analizar y recuperar el mapa del sitio XML nutch - xml, web-crawler, sitemap, nutch

Cómo analizar y recuperar XML sitemap nutch - xml, web-crawler, sitemap, nutch

Cuando Nutch recupera un mapa del sitio, no continúa recuperando todos los enlaces en la etiqueta en el mapa del sitio.

¿Qué opción de configuración configuro para que nutch rastree y busque todos los enlaces mencionados en el mapa del sitio?

Respuestas

1 para la respuesta № 1

Encontré este enlace en Nutch Wiki
https://wiki.apache.org/nutch/SitemapFeature


0 para la respuesta № 2

Puedes ver el problema de nutch.

Hay un analizador de mapa de sitio de nutch funcionando aquí