/ / Come analizzare e recuperare XML sitemap nutch - xml, web crawler, sitemap, nutch

Come analizzare e recuperare XML sitemap nutch - xml, web-crawler, sitemap, nutch

Quando Nutch recupera una Sitemap, non procede a recuperare tutti i collegamenti nel tag nella Sitemap.

Quale opzione di configurazione devo impostare per fare in modo che Nutch esegua la scansione e recuperi tutti i collegamenti menzionati nella Sitemap.

risposte:

1 per risposta № 1

Ho trovato questo link sul Nutch Wiki
https://wiki.apache.org/nutch/SitemapFeature


0 per risposta № 2

Puoi vedere il problema nutch.

Esiste un funzionamento per il parser Sitemap Nutch Qui