/ / Ako analyzovať a načítať maticu XML sitemap - xml, webový prehľadávač, sitemap, nutch

Ako analyzovať a načítať XML Sitemap nutch - xml, web-crawler, sitemap, nutch

Keď Nutch načíta súbor Sitemap, nepôjde do neho načítať všetky odkazy v značke v súbore Sitemap.

Akú konfiguračnú možnosť nastavím na prehľadávanie a získavanie všetkých odkazov uvedených v súbore Sitemap.

odpovede:

1 pre odpoveď č. 1

Tento odkaz som našiel na Nutch Wiki
https://wiki.apache.org/nutch/SitemapFeature


0 pre odpoveď č. 2

Môžete vidieť orechový problém.

Existuje syntaktický analyzátor súboru Sitemap pre matice tu