/ / XMLサイトマップナットを解析および取得する方法-xml、web-crawler、sitemap、nutch

どのようにXML sitemapを解析して取り出すかnutch-xml、web-crawler、sitemap、nutch

Nutchがサイトマップを取得するとき、サイトマップ内のタグ内のすべてのリンクを取得することはありません。

nutchをクロールし、サイトマップに記載されているすべてのリンクを取得するために、どの構成オプションを設定しますか。

回答:

回答№1は1

Nutch Wikiでこのリンクを見つけました
https://wiki.apache.org/nutch/SitemapFeature


回答№2の場合は0

あなたは ナットの問題.

nutchサイトマップパーサーの機能があります ここに