Nutch: отримати URL-адреса насіння кожного url - java, nutch, web crawler

Я намагаюся налаштувати Nutch як сканер зображення і вже міг отримати URL-адреси зображення після сканування. Тепер я хочу отримати насіннєвий URL кожного URL-адреси зображення, як це зробити? Дякую!

Відповіді:

0 для відповіді № 1

Спробуйте створити linkdb (перевернутий індекс) з оброблених сегментів, і ви можете отримати URL-адреси "батьків". Якщо в URL-адресі є один з батьків, то це буде насінням цього URL-адреси.
Читайте це і це за допомогою по командах.