Je suis nouveau à Nuth.J'ai utilisé Nutch pour explorer un domaine. Maintenant, j'ai besoin de récupérer tous les fichiers html correspondant au domaine dans un dossier distinct. procéder en ligne de commande.
Réponses:
0 pour la réponse № 1Exécutez la commande suivante:
bin/nutch readseg -dump <segmentDir> <outputDir>
et remplacez segmentDir et outputDir par vos répertoires de segment et de sortie (sans "<")