/ / Erreur d'exécution d'Apache nutch-2.2.1 - java, apache, hadoop, nutch

Erreur d'exécution d'Apache nutch-2.2.1 - java, apache, hadoop, nutch

J'ai installé Nutch 2.2.1 dans Ubuntu 12.04 mais en exécutant la commande ./nutch urls urls / -dir télécharger / -depth 3 -topN 5

Je reçois l'erreur suivante: -

InjectorJob: utilisation de la classe org.apache.gora.memory.store.MemStore en tant que classe de stockage Gora. InjectorJob: nombre total d'URL rejetées par les filtres: 0 InjectorJob: nombre total d'URL injectées après normalisation et filtrage: 0 Exception dans le thread "principal" java.lang.RuntimeException: échec du travail: nom = générer: null, id_travail = job_local1165582916_0002 à org.apache.nutch.util.NutchJob.waitForCompletion (NutchJob.java:54) à org.apache.nutch.crawl.GeneratorJob.run (GeneratorJob.java:199) à org.apache.nutch.crawl.Crawler.runTool (Crawler.java:68) à org.apache.nutch.crawl.Crawler.run (Crawler.java:152) à org.apache.nutch.crawl.Crawler.run (Crawler.java:250) à org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:65) à org.apache.nutch.crawl.Crawler.main (Crawler.java:257)

Réponses:

3 pour la réponse № 1

L'analyse / bin / nutch crawl est obsolète. Vous devriez plutôt utiliser / bin / crawl.