/ / Error en la ejecución de Apache nutch-2.2.1 - java, apache, hadoop, nutch

Error en la ejecución de Apache nutch-2.2.1 - java, apache, hadoop, nutch

He instalado Nutch 2.2.1 en Ubuntu 12.04 pero al ejecutar el comando ./nutch crawl urls / -dir download / -depth 3 -topN 5

Obtuve el siguiente error:-

InjectorJob: Usando la clase org.apache.gora.memory.store.MemStore como la clase de almacenamiento Gora. InjectorJob: número total de urls rechazadas por los filtros: 0 InjectorJob: número total de urls inyectados después de la normalización y el filtrado: 0 Excepción en el subproceso "main" java.lang.RuntimeException: error en el trabajo: nombre = generar: nulo, jobid = trabajo_local1165582916_0002 en org.apache.nutch.util.NutchJob.waitForCompletion (NutchJob.java:54) en org.apache.nutch.crawl.GeneratorJob.run (GeneratorJob.java:199) en org.apache.nutch.crawl.Crawler.runTool (Crawler.java:68) en org.apache.nutch.crawl.Crawler.run (Crawler.java:152) en org.apache.nutch.crawl.Crawler.run (Crawler.java:250) en org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:65) en org.apache.nutch.crawl.Crawler.main (Crawler.java:257)

Respuestas

3 para la respuesta № 1

El comando / bin / nutch crawl está en desuso. Deberías usar / bin / crawl en su lugar.