/ / Erro na execução do Apache nutch-2.2.1 - java, apache, hadoop, nutch

Erro na execução do Apache nutch-2.2.1 - java, apache, hadoop, nutch

Instalei o Nutch 2.2.1 no Ubuntu 12.04, mas ao executar o comando URLs de rastreamento ./nutch / -dir download / -thth 3 -topN 5

Estou tendo o erro a seguir:-

InjectorJob: Usando a classe org.apache.gora.memory.store.MemStore como a classe de armazenamento Gora. InjectorJob: número total de URLs rejeitados pelos filtros: 0 InjectorJob: número total de URLs injetados após normalização e filtragem: 0 Exceção no encadeamento "main" java.lang.RuntimeException: job falhou: name = generate: null, jobid = job_local1165582916_0002 em org.apache.nutch.util.NutchJob.waitForCompletion (NutchJob.java:54) em org.apache.nutch.crawl.GeneratorJob.run (GeneratorJob.java:199) em org.apache.nutch.crawl.Crawler.runTool (Crawler.java:68) em org.apache.nutch.crawl.Crawler.run (Crawler.java:152) em org.apache.nutch.crawl.Crawler.run (Crawler.java:250) em org.apache.hadoop.util.ToolRunner.run (ToolRunner.java:65) em org.apache.nutch.crawl.Crawler.main (Crawler.java:257)

Respostas:

3 para resposta № 1

O rastreamento de comando / bin / nutch foi descontinuado. Você deve usar / bin / crawl.