/ / SolrIndexerJob: java.lang.RuntimeException: trabajo fallido: - apache, nutch

SolrIndexerJob: java.lang.RuntimeException: error de trabajo: - apache, nutch

Los scripts de "rastreo" de Apache nutch fallan al indexar a solr. ¿Alguna idea sobre esto?

IndexingJob: starting
SolrIndexerJob: java.lang.RuntimeException: job failed: name=[myId_1]Indexer, jobid=job_local483340309_0001
at org.apache.nutch.util.NutchJob.waitForCompletion(NutchJob.java:120)
at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:154)
at org.apache.nutch.indexer.IndexingJob.index(IndexingJob.java:176)
at org.apache.nutch.indexer.IndexingJob.run(IndexingJob.java:202)
at org.apache.hadoop.util.ToolRunner.run(ToolRunner.java:70)
at org.apache.nutch.indexer.IndexingJob.main(IndexingJob.java:211)

Respuestas

1 para la respuesta № 1

Este mensaje no es muy informativo, verifique / publique el registro de Solr para ver si hay algún error relevante. Una de las causas habituales de esto es un desajuste entre los esquemas de Nutch y Solr.


0 para la respuesta № 2

1) Debe configurar gora.properties,

2) Además, lo que tenga detrás de Gora (Mongo, HBase, Cassandra, etc.) no responde, por lo que nutch necesita "esperar para completar", así que asegúrese de que esté funcionando.

Asegúrate de eliminar los viejos procesos inactivos con un kill -9 y los viejos procesos java nutch, y reinicia si no puedes encontrarlos (con suerte no llegará a eso ...)