/ / Mejor integración de Tika en Solr o Nutch - solr, nutch, apache-tika

La mejor integración de Tika en Solr o Nutch - solr, nutch, apache-tika

¿Cuál es la mejor integración para Apache Tika suponiendo que ya conecté y usé Nutch (2.2.1) + Solr (4.3)?

Entiendo que Tika puede integrarse dentro de Nutch y / o Solr, pero ¿cuál es la mejor decisión?

Respuestas

1 para la respuesta № 1

Configure el complemento Tika con Nutch, Nutch analizará los datos por usted y hará todo el trabajo duro por usted.

También sugeriría configurarlo en Solr, es posible que desee enviar documentos a Solr a través de curl comando y sería útil tenerlo configurado en Solr también. Viene con poca configuración adicional y sin costos de rendimiento:

Hay una guía para configurar Tika y extraer el manejador de solicitudes aquí


0 para la respuesta № 2

Aplique el analizador tika en la fase de análisis de Nutch.