/ / Melhor integração de Tika em Solr ou Nutch - solr, nutch, apache-tika

Melhor integração Tika em Solr ou Nutch - solr, nutch, apache-tika

Qual é a melhor integração para o Apache Tika supondo que eu já conectei e usei o Nutch (2.2.1) + Solr (4.3)?

Eu entendo que a Tika pode ser integrada dentro da Nutch e / ou da Solr, mas qual é a melhor decisão?

Respostas:

1 para resposta № 1

Configure o plugin Tika com Nutch, Nutch irá analisar os dados para você e fará todo o trabalho duro para você.

Gostaria de sugerir a configuração no Solr também, você pode querer enviar documentos para Solr através do curl comando e ajudaria a configurá-lo em Solr também. Ele vem com pouca configuração extra e sem custos de desempenho:

Existe um guia para configurar o Tika e extrair o manipulador de pedidos Aqui


0 para resposta № 2

Aplique o analisador de tika na fase de análise de Nutch.