/ / Meilleure intégration de Tika sur Solr ou Nutch - solr, nutch, apache-tika

Meilleure intégration Tika sur Solr ou Nutch - solr, nutch, apache-tika

Quelle est la meilleure intégration pour Apache Tika en supposant que je me suis déjà connecté et utilisé Nutch (2.2.1) + Solr (4.3)?

Je comprends que Tika peut être intégré dans Nutch et / ou Solr, mais quelle est la meilleure décision?

Réponses:

1 pour la réponse № 1

Configurez le plugin Tika avec Nutch. Nutch analysera les données pour vous et fera tout le travail difficile pour vous.

Je suggérerais également de l’installer sur Solr, vous pouvez envoyer des documents à Solr via le curl commande et il serait utile de l’installer également sur Solr. Il vient avec peu de configuration supplémentaire et pas de coûts de performance:

Il existe un guide pour configurer Tika et extraire le gestionnaire de requêtes ici


0 pour la réponse № 2

Appliquez l’analyseur tika lors de la phase d’analyse de Nutch.