/ / Найкраща інтеграція Тіка на Solr або Nutch - solr, nutch, apache-tika

Найкраща інтеграція Tika на Solr або Nutch - solr, nutch, apache-ті

Яка найкраща інтеграція для Apache Tika припускаючи, що я вже підключений і використовував Nutch (2.2.1) + Solr (4.3)?

Я розумію, що Tika може бути інтегрована в Nutch та / або Solr, але яке з них є найкращим рішенням?

Відповіді:

1 для відповіді № 1

Налаштуйте Tika плагін з Nutch, Nutch буде аналізувати дані для вас і буде робити всю важку роботу за вас.

Я б запропонував встановити його на Solr, а також, ви можете відправити документи в Solr через curl команді, і це допомогло б встановити на Solr теж. Він має невелику додаткову конфігурацію та не потребує витрат на продуктивність:

Існує керівництво по налаштуванню Tika & вилучення обробника запитів тут


0 для відповіді № 2

Застосовуйте синтаксичний аналізатор у фазі розбору Nutch.