/ / Lucene Konfiguration für verschiedene Sprachen - Lucene

Lucene Konfiguration für verschiedene Sprachen - Lucene

Ich bin interessiert zu lernen, wie Lucenekonfiguriert für verschiedene Sprachen. Gibt es eine Möglichkeit zu wissen, wie der Tokenizer konfiguriert ist und welche Zeichen als Teil von Wörtern betrachtet werden und welche nicht?

Antworten:

0 für die Antwort № 1

Lucene ist standardmäßig nicht zur Verarbeitung konfiguriertSprachen. Es liegt an Ihnen, meinen Ratschlag zu geben, mehrere Sprachen in verschiedenen Dokumentenfeldern für jede Sprache zu indizieren und jedes Mal die richtigen Analysatoren zu verwenden.

Daher hat Lucene keine Standardkonfiguration dafür, aber wenn Sie Elasticsearch oder Solr verwenden, kann es sein. Verwenden Sie Lucene sofort?

Grüße,