मैं सीखने में इंटरेस्टेड हूं कि कितनी लाजवाब हैविभिन्न भाषाओं के लिए विन्यास। क्या यह जानने का कोई तरीका है कि टोकन को कैसे कॉन्फ़िगर किया गया है और किन वर्णों को शब्दों का हिस्सा माना जाता है और कौन सा नहीं?
उत्तर:
जवाब के लिए 0 № 1लुसेन को डिफ़ॉल्ट रूप से संभालने के लिए कॉन्फ़िगर नहीं किया गया हैभाषाओं। यह आप पर निर्भर है, मेरी सलाह होगी कि विभिन्न दस्तावेज़ क्षेत्रों में कई भाषाओं को सूचीबद्ध करें, प्रत्येक भाषा के लिए, और हर बार उचित एनालाइज़र का उपयोग करें।
तो इसके लिए Lucene का कोई डिफ़ॉल्ट कॉन्फ़िगरेशन नहीं है, लेकिन यदि आप "Elasticsearch या Solr का उपयोग कर रहे हैं, तो हो सकता है। क्या आप Lucene का उपयोग बॉक्स से बाहर कर रहे हैं?
सादर,