मैं समझता हूं कि पूर्ण पाठ अनुक्रमण और खोजएक डेटाबेस के लिए कई पूर्व-पैक उत्पादों द्वारा सक्षम किया जा सकता है। हालांकि, अकादमिक जिज्ञासा से बाहर, मुझे आश्चर्य है कि वास्तव में उन पूर्ण पाठ अनुक्रमित कैसे होते हैं। मैंने कम उत्तर वाले परिणामों के लिए Google पर प्रयास किया है। कृपया किसी भी प्रतिक्रिया बहुत सराहना की जाएगी।
उत्तर:
जवाब के लिए 3 № 1पूर्ण पाठ खोजों को इन दिनों कोर फीचर के रूप में काफी कुछ डेटाबेस इंजनों द्वारा समर्थित किया जाता है।
कार्यान्वयन के लिए मुझे लगता है कि आपका सबसे अच्छा दांव पोस्टग्रेज की जांच करना है पूर्ण पाठ खोज, जैसे आप कर सकते हैं
- इसे कैसे लागू किया जाता है, इस पर बहुत सारी सामग्री खोजें
- वास्तव में पार्सर के साथ बदलें और खेलें (उदाहरण के लिए कुछ डोमेन के लिए अनुकूलन)
विकिपीडिया पर आगे विवरण और अवधारणा बताई गई है:
- पूर्ण पाठ अनुक्रमणिका, और आप भी देख सकते हैं
- खुला स्रोत और मुफ्त पूर्ण पाठ खोज इंजन आम तौर पर आप उन लोगों के आंतरिक कामकाज के बारे में बताते हुए सहायक दस्तावेज पाएंगे (मैंने इनके बारे में अच्छी बातें सुनी हैं Lucene / Solr इस सूची से)
उत्तर № 2 के लिए -1
संभवत: "शब्दों" के शब्दकोश का निर्माण करके और शायद थोड़ा सा लेक्सिकल विश्लेषण। (ध्यान दें कि फुलटेक्स्ट पूरे शब्दों को खोजता है न कि शब्दों के हिस्सों को, इसलिए इंडेक्सिंग उस पर विवश हो सकती है।)