Разбирам, че пълното текстово индексиране и търсенеза база данни може да бъде разрешена от много предварително опаковани продукти. Въпреки това, просто от академично любопитство се чудя как действително се прилагат тези пълни текстови индекси. Аз се опитах да Google за резултати с малък отговор. Моля, всяка обратна връзка ще бъде много оценявам.
Отговори:
3 за отговор № 1Търсенията в пълен текст се поддържат от доста двигатели на бази данни в наши дни като основна функция.
Що се отнася до изпълнението мисля, че най-добре е да проверите postgres търсене в пълен текст, както можеш
- намерете много материал за това как се прилага
- всъщност се променя и играе с парсерите (например оптимизиране за определен домейн)
Има още подробности и концепция, обяснени в Уикипедия:
- пълни текстови индексии можете да проверите
- с отворен код и безплатни търсачки с пълен текст както обикновено ще намерите подкрепяща документация, обясняваща и вътрешната работа на тези хора (за това съм чувал добри неща Lucene / Solr от този списък)
-1 за отговор № 2
Вероятно чрез създаване на речници на "думи" и може би малко на лексикален анализ. (Обърнете внимание, че пълният текст търси цели думи, а не части от думи, така че индексирането може да бъде ограничено до това.)