/ / Comment traiter les requêtes de recherche comportant des espaces au mauvais endroit tout en créant un moteur de recherche pour un site de commerce électronique - java, recherche, nlp, moteur de recherche, tf-idf

Comment traiter les requêtes de recherche comportant des espaces au mauvais endroit tout en créant un moteur de recherche pour un site Web de commerce électronique? - java, recherche, nlp, moteur de recherche, tf-idf

Supposons que j'ai un pepe jeans d'entrée sur le site. L'utilisateur cherche pepejeans. J'utilise actuellement les similitudes tf-idf et cosinus pour obtenir les résultats les plus significatifs, mais j'ai aussi minimisé que possible l'utilisation de la mémoire car le contenu est volumineux. Alors, que puis-je utiliser pour traiter ce problème? Une solution consiste à conserver l'enregistrement avec de l'espace et sans espace de tous les ngrammes du contenu.

Un autre exemple- Si l'utilisateur rechercheNikeshoes. Maintenant, Nike est une marque, mais Nikeshoes n'est pas une marque. Si la requête de recherche portait sur nike shoes, elle aurait rendu nike en tant que marque. Le contenu ici fait référence à des noms de marques. J'essaie d'identifier le nom de marque à partir de la requête

Réponses:

0 pour la réponse № 1

La solution typique est de faire une réécriture de requêteavant d'exécuter la requête. Lors de la réécriture de la requête, vous pouvez transformer la requête émise par l'utilisateur en un formulaire plus adapté à votre système de récupération. Cela peut impliquer la création de jetons, la création de raccourcis, la vérification orthographique et d'autres types de réécriture.

Pour un aperçu, voir cet article de blog https://hughewilliams.com/2012/03/19/query-rewriting-in-search-engines/