/ / ¿Cómo tratar las consultas de búsqueda que tienen espacios en el lugar equivocado al hacer un motor de búsqueda en un sitio web de comercio electrónico? - java, search, nlp, search-engine, tf-idf

¿Cómo tratar las consultas de búsqueda que tienen espacios en el lugar equivocado al hacer un motor de búsqueda en un sitio web de comercio electrónico? - java, search, nlp, search-engine, tf-idf

Supongamos que tengo una entrada pepe jeans en el sitio web. El usuario busca pepejeans. Actualmente estoy usando la similitud de tf-idf y coseno para devolver los resultados más significativos, pero he mantenido el uso de memoria lo más pequeño posible porque el contenido es grande. Entonces, ¿qué puedo usar para tratar este problema? Una solución es mantener el registro con espacio y sin espacio de todos los ngrams del contenido.

Otro ejemplo- Si el usuario buscatenis Nike. Ahora nike es una marca, pero nikeshoes no es una marca. Si la consulta de búsqueda fue nike shoes, habría devuelto nike como marca. El contenido aquí se refiere a nombres de marca. Estoy tratando de identificar el nombre de la marca de la consulta

Respuestas

0 para la respuesta № 1

La solución típica es hacer una reescritura de consulta.Antes de ejecutar la consulta. Durante la reescritura de la consulta, puede transformar la consulta que dio el usuario en un formulario que funcione mejor para su sistema de recuperación. Esto puede implicar tokenización, derivación, corrección ortográfica y otros tipos de reescrituras.

Para una visión general, ver esta entrada de blog https://hughewilliams.com/2012/03/19/query-rewriting-in-search-engines/