/ / ¿Cómo utilizar la API de Mahhout Java para convertir el índice lucene a vector? - lucene, indexación, mahout

¿Cómo usar mahout java api para convertir el índice lucene a vector? - lucene, indexación, mahout

Cuando intento convertir el índice lucene a vector, uso la línea de comando /bin/mahout lucene.vector para convertir a archivo de secuencia. ¿Existe una API Java para este tipo de tarea?

Respuestas

0 para la respuesta № 1

Creo que encontré un solución eso podría ayudarme (y a ti) a llegar allí. En Driver.java, hay un main() método que muestra cómo lo hacen. Necesita configurar todas las configuraciones y luego llamar luceneDriver.dumpVectors() que debería volcar a un directorio.


0 para la respuesta № 2

Puede ser demasiado tarde, pero la respuesta se puede encontrar aquí:
https://blog.trifork.com/tag/apache-hadoop/ También ayudará el capítulo seis del libro Taming Text, creo que puedes encontrarlo como un capítulo de ejemplo en la web.

Espero que alguien lo encuentre útil.