Cuando intento convertir el índice lucene a vector, uso la línea de comando
/bin/mahout lucene.vector
para convertir a archivo de secuencia. ¿Existe una API Java para este tipo de tarea?
Respuestas
0 para la respuesta № 1Creo que encontré un solución eso podría ayudarme (y a ti) a llegar allí. En Driver.java, hay un main()
método que muestra cómo lo hacen. Necesita configurar todas las configuraciones y luego llamar luceneDriver.dumpVectors()
que debería volcar a un directorio.
0 para la respuesta № 2
Puede ser demasiado tarde, pero la respuesta se puede encontrar aquí:
https://blog.trifork.com/tag/apache-hadoop/
También ayudará el capítulo seis del libro Taming Text, creo que puedes encontrarlo como un capítulo de ejemplo en la web.
Espero que alguien lo encuentre útil.