Когато се опитам да конвертирате lucene индекс към вектор, аз използвам команден ред
/bin/mahout lucene.vector
, за да конвертирате в последователен файл. Има ли Java API за този вид задачи?
Отговори:
0 за отговор № 1Мисля, че намерих решение това може да ми помогне (и ти) да стигнем там. В Driver.java има a main()
метод, който показва как те го правят. Трябва да настроите всички конфигурации и след това да се обадите luceneDriver.dumpVectors()
които трябва да изхвърлят в директория.
0 за отговор № 2
Може да е късно, но отговорът може да бъде намерен тук:
https://blog.trifork.com/tag/apache-hadoop/
също глава шеста в книгата Укротяване на текст ще помогне, мисля, че можете да го намерите като пример глава в интернет.
Надявам се, че някой ще го намери за полезен.