Помощ при програмиране, отговори на въпроси / Hadoop Как да управлявате Mahout на Spark - хаоп, apache - spark, mahout

Как да управлявате Mahout на Spark - хаоп, apache-spark, mahout

Наскоро забелязах, че има някоидискусии за изпълнението на Mahout алгоритми върху Spark вместо MapReduce. Въпреки това не можах да намеря някаква документация за това.Може ли някой да ми каже дали е възможно да се изпълняват Mahout алгоритми за Spark? Ако е така, има ли някакво ограничение на алгоритми, че можем да тичам?

Отговори:

2 за отговор № 1

Да, махут сега работи на Spark (т.е. новата версия v0.10.0).

Представените алгоритми за различните двигатели са документирани тук.

Те са достъпни на Spark:

Mahout разпределени BLAS. Distributed Row Matrix API с R и Matlab като оператори. Разпределени ALS, SPCA, SSVD, thin-QR. сходство Анализ. Съвместно филтриране, базирано на потребители / артикули. Naive Bayes Класификация. Стохастичен SVD. PCA (чрез стохастичен SVD). QR Разлагане. RowSimilarityJob.

Ето един от алгоритмите, които могат да се използват:

mahout spark-itemsimilarity           
-i /mnt/similarity/input       
-o /mnt/similarity/output      
--master yarn-client           
-D:spark.executor.instances=10 
-D:spark.executor.cores=8

Свързани въпроси

Как да използвате Mahout в среда на Windows? - прозорци, цигуин, сауоп, махут

Mahout: Как влиянието на маркера на времето има препоръки - timestamp, mahout, mahout-recommender

внедряване на стереотип на потребителски модел в Apache Mahout - препоръчително-двигател, mahout-recommender

mahout препоръчано внедряване като .war файл на 0.9 версия - mahout

Не може да се прочете Mahout генерирани последователни файлове с streamed hadoop - mahout, hadoop-streaming

изграждане на класификатор на текст с помощта на

mahout0.7 все още поддържа клъстерирането в паметта и MR KMeans? - махут, к-средства

как да използвате mahout java api да конвертирате lucene индекс на вектор? - lucene, indexing, mahout

Грешка: java.lang.ClassNotFoundException: org.apache.mahout.common.RandomWrapper - java, maven, hadoop, mahout, netbeans-8

Lanczsos-Eigenvector в Mahout - java, хауоп, махут

Hadoop 2.2.0 е съвместим с Mahout 0.8? - хайоп, махут

Каква е ползата от използването на CDH (cloudera)? [затворен] - хайоп, bigdata, apache-spark, cloudera, cloudera-cdh

Как да започнем развитието на махут - хауоп, цигуин, махут

Махаут "Инверсен" Препоръчител - хайоп, махут

Изпълнява Mahout срещу Hadoop клъстер - хауоп, hdfs, mahout

Има ли начин Spark да чете AWS S3 файлове без да използва Hadoop? - хаоп, амазон-s3, apache-spark

Как RecommenderJob (org.apache.mahout.cf.taste.hadoop.item.RecommenderJob) ще се обади на моите обичайни картографи и редуктори? - хайоп, махут

Използвайки mahout и hadoop - apache, hadoop, cassandra, mahout

Когато тичаш mahout с искрово-артикули, имаш грешка? - apache-spark, mahout, mahout-recommender

Ако вече инсталирах Hadoop, трябва ли да изтегля Apache Spark WITH Hadoop или WITHOUT Hadoop? - apache-spark, hadoop, hadoop3