/ / Бореться між Job та JobConf під час використання TableMapReduceUtil та MultipleOutputFormat - java, hadoop, mapreduce

Боротьба між Job і JobConf при використанні TableMapReduceUtil і MultipleOutputFormat - java, hadoop, mapreduce

Я намагаюся прочитати таблицю HBaseTableMapReduceUtil і скидайте дані в HDFS (не запитайте мене, чому. Це набридло, але не маєте жодної іншої можливості). Отже, щоб досягти цього, я хочу маніпулювати кінцевими іменами файлів (випромінюваними редуктором) w.r.t ключем редуктора.

З боку картографа мені вдалося скинути htbase rotryingws до HDFS у замовчуванні. Але щоб перекрити формат вихідного файлу редуктора (назва відповідно до клавіші), я це зрозумів MultipleOutputFormat клас для редуктора (який відсутній на 0.20 через якийсь інтерфейс заплутався, читайте десь), а старий приймає лише JobConf. Але якщо я спробую написати код зі старим JobConf, Я не в змозі використовувати HBase 0,90 "s TableMapReduceUtil який бере лише Робота клас

Не маю багато рук з Hadoop / HBase. Провів деякий час, змінюючи існуючі MRJObs. Здається, я застряг у своєму підході.

Версії Hadoop-Core-0.20 .; HBase 0.90.1

Дякую Панкай

Відповіді:

1 для відповіді № 1

Я не в змозі використовувати таблицю HBase 0,90 "TableMapReduceUtil, яка приймає лише клас" Робота ".

Існує org.apache.hadoop.hbase.mapred.TableMapReduceUtil і org.apache.hadoop.hbase.mapreduce.TableMapReduceUtil заняття. Перший візьме JobConf (старий MR API), а другий - Job (новий MR API). Використовуйте відповідний клас TableMapReduceUtil.