私はHadoopに不慣れで、Mongodb上の3つのコレクションを組み合わせたデータを分析するためのアプリケーションを計画し始めました。 Mongodb river for elasticsearch
しかし、私はHbaseやHDFSにデータをストリーミングする方法を見つけませんでした、私はSqoopとFlumeを見つけました、しかし、これが私が探していたのと同じであるかどうか知りません 私の見方は、それはのようになります http api -> something here -> Hadoop storage
。私のためにこれを行うことができる何かがありますか?
回答:
回答№1は0ストリーミングアセンブリを試してください。
ストリーミングアセンブリはMapReduceを書くことを可能にしますJavaではなくPython、Ruby、JavaScriptなどの言語でジョブを処理するため、MongoDBや一般的な動的プログラミング言語に精通している開発者は、Hadoopの機能を簡単に利用できます。
詳細はこちら 訪問.