Имам академичен курс "Middleware", койтообхваща различни аспекти на разпределените софтуерни системи, включително запознаване с теми като [таг: Разпределена файлова система]. Това включва и запознаване с hbase,Hadoop,MapReduce,hiveql,piglatin, Искам да знам, мога ли да имам малък проект, който се опитва да интегрира горните технологии. Като за начало съм наясно VM предоставена от cloudera за усещането Hadoop и да играете наоколо, използвайки Eclipse. Мислех по линиите на прилагане на приложение, което приема поток от събития като вход, анализира това и дава резултат.
имам и двете прозорци/Linux на моята машина с i7 procoessor и 4Gb Ram.
Моля, уведомете ме как да започнете с всичко и всякакви предложения за просто примерно приложение са добре дошли.
Отговори:
1 за отговор № 1Тук е публикация в блога за анализиране на туитове с помощта на Hive / HDFS. И тук е публикация в блога за извършване на Clickstream анализи с помощта на Pig and Hive.
Вижте някои от случаите на използване на големи данни тук и се опитайте да решите интересен проблем.