С чего начать работу с распределенными вычислениями?

Я заинтересован в изучении методов распределенных вычислений. Как разработчик Java я, вероятно, захочу начать с Hadoop. Не могли бы вы порекомендовать какие-нибудь книги/учебники/статьи для начала?


person folone    schedule 12.05.2010    source источник


Ответы (7)


Может быть, вы можете сначала прочитать некоторые документы, связанные с MapReduce и распределенными вычислениями, чтобы лучше понять это. Вот некоторые из них, которые я хотел бы порекомендовать:

С другой стороны, если вы хотите узнать больше о Hadoop, возможно, вы можете начать читать исходный код фреймворка Hadoop MapReduce.

person ZelluX    schedule 12.05.2010


Hadoop не обязательно лучший инструмент для решения всех задач распределенных вычислений. Несмотря на свою мощность, он также имеет довольно крутую кривую обучения и стоимость владения. Возможно, вы захотите уточнить свои требования и поискать подходящие альтернативы в мире Java, например HTCondor. , JPPF или GridGain (извиняюсь перед теми, кого не упомянул).

person Lolo    schedule 06.04.2013

Вот некоторые ресурсы от Yahoo! Сеть разработчиков

учебник:

http://developer.yahoo.com/hadoop/tutorial/

вводный курс (требуется Siverlight, вздох):

http://yahoo.hosted.panopto.com/CourseCast/Viewer/Default.aspx?id=281cbf37-eed1-4715-b158-0474520014e6

person David M    schedule 12.05.2010

Подкаст All Things Hadoop http://allthingshadoop.com/podcast имеет хороший контент и хороших гостей. Многие из них предназначены для начала работы с распределенными вычислениями.

person Joe Stein    schedule 21.05.2010

MIT 6.824 — лучший вариант. Недостаточно только читать документы Google, связанные с Hadoop. Систематическое изучение курса требуется, если вы хотите пойти глубже.

person Jingguo Yao    schedule 04.04.2013

Если вы хотите изучить платформу распределенных вычислений, которая менее сложна, чем Hadoop, вы можете попробовать Zillabyte. Вам нужно только немного знать Ruby или Python, чтобы создавать приложения на платформе.

Как сказал LoLo, Hadoop — мощное решение, но с ним может быть сложно начать.

Материалы для изучения распределенных вычислений см. на странице http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/ . Курс также рекомендует несколько ресурсов.

person CBlock811    schedule 25.09.2014