Я рассматриваю различные технологии для хранилищ данных и бизнес-аналитики и наткнулся на этот радикальный инструмент под названием Hadoop. Кажется, что Hadoop не совсем создан для целей бизнес-аналитики, но есть упоминания о его потенциале в этой области. (http://www.infoworld.com/d/data-explosion/hadoop-pitched-business-intelligence-488).
Как бы мало информации я ни получил из Интернета, мое чутье подсказывает мне, что hadoop может стать прорывной технологией в пространстве традиционных решений бизнес-аналитики. По этой теме действительно мало информации, и поэтому я хотел собрать здесь все мысли гуру о потенциале Hadoop как инструмента бизнес-аналитики по сравнению с традиционной внутренней инфраструктурой бизнес-аналитики, такой как Oracle Exadata, vertica и т. Д.. Для начала я хотел бы задать следующий вопрос -
- Рекомендации по проектированию. Чем разработка решения бизнес-аналитики с помощью Hadoop будет отличаться от традиционных инструментов? Я знаю, что все должно быть по-другому, поскольку я читал, что в Hadoop нельзя создавать схемы. Я также читал, что основным преимуществом будет полное устранение инструментов ETL для Hadoop (это правда?). Нужен ли нам Hadoop + pig + mahout для получения решения BI?
С уважением!
Изменить - разбить на несколько вопросов. Начну с того, что я считаю наиболее импозантным.