Что такое хранилище данных?

Клиент спросил меня, что на самом деле означает термин «хранилище данных».

Я думал об ETL, деталях модели данных, отличиях от NoSQL, облаках, «обычных» СУБД, MDM (Master Data Management) и т. д., но не смог описать ему этот термин в нескольких словах... (В на самом деле я немного поговорил и оставил его без освещения.)

Как можно описать "хранилище данных" в 1-3 (или чуть больше) предложениях?


person FloE    schedule 22.06.2010    source источник
comment
investinganswers.com/dictionary/d/data-warehousing   -  person Shiwangini    schedule 10.05.2020


Ответы (12)


Для нетехнических парней лучше всего описать это как «Огромный объем данных, хранящихся в специализированной компьютерной системе. Данные обычно связаны с какой-то конкретной областью, и вся система спроектирована так, чтобы быть быстрой и оптимизированной для некоторых специальных задач. Данные хранятся в хранилищах данных, в основном используются для анализа или в процессах принятия решений."

Не уверен, что этого достаточно :) В Интернете есть много ссылок на эту тему, но если бы кто-то попросил меня дать быстрое определение, я бы использовал что-то похожее на то, что я написал выше.

person dzida    schedule 22.06.2010

Из вики:

Хранилище данных — это хранилище данных организации, хранящихся в электронном виде, предназначенное для облегчения создания отчетов и анализа 1.

Это определение хранилища данных фокусируется на хранении данных. Однако средства извлечения и анализа данных, извлечения, преобразования и загрузки данных, а также управления словарем данных также считаются важными компонентами системы хранения данных. Многие ссылки на хранилища данных используют этот более широкий контекст. Таким образом, расширенное определение хранилища данных включает инструменты бизнес-аналитики, инструменты для извлечения, преобразования и загрузки данных в репозиторий, а также инструменты для управления и извлечения метаданных.

person Mitch Wheat    schedule 22.06.2010

По крайней мере, теоретически идея хранилища данных состоит в том, чтобы обеспечить консолидированное представление данных из множества существующих систем, которые обычно считается нецелесообразным переписывать для непосредственной консолидации данных. Таким образом, хранилище данных собирает данные из этих существующих систем и обеспечивает (по крайней мере, иллюзию) того, что все данные находятся в одном месте, поэтому их можно запрашивать одним способом.

Основная цель (обычно) состоит в том, чтобы обеспечить корреляцию между данными из существующих систем. Например, вы можете сравнить, сколько времени ваш продавец провел с покупателем X (это хранится в одной системе) с тем, сколько клиент X купил (хранится во второй системе) и насколько клиент X доволен тем, что он получает (хранится, конечно, в третьей системе).

С практической точки зрения это часто означает, что идеи клиента находятся где-то между плохо определенными и полностью безумными. О стоимости и графике почти невозможно даже догадаться, а твердая оценка явно невозможна. Доставить то, что он действительно хочет, почти наверняка невозможно, а придумать что-то, что будет полезно, займет достаточно времени и работы, поэтому ваш первый шаг — сделать то, что вы делаете, достаточно техническим, чтобы у него не хватило сердца. атаковать, когда он получает представление о стоимости и / или графике.

person Jerry Coffin    schedule 22.06.2010

Ничего себе, я проводил некоторые исследования. Это действительно хороший ответ, с которым я столкнулся:

Хранилище данных ... является воспроизведенной версией транзакций данных, которые специально структурированы и созданы для запросов, анализа и отчетности. В очень простом определении термин «хранилище данных» относится к процессу систематического сбора данных, которые хранятся в организованном порядке, чтобы к ним можно было получить доступ и извлечь их для будущих отчетов и анализа документов.

Это из Хранилище данных 100 секретов успеха" Ричарда Мартина

person Irwin    schedule 01.05.2013

Хранилище данных — это попытка сделать разрозненные системы однородными, независимо от базовой технологии или механизма хранения.

Вы могли бы разобраться в том, «почему» хранение данных, но это другой вопрос.

person Serapth    schedule 22.06.2010

Хранилище данных — это база данных, система загрузки данных и отчетности, предназначенная для агрегирования данных из нескольких источников и представления их таким образом, чтобы их было легко извлекать и составлять отчеты. С практической точки зрения преимущества успешного проекта хранилища данных заключаются в следующем:

  • Статистическая и финансовая отчетность. Хранилища данных упрощают работу с совокупными данными и получение из них полезного анализа, особенно при наличии 65537 и более строк данных.

  • Безопасность данных - данные хорошо себя ведут и не имеют ловушек для молодых игроков. Специальные системы отчетов могут использоваться неопытными пользователями с низким риском получения неверных результатов в отчетах без их ведома.

  • Прозрачность — бизнес может видеть и выявлять проблемы с данными в базовых системах. Хранилище данных может быть хорошим инструментом для управления качеством данных.

  • Расширение возможностей — средства создания отчетов для конечного пользователя должны поддерживать большинство требований к управленческой информации с минимальным набором требований, требующих разработки специального отчета техническим специалистом.

person ConcernedOfTunbridgeWells    schedule 23.06.2010

ЦЕЛОВАТЬ...

Хранилище данных — это хранилище данных, относящихся к данной организации и ее деятельности. Эти данные позволят анализировать и составлять отчеты о производительности организации по различным соответствующим параметрам, таким как время, структура, потоки деятельности. Эти измерения можно комбинировать, а результаты агрегировать с помощью соответствующих иерархий.

person bochgoch    schedule 23.06.2010

С практической точки зрения: бизнес меняется, среда меняется, то, что было важным вопросом вчера, может не быть сегодня и, скорее всего, не будет завтра. Это особенно верно, когда речь идет о вопросах на уровне генерального директора.

Если вы не можете предвидеть, какие будут вопросы, ваш единственный вариант — предоставить средства для быстрого ответа на любой вопрос. Это то, что хранилища данных пытаются или намереваются сделать. Откуда берутся данные и из скольких разрозненных систем не имеет значения.

Многие хранилища данных терпят неудачу в «быстром ответе на любой вопрос», потому что их технология требует, чтобы вы выворачивали имеющиеся необработанные данные «наизнанку» (создавая кубы), чтобы обеспечить «быстро». И определение этих кубов ограничивает разнообразие вопросов, на которые можно ответить.

person Marjan Venema    schedule 23.06.2010

Хранилище данных — это реляционная база данных, предназначенная для запросов и бизнес-анализа, а не для обработки транзакций. Она содержит исторические данные, полученные из данных транзакций. Эти исторические данные используются бизнес-аналитиками для подробного понимания бизнеса.

Хранилище данных должно иметь следующие характеристики:

  1. Тематическая направленность:

Хранилище данных помогает в анализе данных. Например, чтобы знать о продажах компании, хранилище данных должно основываться на данных о продажах. Используя это хранилище данных, мы можем найти продажи за последний год. Эта способность определять хранилище данных по предмету (продажам) делает его предметно-ориентированным.

  1. Интегрировано:

Сбор данных из разных источников и приведение их к единому формату. Это включает в себя разрешение единиц измерения, конфликты имен и т. д.

  1. Энергонезависимый:

Как только данные поступают в хранилище данных, данные не должны обновляться.

  1. Вариант времени:

Для анализа бизнеса аналитикам нужны большие объемы данных. Итак, хранилище данных должно содержать исторические данные.

person vidya123    schedule 19.01.2016

Хранилище данных — это комплексная технология, обеспечивающая ключевому персоналу предприятия доступ к любому уровню требуемой информации внутри предприятия. Это корпоративная структура, которая позволяет управлять всей корпоративной информацией.

Хранилище данных — это центральный репозиторий информации, которую можно анализировать для принятия более взвешенных решений. Данные поступают в хранилище данных из транзакционных систем, реляционных баз данных и других источников, как правило, в регулярном ритме. Бизнес-аналитики, специалисты по данным и лица, принимающие решения, получают доступ к данным с помощью инструментов бизнес-аналитики (BI), клиентов SQL и других аналитических приложений.

введите здесь описание изображения

person Santhoopa Jayawardhana    schedule 17.05.2020

Насколько я знаю, хранилище данных — это не что иное, как реляционная база данных, предназначенная для запросов и анализа. Обычно он содержит данные истории, полученные из данных транзакций.

Согласно Уильяму Инмону, определение хранилища данных:

Хранилище данных представляет собой предметно-ориентированный, интегрированный, энергонезависимый и изменяющийся во времени набор данных для поддержки управленческих решений.

И приведенное выше определение логично и совершенно, если мы мыслим рационально, и его можно понять из здесь

person farhankhwaja    schedule 07.01.2013

Простыми словами...

Хранилище данных — это способ управления предметами на реальном складе, который включает в себя контроль местоположения, запасов, движения, отчетности, аудита и всего, что касается «реальных предметов» на «реальном складе».

Я надеюсь, что это более просто.

person Candra Purnama    schedule 26.07.2012
comment
О, нет, боюсь, это не так. Прочитайте некоторые другие ответы здесь, чтобы понять термин хранилище данных. - person David Gorsline; 26.07.2012
comment
О Боже .. спасибо, мистер. Дэйвид. ваш комментарий заставляет меня прочитать всю эту страницу. чем мне нужно перестроить свое мнение о хранилище данных. - person Candra Purnama; 26.07.2012