Немного предыстории:
Я более или менее знаю , что такое хранилище данных. Я прочитал несколько десятков руководств по хранению данных, я играл с SSAS, я знаю, что такое звездообразная схема, таблица измерений и таблица фактов, я знаю, что такое ETL и как это делать. Это не вопрос о том, как это сделать, или просьба об учебных курсах.
Моя проблема в том, что весь прочитанный мною материал по хранилищам данных, кажется, затушевывает обоснование построения хранилища данных. Все они образно, а в некоторых случаях буквально начинаются с фразы «Итак, вы решили построить хранилище данных ...», за исключением того, что я еще не принял это решение.
Так что я надеюсь, что члены SO могут указать мне или помочь придумать какой-то полуобъективный тест. Что-то, что я могу адаптировать к конкретной системе, и в итоге скажу либо «да, нам нужно хранилище данных», либо «нет, отдача сегодня будет слишком мала». Я думаю, что мне нужно ответить на следующие конкретные вопросы:
В какой момент стоит рассмотреть вариант создания хранилища данных? Другими словами, какие контрольные признаки, метрики или другие критерии мне следует искать, которые могут указывать на то, что стандартной транзакционной среды более недостаточно?
Каковы альтернативы полноценному хранилищу данных? На ум приходят денормализация в транзакционной базе данных и стандартный реплицированный «сервер отчетов»; есть ли еще какие-то другие, которые мне следует изучить, прежде чем переходить к DW?
Почему хранилище данных лучше указанных альтернатив? Если ответ - «это зависит», то от чего это зависит?
Когда не следует пытаться построить хранилище данных? Я скептически отношусь к чему-либо, заявленному как «лучшая практика», независимо от контекста. Несомненно, должны быть некоторые сценарии, в которых DW является неправильным выбором - каковы они?
Есть ли какие-нибудь практические примеры систем, которые были улучшены путем внедрения хранилища данных? Что-то, что объяснило бы мне, от начала до конца, для каких решений или анализа им нужен склад, как они решили, что в него поместить, и как склад в итоге вписался в более крупную среду? Я не хочу надуманного «давайте сделаем куб из базы данных AdventureWorks» - для меня реализация не имеет отношения, меня интересуют спецификации и дизайн и общий мыслительный процесс < / em> которые были задействованы.
Я обычно стараюсь не спрашивать мульти-партеров, но я думаю, что все они очень тесно связаны. Я готов принять любой ответ, который касается по крайней мере первых 4 вопросов, хотя последний действительно помог бы кристаллизовать это в моем сознании. Ссылки хороши, если кто-то уже писал об этом, при условии, что они достаточно краткие и конкретные (ссылка на домашнюю страницу Ральфа Кимбалла = бесполезна).
Надеюсь, я прояснил вопрос - заранее спасибо за ответы!