Публикации по теме 'data-warehouse'


Лучшие курсы, чтобы стать инженером данных в 2023 году
Инжиниринг данных — одна из самых быстрорастущих областей технологий. Спрос на инженеров данных высок, поскольку компании все больше полагаются на данные для управления своим бизнесом. Если вы заинтересованы в том, чтобы стать инженером данных, вам необходимо иметь прочную основу в области программирования, баз данных и хранилищ данных. В этом сообщении блога мы обсудим лучшие курсы, чтобы стать инженером данных в 2023 году. Какой язык программирования вам следует выучить? Не..

Что такое озеро данных?
Озера данных обычно не структурированы и, таким образом, обеспечивают более простой способ хранения и анализа неструктурированных данных. Они также более гибкие, чем традиционные базы данных, в том смысле, что они позволяют нескольким пользователям одновременно обращаться к одним и тем же данным. Озера данных — это тип системы хранения данных, предназначенный для хранения большого объема необработанных данных в их исходной форме. Озера данных обычно создаются путем объединения различных..

3 шляпы специалиста по данным
Приключения в смене метафорического головного убора Наука о данных - странное существо, гибридное химерное детище машинного обучения и статистики. Его случаи многочисленны, но сбивают с толку, потому что они часто нечетко определены и принимают разные формы в зависимости от данных и задействованных людей. В контексте бизнес-проблем «наука» в науке о данных на самом деле сводится к простому «узнать больше» в духе Scientia - «знать». Это хорошо согласуется с моим личным стремлением..

Вопросы по теме 'data-warehouse'

Типичное хранилище данных по звездной схеме Кимбалла — возможно ли представление модели? и как генерировать код
У меня есть хранилище данных, содержащее типичные звездообразные схемы, и целую кучу кода, который делает подобные вещи (очевидно, намного больше, но это иллюстративно): SELECT cdim.x ,SUM(fact.y) AS y ,dim.z FROM fact INNER JOIN...
2765 просмотров

Настройка / передовой опыт Инструмент бизнес-аналитики Inetsoft Style Report?
Кто-нибудь использует инструмент бизнес-аналитики Inetsoft Style Report? Я застрял в этом и хотел бы знать, есть ли у кого-нибудь совет по настройке и / или лучшие практики для администратора сервера? Мы работаем на быстром Solaris, используя Tomcat...
613 просмотров

Хранилище данных - время работы
Я работаю над хранилищем данных, которое, в конце концов, потребует от меня создания отчетов на основе рабочих часов. В настоящее время мое измерение времени гранулировано до часа. Мне интересно, следует ли мне изменить измерение времени, чтобы...
757 просмотров
schedule 03.05.2022

MDX, вычисляющий время между событиями
У меня есть куб, который извлекает данные из 4 таблиц фактов/тускнений. FactCaseEvents (EventID,CaseID,TimeID) DimEvents (EventID, EventName) DimCases (CaseID,StateID,ClientID) DimTime (TimeID,FullDate) События будут:...
3821 просмотров
schedule 04.02.2023

Ошибка при обновлении куба хранилища данных MS
У нас есть куб, который мы заполняем данными из исходных таблиц. Чтобы данные отражались, мы вызываем компонент «Задача обработки сервисов аналитики». Пока куб обновляется, мы получаем следующую ошибку. Описание: Ошибка OLE DB: ошибка OLE DB или...
510 просмотров
schedule 15.06.2023

Преобразование реляционной базы данных OLTP в модель хранилища данных
Какие общие подходы к проектированию используются при загрузке данных из типичной модели базы данных Entity-Relationship OLTP в модель Data Warehouse / Marts со звездообразной схемой Кимбалла? Используете ли вы промежуточную зону для...
10421 просмотров
schedule 30.12.2023

лучший способ статистически обнаружить аномалии в данных
наше веб-приложение собирает огромное количество данных о действиях пользователя, сетевом бизнесе, загрузке базы данных и т. д. и т. д. Все данные хранятся на складах и у нас есть довольно много интересных просмотров этих данных. если происходит...
3386 просмотров
schedule 21.07.2023

SSAS – пользовательская сумма
Я пытаюсь создать куб, в котором сумма берется из атрибута факта, а не рассчитывается как совокупность дочерних элементов в SSAS 2005. Например. Предположим, у меня есть 10 магазинов, которые в определенный день посетили 100 покупателей. Однако...
808 просмотров
schedule 12.04.2023

требуется предложение по дизайну базы данных
Мне нужно разработать таблицу для ежедневных продаж фармацевтической продукции. Доступны сотни типов продуктов {Name, code}. Тысячи продавцов заняты продажей этих продуктов {название, код}. Они собирают товары с разных складов {имя, код}....
456 просмотров
schedule 03.01.2023

хранилище данных в реальном времени для журналов веб-доступа
Мы думаем о создании системы хранилища данных для загрузки журналов веб-доступа, которые генерируются нашими веб-серверами. Идея состоит в том, чтобы загружать данные в режиме реального времени. Мы хотим представить пользователю линейный график...
1842 просмотров
schedule 27.02.2022

Рекомендации по хранилищу данных: когда и почему?
Немного предыстории: Я более или менее знаю , что такое хранилище данных . Я прочитал несколько десятков руководств по хранению данных, я играл с SSAS, я знаю, что такое звездообразная схема, таблица измерений и таблица фактов, я знаю, что такое...
7587 просмотров

Верно или неверно: хороший дизайн требует, чтобы каждая таблица имела первичный ключ, а если не что иное, то текущее целое число.
Рассмотрим сценарий продуктового магазина (я придумал это), где у вас есть записи FACT, которые представляют транзакцию продажи, где столбцы таблицы Fact включают SaleItemFact Table ------------------ CustomerID ProductID Price DistributorID...
1175 просмотров
schedule 03.08.2023

выбрать все значения из измерения, для которого есть факты во всех других измерениях
Я попытался упростить, чтобы задать этот вопрос. Надеюсь, это будет понятно. По сути, у меня есть таблица фактов с измерением времени, другим измерением и иерархическим измерением. Для целей вопроса предположим, что иерархическим измерением...
1035 просмотров
schedule 04.07.2022

Сторонние данные - хранить в хранилище данных или в основной базе данных?
Это в основном вопрос философии хранилища данных. Мой проект включает приложение Oracle Forms и хранилище данных Teradata для отчетов и специальных целей. Помимо первичных данных, созданных пользователями нашего приложения, нам также требуются...
710 просмотров
schedule 30.08.2022

Что такое хранилище данных?
Клиент спросил меня, что на самом деле означает термин «хранилище данных». Я думал об ETL, деталях модели данных, отличиях от NoSQL, облаках, «обычных» СУБД, MDM (Master Data Management) и т. д., но не смог описать ему этот термин в нескольких...
4376 просмотров

Получение данных из хранилища данных в реляционную базу данных
Это довольно необычно, но из-за офисной политики и т. Д. У нас есть доступ (только для чтения) к хранилищу данных, но не к оперативным данным. Однако нам нужны актуальные данные для заполнения нашей реляционной (OLTP) базы данных (сервер MS SQL....
219 просмотров
schedule 28.04.2022

Оптимальная структура базы данных для MicroStrategy
Я провел большую часть своей карьеры, разрабатывая хранилища\витрины данных в виде звездных схем, потому что они обычно использовались в сочетании со службами Microsoft Analysis Services. Однако мы начинаем использовать MicroStrategy 9.0.1, и мне...
6309 просмотров

Python: взаимодействие со сложным хранилищем данных
Мы много работали над созданием полноразмерной модели базы данных нашей проблемы, и теперь пора приступить к программированию. В наших предыдущих проектах использовались вручную созданные запросы, созданные путем манипулирования строками. Есть ли...
3210 просмотров

Население SSIS медленно меняющегося измерения с выносной опорой
При работе с хранилищем данных подходящей аналогией проблемы является то, что у нас есть практикующие врачи. Практикующие медицинские работники обладают рядом профессиональных качеств и работают в открытом количестве команд и в открытом количестве...
1001 просмотров

следует ли обрабатывать поиск ключей таблицы измерений до того, как данные попадут в промежуточную таблицу?
Я читал, что промежуточная таблица должна быть точным столбцом за столбцом, совпадающим с целевой таблицей в dw. Если это так, то лучше ли после заполнения промежуточной таблицы не выполнять последующие поиски для сопоставления ключей с ключами в...
489 просмотров
schedule 10.05.2022