Публикации по теме 'big-data'


Регрессия в Python с использованием Sklearn, XGBoost и PySpark
Машинное обучение обычно используется для решения задач регрессии. В частности, применение алгоритма регрессии к многомерному кадру данных - это метод, обычно используемый для измерения степени, в которой одна (или несколько) независимая переменная (предикторы) и более одной зависимой переменной (ответы) , связаны линейно. Если вы только собираетесь приступить к настройке своей модели машинного обучения, я полагаю, что вы, должно быть, уже выполнили свой исследовательский анализ..

Сила и вызовы синтетических данных — 3 принципа
Если данные — это новая нефть , то что делать, если у вашей компании их нет? Вы можете купить, т.е. заплатить за повторяющийся или разовый доступ. Вы могли бы поискать, т.е. найти базы данных с открытым исходным кодом. Или вы могли бы на самом деле построить, т.е. произвести синтетические данные. Ниже приведены три основных принципа, о которых следует помнить. 1) Обеспечение репрезентативности Существует два ключевых метода создания синтетических данных: случайным образом..

«Все модели неправильные, но некоторые полезны»
Эта цитата приписывается Джорджу Э. П. Боксу, и 3 дня назад фактически исполняется 3 года со дня его смерти. Он был британским математиком и профессором статистики ... Это блестящее понимание, которое говорит о том, где мы находимся в области машинного обучения и алгоритмической разработки. Я ни в коем случае не нахожусь и близко к тому типу экспертов, которым был он или многие из ведущих мыслителей в этой области, но я нахожу это увлекательным и очень ценным. Все модели..

Официальный член Elevate Greece предлагает рекомендации по покупкам от mobiplus !
Elevate Greece — это национальный реестр многообещающих греческих стартапов, демонстрирующих значительные инновации и значительный потенциал для международного роста. https://elevategreice.gov.gr/ Зарегистрированные компании аккредитованы Министерством развития и инвестиций — Генеральным секретариатом исследований и технологий [GSRT]. mobiplus является членом Elevate Greece с прошлой недели. Мы хотели бы поблагодарить Министерство развития и инвестиций и всех причастных..

На пути к Индустрии 4.0: цифровая трансформация производства
Цифровая трансформация в производстве, по сути, означает устранение повторяющихся операций, выполняемых человеком на производственной линии, и замену их автоматизированными функциями, управляемыми данными. Эта технологическая революция представляет собой сочетание анализа данных, Интернета вещей (Интернета вещи) и машинное обучение для повышения эффективности производственной линии. Цифровые технологии будут интегрированы во все сферы бизнеса, начиная с производственной линии и..

4 способа расчета промежуточной суммы с помощью SQL
Описания и объяснения способов «пополнения» вашего арсенала. Вычисление промежуточной / скользящей суммы в SQL - полезный навык. Это часто может пригодиться для составления отчетов и даже при разработке приложений. Возможно, ваши пользователи захотят увидеть общую сумму набранных баллов или заработанных денег. Как и большинство проблем в SQL , есть несколько способов решить эту проблему. Вы можете использовать аналитические функции, самостоятельные объединения или сводную..

Топ-5 тем, которые охватывают науку о данных
Введение Наука о данных — это исследование, которое занимается идентификацией, представлением и извлечением значимой информации из данных. Их можно собирать из разных источников для использования в бизнес-целях. Поскольку ежеминутно генерируется огромное количество фактов, необходимость извлечения полезной информации является обязательной для бизнеса. Это помогает им выделиться из толпы. Инженеры данных настраивают хранилище данных, чтобы облегчить процесс интеллектуального анализа..