Публикации по теме 'data-science'
Освоение основ статистики для науки о данных - от начального до продвинутого уровня - часть 3
Статистика – это раздел математики, который занимается сбором, анализом, интерпретацией и представлением числовых данных. В науке о данных статистика используется для извлечения идей и значимой информации из больших объемов данных.
В этой статье мы рассмотрим предварительную статистику. Если вы пропустили часть 1 и часть 2, вы можете найти ее здесь.
Основы статистики для науки о данных — от основ до продвинутого уровня — часть 1
Основы статистики для науки о данных..
Полное руководство по прогнозированию временных рядов с использованием Sklearn, Pandas и Numpy
Практическое руководство и платформа для использования любой модели scikit-learn для прогнозирования временных рядов в Python.
Введение
Существует много так называемых традиционных моделей для прогнозирования временных рядов, таких как семейство моделей SARIMAX , экспоненциальное сглаживание или BATS и TBATS .
Однако очень редко мы упоминаем наиболее распространенные модели машинного обучения для регрессии, такие как деревья решений, случайные леса, повышение градиента или..
Понимание Debiasing Framework, часть 2 (ИИ)
MTMD: многомасштабное обучение временной памяти и эффективная система устранения смещения для прогнозирования тренда акций (arXiv)
Автор: Минцзе Ван , Мингзе Чжан , Цзяньсюн Го , Вейцзя Цзя .
Аннотация: В последнее время методы машинного обучения показали перспективность прогнозирования тренда акций. Однако изменчивый и динамичный характер фондового рынка затрудняет прямое применение методов машинного обучения. Предыдущие методы обычно используют временную информацию об..
Постройте и настройте несколько матриц путаницы с помощью matplotlib
Матрица путаницы — ценный инструмент, используемый в машинном обучении и статистике для оценки производительности алгоритмов классификации. Он визуально представляет фактические и прогнозируемые результаты модели классификации, помогая определить точность модели, воспроизводимость и оценку F1.
Важность матрицы путаницы заключается в ее способности обобщать работу классификатора, показывая распределение правильных и неправильных прогнозов. Эту информацию можно использовать для определения..
Вниз по кроличьей норе (занимаюсь наукой о данных)
Вниз по кроличьей норе занимается наукой о данных, изучает магазины Walmart с помощью методов неконтролируемого обучения.
Скажите, пожалуйста, куда мне отсюда идти?” “Это во многом зависит от того, куда вы хотите попасть”, – сказал Кот.
Погружение в данные — наша кроличья нора. Мы вступаем в мир, полный данных, со скудным руководством, надеясь найти какой-то смысл.
Моя собственная кроличья нора на этот раз состояла из 1494450 строк данных, скрывающих истории о магазинах..
Прогнозирование победителей Оскара с помощью машинного обучения
Введение
Оскар — самая престижная премия в киноиндустрии, присуждаемая лучшим фильмам и спектаклям года. Каждый год миллионы людей наблюдают за церемонией и задаются вопросом, кто же получит заветные трофеи. Но можем ли мы использовать науку о данных, чтобы предсказать победителей до того, как они будут объявлены?
Наука о данных может предсказать победителей Оскара, используя различные источники данных, такие как исторические награды, рейтинги, обзоры, кассовые сборы, жанр и анализ..
Что такое расхождение Реньи, часть 2 (оптимизация)
Адаптация нескольких источников и расхождение Реньи ( arXiv )
Автор: Ишай Мансур , Мехрияр Мори , Афшин Ростамизаде
Аннотация: в этой статье представлено новое теоретическое исследование общей проблемы адаптации из нескольких источников с использованием понятия дивергенции Реньи. Наши результаты основаны на нашей предыдущей работе [12], но значительно расширяют объем этой работы в нескольких направлениях. Мы распространяем предыдущие гарантии потерь от нескольких..