Публикации по теме 'data-science'


Освоение основ статистики для науки о данных - от начального до продвинутого уровня - часть 3
Статистика  – это раздел математики, который занимается сбором, анализом, интерпретацией и представлением числовых данных. В науке о данных статистика используется для извлечения идей и значимой информации из больших объемов данных. В этой статье мы рассмотрим предварительную статистику. Если вы пропустили часть 1 и часть 2, вы можете найти ее здесь. Основы статистики для науки о данных — от основ до продвинутого уровня — часть 1 Основы статистики для науки о данных..

Полное руководство по прогнозированию временных рядов с использованием Sklearn, Pandas и Numpy
Практическое руководство и платформа для использования любой модели scikit-learn для прогнозирования временных рядов в Python. Введение Существует много так называемых традиционных моделей для прогнозирования временных рядов, таких как семейство моделей SARIMAX , экспоненциальное сглаживание или BATS и TBATS . Однако очень редко мы упоминаем наиболее распространенные модели машинного обучения для регрессии, такие как деревья решений, случайные леса, повышение градиента или..

Понимание Debiasing Framework, часть 2 (ИИ)
MTMD: многомасштабное обучение временной памяти и эффективная система устранения смещения для прогнозирования тренда акций (arXiv) Автор: Минцзе Ван , Мингзе Чжан , Цзяньсюн Го , Вейцзя Цзя . Аннотация: В последнее время методы машинного обучения показали перспективность прогнозирования тренда акций. Однако изменчивый и динамичный характер фондового рынка затрудняет прямое применение методов машинного обучения. Предыдущие методы обычно используют временную информацию об..

Постройте и настройте несколько матриц путаницы с помощью matplotlib
Матрица путаницы — ценный инструмент, используемый в машинном обучении и статистике для оценки производительности алгоритмов классификации. Он визуально представляет фактические и прогнозируемые результаты модели классификации, помогая определить точность модели, воспроизводимость и оценку F1. Важность матрицы путаницы заключается в ее способности обобщать работу классификатора, показывая распределение правильных и неправильных прогнозов. Эту информацию можно использовать для определения..

Вниз по кроличьей норе (занимаюсь наукой о данных)
Вниз по кроличьей норе занимается наукой о данных, изучает магазины Walmart с помощью методов неконтролируемого обучения. Скажите, пожалуйста, куда мне отсюда идти?” “Это во многом зависит от того, куда вы хотите попасть”, – сказал Кот. Погружение в данные — наша кроличья нора. Мы вступаем в мир, полный данных, со скудным руководством, надеясь найти какой-то смысл. Моя собственная кроличья нора на этот раз состояла из 1494450 строк данных, скрывающих истории о магазинах..

Прогнозирование победителей Оскара с помощью машинного обучения
Введение Оскар — самая престижная премия в киноиндустрии, присуждаемая лучшим фильмам и спектаклям года. Каждый год миллионы людей наблюдают за церемонией и задаются вопросом, кто же получит заветные трофеи. Но можем ли мы использовать науку о данных, чтобы предсказать победителей до того, как они будут объявлены? Наука о данных может предсказать победителей Оскара, используя различные источники данных, такие как исторические награды, рейтинги, обзоры, кассовые сборы, жанр и анализ..

Что такое расхождение Реньи, часть 2 (оптимизация)
Адаптация нескольких источников и расхождение Реньи ( arXiv ) Автор: Ишай Мансур , Мехрияр Мори , Афшин Ростамизаде Аннотация: в этой статье представлено новое теоретическое исследование общей проблемы адаптации из нескольких источников с использованием понятия дивергенции Реньи. Наши результаты основаны на нашей предыдущей работе [12], но значительно расширяют объем этой работы в нескольких направлениях. Мы распространяем предыдущие гарантии потерь от нескольких..