Анализ временных рядов: основные концепции

Привет, народ! В этом блоге основное внимание уделяется базовой концепции, необходимой для построения модели временных рядов, и шагу к пониманию мельчайших деталей анализа временных рядов. Я объяснил различные статистические меры и концепции, необходимые для полного понимания процесса построения модели.

Вступление

Данные, собранные за определенный период времени, имеют большое значение и используются. В бизнесе мы наблюдаем еженедельные процентные ставки, ежедневные цены на акции на момент закрытия, ежемесячные индексы цен, годовые показатели продаж и т. Д. В метеорологии мы наблюдаем ежедневные высокие и низкие температуры, годовые показатели осадков и засухи, а также почасовые скорости ветра. В сельском хозяйстве мы фиксируем годовые показатели растениеводства и животноводства, эрозии почвы и экспортных продаж.
Как уже упоминалось, анализ временных рядов находит применение в различных отраслях и областях. (Отсюда важность предмета.)

Мы разработаем многоэтапную стратегию построения модели, которую так хорошо поддерживают Бокс и Дженкинс.
i) Спецификация модели (идентификация): имеет дело с выбором подходящих моделей временных рядов на основе определенных статистических показателей.
ii) Подбор модели: поиск наилучшей возможной оценки неизвестных параметров модели. < br /> iii) Диагностика модели: оценка качества модели с использованием определенных статистических мер и тестов.

Основные концепции

Последовательность случайных величин {Yt: t = 0, ± 1, ± 2, ± 3,…} называется случайным процессом и служит моделью для наблюдаемого временного ряда.
Полная вероятностная структура определяется набором всех распределений, но нам не нужно иметь с ними дело. (По мере продвижения вперед некоторые ключевые статистические показатели учитывают то же самое.)

Средние, ковариации и корреляции

Используя эти три статистических показателя, мы можем в определенной степени оценить нашу модель временных рядов. Итак, ниже представлены функции, используемые в анализе.

Для случайного процесса функция среднего определяется как:

Функция среднего - это, по сути, ожидаемое значение в данный момент времени. Это может быть, а может и не быть равным.

Функция автоковариации определяется следующим образом:

Наконец, функция автокорреляции выглядит так:

И корреляция, и ковариация - это меры линейной зависимости между случайными величинами. Обычно предпочтение отдается корреляции, поскольку она безразмерна. (и легче интерпретировать). Корреляция ± 1 считается сильной линейной зависимостью, тогда как корреляция 0 считается нулевой линейной зависимостью.

Случайная прогулка

Процесс случайного блуждания может быть приблизительной или начальной оценкой нашего графика временного ряда.
Пусть e 1, e 2,… будет последовательностью независимых , одинаково распределенные случайные величины, каждая с нулевым средним и постоянной дисперсией. Временной ряд строится следующим образом:

В качестве альтернативы это можно записать как:

Скользящая средняя

Предположим, мы построим временной ряд, используя эту формулу:

где е являются i e, предполагается, что они независимы и одинаково распределены с нулевым средним и постоянной дисперсией.

Стационарность

Основная идея стационарности заключается в том, что законы вероятности, которые управляют поведением процесса, не меняются с течением времени.
В частности, процесс {Yt} называется строго стационарным если совместное распределение двух временных рядов равно с постоянным запаздыванием.

В будущих блогах я более подробно расскажу о методах создания канцелярских товаров с временными рядами.

Остаточный анализ

Он используется для проверки правильности предположения о тренде ряда. А также для проверки наличия постоянного среднего значения.
Различные предположения могут быть проверены путем оценки результатов анализа остатков.

Общая ненормальность может быть оценена путем построения гистограммы остатков или стандартизованных остатков. Нормальность можно проверить более тщательно, построив так называемые нормальные оценки или график квантиль-квантиль (QQ). При нормально распределенных данных график QQ выглядит примерно как прямая линия.

Пример функции автокорреляции

Еще один очень важный диагностический инструмент для изучения зависимости - это функция автокорреляции выборки. Очевидный способ сделать это - вычислить выборочную корреляцию между парами k единиц, разделенных во времени. То есть среди (Y 1, Y 1 + k), (Y 2, Y 2 + k), (Y 3, Y3 + k),… и (Yn - k, Yn).

Заключение

Выше приведены упомянутые теоретические концепции, которые помогают создать основу для моделирования.

Использованная литература:

[1] Анализ временных рядов: с приложениями в R, Джонатан Крайер и Кунг-сик Чан.

Профиль среднего: Кушал Вала, специалист по данным Tech9