Временные ряды - один из уникальных типов данных, используемых в науке о данных. В большинстве случаев этот тип данных представляет собой последовательность наблюдений во времени. Анализ временных рядов широко применяется для понимания тенденций и закономерностей в больших наборах разнородных данных из различных областей, таких как экономика, метеорология, медицина и т. Д. В этой статье мы обсудим некоторые причины, которые делают его особенным.

Термин «временной ряд» относится к набору данных, в котором конкретное событие или переменная многократно измеряется в последовательных смежных единицах времени. Анализ временных рядов используется для понимания закономерностей, взаимосвязей и тенденций в данных. Его можно применять к широкому спектру различных типов данных, таких как финансовые, погодные, сейсмологические и даже ленты Twitter. Анализ временных рядов часто включает обработку нескольких последовательностей (то есть временных рядов) одну за другой или в перекрывающиеся периоды времени. Например, мы могли бы разделить данный год на 12 месячных сегментов и выполнить какой-то анализ для каждого месяца отдельно (например, чтобы увидеть, как изменяется температура в течение года). С другой стороны, мы могли бы сделать наоборот; то есть проанализировать все эти сегменты сразу, но с разными переменными (чтобы обнаружить какие-либо корреляции между влажностью и влажностью).

В этой области широко используются три типа техник:

- Модели ARIMA (авторегрессионная интегрированная скользящая средняя) - Экспоненциальное сглаживание.

- Графики функции автокорреляции (ACF), функции частичной автокорреляции (PACF)

- Авторегрессионные распределенные запаздывания (ADL).

Эти методы позволяют анализировать различные свойства временных рядов, такие как:

- Обнаружение тренда (стационарный, нестационарный)

- Обнаружение и идентификация сезонности (периодический / непериодический), сезонный сдвиг и дрейф, а также разность первого и второго порядка.

- Прогнозирование с использованием различных методов, таких как ARMA-GARCH; Модели TAR; NZM. Следует отметить, что прогнозирование временных рядов также может выполняться нейронными сетями. Фактически, это очень хорошо изученная область глубокого обучения, поскольку существует множество сценариев, в которых может быть полезно применить глубокое обучение для такого рода проблем. Последняя работа Google по прогнозированию фондового рынка - хороший тому пример.

Кроме того, эти методы применялись в различных областях, помимо интеллектуального анализа данных, таких как медицина и финансы.

- Кластеризация: эта задача состоит из группировки набора точек данных, чтобы точки данных в одной группе (называемой кластером) были более похожи друг на друга, чем точки из разных кластеров. Обычно он используется для поиска скрытых закономерностей и структур во временном ряду. Например, это может быть полезно для поиска сезонных или периодических компонентов во временном ряду; обнаружение выбросов; прогнозирование. Более того, методы кластеризации успешно применялись для открытия новых знаний, таких как функции белков или генов.

- Моделирование: оно заключается в подборе временного ряда соответствующей модели для прогнозирования будущих значений. Выбранная нами модель должна не только хорошо соответствовать нашим данным, но и давать значимые прогнозы и не допускать переобучения данных. Для этой цели обычно используется модель авторегрессионного интегрированного скользящего среднего (ARIMA).

- Уменьшение размеров: оно заключается в отображении многомерных данных на меньшее количество измерений для облегчения их визуализации или выполнения дальнейшего статистического анализа. Для этой цели используются как анализ главных компонентов, так и факторный анализ.

- Визуализация: из заданного временного ряда мы можем извлечь его основные характеристики с помощью подходящих методов визуализации, таких как линейная диаграмма, фазовая диаграмма и т. д. Это также облегчает определение отношений между различными переменными, которые будут полезны. при их кластеризации или моделировании. Например, географические карты широко используются для выявления связей между болезнями и факторами окружающей среды.

Анализ временных рядов помогает нам понять среднесрочные перспективы экономического роста. Он предоставляет механизм для анализа взаимосвязи между двумя переменными, которые меняются во времени, и позволяет прогнозировать. Область анализа временных рядов включает несколько методов, с помощью которых можно классифицировать или сгруппировать образцы в группы на основе их сходства. Совсем недавно методы глубокого обучения стали применяться к задачам обработки временных рядов, в которых задействованы сложные нелинейные отношения. Другие модели, разработанные на основе статистических методологий, таких как ARMA, могут использоваться для создания прогнозов на основе исторических данных.

Как уже упоминалось выше, временные ряды стали чрезвычайно популярными, потому что они позволяют нам понять среднесрочные перспективы экономического роста. Временные ряды также могут дать ценную информацию о вашей бизнес-среде и помочь вам определить такие закономерности, как сезонность (повторяющиеся колебания в пределах определенного временного диапазона), которые могут помочь вам спрогнозировать будущую производительность. Временной ряд - это последовательность точек данных, проиндексированных (или перечисленных или графически отображенных) в неубывающем порядке некоторого параметра - обычно времени или пространства. Многие реальные процессы лучше всего моделируются временными рядами.

Первоначально опубликовано на https://protonautoml.com 9 августа 2021 г.