Наука о данных в реальном мире

Как моделировать цену на золото

Использование знаний предметной области и контролируемой модели обучения для понимания и прогнозирования цены на золото

В этой статье я хотел бы представить вам очень простую, но действенную модель цены на золото, последовательно рассмотрев следующие элементы:

  • историческое и текущее использование золота;
  • факторы, теоретически влияющие на цены на золото;
  • регрессионная модель, используемая для прогнозирования цены на золото;
  • применение регрессионной модели для принятия инвестиционных решений.

Для занятых читателей статья также предоставляет TL; DR в приложении, а также заявление об отказе от ответственности, сокращенную записную книжку Jupyter и список источников.

1. Зачем нам золото?

Около 3600 г. до н.э. золото было впервые выплавлено в Древнем Египте. Тридцать веков спустя первая золотая монета была отчеканена в древнем королевстве на западе Турции и с тех пор была принята в качестве физических денег могущественными королевствами.

В современную эпоху золото превратилось из физических денег в валютный резерв. В 1819 году Великобритания официально приняла первый в истории золотой стандарт, привязав свою валюту к золоту. К 1900 году большинство стран, за исключением Китая, приняли золотой стандарт. Однако, когда началась Первая мировая война, золотой стандарт в конечном итоге исчез, поскольку многим странам потребовалось печатать деньги для оплаты войны.

Сегодня золото используется для различных целей в нашей жизни, таких как монеты, украшения, электроника и стоматологические процедуры. Однако влияние денежно-кредитной политики и финансовых требований может иметь более существенное влияние на цену золота.

2. Какие факторы могут повлиять на цену золота?

Теоретически существует множество фундаментальных, макроэкономических и сентиментальных факторов, которые могут повлиять на цену золота. С фундаментальной точки зрения, есть требования со стороны центрального банка, покупателей ювелирных изделий и ETF на физическое золото, тогда как в макропространстве это инфляция, процентная ставка, денежная масса и сила доллара. Кроме того, некоторые трейдеры отслеживают данные о чистой позиции CFTC, чтобы оценить настроения спекулянтов.

Проще всего понять влияние фундаментальных факторов. Чем больше золота покупают правительства и люди, тем меньше золота на рынке, и цена должна расти.

В макропространстве уровень инфляции (дефляции) является мерой повышения (снижения) цены корзины товаров и услуг. Если уровень инфляции вырастет, цена на наш обед и золото тоже вырастет. И наоборот, если процентная ставка повышается, золото как средство инвестирования становится непривлекательным по сравнению с казначейскими облигациями. Как сказал Баффет, золото - это курица, которая не откладывает яиц.

«Если вы владеете одной унцией золота в течение вечности, вы все равно будете владеть одной унцией золота на ее концах». - Уоррен Баффет

Одним из наиболее важных факторов является денежная масса, которая измеряет общую сумму денег, имеющихся в экономике. Давайте рассмотрим два примера, чтобы объяснить, почему увеличение денежной массы приведет к увеличению цены на золото.

  1. Представьте себе небольшую экономику, состоящую из вас и ваших друзей, которые соглашаются использовать ваши монопольные деньги для покупки и продажи золота друг у друга. Если вы начнете печатать монопольные деньги в своем гараже и начнете покупать все золото у своих друзей, цена на золото по отношению к вашей монополии вырастет. Другими словами, если ФРС начнет печатать тонны доллара США, цена на золото по отношению к доллару США может вырасти.
  2. Снова представьте себе небольшую экономику из вас и ваших друзей, которые используют доллар США для торговли. Если вы напечатаете деньги и дадите всем бесплатные деньги, цены на товары и услуги вырастут, так как свободные деньги будут использоваться для покупки дополнительных товаров и услуг. Увеличение денежной массы в конечном итоге вернулось к росту уровня инфляции, поэтому цена на золото может вырасти.

И последнее, но не менее важное: сила доллара США может повлиять на цену золота и любых других товаров, номинированных в долларах США. Если доллар становится слабым, другие страны могут покупать больше долларов, а затем и золота, что приводит к росту цен на золото и другие товары, если они котируются в долларах.

3. Как мы можем смоделировать цену на золото?

Чтобы смоделировать цену на золото, мы сначала собираем входные данные и применяем преобразования данных. С преобразованными данными мы используем модель линейной регрессии, чтобы объяснить взаимосвязь между предикторами и ценой на золото. Для проверки модели проводится тестирование на исторических данных вне выборки, и значение R² будет вычислено для измерения производительности модели.

3.1 Сбор данных

Для подготовки к анализу и разработке модели с 1981 года собираются и очищаются следующие данные:

  • XAUUSD: спотовая цена на золото выражена в долларах США.
  • ИПЦ США: индекс отслеживает изменения цен на товары и услуги, оплачиваемые городскими потребителями (т.е. уровень инфляции).
  • США M2: денежная масса включает наличные деньги, чековые депозиты и легко конвертируемые деньги.
  • ВВП США: указанный показатель измеряет размер экономического производства США.
  • Индекс доллара: индекс, который отслеживает стоимость доллара США по отношению к корзине иностранных валют.

Одна заметная проблема с данными заключается в том, что эти факторы наблюдаются с разной частотой. Для выравнивания частоты значения группируются по четвертям, а затем усредняются.

3.2. Преобразование данных и разработка функций

3.2.1. Целевая переменная

Целевая переменная в этой модели - спотовая цена на золото с поправкой на инфляцию. Чтобы скорректировать спотовую цену на золото с учетом инфляции, мы дефлируем временные ряды спотовых цен на золото по индексу потребительских цен США. В дальнейшем этот временной ряд золота с поправкой на инфляцию будет называться «спотовая цена золота», «цена золота» или «XAUUSD».

3.2.2. Предсказатели

В этой регрессионной модели используются два предиктора: отношение денежной массы к ВВП (M2 / GDP) и индекс доллара. Хотя индекс доллара может оставаться неизменным, нам необходимо получить коэффициент, разделив M2 США на ВВП США. Отношение денежной массы к ВВП предпочтительнее денежной массы, потому что оно является мерой избытка денежной массы в экономике.

3.2.3. Лог-трансформация

После двух преобразований мы применяем логарифмическое преобразование к целевой переменной и предикторам, поскольку все значения положительны и демонстрируют высокую положительную асимметрию. Это поможет любой линейной модели легче находить закономерности.

Используя преобразованные переменные, мы строим корреляционную матрицу, чтобы понять линейную зависимость между ценой на золото и предикторами. Как показано, спотовая цена на золото сильно коррелирует с соотношением денежной массы к ВВП и имеет некоторую, но отрицательную корреляцию с индексом доллара.

Что еще более важно, два предиктора почти не коррелируют с показателем корреляции -0,08. Это говорит о том, что даже несмотря на то, что корреляция для индекса доллара меньше, чем корреляция отношения денежной массы к ВВП, доллар все же может быть полезен, поскольку он может добавлять неперекрывающуюся информацию.

3.3. Обучение модели и результаты тестирования на истории

Теперь, используя предикторы и целевую переменную, мы подбираем цену на золото, используя два предиктора с уравнением линейной регрессии.

Обратите внимание, что добавление параметров регуляризации L1 и L2 для уменьшения переобучения вряд ли приведет к добавлению значений в этой модели из-за небольшого количества предикторов и небольшой корреляции между предикторами. Тем не менее, другие алгоритмы, включая случайный лес и XGBoost, также могут быть обучены.

Для оценки этой модели проводится тестирование на исторических данных вне выборки путем многократного обучения модели с использованием скользящего окна на 100 кварталов и прогнозирования средней цены на золото в следующем квартале. В конечном итоге прогнозируемые значения сравниваются с фактическими значениями для расчета R², который составляет примерно 92%.

R² - это коэффициент детерминации, который представляет собой процент от общей вариации, которую можно объяснить с помощью модели. Следовательно, эта простая модель может объяснить колоссальные 92% общего разброса цен на золото.

4. Как мы можем использовать эту модель?

Используя эту модель, мы можем предсказать цену на золото, переведя наши взгляды на денежную массу в ВВП, силу доллара и уровень инфляции. в влияние цен на золото.

На мой взгляд, соотношение денежной массы к ВВП будет увеличиваться в краткосрочной и долгосрочной перспективе, поскольку правительства будут продолжать печатать деньги, чтобы компенсировать эффект глобальной изоляции и обеспокоенность на кредитных рынках соответственно.

Однако индекс доллара может немного укрепиться из-за спроса на безопасные убежища. Когда на рынке происходит распродажа, потребность в активах-убежищах, таких как доллар США, возрастает, укрепляя доллар США.

В совокупности я ожидаю, что цена на золото останется довольно волатильной в краткосрочной перспективе, поскольку эти два предсказателя могут компенсировать друг друга. Однако в долгосрочной перспективе я верю, что долгожданный бычий рынок вернется.

Приложение

TL;DR

В условиях пандемии и валютной войны золото может быть идеальной защитой от неожиданной инфляции, резкой девальвации валюты и вялого экономического роста. Анализ данных показывает, что цена на золото в основном определяется:

  • уровень инфляции
  • денежная масса относительно размера экономики
  • сила и слабость деноминированной валюты

Другими фундаментальными и сентиментальными факторами, которые могут повлиять на цену золота, являются:

  • процентные ставки
  • требование центрального банка
  • спрос на золото в ETF
  • спрос на ювелирные изделия
  • Позиции CFTC

Отказ от ответственности

Единственная цель этой статьи - обучить читателей, выразив личное мнение автора. Содержание отражает только точку зрения автора на момент написания и не представляет собой никаких финансовых рекомендаций и не отражает каких-либо взглядов аффилированных с автором организаций.

Исходный код

Источники