Наука о данных в реальном мире
Как моделировать цену на золото
Использование знаний предметной области и контролируемой модели обучения для понимания и прогнозирования цены на золото
В этой статье я хотел бы представить вам очень простую, но действенную модель цены на золото, последовательно рассмотрев следующие элементы:
- историческое и текущее использование золота;
- факторы, теоретически влияющие на цены на золото;
- регрессионная модель, используемая для прогнозирования цены на золото;
- применение регрессионной модели для принятия инвестиционных решений.
Для занятых читателей статья также предоставляет TL; DR в приложении, а также заявление об отказе от ответственности, сокращенную записную книжку Jupyter и список источников.
1. Зачем нам золото?
Около 3600 г. до н.э. золото было впервые выплавлено в Древнем Египте. Тридцать веков спустя первая золотая монета была отчеканена в древнем королевстве на западе Турции и с тех пор была принята в качестве физических денег могущественными королевствами.
В современную эпоху золото превратилось из физических денег в валютный резерв. В 1819 году Великобритания официально приняла первый в истории золотой стандарт, привязав свою валюту к золоту. К 1900 году большинство стран, за исключением Китая, приняли золотой стандарт. Однако, когда началась Первая мировая война, золотой стандарт в конечном итоге исчез, поскольку многим странам потребовалось печатать деньги для оплаты войны.
Сегодня золото используется для различных целей в нашей жизни, таких как монеты, украшения, электроника и стоматологические процедуры. Однако влияние денежно-кредитной политики и финансовых требований может иметь более существенное влияние на цену золота.
2. Какие факторы могут повлиять на цену золота?
Теоретически существует множество фундаментальных, макроэкономических и сентиментальных факторов, которые могут повлиять на цену золота. С фундаментальной точки зрения, есть требования со стороны центрального банка, покупателей ювелирных изделий и ETF на физическое золото, тогда как в макропространстве это инфляция, процентная ставка, денежная масса и сила доллара. Кроме того, некоторые трейдеры отслеживают данные о чистой позиции CFTC, чтобы оценить настроения спекулянтов.
Проще всего понять влияние фундаментальных факторов. Чем больше золота покупают правительства и люди, тем меньше золота на рынке, и цена должна расти.
В макропространстве уровень инфляции (дефляции) является мерой повышения (снижения) цены корзины товаров и услуг. Если уровень инфляции вырастет, цена на наш обед и золото тоже вырастет. И наоборот, если процентная ставка повышается, золото как средство инвестирования становится непривлекательным по сравнению с казначейскими облигациями. Как сказал Баффет, золото - это курица, которая не откладывает яиц.
«Если вы владеете одной унцией золота в течение вечности, вы все равно будете владеть одной унцией золота на ее концах». - Уоррен Баффет
Одним из наиболее важных факторов является денежная масса, которая измеряет общую сумму денег, имеющихся в экономике. Давайте рассмотрим два примера, чтобы объяснить, почему увеличение денежной массы приведет к увеличению цены на золото.
- Представьте себе небольшую экономику, состоящую из вас и ваших друзей, которые соглашаются использовать ваши монопольные деньги для покупки и продажи золота друг у друга. Если вы начнете печатать монопольные деньги в своем гараже и начнете покупать все золото у своих друзей, цена на золото по отношению к вашей монополии вырастет. Другими словами, если ФРС начнет печатать тонны доллара США, цена на золото по отношению к доллару США может вырасти.
- Снова представьте себе небольшую экономику из вас и ваших друзей, которые используют доллар США для торговли. Если вы напечатаете деньги и дадите всем бесплатные деньги, цены на товары и услуги вырастут, так как свободные деньги будут использоваться для покупки дополнительных товаров и услуг. Увеличение денежной массы в конечном итоге вернулось к росту уровня инфляции, поэтому цена на золото может вырасти.
И последнее, но не менее важное: сила доллара США может повлиять на цену золота и любых других товаров, номинированных в долларах США. Если доллар становится слабым, другие страны могут покупать больше долларов, а затем и золота, что приводит к росту цен на золото и другие товары, если они котируются в долларах.
3. Как мы можем смоделировать цену на золото?
Чтобы смоделировать цену на золото, мы сначала собираем входные данные и применяем преобразования данных. С преобразованными данными мы используем модель линейной регрессии, чтобы объяснить взаимосвязь между предикторами и ценой на золото. Для проверки модели проводится тестирование на исторических данных вне выборки, и значение R² будет вычислено для измерения производительности модели.
3.1 Сбор данных
Для подготовки к анализу и разработке модели с 1981 года собираются и очищаются следующие данные:
- XAUUSD: спотовая цена на золото выражена в долларах США.
- ИПЦ США: индекс отслеживает изменения цен на товары и услуги, оплачиваемые городскими потребителями (т.е. уровень инфляции).
- США M2: денежная масса включает наличные деньги, чековые депозиты и легко конвертируемые деньги.
- ВВП США: указанный показатель измеряет размер экономического производства США.
- Индекс доллара: индекс, который отслеживает стоимость доллара США по отношению к корзине иностранных валют.
Одна заметная проблема с данными заключается в том, что эти факторы наблюдаются с разной частотой. Для выравнивания частоты значения группируются по четвертям, а затем усредняются.
3.2. Преобразование данных и разработка функций
3.2.1. Целевая переменная
Целевая переменная в этой модели - спотовая цена на золото с поправкой на инфляцию. Чтобы скорректировать спотовую цену на золото с учетом инфляции, мы дефлируем временные ряды спотовых цен на золото по индексу потребительских цен США. В дальнейшем этот временной ряд золота с поправкой на инфляцию будет называться «спотовая цена золота», «цена золота» или «XAUUSD».
3.2.2. Предсказатели
В этой регрессионной модели используются два предиктора: отношение денежной массы к ВВП (M2 / GDP) и индекс доллара. Хотя индекс доллара может оставаться неизменным, нам необходимо получить коэффициент, разделив M2 США на ВВП США. Отношение денежной массы к ВВП предпочтительнее денежной массы, потому что оно является мерой избытка денежной массы в экономике.
3.2.3. Лог-трансформация
После двух преобразований мы применяем логарифмическое преобразование к целевой переменной и предикторам, поскольку все значения положительны и демонстрируют высокую положительную асимметрию. Это поможет любой линейной модели легче находить закономерности.
Используя преобразованные переменные, мы строим корреляционную матрицу, чтобы понять линейную зависимость между ценой на золото и предикторами. Как показано, спотовая цена на золото сильно коррелирует с соотношением денежной массы к ВВП и имеет некоторую, но отрицательную корреляцию с индексом доллара.
Что еще более важно, два предиктора почти не коррелируют с показателем корреляции -0,08. Это говорит о том, что даже несмотря на то, что корреляция для индекса доллара меньше, чем корреляция отношения денежной массы к ВВП, доллар все же может быть полезен, поскольку он может добавлять неперекрывающуюся информацию.
3.3. Обучение модели и результаты тестирования на истории
Теперь, используя предикторы и целевую переменную, мы подбираем цену на золото, используя два предиктора с уравнением линейной регрессии.
Обратите внимание, что добавление параметров регуляризации L1 и L2 для уменьшения переобучения вряд ли приведет к добавлению значений в этой модели из-за небольшого количества предикторов и небольшой корреляции между предикторами. Тем не менее, другие алгоритмы, включая случайный лес и XGBoost, также могут быть обучены.
Для оценки этой модели проводится тестирование на исторических данных вне выборки путем многократного обучения модели с использованием скользящего окна на 100 кварталов и прогнозирования средней цены на золото в следующем квартале. В конечном итоге прогнозируемые значения сравниваются с фактическими значениями для расчета R², который составляет примерно 92%.
R² - это коэффициент детерминации, который представляет собой процент от общей вариации, которую можно объяснить с помощью модели. Следовательно, эта простая модель может объяснить колоссальные 92% общего разброса цен на золото.
4. Как мы можем использовать эту модель?
Используя эту модель, мы можем предсказать цену на золото, переведя наши взгляды на денежную массу в ВВП, силу доллара и уровень инфляции. в влияние цен на золото.
На мой взгляд, соотношение денежной массы к ВВП будет увеличиваться в краткосрочной и долгосрочной перспективе, поскольку правительства будут продолжать печатать деньги, чтобы компенсировать эффект глобальной изоляции и обеспокоенность на кредитных рынках соответственно.
Однако индекс доллара может немного укрепиться из-за спроса на безопасные убежища. Когда на рынке происходит распродажа, потребность в активах-убежищах, таких как доллар США, возрастает, укрепляя доллар США.
В совокупности я ожидаю, что цена на золото останется довольно волатильной в краткосрочной перспективе, поскольку эти два предсказателя могут компенсировать друг друга. Однако в долгосрочной перспективе я верю, что долгожданный бычий рынок вернется.
Приложение
TL;DR
В условиях пандемии и валютной войны золото может быть идеальной защитой от неожиданной инфляции, резкой девальвации валюты и вялого экономического роста. Анализ данных показывает, что цена на золото в основном определяется:
- уровень инфляции
- денежная масса относительно размера экономики
- сила и слабость деноминированной валюты
Другими фундаментальными и сентиментальными факторами, которые могут повлиять на цену золота, являются:
- процентные ставки
- требование центрального банка
- спрос на золото в ETF
- спрос на ювелирные изделия
- Позиции CFTC
Отказ от ответственности
Единственная цель этой статьи - обучить читателей, выразив личное мнение автора. Содержание отражает только точку зрения автора на момент написания и не представляет собой никаких финансовых рекомендаций и не отражает каких-либо взглядов аффилированных с автором организаций.