Что хорошо, почему у вас плохо и как оценить причинно-следственную связь.

1 . Что такое хорошая корреляция?

Если вы когда-нибудь видели коэффициент корреляции, вы, вероятно, смотрели на число и задавались вопросом, хорошо ли это? Является ли корреляция -0,73 хорошей, но не +0,58? Что такое хорошая корреляция и что делает корреляцию хорошей?

Типы корреляции

Сила взаимосвязи между двумя переменными обычно выражается коэффициентом корреляции момента продукта Пирсона, обозначаемым r. Коэффициенты корреляции Пирсона имеют значения от -1,0 до +1,0, где:

  • -1,0 представляет идеальную корреляцию, при которой все измеренные точки попадают на линию с отрицательным наклоном.
  • 0.0 представляет абсолютно отсутствие линейной зависимости между переменными
  • +1,0 представляет собой идеальную корреляцию точек на линии с положительным наклоном.

Если у вас есть набор данных с более чем одной переменной, вам нужно взглянуть на коэффициенты корреляции. Есть много типов.

Коэффициент корреляции Пирсона используется, когда обе переменные измеряются на непрерывной (т. е. интервальной или относительной) шкале. Существует несколько вариантов коэффициентов корреляции произведения Пирсона. коэффициент множественной корреляции, обозначаемый R, указывает на силу связи между зависимой переменной и двумя или более независимыми переменными. Коэффициент частичной корреляции показывает силу связи между зависимой переменной и одной или несколькими независимыми переменными при постоянном влиянии других независимых переменных. Скорректированный или уменьшенный коэффициент корреляции указывает на силу связи между переменными после поправки на количество переменных и количество точек данных. Существуют также коэффициенты корреляции для переменных, измеряемых на прерывистой шкале. Например, Spearman R рассчитывается на основе рангов по порядковой шкале.

«Хорошо» относительно

Итак, что такое хорошая корреляция? Это зависит от того, кого вы спросите.

  • Однажды я спросил химика, калибровавшего лабораторный прибор по эталону, какое значение коэффициента корреляции она ищет. «0,9 — это слишком мало. Вам нужно как минимум 0,98 или 0,99». Она получила номер из правительственного директивного документа.
  • Однажды я спросил инженера, проводившего регрессионный анализ процесса обработки, какое значение коэффициента корреляции он ищет. «Все, что находится между 0,6 и 0,8, приемлемо». Об этом ему рассказал профессор колледжа.
  • Однажды я спросил биолога, который проводил дисперсионный анализ размеров полевых мышей, живущих в загрязненных и нетронутых почвах, какое значение коэффициента корреляции он искал. Он не знал, но его отсечка составила 0,2, исходя из наименьшей разницы в размерах, которую его модель могла обнаружить с количеством образцов, которые у него были.

Является ли 0,2 хорошей корреляцией или хорошая корреляция должна быть как минимум 0,6 или даже 0,98? Как оказалось, у химика, инженера и биолога все было в порядке. Все эти корреляции были хорошими для этих целей. Таким образом, «хорошесть» коэффициента корреляции частично зависит от ожиданий человека, который его использует.

Но как узнать, какое значение коэффициента корреляции следует ожидать, чтобы он был хорошим? Один из ответов — посмотреть на квадрат коэффициента корреляции, называемый коэффициентом детерминации, R-квадрат. R-квадрат — это оценка доли дисперсии зависимой переменной, которая учитывается независимой переменной (переменными). Он обычно используется для интерпретации силы взаимосвязи между переменными и для сравнения альтернативных статистических моделей.

Возможно, вы сможете решить, насколько хороша ваша корреляция, исходя из интуитивных ощущений того, какую изменчивость вы хотите учесть в зависимости. Например, значения коэффициента корреляции примерно от -0,3 до +0,3 составляют менее 9% дисперсии связи между двумя переменными, что может указывать на слабую связь или даже на ее отсутствие. Значения от -0,3 до -0,6 или от +0,3 до +0,6 составляют от 9% до 36% дисперсии, что может указывать на связь от слабой до умеренно сильной. Значения от -0,6 до -0,8 или от +0,6 до +0,8 составляют от 36% до 64% ​​дисперсии, что может указывать на зависимость от умеренно сильной до сильной. Значения между -0,8 и -1,0 или +0,8 и +1,0 составляют более 64% дисперсии, что может указывать на очень сильную связь.

Вы можете найти другие рекомендации и способы интерпретации коэффициентов корреляции в Википедии, Коэффициент корреляции: определение Брюса Ратнера, Интерпретация коэффициента корреляции: базовый обзор Ричарда Тейлора и Как интерпретировать Коэффициент корреляции r Деборы Дж. Рамси».

Как проверить, что хорошее является «хорошим»

Есть несколько вещей, которые вы можете сделать, чтобы убедиться, что ваша корреляция действительно «хорошая». Вы можете построить данные и провести статистический тест.

Графики — всегда следует отображать данные, используемые для расчета корреляции, чтобы гарантировать, что коэффициент адекватно представляет взаимосвязь. Величина r очень чувствительна к наличию нелинейных тенденций и выбросов. Нелинейные тенденции в данных приводят к недооценке величины взаимосвязи. Вы часто можете использовать преобразования, чтобы выпрямить любые нелинейные паттерны, которые вы видите. Выбросы (т. е. значения данных, не репрезентативные для совокупности), которые расположены перпендикулярно тренду данных, вызывают недооценку взаимосвязи. Выбросы, параллельные тренду данных, вызывают переоценку отношения.

Тесты.Каждый рассчитанный коэффициент корреляции является оценкой. «Реальное» значение может быть несколько больше или несколько меньше. Вы можете провести статистический тест, чтобы определить, отличается ли рассчитанная вами корреляция от нуля. Если это не так, нет никаких доказательств взаимосвязи между вашими переменными. В этом тесте рассматривается абсолютное значение коэффициента корреляции и количество пар данных, использованных для его расчета. Чем больше значение корреляции и чем больше количество пар данных, тем больше вероятность того, что корреляция будет значительно отличаться от нуля.

Например, корреляция 0,5 будет значительно больше нуля на основе примерно 11 пар данных, но корреляция 0,1 не будет существенно отличаться от нуля с 380 парами данных. Вот почему все статистические программы выводят количество пар данных и вероятность теста с корреляцией. С помощью некоторых программ вы также можете рассчитать доверительный интервал вокруг вашей оценки, чтобы увидеть, включает ли этот интервал значение, которое вы установили в качестве цели. Но так или иначе, вы должны учитывать изменчивость вашей расчетной оценки, чтобы решить, является ли корреляция хорошей.

У коэффициентов корреляции есть несколько других ловушек, о которых следует знать. Значение коэффициента множественной или частичной корреляции может не соответствовать вашему определению хорошей корреляции, даже если оно значительно отличается от нуля. Это связано с тем, что вычисляемые значения будут иметь тенденцию к завышению, если переменных много, но пар данных всего несколько, поэтому необходим этот сокращенный коэффициент корреляции. Парадокс заключается в том, что большая корреляция не обязательно является хорошей вещью. Если вы разрабатываете статистическую модель и обнаруживаете, что ваши переменные-предикторы сильно коррелируют с вашей зависимой переменной, это здорово. Но если вы обнаружите, что ваши переменные-предикторы сильно коррелируют друг с другом, это нехорошо, и вам придется иметь дело с этой мультиколлинеарностью в вашем анализе. Наконец, если вы вычисляете множество коэффициентов корреляции из большого набора данных, вы можете обнаружить, что количество пар данных для каждого расчета разное из-за отсутствия данных. Некоторые статистики считают допустимым сравнивать корреляции, рассчитанные с разным количеством пар данных, а другие статистики считают, что это необоснованно, бессмысленно, нечестно, мошеннически, отвратительно и отвратительно зло.

Что ты должен делать

То, что делает корреляцию хорошей, зависит от ваших ожиданий, значения оценки, значительно ли отличается оценка от нуля и образуют ли пары данных линейный шаблон без каких-либо нерепрезентативных выбросов. Вы должны рассматривать корреляции в каждом конкретном случае. Однако помните также, что «отсутствие отношений» также может быть важным выводом.

2. Почему вы не получаете ожидаемой корреляции?

Если вы когда-либо посещали занятия по статистике корреляции, вы, вероятно, пришли к выводу, что большое значение коэффициента корреляции, как положительное, так и отрицательное, означает, что между двумя переменными существует заслуживающая внимания взаимосвязь. Это не всегда так. Кроме того, небольшая корреляция не всегда может означать отсутствие связи между переменными.

Размер корреляции не всегда имеет значение

Небольшой коэффициент корреляции не обязательно означает отсутствие связи в большей степени, чем большой коэффициент корреляции подразумевает сильную связь. Это зависит от типа отношения и данных, используемых для его характеристики. Это важно, потому что аналитики часто посвящают все свое время изучению больших корреляций, игнорируя отношения с малыми коэффициентами корреляции, особенно если у них нет ожиданий относительно того, каким на самом деле может быть хорошее значение.

Статистические причины малых корреляций

Есть несколько статистических причин неожиданных корреляций:

  • Нелинейные отношения. Коэффициенты корреляции предполагают, что отношения между двумя переменными являются линейными. Нелинейные отношения приводят к меньшим, чем ожидалось, коэффициентам корреляции. Диаграмма рассеяния переменных обычно может подтвердить эту проблему, которую часто можно исправить с помощью преобразования данных.
  • Выбросы. Сила коэффициента корреляции может быть понижена или завышена за счет выбросов. Диаграмма рассеяния обычно может подтвердить наличие выбросов, хотя решение о том, как с ними обращаться, может быть более проблематичным.
  • Чрезмерная неконтролируемая дисперсия. Иногда точки данных, которые кажутся выбросами, могут быть просто случаями избыточной дисперсии. Избыточная дисперсия, вероятно, является наиболее распространенной причиной меньших, чем ожидалось, корреляций. Обычно избыточная дисперсия является результатом отсутствия адекватного контроля при генерации данных.

  • Несоответствующая выборка. Точки данных, которые выглядят как выбросы или избыточная дисперсия, могут быть фиктивными выборками. Фальсифицированные образцы не являются репрезентативными для анализируемой совокупности и, таким образом, искажают любые расчетные статистические данные. Выборки также могут отражать тенденции, скрытые в субпопуляциях, что, возможно, даже приводит к парадоксу Симпсона.
  • Неэффективные показателиПеременные, используемые в анализе, могут не подходить для исследования рассматриваемого явления. Например, качество воды может быть связано с растворенными или взвешенными твердыми частицами, но они не измеряют одно и то же. Как следствие, сила связи будет меньше, чем ожидалось.

Вот почему любая оценка корреляции должна включать рассмотрение знака и величины коэффициента, диаграммы рассеяния связи и статистической проверки значимости. В отношениях данных гораздо больше информации, чем может быть выражено одной статистикой.

Если с набором данных нет статистических проблем, важно также рассмотреть, какие типы взаимосвязей между переменными возможны.

Отношения Причины малых корреляций

Типы отношений

Когда аналитики видят большой коэффициент корреляции, они начинают строить догадки о возможных причинах. Они, естественно, будут тяготеть к своей первоначальной гипотезе (или предвзятому мнению), которая заставит их в первую очередь исследовать взаимосвязь данных. Поскольку гипотезы обычно касаются причинно-следственной связи, они часто начинаются с этого наименее вероятного типа отношений. Помимо причинно-следственной связи отношения могут также отражать влияние или ассоциацию:

Причины. Причина – это условие или событие, которое непосредственно запускает, инициирует, вызывает или вызывает другое условие или событие. Причина — это sine qua non; без причины не будет следствия. Причины имеют направленный характер. Причина должна предшествовать своему следствию.

Влияния. Влияние – это условие или событие, которое изменяет проявление существующего состояния или события. Воздействия могут быть прямыми или опосредованными отдельным условием или событием. Влияния могут существовать в любое время до или после воздействия условия или события. Воздействия могут быть однонаправленными или двунаправленными.

Связи. Связи – это два условия или события, которые изменяются взаимосвязанным образом. Любые две переменные, которые изменяются сходным образом, будут казаться связанными. Таким образом, ассоциации могут быть ложными или реальными. Связи могут существовать в любое время до или после связанного условия или события. В отличие от причин и влияний, связанные переменные не влияют друг на друга и могут не существовать в разных популяциях или в одной и той же популяции в разное время или в разных местах.

Ассоциации обычные. Большинство наблюдаемых корреляций, вероятно, являются просто ассоциациями. Влияния и причины менее распространены, но, в отличие от ассоциаций, они могут быть подтверждены наукой или другими принципами, на которых основаны данные. Сила коэффициента корреляции не связана с типом связи. Причины, влияния и ассоциации могут иметь как сильную, так и слабую корреляцию в зависимости от эффективности коррелируемых переменных и характера взаимосвязи.

Модели взаимоотношений

Большинство дискуссий о корреляции и причинно-следственной связи сосредоточены на простой прямой связи, состоящей в том, что одно событие или условие, обозначенное как A, связано со вторым событием или условием, обозначенным как Б. Например, гравитационные силы Луны и Солнца вызывают океанские приливы на Земле. A вызывает B, но B не вызывает А. Другая прямая связь заключается в том, что возраст влияет на рост и вес. Возраст не влияет на рост и вес, но с возрастом мы становимся больше, поэтому A влияет на B.

Прямые отношения легко понять, и, если нет статистических запутанностей, они должны демонстрировать высокую степень корреляции. На практике, однако, не все отношения прямые или простые. Вот восемь:

Отношения обратной связи: A и B связаны в петле; A вызывает или влияет на B, который затем вызывает или влияет на A и так далее. Например, плохая успеваемость в школе или на работе (A) вызывает стресс (B), который еще больше ухудшает успеваемость. (A), что приводит к большему стрессу (B) и т. д.

Общая взаимосвязь: третье событие или условие, C, вызывает или влияет на оба A и B. Например, жаркая погода (c) заставляет людей носить шорты (A) и пить прохладительные напитки (B). Ношение шорт не вызывает и не влияет на потребление напитков, хотя они связаны общей причиной. Другим примером является влияние ожирения на восприимчивость к различным заболеваниям.

Опосредованная связь: A вызывает или влияет на C и C вызывает или влияет на Bтак что создается впечатление, что A вызывает B. Например, дождливая погода (A) часто побуждает людей пойти в местный торговый центр, чтобы чем-нибудь заняться (c). Находясь там, они делают покупки, обедают и ходят в кино или другие развлекательные заведения, тем самым увеличивая доход торгового центра (B). Напротив, снежные бури (A) часто вынуждают людей оставаться дома (c), что снижает доходы торговых центров (B ). Плохая погода напрямую не влияет на доходы торговых центров, но влияет на то, посещают ли их люди.

Стимулированные отношения: A вызывает или влияет на B но только в присутствии C. Есть много примеров этого паттерна, например, метаболические и химические реакции с участием ферментов или катализаторов.

Подавленная связь: A вызывает или влияет на B но не в присутствии C. Например, патогены (A) вызывают инфекции (B), но не в присутствии антибиотиков (с). Некоторые препараты (A) вызывают побочные эффекты (B) только у определенных групп риска ( в).

Обратная связь: отсутствие A вызывает или влияет на B. Например, дефицит витаминов (A) вызывает или влияет на широкий спектр симптомов (B).

Пороговая взаимосвязь: A вызывает или влияет на B только когда A выше определенного уровня. Например, дождь (А) вызывает наводнение (В) только в том случае, если его объем или интенсивность очень высоки.

Сложная взаимосвязь. Множество факторов или событий A способствуют возникновению или влиянию B . Многочисленные экологические процессы соответствуют этому образцу. Например, различные атмосферные и астрономические факторы (A) влияют на изменение климата (B ).

Фальшивые отношения

Существует также множество ложных отношений, в которых A представляется причиной или влиянием B, но нет. Часто причина в том, что отношения основаны на анекдотических свидетельствах, которые в более общем плане недействительны. Иногда ложные отношения могут быть какими-то другими отношениями, которые не понимают. Вот пять других причин, по которым ложные отношения так распространены.

Неправильно понятые отношения. Наука, стоящая за отношениями, может быть неправильно понята. Например, раньше врачи считали, что острая пища и стресс вызывают язву. В настоящее время более широко признается роль бактериальной инфекции. Точно так же было обнаружено, что основной причиной акне являются гормоны, а не диета (например, потребление шоколада и жареной пищи).

Неверная интерпретация статистики. Существует множество примеров неправильной интерпретации статистических взаимосвязей. Например, количество бездомных, по-видимому, влияет на преступность. Опять же, как и количество музеев и доступность общественного транспорта. Все эти факторы связаны с городскими районами, но не обязательно с преступностью.

Неправильно интерпретированные наблюдения: к реальным наблюдениям привязаны неправильные причины. Многие сказки старых жен основаны на заслуживающих доверия наблюдениях. Например, представление о том, что волосы и ногти продолжают расти после смерти, является неверным объяснением законного наблюдения.

Городские легенды. Некоторые городские легенды имеют под собой реальную основу, а некоторые являются чистой выдумкой, но все они связаны с ложными отношениями. Например, в Южной Корее считалось, что сон с вентилятором в закрытом помещении приведет к смерти.

Предвзятые утверждения: некоторые ложные отношения не основаны на каких-либо доказательствах, а вместо этого утверждаются в попытке убедить других в их достоверности. Например, утверждение о том, что из-за мастурбации у вас появляются волосатые ладони, не только смехотворно, но и легко опровергаемо. Точно так же почти любая реклама в поддержку кандидата на выборах содержит какую-то предвзятость, например, выбор вишен.

3. Как определить, подразумевает ли корреляция причинно-следственную связь?

Вы, наверное, слышали предостережение:

Корреляция не подразумевает причинно-следственную связь.

Все согласны с тем, что корреляция — это не то же самое, что причинно-следственная связь. Однако эти два слова — корреляция и причинность — вызвали немало дискуссий.

Не всегда то, что вы ожидаете

Вычисленные коэффициенты корреляции являются невинными сторонними наблюдателями в дебатах о причинно-следственной связи, влиянии и ассоциации. Со всеми статистическими и реляционными нюансами, которые могут повлиять на их интерпретацию, удивительно, что они так часто используются сами по себе в качестве детерминант причинно-следственной связи и влияния. Как и все статистические данные, коэффициенты корреляции необходимо интерпретировать в контексте, обеспечиваемом другими типами информации. Достоверная корреляция не подразумевает причинно-следственной связи, но, по мнению Эдварда Тафте и других, иногда является хорошей подсказкой.

Почему причинно-следственная связь имеет значение

Никто не возмутится, если вы скажете, что два состояния или события коррелированы, но даже предполагаете, что причинно-следственная связь возможна, и вы получите избитое предостережение и, возможно, еще более резкую критику. Однако доказать причинно-следственную связь непросто, поэтому должна быть причина для приложения усилий. Например, если вы можете выяснить, что вызывает состояние или событие, вы можете:

  • Продвигайте взаимосвязь для извлечения выгоды, например, между сельскохозяйственными методами и растениеводством или фармацевтическими препаратами и выздоровлением от болезней.
  • Предотвратите причину, чтобы избежать пагубных последствий, таких как авиакатастрофы и производственные дефекты.
  • Подготовьтесь к неизбежным пагубным последствиям, таким как стихийные бедствия, такие как наводнения.
  • Привлечь к ответственности виновного, как в законе, или возложить вину, как в политике.
  • Размышляйте о том, что может произойти в будущем, если возникнут такие же отношения, например, в экономике.
  • Искать знания, основанные не более чем на любопытстве, например, как мурлыкают кошки.

Так как же определить, действительно ли корреляция подразумевает причинно-следственную связь?

Критерии причинности

Иногда почти невозможно убедить скептиков в причинно-следственной связи. Иногда даже трудно убедить своих сторонников. Разработка критериев причинно-следственной связи была предметом беспокойства в медицине на протяжении веков. За эти годы было предложено несколько наборов критериев, наиболее широко цитируемыми из которых являются критерии, описанные в 1965 году Остином Брэдфордом Хиллом, британским медицинским статистиком. Критерии Хилла для причинно-следственной связи определяют минимальные условия, необходимые для принятия вероятности причинно-следственной связи между двумя показателями, как:

  • Сила. Связь с большей вероятностью будет причинно-следственной, если коэффициент корреляции велик и статистически значим.
  • Постоянство. Связь с большей вероятностью будет причинно-следственной, если ее можно воспроизвести.
  • Специфичность: связь с большей вероятностью будет причинно-следственной, если нет другого вероятного объяснения.
  • Временность: связь с большей вероятностью будет причинно-следственной, если следствие всегда возникает после причины.
  • Градиент. Связь с большей вероятностью будет причинно-следственной, если большее воздействие предполагаемой причины приводит к большему эффекту.
  • Правдоподобие. Связь с большей вероятностью будет причинно-следственной, если существует правдоподобный механизм между причиной и следствием.
  • Согласованность. Связь с большей вероятностью будет причинно-следственной, если она совместима со связанными фактами и теориями.
  • Эксперимент. Скорее всего, связь будет причинно-следственной, если ее можно проверить экспериментально.
  • Аналогия. Связь с большей вероятностью будет причинно-следственной, если между сходными причинами и следствиями есть доказанная взаимосвязь.

Эти критерии являются надежными принципами для установления того, является ли одно условие или событие причиной другого состояния или события. Однако ни один индивидуальный критерий не является надежным. Вот почему важно соответствовать как можно большему количеству критериев. Тем не менее, иногда причинно-следственная связь недоказуема.

Три шага, чтобы решить, подразумевает ли корреляция причинно-следственную связь

Критерии Хилла можно рассматривать как аспекты процесса критического мышления, соображения в рамках научного метода или модель для принятия решения о том, включает ли связь причинно-следственную связь. Не обязательно, чтобы все критерии были соблюдены, чтобы предположить наличие причинно-следственной связи, а некоторые могут даже не соответствовать всем критериям. Важным моментом является тщательное и беспристрастное рассмотрение критериев.

Шаг 1. Проверка показателей

Предостережение о том, что корреляция не подразумевает причинно-следственную связь, используется, чтобы напомнить всем, что коэффициент корреляции может фактически характеризовать некаузальное влияние или связь, а не причинно-следственную связь. Большой коэффициент корреляции не обязательно указывает на причинно-следственную связь. С другой стороны, утверждение, что корреляция является необходимым, но недостаточным условием причинности, или, другими словами, причинность не может возникнуть без корреляции, также не обязательно верно. Причин отсутствия корреляции довольно много.

Итак, прежде чем слишком увлекаться какой-то причинно-следственной связью, убедитесь, что корреляция статистически законна. Вы не можете оценить градиент отношения (т. е. знак коэффициента корреляции) и силу (т. е. значение коэффициента корреляции), если корреляция ошибочна. Убедитесь, что:

  • Используйте метрики (переменные), которые подходят для количественной оценки отношений. Например, не используйте индекс, который является отношением другой метрики в отношении.
  • Используйте соответствующий коэффициент корреляции, основанный на шкалах метрик отношений.
  • Подтвердите, что образцы репрезентативны для анализируемой совокупности и что взаимосвязь является линейной (или вы используете нелинейные методы анализа).
  • Убедитесь, что нет никаких выбросов или чрезмерной неконтролируемой дисперсии.

Градиент большинства причинно-следственных связей положителен. Обратные отношения будут иметь отрицательный градиент. Сила причинно-следственных связей может быть почти любой; это зависит от того, что вы ожидаете. Если вы не знаете, чего ожидать, посмотрите на квадрат коэффициента корреляции, называемый коэффициентом детерминации, R-квадрат. R-квадрат — это оценка доли дисперсии, разделяемой двумя переменными. Он обычно используется для интерпретации силы взаимосвязи между переменными. Имейте в виду, однако, что даже причинно-следственные связи могут показывать меньшие, чем ожидалось, корреляции.

Шаг 2. Объясните взаимосвязь

Если вас устраивают градиент и сила коэффициента корреляции, следующим шагом будет определение модели взаимосвязи. Корреляция может оказаться бесполезной при изучении модели взаимосвязи, поскольку графики данных для разных моделей могут выглядеть одинаково. Тем не менее, нет смысла прилагать дополнительные усилия, если корреляция каким-то образом сомнительна.

Сначала проверьте временность данных. Если причина не всегда предшествует следствию, то либо отношение является отношением обратной связи, либо не является причинным. Если причина и следствие не измеряются одновременно, временность может быть скрыта.

Затем попытайтесь определить, какая модель отношений вероятнее всего. Это непросто, но это также и не постоянное решение. Если вы не уверены, начните с прямой или обратной зависимости, которую можно определить по графикам данных. Затем, изучая отношения дальше, вы сможете оценить, могут ли они быть основаны на обратной связи, общем источнике, посредничестве, стимуляции, подавлении, пороге или множественных сложностях.

Рассмотрите ваши отношения с точки зрения критериев правдоподобия, согласованности, аналогии и специфичности Хилла. Правдоподобие и когерентность, пожалуй, самые простые из критериев, потому что слишком легко рационализировать объяснения наблюдаемого явления. Они также могут полагаться на связанные факты и теории, которые могут меняться со временем. Аналогию встретить немного сложнее, но не невозможно для плодотворного ума. Однако аналогичные отношения могут казаться похожими, но на самом деле их можно отнести к очень разным лежащим в их основе механизмам. Недалекие люди полагаются на конкретику в своих аргументах. С другой стороны, взаимосвязи могут не иметь другого вероятного объяснения, потому что явление недостаточно изучено.

Шаг 3. Проверка объяснения

Возможно, наиболее важными критериями Хилла являются Эксперимент и Постоянство. Если вы серьезно относитесь к доказательству наличия причинно-следственной связи между двумя состояниями или событиями, вам необходимо проверить эту связь с помощью эффективного плана исследования. Такой эксперимент обычно требует модели взаимосвязи, проверяемой гипотезы, основанной на модели, включения мер контроля дисперсии, сбора подходящих показателей для взаимосвязи и соответствующего анализа.

Соответствующий анализ может быть статистическим (с использованием нескольких выборок из четко определенной совокупности и таких анализов, как ANOVA, для оценки эффектов) или детерминированным (с использованием репрезентативного примера компонента взаимосвязи для демонстрации эффекта). Если эксперимент подтвердит взаимосвязь, особенно если она может быть последовательно воспроизведена независимыми сторонами, будут получены убедительные доказательства причинно-следственной связи, и любые ложные связи будут опровергнуты. Две проблемы заключаются в том, что эта проверка может потребовать значительных усилий и что не каждое соотношение можно проверить экспериментально.

Существует два типа исследований — экспериментальные и наблюдательные. В экспериментальном исследовании исследователи решают, каким условиям будут подвергаться субъекты (сущности, над которыми экспериментируют), а затем измеряют интересующие переменные. В обсервационном исследовании исследователи наблюдают за субъектами, которые обладают оцениваемыми условиями, а затем измеряют интересующие переменные. Оба типа экспериментальных планов имеют свои проблемы. Исследователи могут быть не в состоянии манипулировать изучаемыми условиями в эксперименте из-за стоимости, логистических или этических проблем. Наблюдательные исследования могут подвергаться смешению, условиям, которые мешают интерпретации результатов. Следовательно, подтвердить, что связь является причинно-следственной, часто легче сказать, чем сделать.

Подразумевающая причинно-следственная связь

Критерии Хиллса были разработаны для медицины. Медицинские исследования могут начинаться с отдельных наблюдений и переходить к статистическим наблюдениям за случаями. Добавьте демографические данные, и любые закономерности появления могут стать очевидными. Затем модели оцениваются для поиска последовательных, правдоподобных объяснений и аналогов. Некоторые медицинские гипотезы можно проверить и проанализировать статистически. Фармацевтическая эффективность является примером. Психологические и сельскохозяйственные отношения часто можно проверить. Другими отношениями нельзя манипулировать, поэтому их необходимо анализировать на основе наблюдений. Примером могут служить эпидемиологические исследования. Без возможности полагаться на критерии Эксперимент и Непротиворечивость, причинно-следственная связь может быть аргументирована только с использованием более слабого Правдоподобия, Согласованности, Аналогия и Специфичность. Это также относится к природным явлениям, таким как оползни и землетрясения. Некоторые условия уникальны или базовая база знаний недостаточна для убедительного объяснения явления. В таких случаях даже критерии Правдоподобие, Согласованность, Аналогия и Специфичность бесполезны. Экономические и политические отношения часто попадают в эту категорию.

Итак, если вы слышите, как кто-то утверждает, что связь является причинно-следственной, подумайте, как могут применяться критерии Хилла, прежде чем верить этому утверждению.

Все изображения созданы автором, если не указано иное.