Теперь Кью работает в режиме чтения

Мы сохранили весь контент, но добавить что-то новое уже нельзя

Что такое ложная корреляция?

ПрограммированиеМашинное обучение+3
  · 2,9 K
Openstack DevOps and IBM/Informix Certified DBA . Phd in Math (Duality of spaces of...  · 15 мар 2022
Что такое ложная корреляция?
В статистике ложная корреляция (или ложная корреляция) относится к связи между двумя переменными, которая кажется причинно-следственной, но таковой не является.
При ложной корреляции любые наблюдаемые зависимости между переменными обусловлены просто случайностью или обе связаны с каким-то невидимым искажающим фактором.
===============================
ОСНОВНЫЕ ВЫВОДЫ
===============================
Ложная корреляция или ложность возникает, когда два фактора кажутся случайно связанными друг с другом, но таковыми не являются.
Появление причинно-следственной связи часто связано с аналогичным движением на графике, которое оказывается случайным или вызвано третьим «мешающим» фактором. Ложная корреляция может быть вызвана небольшим размером выборки или произвольными конечными точками. Статистики и ученые используют тщательный статистический анализ для выявления ложных взаимосвязей. Подтверждение причинно-следственной связи требует исследования, в котором учитываются все возможные переменные.
=============================
Понимание ложной корреляции
=============================
Сначала будут казаться ложные отношения, показывающие, что одна переменная напрямую влияет на другую, но это не так. Эта вводящая в заблуждение корреляция часто вызвана третьим фактором, который не очевиден во время исследования, иногда называемым вмешивающимся фактором.
Когда две случайные величины близко отслеживают друг друга на графике, легко заподозрить корреляцию, когда изменение одной переменной вызывает изменение другой переменной. Если оставить в стороне причинно-следственную связь, которая является другой темой, это наблюдение может привести читателя диаграммы к мысли, что движение переменной А связано с движением переменной В или наоборот. Однако более тщательное статистическое исследование может показать, что выровненные движения случайны или вызваны третьим фактором, влияющим на две переменные. Это ложная корреляция. Исследования, проводимые с небольшими размерами выборки или произвольными конечными точками, особенно подвержены ложным результатам.
=======================
Обнаружение ложности
=======================
Самый очевидный способ обнаружить ложную взаимосвязь в результатах исследований — руководствоваться здравым смыслом. Тот факт, что две вещи происходят и кажутся связанными, не означает, что не действуют никакие другие факторы. Однако, чтобы знать наверняка, методы исследования подвергаются критическому анализу.В исследованиях все переменные, которые могут повлиять на результаты, должны быть включены в статистическую модель, чтобы контролировать их влияние на зависимую переменную.
====================================
Как обнаружить ложную корреляцию?
====================================
Статистики и другие ученые, которые анализируют данные, должны постоянно следить за ложными отношениями. Существует множество методов, которые они используют для их идентификации, в том числе:
Обеспечение надлежащей репрезентативности выборки
Получение адекватного размера выборки
Будьте осторожны с произвольными конечными точками
Контроль как можно большего количества внешних переменных
Использование нулевой гипотезы и проверка сильного p-значения
=====================================
Что является примером корреляции, но не причинно-следственной связи?
Примером корреляции является то, что больше сна приводит к лучшей производительности в течение дня. Хотя есть корреляция, не обязательно есть причинно-следственная связь. Больше сна не может быть причиной того, что человек работает лучше; например, они могут использовать новый программный инструмент, повышающий их производительность. Чтобы найти причинно-следственную связь, должны быть фактические данные исследования, показывающего причинно-следственную связь между сном и работоспособностью
Отсутствие "причинно-следственная связь" при наличии "статистической связи" между показателями никак не связано с... Читать дальше
DIY, R, gis  · 17 мар 2022
Это ситуация когда вы рассчитываете корреляцию между двумя показателями в выборке которая представляет из себя смесь распределений с разными матожиданиями. То есть вся наблюдаемая корреляция это просто результат того, что имеется на графике этих показателей минимум две разнесенных группы-кластера вариант изучаемой выборки. В каждом из этих "кластеров" может вообще быть... Читать далее