Представь что ковариация это расстояние в шагах, а корреляция - в процентах от максимума.
Если я скажу "до магазина 500 шагов" - это много или мало? Зависит от длины твоего шага.
Если скажу "до магазина 80% от максимального расстояния которое ты можешь пройти" - сразу понятно что далеко.
Ковариация показывает направление и "сырую силу" связи, но ее нельзя сравнивать между разными наборами данных. Ковариация 1000 между переменными A и B может означать слабую связь, а ковариация 50 между C и D - сильную. Зависит от масштаба переменных.
Корреляция (Пирсона) - это ковариация деленная на произведение стандартных отклонений обеих переменных. Получается безразмерная величина от -1 до +1.
- 0.9 - очень сильная положительная связь
- 0.5 - средняя
- 0.1 - слабая
- 0 - нет линейной связи
- отрицательные значения - обратная связь
Формула корреляции:
r = Cov(X,Y) / (σx * σy)
Где Cov - ковариация, σ - стандартное отклонение.
На практике почти всегда используют корреляцию, потому что ее можно интерпретировать и сравнивать. Ковариация нужна в некоторых расчетах (например в формулах портфельной теории Марковица), но для понимания силы связи - корреляция.
Аналогия с шагами просто спасла мне жизнь перед экзаменом! Теперь все встало на места, спасибо огромное!