La covarianza è una misura statistica che indica il grado di variazione congiunta tra due variabili. In altre parole, ci dice se due variabili tendono a muoversi insieme (in modo simile) o in direzioni opposte.
Formula di Covarianza:
Covarianza campionaria:
cov(X, Y) = Σ [(xi - X̄) * (yi - Ȳ)] / (n - 1)
Dove:
* xi
è l'i-esimo valore della variabile X.
* yi
è l'i-esimo valore della variabile Y.
* X̄
è la media campionaria della variabile X.
* Ȳ
è la media campionaria della variabile Y.
* n
è il numero di osservazioni.
Covarianza della popolazione:
cov(X, Y) = Σ [(xi - μx) * (yi - μy)] / N
Dove:
* xi
è l'i-esimo valore della variabile X.
* yi
è l'i-esimo valore della variabile Y.
* μx
è la media della popolazione della variabile X.
* μy
è la media della popolazione della variabile Y.
* N
è la dimensione della popolazione.
Limitazioni della Covarianza:
Alternativa: Coefficiente di Correlazione:
Per superare le limitazioni della covarianza, viene spesso utilizzato il <a href="https://it.wikiwhat.page/kavramlar/coefficiente%20di%20correlazione" target="_blank">coefficiente di correlazione</a> (spesso indicato come r di Pearson), che è una versione normalizzata della covarianza. Il coefficiente di correlazione varia tra -1 e +1 e fornisce una misura più interpretabile della forza e della direzione della relazione lineare tra due variabili. È calcolato dividendo la covarianza per il prodotto delle deviazioni standard delle due variabili.
In sintesi: La covarianza è uno strumento utile per determinare la direzione della relazione tra due variabili, ma il coefficiente di correlazione è generalmente preferito per valutare la forza e la direzione di tale relazione.