Cos'è covarianza?

Covarianza: Misura della Relazione tra Variabili

La covarianza è una misura statistica che indica il grado di variazione congiunta tra due variabili. In altre parole, ci dice se due variabili tendono a muoversi insieme (in modo simile) o in direzioni opposte.

  • Covarianza positiva: Indica che quando una variabile aumenta, anche l'altra tende ad aumentare. Similmente, quando una variabile diminuisce, anche l'altra tende a diminuire. C'è una <a href="https://it.wikiwhat.page/kavramlar/relazione%20diretta" target="_blank">relazione diretta</a>.
  • Covarianza negativa: Indica che quando una variabile aumenta, l'altra tende a diminuire. Similmente, quando una variabile diminuisce, l'altra tende ad aumentare. C'è una <a href="https://it.wikiwhat.page/kavramlar/relazione%20inversa" target="_blank">relazione inversa</a>.
  • Covarianza zero: Indica che non esiste una relazione lineare apparente tra le due variabili. Questo NON implica necessariamente che le variabili siano indipendenti, potrebbero esistere relazioni non lineari. <a href="https://it.wikiwhat.page/kavramlar/indipendenza%20statistica" target="_blank">Indipendenza statistica</a> implicherebbe una covarianza di zero, ma non viceversa.

Formula di Covarianza:

  • Covarianza campionaria:

    cov(X, Y) = Σ [(xi - X̄) * (yi - Ȳ)] / (n - 1)
    

    Dove: * xi è l'i-esimo valore della variabile X. * yi è l'i-esimo valore della variabile Y. * è la media campionaria della variabile X. * Ȳ è la media campionaria della variabile Y. * n è il numero di osservazioni.

  • Covarianza della popolazione:

    cov(X, Y) = Σ [(xi - μx) * (yi - μy)] / N
    

    Dove: * xi è l'i-esimo valore della variabile X. * yi è l'i-esimo valore della variabile Y. * μx è la media della popolazione della variabile X. * μy è la media della popolazione della variabile Y. * N è la dimensione della popolazione.

Limitazioni della Covarianza:

  • Difficile da interpretare la grandezza: La covarianza ha un'unità di misura che è il prodotto delle unità di misura delle due variabili, rendendo difficile valutare l'intensità della relazione. Ad esempio, una covarianza di 10 tra vendite (in euro) e pubblicità (in ore) non è facilmente confrontabile con una covarianza di 5 tra altezza e peso.
  • Sensibile alla scala: La covarianza è sensibile alla scala delle variabili. Moltiplicare una variabile per una costante cambierà il valore della covarianza.

Alternativa: Coefficiente di Correlazione:

Per superare le limitazioni della covarianza, viene spesso utilizzato il <a href="https://it.wikiwhat.page/kavramlar/coefficiente%20di%20correlazione" target="_blank">coefficiente di correlazione</a> (spesso indicato come r di Pearson), che è una versione normalizzata della covarianza. Il coefficiente di correlazione varia tra -1 e +1 e fornisce una misura più interpretabile della forza e della direzione della relazione lineare tra due variabili. È calcolato dividendo la covarianza per il prodotto delle deviazioni standard delle due variabili.

In sintesi: La covarianza è uno strumento utile per determinare la direzione della relazione tra due variabili, ma il coefficiente di correlazione è generalmente preferito per valutare la forza e la direzione di tale relazione.