Cos'è dispersione?

Dispersione (Statistica)

La dispersione, in statistica, si riferisce alla misura in cui i dati in un insieme di dati sono sparsi o raggruppati intorno a un valore centrale, come la media o la mediana. Una bassa dispersione indica che i dati sono concentrati vicino al valore centrale, mentre un'alta dispersione indica che i dati sono più distribuiti.

Diverse misure statistiche vengono utilizzate per quantificare la dispersione:

  • Campo di variazione (Range): La differenza tra il valore massimo e il valore minimo in un insieme di dati. È una misura semplice ma sensibile agli outlier.
  • Varianza: Una misura della media dei quadrati delle deviazioni di ciascun valore dalla media. Fornisce una misura complessiva della dispersione, ma è espressa in unità quadrate.
  • Deviazione standard: La radice quadrata della varianza. Esprime la dispersione nella stessa unità di misura dei dati originali, rendendola più interpretabile. (Vedi anche Deviazione%20Standard)
  • Scarto interquartile (IQR): La differenza tra il terzo quartile (Q3) e il primo quartile (Q1). Rappresenta la dispersione del 50% centrale dei dati ed è meno sensibile agli outlier rispetto al campo di variazione.
  • Coefficiente di variazione: Il rapporto tra la deviazione standard e la media. È una misura adimensionale di dispersione che consente di confrontare la variabilità tra insiemi di dati con medie diverse.

La scelta della misura di dispersione appropriata dipende dalla natura dei dati e dagli obiettivi dell'analisi. Ad esempio, se ci sono outlier significativi nei dati, lo scarto interquartile potrebbe essere una misura più robusta della dispersione rispetto alla deviazione standard.

Comprendere la dispersione è fondamentale nell'analisi statistica perché fornisce informazioni sulla variabilità dei dati, sulla loro affidabilità e sulla loro distribuzione. Permette di valutare la rappresentatività della media e di identificare eventuali anomalie.