Covarianza (probabilità)

In statistica e in teoria della probabilità, la covarianza di due variabili statistiche o variabili aleatorie è un valore numerico che fornisce una misura di quanto le due varino assieme.

Probabilità modifica

Definizione modifica

La covarianza di due variabili aleatorie   e   è il valore atteso del prodotto delle loro distanze dalla media:

 

La covarianza di   e   può anche essere espressa come la differenza tra il valore atteso del loro prodotto e il prodotto dei loro valori attesi:

 

Infatti per la linearità del valore atteso risulta

 

Proprietà modifica

La covarianza rispetta le seguenti proprietà, per variabili aleatorie  ,   e  , e costanti   e  :

  •  
  •  
  •  

Due variabili aleatorie indipendenti hanno covarianza nulla, poiché dalla loro indipendenza segue

 

Due variabili aleatorie che hanno covarianza nulla sono incorrelate.

Due variabili aleatorie dipendenti possono essere incorrelate. Ad esempio, se   è una variabile aleatoria di legge uniforme sull'intervallo   e  , allora

 

Varianza modifica

La covarianza può essere considerata una generalizzazione della varianza

 

e compare come termine di correzione nella relazione

 

Più in generale, per variabili aleatorie   e   vale

 

come caso particolare di

 

Statistica modifica

In statistica la covarianza di due variabili statistiche   e  , indicata come  , è un indice di variabilità congiunta.

Su una popolazione di   osservazioni congiunte  , di rispettive medie   e  , la covarianza osservata è

 

Uno stimatore della covarianza di   osservazioni congiunte   può essere ottenuto correggendo la formula della covarianza, dividendo per il numero di gradi di libertà. In questo caso il numero di gradi di libertà è dato dal numero delle osservazioni,  , a cui va sottratto il numero di stimatori utilizzati nel computo della covarianza. Nella covarianza entrano le medie campionarie delle  , e si può dimostrare che il computo di queste medie corrisponde alla sottrazione di 1 solo grado di libertà (non due, come ci si potrebbe aspettare). Perciò lo stimatore della covarianza è dato da

 

Lo stimatore della covarianza è anche detto covarianza campionaria.

La varianza e la covarianza intervengono per definire l'indice di correlazione di Bravais-Pearson

 

La covarianza è limitata dalla disuguaglianza di Cauchy-Schwarz, infatti siano   e   i vettori degli scarti degli   e   rispetto alle relative medie, si può applicare la diseguaglianza ottenendo

 

che equivale a scrivere

 

Moltiplicando per Un fattore   entrambi i lati si ottiene la relazione

 

dove   e   sono le deviazioni standard per le due variabili.

Nel caso in cui   possiamo dire che la covarianza è limitata nell'intervallo

 

Infatti, l'espressione generale per la deviazione standard di   è

 

Il valore massimo (minimo), per monotonia delle funzioni, sarà ottenuto in corrispondenza di   ( ), quindi il valore corrispondente di   massimo sarà

 

Osserviamo che il valore massimo è dato dalla somma diretta dei contributi delle incertezze tipo moltiplicate per i relativi coefficienti ottenuti linearizzando la relazione. Si dimostra anche che tale formula è generalizzabile al caso di una funzione dipendente da   variabili.

Voci correlate modifica

Collegamenti esterni modifica

Controllo di autoritàThesaurus BNCF 47720 · GND (DE4140520-1