Apri il menu principale

Varianza

funzione che che fornisce una misura della variabilità dei valori assunti da una variabile
Nota disambigua.svg Disambiguazione – Se stai cercando il grado di libertà in termodinamica, vedi Grado di libertà (chimica).

In statistica e in teoria della probabilità la varianza di una variabile statistica o di una variabile aleatoria è una funzione, indicata con o con (o semplicemente con se la variabile è sottintesa), che fornisce una misura della variabilità dei valori assunti dalla variabile stessa; nello specifico, la misura di quanto essi si discostino quadraticamente rispettivamente dalla media aritmetica o dal valore atteso .

Il termine di "varianza" venne introdotto nel 1918 da Ronald Fisher e sostituì nel tempo la denominazione di "deviazione standard quadratica" utilizzata da Karl Pearson.

ProbabilitàModifica

DefinizioneModifica

La varianza della variabile aleatoria   è definita come il valore atteso del quadrato della variabile aleatoria centrata  

 

Un esempio di "misura" dello scostamento di una variabile aleatoria dalla media è dato dalla disuguaglianza di Čebyšëv che controlla questo scostamento in termini dello scarto tipo:

 

dove  

ProprietàModifica

Segno della varianzaModifica

La varianza di una variabile aleatoria non è mai negativa, ed è zero solamente quando la variabile assume quasi certamente un solo valore  , cioè se  .

Massimo e minimo della varianza fissati i valori estremi della distribuzioneModifica

Dato un insieme di   unità statistiche, dove   e   sono i valori massimo e minimo tra le unità, il massimo valore che può assumere la varianza è uguale a

 

Se delle osservazioni si conosce soltanto la media  , il valore è uguale a

 

Espressione della varianza come differenza tra il momento di ordine 2 e il quadrato del valore attesoModifica

 Lo stesso argomento in dettaglio: Formula computazionale per la varianza.

Una formula alternativa per la varianza è

 

Questa formula è più pratica per calcolare la varianza.

Dimostrazione

La varianza di   è per definizione pari al valore atteso di

 :

per la linearità del valore atteso si ottiene

 .

Invarianza per traslazioneModifica

La varianza è invariante per traslazione, che lascia fisse le distanze dalla media, e cambia quadraticamente per riscalamento:

 
Dimostrazione

Sfruttando la linearità del valore atteso si trova

 

quindi

 

Varianza della somma di due variabili indipendentiModifica

La varianza della somma di due variabili indipendenti o anche solo incorrelate è pari alla somma delle loro varianze

 
Dimostrazione

Se  , allora   e

 

e siccome le variabili sono indipendenti risulta  

Nel caso generale basta traslare le variabili di modo che abbiano valore atteso nullo (come  ); la loro varianza non cambia.

Varianza della differenza di due variabili indipendentiModifica

Usando le due precedenti affermazioni, possiamo dire che la varianza della differenza di due variabili indipendenti è pari alla somma delle loro varianze

 

Varianza della somma di due variabili non indipendentiModifica

Se   e   non sono indipendenti, la formula viene corretta dalla loro covarianza,

 

dove

 

Varianza della media aritmetica di variabili indipendentiModifica

In particolare, la media aritmetica   di   variabili aleatorie indipendenti aventi la medesima distribuzione, ha varianza aritmetica

 

Variabili aleatorie discrete e continueModifica

La varianza di una variabile aleatoria discreta   a valori in un insieme   si calcola attraverso la sua funzione di probabilità:

 
 

La varianza di una variabile aleatoria continua   a valori in un insieme   si calcola attraverso la sua densità di probabilità:

 
 

EsempioModifica

Una variabile aleatoria di Bernoulli  , cioè che ha probabilità   di fornire "1" e probabilità   di fornire "0", ha valore atteso

 

e la sua varianza può essere calcolata come

 

oppure come

 

StatisticaModifica

In statistica la varianza è un indice di variabilità. Data una distribuzione di un carattere quantitativo   su una popolazione di   elementi, la varianza è la media aritmetica del quadrato delle distanze dei valori dalla loro media

 

dove   è la media aritmetica di  .

Nel caso si disponga della distribuzione di frequenze di un carattere, è possibile calcolare più facilmente la varianza attraverso la seguente formula:

 

dove  rappresenta il numero di modalità in cui si presenta il carattere x, mentre   e   sono rispettivamente la j-esima modalità di x e la relativa frequenza assoluta.

A partire dalla precedente formula, ricordando che  , si ricava anche:

 

dove   è la frequenza relativa della j-esima modalità.

Esiste, infine, una formula semplificata per il calcolo della varianza:

 

Le formule corrispondenti alla precedente che fanno uso della frequenza assoluta e di quella relativa sono:

 
 

Il difetto della varianza è quello di non avere la stessa unità di misura dei valori analizzati (se, per esempio, questi sono in cm, la varianza sarà in cm2), perciò in statistica viene molto spesso utilizzata anche la radice quadrata della varianza, vale a dire lo scarto quadratico medio (o deviazione standard o scarto tipo)  . Con riferimento a questa notazione la varianza si trova quindi anche indicata come  .

StimatoriModifica

In statistica si utilizzano solitamente due stimatori per la varianza su un campione di cardinalità  :

  e  

dove   è la media campionaria. Il primo è detto varianza campionaria, mentre il secondo è detto varianza campionaria corretta a causa della sua proprietà di correttezza. Infatti lo stimatore   è privo di distorsione, cioè il suo valore atteso è proprio la varianza:

 .
Dimostrazione
 

Al contrario, lo stimatore   ha un valore atteso diverso dalla varianza,  .

Una spiegazione del termine   è data dalla necessità di stimare anche la media che per il teorema del limite centrale ha varianza 1/n. Se la media è nota, lo stimatore   diventa corretto. Questa è detta "correzione di Bessel".

Se le   sono variabili aleatorie normali  , lo stimatore   è una variabile aleatoria con distribuzione  .

EsempioModifica

Il campione di   elementi   ha media campionaria pari a:

 

e gli stimatori della varianza valgono rispettivamente

 

e

 

Voci correlateModifica

Altri progettiModifica

Collegamenti esterniModifica

Controllo di autoritàGND (DE4078739-4 · NDL (ENJA00561029