Legge della varianza totale

La legge della varianza totale è un teorema della teoria della probabilità, che afferma che se e sono variabili casuali definite sul medesimo spazio di probabilità, e la varianza di è finita, allora:

dove è il valore atteso condizionato di x, e la varianza condizionata, ovvero:

Dal punto di vista della statistica più che della teoria della probabilità, il primo termine è detto componente non spiegata della varianza totale, e il secondo è la componente spiegata; tale suggestiva terminologia si ricollega all'analisi del modello lineare, e in particolare al coefficiente di determinazione, o R².

DimostrazioneModifica

La legge della varianza totale può essere immediatamente dimostrata sfruttando la legge delle aspettative iterate, come segue.

 
 
 
 

Relazione con il modello lineareModifica

La legge della varianza totale presenta un'importante relazione con il modello di regressione lineare. Nel caso univariato, il modello lineare può essere enunciato come:

 

Si ha in tal caso che il rapporto di covarianza:

 

Ma allora, la componente spiegata della varianza totale altro non è che:

 

così che il rapporto tra l'espressione sopra e   è il quadrato del coefficiente di correlazione tra   e  :

 

Tale grandezza corrisponde in effetti al coefficiente di determinazione R². È possibile ottenere un'analoga relazione nel caso multivariato.

Estensioni ai momenti di ordine superioreModifica

Esistono relazioni analoghe alla legge della varianza totale e alla legge delle aspettative iterate per i momenti centrali di ordine superiore. Ad esempio, con riferimento al momento centrale di ordine 3, si ha:

 

Voci correlateModifica

  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica