Formula computazionale per la varianza

metodi computazionali per ottenere la varianza

In teoria della probabilità e statistica, ci sono parecchie formule computazionali per la varianza che permettono di ottenere la varianza di una variabile casuale. La loro utilità dipende da ciò che è già noto sulla variabile casuale; per esempio, una variabile casuale può essere definita in termini della sua funzione di densità di probabilità o per costruzione da altre variabili casuali. In questo contesto, intendiamo ottenere espressioni algebriche per la varianza teorica di una variabile casuale, differentemente dalle questioni di stimare la varianza di una popolazione da dati campione per i quali ci sono speciali considerazioni per l'implementazione di algoritmi di calcolo.

In termini di momenti di origine zeroModifica

Se i momenti di origine zero E(X) e E(X2) di una variabile casuale X sono noti (dove E(X) è il valore atteso di X), allora Var(X) è data da

 

Il risultato è chiamato formula di KönigHuygens nella letteratura francese[1] e noto come teorema di traslazione di Steiner in Germania.[2]

Esiste una formula corrispondente da utilizzare per la stima della varianza da dati campione, che può essere utile nei calcoli manuali. Si tratta di un'identità strettamente correlata che è strutturata per creare una stima priva di bias della varianza della popolazione

 

L'uso di queste formule può tuttavia essere sconveniente nella pratica quando si utilizza l'aritmetica in virgola mobile con precisione limitata: la sottrazione tra due valori di grandezza analoga può portare a una cancellazione catastrofica,[3] e causare così una perdita di significato quando  . Esistono altri algoritmi per il calcolo della varianza numericamente stabili per l'uso con l'aritmetica in virgola mobile.

Dimostrazione

La formula computazionale per la varianza della popolazione segue in maniera diretta dalla proprietà di linearità dei valori attesi e dalla definizione di varianza:

 
Dimostrazione per la stima della varianza
 

Generalizzazione per la covarianzaModifica

Questa formula può essere generalizzata per la covarianza, con due variabili casuali Xi e Xj:

 

così come per la matrice delle covarianze n per n di un vettore casuale di lunghezza n:

 

e per la matrice delle covarianze incrociate n per m tra due vettori casuali di lunghezze n ed m:

 

dove le aspettazioni sono prese elemento per elemento e   e   sono vettori casuali di lunghezze rispettive n e m.

Notare che questa formula soffre della stessa perdita di significato di cui soffre la formula per la varianza se usata per calcolare stime della covarianza.

NoteModifica

  1. ^ In Francese: formule de Koenig–Huygens. Consultare, per esempio, Jean-Jacques Martiano, Maths: prépas commerciales, Studyrama, 2006, p. 148, ISBN 978-2-84472-828-9.
  2. ^ In tedesco: Verschiebungssatz von Steiner. Consultare, per esempio, Gerd Christoph e Horst Hackel, Starthilfe Stochastik: Studium, Springer, 2013, p. 50, ISBN 978-3-322-84799-7..
  3. ^ Donald E. Knuth (1998). The Art of Computer Programming, volume 2: Seminumerical Algorithms, 3rd edn., p. 232. Boston: Addison-Wesley.

Voci correlateModifica