Utente:Pino723/Sandbox/s5

Test di adattamento di Kolmogorov-Smirnov per dati continui

modifica
 
Confronto tra funzione di ripartizione empirica (in blu) e funzione di ripartizione teorica (in rosso)

Considerando un campione di dati   proveniente da una distribuzione continua si vuole verificare l'ipotesi nulla che la relativa funzione di ripartizione sia una certa   assegnata; a tal scopo si definisce la funzione di ripartizione empirica:[1]

 

dove # indica la cardinalità o il numero di elementi dell'insieme.

In base a tale definizione,   è uguale alla frazione dei dati del campione minori o uguali a  , e quindi rappresenta la funzione di ripartizione della variabile aleatoria discreta che può assumere gli   valori osservati con uguale probabilità, e risulta essere una funzione a gradini.[2]

Poiché   è uno stimatore della probabilità che un'osservazione sia minore o uguale a  , cioè della funzione di ripartizione reale dei dati, se l'ipotesi nulla fosse vera, allora   e   non devono scostarsi più di quanto sia ragionevole aspettarsi.[2]

Per valutare l'entità di tale scostamento si definisce la statistica del test di Kolmogorov-Smirnov:[2]

 

Chiamato   il valore assunto dalla statistica  , si definisce il p-dei-dati come:[3]

 

essendo   la probabilità che   sia maggiore o uguale a   nell'ipotesi che   sia la vera distribuzione della popolazione.

Poiché è dimostrabile che la distribuzione di  , e quindi anche  , non dipende dalla scelta di  , si può stimare   simulando una qualunque distribuzione continua su  , anche quella uniforme su (0, 1).[3]

Per effettuare un test con significatività   che in prima approssimazione non dipenda da   si può definire la quantità  :

 

per cui i valori critici   sono quelli che soddisfano la relazione:

 

Perciò, in un test con significatività   si rifiuta l'ipotesi nulla che   sia la distribuzione reale della popolazione se il valore   ottenuto dai dati risulta maggiore di  .[4]

Approssimazioni di   per valori notevoli di  
Livello di significatività   0,10 0,05 0,025 0,01
Valore critico   1,224 1,358 1,480 1,626
  1. ^ Ross (2015), pp. 503-504
  2. ^ a b c Ross (2015), p. 504
  3. ^ a b Ross (2015), p. 506
  4. ^ Ross (2015), p. 507