Bootstrap (statistica)

metodo statistico

Il bootstrap è una tecnica statistica di ricampionamento con reimmissione per approssimare la distribuzione campionaria di una statistica. Permette perciò di approssimare media e varianza di uno stimatore, costruire intervalli di confidenza e calcolare p-value di test quando, in particolare, non si conosce la distribuzione della statistica di interesse.

Nel caso di campionamento casuale semplice, il funzionamento è il seguente: consideriamo un campione effettivamente osservato di numerosità pari ad n, diciamo . Da si ricampionano m altri campioni di numerosità costante pari ad n, diciamo ; in ciascuna estrazione bootstrap, i dati provenienti dal primo elemento del campione, cioè , possono essere estratti più di una volta e ciascun dato ha probabilità pari a 1/n di essere estratto.

Sia lo stimatore di che ci interessa studiare, diciamo . Si calcola tale quantità per ogni campione bootstrap, . In questo modo si hanno a disposizione m stime di , dalle quali è possibile calcolare la media bootstrap, la varianza bootstrap, i percentili bootstrap etc. che sono approssimazioni dei corrispondenti valori ignoti e portano informazioni sulla distribuzione di .

Partendo quindi da queste quantità stimate è possibile calcolare intervalli di confidenza, saggiare ipotesi, etc.

Voci correlateModifica

Controllo di autoritàThesaurus BNCF 52499 · LCCN (ENsh91004766 · BNF (FRcb12378257v (data)
  Portale Matematica: accedi alle voci di Wikipedia che trattano di matematica