Paradosso di Simpson: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
"Il paradosso di Simpson è in statistica"???
"sia la metà di quella che si ha tra chi non ha" Con queste belle filastrocche cacofoniche passa la voglia di leggere qualsiasi cosa..
Riga 7:
== Storia ==
Fu descritto da [[George Udny Yule]], nell'articolo "Notes on the theory of association of attributes in Statistics", comparso in [[Biometrika]] nel [[1903]], e da [[E. H. Simpson]], con l'articolo "The interpretation of interaction in contingency tables", pubblicato nel ''Journal of the [[Royal Statistical Society]]'' ([[1951]]).
 
 
== Definizione formale ==
Line 22 ⟶ 21:
== Esempio ==
 
Si ipotizzi una situazione nella quale, a parità di età, la percentuale di disoccupati tra i diplomati o i laureati la percentuale di disoccupati sia la metà dirispetto quellaalla chepopolazione si ha tradi chi non ha conseguito il diploma.
 
Consideriamo però pure il fatto che, per motivi storici, tra le generazioni più anziane i diplomati siano in numero molto minore e che, per motivi legati al [[mercato del lavoro]], tra i giovani il [[tasso di disoccupazione]] èsia più elevato che tra gli anziani.
 
Partendo dalle seguenti due statistiche ipotetiche:
 
{| class="wikitable"
Line 56 ⟶ 55:
|}
dove abbiamo che in entrambi i casi la disoccupazione è circa doppia tra i non diplomati, rispetto ai diplomati, possiamosi può calcolare il numero di disoccupati:
 
{| class="wikitable"
Line 74 ⟶ 73:
|}
 
Questi valori assoluti ci permettono ora di calcolare il tasso di disoccupazione per i non diplomati e per i diplomati senza tenere conto dell'età:. siSi ottiene:
 
{| class="wikitable"
Line 87 ⟶ 86:
|}
 
Improvvisamente siSi scopre così che tra i diplomati il tasso di disoccupazione invece che essere la metà è maggiore di un quarto '''maggiore''' che tra i non diplomati, esattamenteproprio il contrario di quello che si era ipotizzato.
== Cause==
 
Questo paradosso è detto appunto ''di Simpson'' ed è dovuto al fatto che il tasso di disoccupazione è nettamente maggiore nel gruppo che ha una maggiore percentuale di diplomati; trascurare l'esistenza di due relazioni fondamentali (quella tra disoccupazione e età, nonché quella tra età e titolo di studio) fa giungere a conclusioni errate.
 
Mentre in questo caso preparato a tavolino la contraddizione è evidente, nelle analisi statistiche reali può capitare di non accorgersi delle relazioni implicite esistenti tra le variabili e limitarsi ad analizzare dati aggregati senza incrociarli con le variabili essenziali; la contraddizione non verrebbe allora minimamente percepita, e si potrebbero trarre conclusioni completamente opposte alla vera distribuzione, con conseguenze potenzialmente molto gravi.
Line 107 ⟶ 106:
# I giovani sono sei volte più soggetti alla disoccupazione rispetto agli anziani
# ma sia tra i giovani che tra gli anziani avere un diploma riduce il "rischio disoccupazione" alla metà
{{Portale|economia|matematica|medicina|statistica}}
 
[[Categoria:Econometria]]