Concentrazione (statistica)
In statistica la concentrazione è una proprietà dei caratteri trasferibili
Il concetto statistico di concentrazione
modificaCaratteri quantitativi trasferibili
modificaSi usa distinguere i caratteri statistici in qualitativi - quando le modalità del carattere sono espresse mediante attributi - e quantitativi - quando le modalità sono espresse mediante valori numerici, rappresentativi di una misurazione o di un conteggio [1].
Un carattere quantitativo può essere misurato su scala di intervallo - quando lo 0 ha valore convenzionale e i confronti fra valori possono essere eseguiti mediante differenze - o su scala di rapporto - quando lo 0 sta ad indicare l'assenza del carattere medesimo e i confronti possono essere eseguiti anche mediante rapporti fra valori [2]. Alcuni caratteri quantitativi sono propri di una data unità statistica e non sono cedibili o trasferibili da questa ad altre unità, come per esempio la statura, il peso, l'età o il numero di figli partoriti da una donna. Esistono altri caratteri quantitativi, invece, che possono essere ceduti parzialmente o totalmente da un'unità ad un'altra. Ne sono un esempio il patrimonio o il reddito, nonché il numero di dipendenti di un'azienda o il numero di autovetture di una famiglia. Il carattere che un'unità statistica può cedere, anche parzialmente, ad un'altra è detto carattere trasferibile. I caratteri trasferibili sono misurati, naturalmente, su scala di rapporto[3]
Equidistribuzione e concentrazione
modificaSi supponga di rilevare un carattere trasferibile in un collettivo composto da n individui. Le n osservazioni di tale carattere sono genericamente indicate con , , , e, senza perdere in generalità, si supponga che tali valori siano ordinati in senso non decrescente, cioè quando . Essendo il carattere trasferibile ha senso considerare la somma delle n osservazioni, cioè l'ammontare complessivamente posseduto dall'intero collettivo
I termini equidistribuzione e concentrazione fanno riferimento al modo in cui l'ammontare complessivo A è ripartito fra gli n individui. Un carattere trasferibile è equidistribuito quando l'ammontare complessivo A è distribuito in parti uguali fra tutti gli individui, cioè quando
In una simile situazione la frazione degli h individui più poveri è uguale a h/n ed essa possiede una frazione dell'ammontare complessivo A uguale a
cioè le due frazioni coincidono.
Quando il carattere non è equidistribuito, esso è tanto più concentrato quanto minore è la frazione dell'ammontare complessivo A che spetta ad una qualunque frazione degli individui più "poveri", oppure esso è tanto più concentrato quanto maggiore è la frazione dell'ammontare complessivo A che spetta ad una qualunque frazione degli individui più "ricchi". In altre parole, la frazione degli h individui più poveri è ; questi individui collettivamente posseggono una quota dell'ammontare A che può essere determinata come
Agli h individui più poveri si possono contrapporre idealmente gli h individui più ricchi. La frazione degli individui più ricchi sarà ancora , ma la quota dell'ammontare da questi posseduta è
Eccetto che nel caso di equidistribuzione, risulta sempre , cioè e questa differenza è tanto più grande quanto più il carattere è concentrato. Il carattere ha concentrazione massima quando una sola unità possiede l'intero ammontare A e le rimanenti n-1 unità possiedono 0. In questo caso risulta e . Il concetto statistico di concentrazione ha molteplici applicazioni in ambito economico e sociale di cui si darà conto nel par. Applicazioni.
Legami con altri concetti statistici
modificaDalla definizione di equidistribuzione e di concentrazione di un carattere quantitativo trasferibile è evidente che esiste un legame fra questi concetti e la variabilità. La situazione di equidistribuzione coincide chiaramente con una situazione di variabilità nulla. Mentre all'aumentare della concentrazione aumenta la variabilità e viceversa. Fissato l'ammontare complessivo A di un carattere trasferibile, è possibile determinare la distribuzione di frequenze che ha la massima variabilità rispetto ad una data misura (varianza, differenza semplice media, etc.). Si può dimostrare facilmente che tale distribuzione è proprio quella di massima concentrazione, cioè quella in cui n-1 individui posseggono 0 e un solo individuo possiede l'ammontare complessivo A. Potenzialmente, un qualsiasi indice relativo di variabilità può essere adatto a misurare la concentrazione, ma non tutti soddisfano i requisiti necessari per misurare in modo appropriato la concentrazione. Comunque, i legami sopra evidenziati si traducono in relazioni funzionali fra misure di variabilità e di concentrazione che saranno, brevemente, esaminate quando si illustreranno gli indici di concentrazione.
Il concetto statistico di omogeneità è per certi versi analogo a quello di equidistribuzione o concentrazione nulla: difatti, un collettivo è detto omogeneo rispetto ad un dato carattere se tutte le sue unità presentano la medesima modalità del carattere. Il concetto complementare di eterogeneità non coincide con quello di concentrazione. Equidistribuzione e concentrazione hanno anche un legame con i concetti di simmetria e asimmetria della distribuzione di un carattere quantitativo trasferibile.
Il diagramma di Lorenz
modificaIl diagramma di Lorenz è una rappresentazione grafica che consente di mettere rapidamente a confronto una situazione di concentrazione realmente osservata con la situazione ideale di equidistribuzione, nonché di calcolare alcune misure sintetiche della concentrazione.
Costruzione del diagramma a partire da una distribuzione unitaria
modificaCome nella precedente sezione "Equidistribuzione e concentrazione", supponiamo che le n osservazioni di un carattere trasferibile in un collettivo di n unità siano genericamente indicate con e, senza perdere in generalità, si supponga che tali valori siano ordinati in senso non decrescente, cioè quando . Si defiscono le sequenze di valori:
- ammontare cumulato posseduto dalle i unità più povere: . L'ultimo termine di questa successione, , indica l'ammontare del carattere complessivamente detenuto dalle n unità statistiche[4].
- proporzione cumulata del totale posseduta dalle i unità più povere: e per . Si tratta di una sequenza non decrescente di valori, poiché se ,allora risulta .
- proporzione cumulata delle i unità più povere: e per . Si tratta di una sequenza strettamente crescente di valori, poiché se , allora risulta e dunque . Si osservi, inoltre, che i valori rappresentano anche la proporzione cumulata del totale posseduta dalle i unità più povere nel caso in cui vi fosse equidistribuzione del carattere. In tal caso infatti ogni unità possiederebbe e, pertanto, risulta e, naturalmente, , pertanto .
Notiamo, infine, che nel caso di equidistribuzione risulta , mentre se il carattere è concentrato risulta . Difatti per una nota proprietà della media aritmetica risulta e da questa si ottiene .
La curva di Lorenz o di concentrazione si costruisce collocando su un sistema cartesiano monometrico la sequenza in ascissa e la sequenza in ordinata, congiungendo con segmenti i punti così individuati nel piano. Per un pronto confronto visivo con la situazione di equidistribuzione, si riporta sul grafico anche il segmento congiungente i punti e .
Note
modifica- ^ Borra e Di Ciaccio (2008), par. 1.3, Vajani (1978), par. 4.2] e Leti (1983), pp. 73 e seguenti per approfondimenti sulla classificazione dei caratteri statistici.
- ^ Segnaliamo che si usa anche fare distinzione fra caratteri quantitativi discreti e continui. Tale distinzione, però, non è particolarmente importante per la misura della concentrazione.
- ^ Leti (1983), p. 89.
- ^ La notazione serve anche ad evidenziare il fatto che l'ammontare complessivo è una funzione non decrescente del numero delle unità n: se al collettivo viene aggiunta una nuova unità, indicheremo il totale con e risulterà
Bibliografia
modifica- Borra, Simone e Di Ciaccio, Agostino, Statistica: metodologie per le scienze economiche e sociali, 2ª ed., McGraw-Hill, Milano, 2008;
- Leti, Giuseppe, Statistica Descrittiva, Il Mulino, Bologna, 1983;
- Zenga, Michele, Lezioni di statistica descrittiva, Giappichelli Editore, Torino, 2007.