Analisi di sopravvivenza: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Smistamento lavoro sporco
Revisione
Riga 1:
L''''analisi di sopravvivenza ''' è un'applicazione della [[statistica]] usata per studiare la [[mortalità]] negli [[Organismo vivente|organismi biologici]] e i guasti nei sistemi meccanici.
Questo argomento è chiamato in ingegneria "[[teoria dell'affidabilità]]" o "analisi di affidabilità", mentre in [[economia]] o in [[sociologia]] è chiamato '''analisi di durata''' o '''modello di durata'''.
 
Riga 18:
 
== Funzione di sopravvivenza==
L'oggetto di interesse primario nella '''funzione di sopravvivenza''' è indicato convenzionalmente con ''S'', viene definito come
 
:<math>S(t) = \Pr(T > t)</math>
Riga 33:
==La funzione di distribuzione della durata della vita e la densità degli eventi==
Le quantità in relazione sono definite in termini della funzione di sopravvivenza.
La '''funzione di distribuzione della durata della vita''', indicata convenzionalmente con ''F'', è definita come il complemento della funzione di sopravvivenza.
 
:<math>F(t) = \Pr(T \le t) = 1 - S(t)</math>
Riga 52:
:<math>\lambda(t)\,dt = \Pr(t \leq T < t+dt\,|\,t \geq T) = \frac{f(t)\,dt}{S(t)} = -\frac{S'(t)\,dt}{S(t)}</math>
 
[[Forza di mortalità]] è un sinonimo di ''"funzione di rischio''", che è usato in modo particolare in [[demografia]] e [[scienza attuariale]].
ilIl termine ''"parte di rischio''" è un altro sinonimo.
 
laLa funzione di rischio deve essere non negativa, λ(''t'') ≥ 0, e il suo integrale tra <math>[0, \infty)</math> deve essere infinito, o altrimenti non limitato; la funzione di rischio può essere crescente o decrescente, non monotona, o discontinua.
Un esempio è la funzione di rischio [[curva del tubo del lavabo]], che è più larga per valori più piccoli di ''t'', decresce ad un certo minimo e dopo cresce di nuovo; questo può descrivere la proprietà di alcuni sistemi meccanici, come anche il fallimento subito dopo una un'operazione, o più tardi, quando il sistema invecchia.
 
La funzione di rischio può in alternativa essere rappresentata nei termini della '''funzione cumulativa di rischio ''', convenzionalmente indicata con <math>\Lambda</math>:
 
:<math>\Lambda(t) = -\log S(t)</math>
Riga 66:
:<math>\frac{d}{dt} \Lambda(t) = -\frac{S'(t)}{S(t)} = \lambda(t)</math>
 
<math>\Lambda</math> è chiamata funzione cumulativa di rischio perché le precedenti definizioni insieme implicano
 
:<math> \Lambda(t) = \int_0^{t} \lambda(u) \, du </math>,
 
che è l''accumulazione'' di rischio nel tempo.
 
poiché <math>\Lambda(t) = -\log S(t)</math> si osserva che <math>\Lambda(t)</math> cresce illimitatamente, <math>t</math> tende ad infinito (ponendo <math>S(t)</math> tendente a zero).
questo implica che <math>\lambda(t)</math> non decresce troppo velocemente, in quanto il rischio cumulativo diverge. Per esempio <math>\exp(-t)</math> non è la funzione di rischio di qualche distribuzione di sopravvivenza, perché il suo integrale converge (a 1).
 
=== Quantità derivate dalla distribuzione di sopravvivenza===
 
''La durata di vita futura'' ada un tempo ''t''<sub>0</sub> è indicata dal tempo che rimane prima della morte, la durata di vita futura è <math>T-t_0</math> nell'attuale notazione.
La '''durata di vita futura attesa''' è il [[valore atteso]] della durata di tempo futuro. La probabilità di morte prima o al tempo<math>t + t_0</math>, una data sopravvivenza fino a <math>t_0</math>, è giusto
 
:<math>P(T \le t_0 + t | T > t_0) = \frac{P(t_0 < T \le t_0 + t)}{P(T > t_0)} = \frac{F(t_0 + t) - F(t_0)}{S(t_0)}</math>
Riga 100:
''S''(''t'') = ''q'' rispetto a ''t''
dove ''q'' è la [[Proporzionalità (matematica)|proporzione]] in questione.
di solito si è interessati al '''tempo di vita [[Media (statistica)|medio]]''', per il quale ''q'' =1/2, o ad altre proporzioni come ''q''=0,90 o ''q'' = 0,99.
 
Si possono ricavare anche inferenze più complesse dalla distribuzione di sopravvivenza.
Riga 108:
==Alcune distribuzioni di sopravvivenza==
I modelli di sopravvivenza [[parametrici]], sono costruiti scegliendo una specifica [[distribuzione di probabilità]] per la funzione di sopravvivenza.
È giusto parlare di adattamento e di analisi di modelli in termini generali, usando il concetto evidenziato in seguito di <nowiki>[[Adattamentoadattamento dei parametri ai dati]]</nowiki>.
Così è relativamente facile sostituire una distribuzione con un'altra, al fine di studiare le conseguenze di scelte differenti.
 
Riga 137:
la [[censura]] è una forma di problema di dati mancanti che è diffusa nell'analisi di sopravvivenza.
Idealmente sia la data di nascita che quella di morte di un soggetto sono note, in tal caso ci è nota la durata della sua vita.
Se sappiamoè noto solo che la data di morte è dopo una tale data, questosi èparla dettodi ''censura destra''. La censura destra si ha per quei soggetti per cui è nota la data di nascita ma che sono ancora vivi quando vengono persi di vista o quando lo studio finisce. Se si sa che la durata di vita di un soggetto è minore di una certa durata, la durata della vita si dice essere censurata a sinistra.
Può anche accadere che soggetti con durata della vita inferiore a qualche soglia non possano essere del tutto osservati: questo si chiama ''troncamento''.
Si noti che il troncamento è differente dalla censura a sinistra, perché per un dato censurato a destra, si sappiamosa che il soggetto esiste, ma per un dato troncato, noisi potremmo essereè completamente ignari del soggetto.il Il troncamento è anche comune. In uno studio definito definito a ''inserimento ritardato'', i soggetti non sono osservati completamente fino a quando non raggiungono una certa età. perPer esempio lail gentecampione non viene osservataosservato fino a quando non raggiunge l'età scolastica. Qualsiasi soggetto deceduto in età prescolare potrebbe rimanere sconosciuto.
 
==Adattamento dei parametri ai dati==
Riga 148:
Allora la funzione di verosimiglianza è il prodotto della verosomiglianza di ciascun dato.
Conviene suddividere i dati in quattro categorie: incensurati, censurati a sinistra, censurati a destra e censurati ad intervallo.
Queste sono indicati rispettivamente cocon ''unc'', ''l.c'' ''r.c'', e ''i.c'' nella seguente equazione.
 
:<math> L(\theta) = \prod_{T_i\in unc.} \Pr(T = T_i|\theta)
Riga 155:
\prod_{i\in i.c.} \Pr(T_{i,l} < T < T_{i,r}|\theta) </math>
 
Per un dato incensurato con <math>T_i</math> uguale all'età della morte, abbiamosi ha
 
:<math> \Pr(T = T_i|\theta) = f(T_i|\theta) </math>
 
Per un dato censurato a sinistra, come quando è noto che l'età della morte è minore di <math>T_i</math>, abbiamosi ha
 
:<math> \Pr(T < T_i|\theta) = F(T_i|\theta) = 1 - S(T_i|\theta) </math>
 
Per un dato censurato a destra, come il caso in cui si sa che l'età di morte è posteriore a <math>T_i</math>, abbiamosi ha
 
:<math> \Pr(T > T_i|\theta) = S(T_i|\theta) </math>
 
Per un dato censurato in un intervallo, come il caso che si sa che l'eta di morte e più grande di <math>T_{i,r}</math> e inferiore di <math>T_{i,l}</math>, abbiamosi ha
 
:<math> \Pr(T_{i,l} < T < T_{i,r}|\theta)
Riga 173:
 
== Bibliografia ==
* David Collett., ''Modelling Survival Data in Medical Research.'', Boca Raton:, Chapman & Hall\CRC., 2003.
* Regina Elandt-Johnson and, Norman Johnson., ''Survival Models and Data Analysis.'', New York:, John Wiley & Sons., 1980/1999.
* Jerald F. Lawless., ''Statistical Models and Methods for Lifetime Data'', 2nd edition., Hoboken, John Wiley and Sons, Hoboken. 2003.
* Terry Therneau. "A Package for Survival Analysis in S"., [https://web.archive.org/web/20060907234826/http://www.mayo.edu/hsr/people/therneau/survival.ps, at:''A https://web.archive.org/web/20080513061144/http://mayoresearch.mayo.edu/mayo/research/biostat/therneau.cfmPackage for Survival Analysis in S'']
*"Engineering Statistics Handbook", NIST/SEMATEK, [http://www.itl.nist.gov/div898/handbook/ NIST/SEMATECH e-Handbook of Statistical Methods]