Discussione:Analisi delle componenti principali

Ultimo commento: 3 anni fa, lasciato da Cipintina in merito all'argomento Tabelle
Questa voce rientra tra gli argomenti trattati dal progetto tematico sottoindicato.
Puoi consultare le discussioni in corso, aprirne una nuova o segnalarne una avviata qui.
 Economia
ncNessuna informazione sull'accuratezza dei contenuti. (che significa?)
ncNessuna informazione sulla scrittura. (che significa?)
ncNessuna informazione sulla presenza di fonti. (che significa?)
ncNessuna informazione sulla presenza di immagini o altri supporti grafici. (che significa?)


Considerando l'utilità della Analisi delle componenti Principali porrò qui l'algoritmo, ricavato da un libro, su come calcolare appunto le componenti principali. L'algoritmo non è copiato, ma ricavato da una sua applicazione sui dati. Inoltre ho aggiunto qualche dritta per il codice matlab nel caso vogliate far qualche verifica sui software da voi implementati. Con sqrt, indicherò la radice quadrata.

Considero M la Matrice dei dati Calcolo la matrice di covarianza dei dati (in matlab c=cov(m))

Calcolo successivamente la matrice di correlazione (in matlab corrcoef(M)) La matrice di covarianza e correlazione sono strettamente legate Se C è la matrice di covarianza, c = cov(M), allora la matrice di correlazione, CORRCOEF(M), è la matrice i cui elementi (i,j) sono così definiti:

          C(i,j)/sqrt(C(i,i)*C(j,j))

Da ora in poi si lavora solo sulla matrice di correlazione. Si calcolano gli autovettori e autovalori della matrice di correlazione ordinati per autovalori decrescenti (in matlab [v,d]=eig(c) dove in v si avranno gli autovalori e in d gli autovettori)

Si opera sulla matrice di correlazione Ora che conosco gli autovalori e gli autovettori posso conoscere le colonne che danno maggior il maggior contributo di informazione sui dati.

Le colonne della matrice degli autovettori della matrice di correlazione vanno moltiplicati per la radice quadrata positiva del corrispondente autovettore: Sj= sqrt(autovalore)*autovettore (in matlab semplicemente si fa con v*sqrt(d). N.B.: d, che sono gli autovettori, in matlab è una matrice);

Per verifica si nota che: La somma dei quadrati delle righe è 1 La somma dei quadrati delle colonne è l'autovalore corrispondente

Il valore dell'autovalore diviso la somma dei quadrati degli autovalori per cento da i valori comulati percentuali. Più è grande l'autovalore quindi più è rappresentativo. Quelli più grandi quindi sono i dati maggiormente rappresentativi della nostra informazione.

Tabelle

modifica

Le tabelle andrebbero scritte come tabelle e non come immagini jpg provenienti da SPSS. Ho omesso il template W però sarebbe necessario. --AlessioF 21:03, 1 feb 2010 (CET)Rispondi

Ciao Alessio, ho trascritto le tabelle secondo convenzione, ma è la prima volta che mi ci metto e devo farci ancora amicizia, motivo per cui non sono (ancora) riuscito a unire due celle nelle ultime tre tabelle (mi sto riferendo alle celle in corrispondenza del termine "Componenti"). Proverò ancora, ma magari sai darmi un suggerimento? o forse lo sai fare tu? Ti ringrazio in anticipo per qualsiasi dritta in proposito. --Cipintina (msg) 23:47, 31 ago 2021 (CEST)Rispondi
[@ Cipintina]   Fatto! --Horcrux (msg) 21:38, 2 set 2021 (CEST)Rispondi
Grazie mille, @Horcrux :) --Cipintina (msg) 21:48, 2 set 2021 (CEST)Rispondi
Ritorna alla pagina "Analisi delle componenti principali".