Data mining: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Recupero di 1 fonte/i e segnalazione di 0 link interrotto/i.) #IABot (v2.0
AttoBot (discussione | contributi)
m Bot: Formattazione delle date; modifiche estetiche
Riga 6:
Il concetto di ''data mining'' è simile, ma con una sostanziale differenza: la statistica permette di elaborare informazioni generali riguardo ad una [[campione (statistica)|popolazione]] (es. percentuali di [[disoccupazione]], [[natalità|nascite]]), mentre il ''data mining ''viene utilizzato per cercare correlazioni tra più variabili relativamente ai singoli individui; ad esempio conoscendo il comportamento medio dei clienti di una compagnia telefonica cerco di prevedere quanto spenderà il cliente medio nell'immediato futuro.
 
In sostanza il data mining è "''l'analisi, da un punto di vista matematico, eseguita su [[database]] di grandi dimensioni''", preceduta tipicamente da altre fasi di preparazione/trasformazione/filtraggio dei dati come il [[data cleaning]]. Il termine ''data mining'' è diventato popolare nei tardi [[anni '90]]novanta come versione abbreviata della definizione appena esposta; oggi il ''data mining'' ha una duplice valenza:
 
* estrazione, con tecniche analitiche all'avanguardia, di informazione implicita, nascosta, da dati già strutturati, per renderla disponibile e direttamente utilizzabile;
Riga 27:
Un concetto correlato al data mining è quello di [[apprendimento automatico]] (''Machine learning''); infatti, l'identificazione di pattern può paragonarsi all'apprendimento, da parte del sistema di data mining, di una relazione causale precedentemente ignota, cosa che trova applicazione in ambiti come quello degli [[algoritmo euristico|algoritmi euristici]] e dell'[[intelligenza artificiale]]. Tuttavia, occorre notare che il processo di data mining è sempre sottoposto al rischio di rivelare relazioni causali che poi si rivelano inesistenti.
 
=== Tecniche ===
Tra le tecniche maggiormente utilizzate in questo ambito vi sono:
* [[Clustering]];
Riga 65:
* [[SPSS]]: SPSS Clementine
* [[SAS (linguaggio di programmazione)|SAS]]: SAS Enterprise Miner e SAS Text Miner
* STATA
* [[R (software)|R]]
* [[Oracle Database|Oracle Data Miner]]