Scienza dei dati: differenze tra le versioni

Contenuto cancellato Contenuto aggiunto
Riga 6:
Il termine "Scienza dei dati" è stato introdotto per la prima volta nel [[1974]] dall'informatico danese [[Peter Naur]] nel suo libro ''Concise Survey of Computer Methods'' come evoluzione del concetto di ''datalogy'' utilizzato dallo stesso Naur qualche anno prima<ref>{{Cita pubblicazione|autore=Peter Naur|anno=1966|titolo=The science of datalogy|rivista=Communications of the ACM|volume=9|numero=7}}</ref> per contrapporlo al concetto più limitativo di [[informatica]]. In questa prima definizione, Naur intende la Scienza dei dati come una disciplina relativa alla gestione e alla manipolazione dei dati così come si presentano<ref>{{Cita libro|autore=Peter Naur|titolo=Concise Survey of Computer Methods|data=1974|editore=Studentlitteratur}}</ref>, ponendo poca enfasi alla possibilità di estrarre, dagli stessi dati, informazioni di valore.
 
E'È stata riconosciuta come disciplina a sé stante (quindi non più una branca di informatica e statistica) soltanto nel [[2001]], quando William Cleveland ne delineò i campi di competenza, elencando sei diverse aree: ricerca multidisciplinare, modelli, elaborazione dati, pedagogia, valutazione degli strumenti e teoria<ref>{{Cita pubblicazione|autore=William S. Cleveland|anno=2001|titolo=Data science: An action plan for expanding the technical areas of the field of statistics|rivista=International Statistical Review|volume=|numero=|url=https://www.semanticscholar.org/paper/Data-science%3A-An-action-plan-for-expanding-the-of-Cleveland/915cd8e2b39eb02723553913d592b2237d4d9960}}</ref>.
 
Con l'avvento dei big data e dell'idea di "valore del dato" propria di questo paradigma, è evoluto il concetto stesso di Scienza dei dati, che diviene così una {{sf|scienza olistica}}, il quale principio fondante non è la mera gestione del dato, ma una più ampia valorizzazione della grande mole eterogenea di dati proveniente da diverse fonti ([[data warehouse]], sensori, web, ecc...). La Scienza dei dati al giorno d'oggi va quindi intesa come una disciplina trasversale, cui fanno capo sia le sfere dell'informatica, della statistica e della matematica, come nell'accezione originale, sia un insieme di competenze più manageriali, legate alla più recente necessità di sapere leggere, interpretare e capitalizzare i dati a fini di business.