OpenRefine

programma per pulire dati e allinerli con dati esistenti

OpenRefine è un'applicazione open source per la pulizia e trasformazione dei dati in altri formati, un'attività conosciuta comunemente come data wrangling.[1] Simile alle applicazioni di fogli di calcolo, può gestire formati di file come CSV ma si comporta di più come una base di dati.

OpenRefine
software
Logo
Logo
Schermata di esempio
Schermata di esempio
SviluppatoreGoogle, Metaweb e Antonin Delpeuch
Ultima versione3.6.1 (22 agosto 2022)
LinguaggioJava
JavaScript
Licenzalicenza BSD
(licenza libera)
Sito webopenrefine.org/

Lavora su "righe" di dati composte da celle sotto "colonne", in maniera simile a come opera una base di dati relazionale con le tabelle. I progetti di OpenRefine consistono di un'unica tabella, le cui righe possono essere filtrate usando "facet" che definiscono criteri (ad esempio mostrano le righe dove una data colonna non è vuota).

A differenza dei fogli di calcolo, la maggior parte delle operazioni in OpenRefine sono fatte su tutte le righe visibili, ad esempio, la trasformazione di tutte le celle in tutte le righe sotto un'unica colonna,[2] o la creazione di una nuova colonna basata su dati esistenti. Le azioni eseguite su un insieme di dati (dataset) sono archiviate e possono essere riutilizzate in altri insieme di dati (dataset). Le formule non sono memorizzate nelle celle, ma sono usate per trasformare i dati. La trasformazione è fatta solo una volta.[3] Le espressioni delle formule possono essere scritte nel linguaggio General Refine Expression Language (GREL),[4] in Jython e in Clojure.[5]

Usi modifica

  • Pulizia di dati
  • Trasformazione di dati
  • Analisi di dati di siti web
  • Aggiungere dati per un insieme di dati prelevato da servizi web
  • Allineamento di Wikidata

Formati supportati modifica

Di importazione modifica

Di esportazione modifica

Note modifica

  1. ^ openrefine.github.com, su openrefine.org.
  2. ^ Editing by transforming: Cell Editing wiki page from Refine documentation, su code.google.com. URL consultato il 18 aprile 2012.
  3. ^ Comparison with spreadsheet software: Cell Editing wiki page in Refine documentation, su code.google.com. URL consultato il 18 aprile 2012.
  4. ^ General Refine expression language OpenRefine/OpenRefine Wiki GitHub. Github.com (2013-04-03). Retrieved on 2013-08-16.
  5. ^ Expressions: Refine documentation, su code.google.com. URL consultato il 18 aprile 2012.

Altri progetti modifica

Collegamenti esterni modifica

  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica