Azure Data Factory

servizio cloud Microsoft

Azure Data Factory è un servizio di integrazione di dati basato su cloud sviluppato da Microsoft Corporation. Fornisce strumenti per l'orchestrazione, la trasformazione e l'integrazione (processi ETL) di grandi quantità di dati provenienti da diverse origini in diverse destinazioni[1].

Azure Data Factory
software
GenereData integration, Data transformation, Data orchestration (non in lista)
SviluppatoreMicrosoft Corporation
Sistema operativo
Sito webazure.microsoft.com

Caratteristiche

modifica

Azure Data Factory[2] offre diverse funzionalità per agevolare l'integrazione dei dati:

  • Pipeline di dati[3]: permette di definire e orchestrare flussi di lavoro per l'estrazione, la trasformazione e il caricamento dei dati da varie sorgenti verso le destinazioni desiderate.
  • Connessioni ai dati[4]: supporta una vasta gamma di origini e destinazioni di dati, inclusi database relazionali, servizi cloud, file system, servizi di archiviazione, ecc.
  • Trasformazione dei dati: fornisce una serie di strumenti per manipolare e trasformare i dati (dataflow), l'elaborazione dei dati in batch e in streaming, e l'uso di funzioni di data wrangling[5].
  • Monitoraggio e gestione[6][7]: permette di monitorare le pipeline di dati, controllare le prestazioni e gestire le risorse in modo efficiente.

Utilizzo

modifica

Azure Data Factory è ampiamente utilizzato in scenari aziendali in cui è necessario integrare e orchestrare grandi quantità di dati provenienti da diverse fonti. Alcuni esempi di utilizzo includono[8]:

  • Data integration: Azure Data Factory consente alle aziende di aggregare dati provenienti da varie origini, come database, servizi cloud, applicazioni SaaS, file system, ecc., e di trasformarli in un formato unificato per un'analisi più approfondita.
  • Data transformation: offre funzionalità avanzate per la trasformazione dei dati, inclusa l'elaborazione in batch e in tempo reale, la pulizia dei dati, la normalizzazione, la deduplicazione[9], ecc.
  • Data orchestration: permette di definire flussi di lavoro complessi per orchestrare il movimento dei dati tra le origini e le destinazioni desiderate, garantendo la coerenza e l'integrità dei dati durante il processo.
  1. ^ (EN) Compare AWS Glue vs. Azure Data Factory | TechTarget, su Cloud Computing. URL consultato il 14 giugno 2023.
  2. ^ (EN) Introduction to Azure Data Factory, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  3. ^ Pipeline di Azure, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  4. ^ Connettori di Azure, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  5. ^ (EN) Creating a dataflow, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  6. ^ (EN) Azure monitor, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  7. ^ (EN) Patrick Pichler, Custom Logging in Azure Data Factory and Azure Synapse Analytics, su Creative Data, 9 novembre 2022. URL consultato il 14 giugno 2023.
  8. ^ (EN) Data factory use cases, su azure.microsoft.com. URL consultato l'11 giugno 2023.
  9. ^ Cos’è la deduplicazione dei dati?, su hpe.com.

Collegamenti esterni

modifica
  Portale Informatica: accedi alle voci di Wikipedia che trattano di informatica