Definizione, caratteristiche, vantaggi e sfide

Contenuti


Processi etlIl Processi ETL sono una definizione standard utilizzata per riferirsi alla proprietà spostamento e trasformazione dei dati. È la procedura che abilita le istituzioni Spostare i dati da più origini, reformatear y cargar en otra Banca dati (chiamato data mart oh data warehouse) per analizzarli. Possono anche essere inviati a un altro sistema operativo per supportare una procedura aziendale.

In sintesi, L'obiettivo principale di questa procedura è facilitare lo spostamento e la trasformazione dei dati, integrare i diversi sistemi e fonti nell'organizzazione moderna.

Il termine ETL sta per:

  • Eestratto: estratto.

  • Ttrasformare: trasformare.

  • lOad ·: carico.

Fasi di una procedura ETL

Le diverse fasi o sequenze di una procedura ETL sono le seguenti:

  • Estrazione di dati provenienti da uno o più sistemi di origine.

  • Trasformazione di tali dati, In altre parole, l'opportunità di riformattare e pulire questi dati quando necessario.

  • Carico di tali dati in un'altra posizione o database, un data mart o un data warehouse, per analizzarli o supportare una procedura aziendale.

Pulizia dei dati come fase separata dei processi ETL

Anche se potrebbe essere inteso come un'azione integrata nella fase di trasformazione dei dati, oggi la tendenza è quella di considerare il pulizia dei dati come fase separata della procedura ETL.

Questa visione corrisponde a una concezione più moderna e pratica della procedura.. Per risparmiare tempo ed essere più efficaci, i criteri dovrebbero essere unificati, come esempio inserendo “Av” invece di “viale avenue” in tutti i record di un database di indirizzi postali, PRIMA di avviare la procedura ETL stessa.

È importante avere le informazioni consolidate in quanto tutti i dati sono corretti e con un'unica visione per tutti gli utenti. Solo in questo modo sarà possibile ottenere circuiti di lavoro e analisi di tali dati veramente ottimali ed efficienti..

Quali sistemi possono essere integrati in una procedura ETL?

I processi ETL possono includere:

  • Sistemi Eredità. In altre parole, Eredità, ereditato o vecchio.

  • Nuovi sistemi. Basato su Windows, Linux e anche nei moderni social network: Facebook, Twitter, Linkedin, eccetera.

Il Sistemi Eredità o ereditato sono generalmente caratterizzati da: essere chiuso, non consentire modifiche e avere un accesso difficile (in generale una sorta di autista speciale). Sono sistemi che elaborano verso l'interno e, perché, Non consentire l'aggiunta di un computer che funziona in parallelo.

Caso opposto, sistemi nuovi o moderni (Basato su Windows o Linux) sono aperti, completo e interconnesso. Un esempio potrebbe essere una farm Linux, che consente ai diversi nodi di interconnettersi tra loro.

Vantaggi dei processi ETL

Qualsiasi azienda o organizzazione trae vantaggio dall'implementazione di una procedura ETL per spostare e trasformare i dati che gestisce per i seguenti motivi::

  • Essere in grado di creare un Gestione dei dati anagrafici, In altre parole, un repository centrale standardizzato di tutti i dati dell'organizzazione. Come esempio, Se abbiamo un oggetto cliente in un database di credito e un altro oggetto cliente nel database delle carte di credito, quale sarebbe il Maestria Sarebbe quello di stabilire, concretamente e inequivocabilmente, un record cliente univoco con il tuo nome e cognome per l'organizzazione.

  • Abilita i manager prendere decisioni strategiche basato sull'analisi dei dati caricati in database nuovi e aggiornati: il lady mart o data warehouse.

  • Serve a integrare i sistemi. Le istituzioni crescono organicamente e vengono aggiunte sempre più fonti di dati. Ciò fa sì che inizino ad emergere nuove esigenze., Che cosa integrare i dati di un servizi bancari online con vecchi dati da un sistema Eredità.

  • Può avere una visione globale di tutti dati consolidati in un data warehouse. Come esempio, creare una strategia di marketing basata sull'analisi dei dati di cui sopra.

Caratteristiche degli strumenti ETL: un sistema efficace, ma con sfide e problemi da risolvere

Come abbiamo visto, I processi ETL sono molto utili e vantaggiosi per le istituzioni a causa della loro capacità di integrare database di grandi dimensioni, realizzando così una visione globale unica che consente ad analisti e manager di prendere le giuste decisioni strategiche.

L'implementazione di un sistema ETL ben definito è una sfida dato che, per essere veramente efficaci, deve consentire l'integrazione dei sistemi. Eredità (alcuni già molto obsoleti) con i più moderni. Allo stesso tempo, L'accesso a tutti questi sistemi deve avvenire non solo in modalità di lettura, ma anche come scrittura.

Articoli correlati:

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.