Definición, características, beneficios y desafíos

Contenidos


procesos etlEl Procesos ETL son una definición estándar que se utiliza para referirse a la movimiento y transformación de datos. Es el procedimiento que posibilita a las instituciones mover datos de múltiples fuentes, reformatear y cargar en otra base de datos (llamado data mart o almacén de datos) para analizarlos. Además se pueden enviar a otro sistema operativo para respaldar un procedimiento empresarial.

En resumen, el principal objetivo de este procedimiento es facilitar el movimiento y la transformación de datos, integrando los diferentes sistemas y fuentes en la organización moderna.

El término ETL corresponde a las siglas en inglés de:

  • Yextraer: extraer.

  • Ttransformar: transformar.

  • Load: carga.

Fases de un procedimiento ETL

Las diferentes fases o secuencias de un procedimiento ETL son las siguientes:

  • Extracción de datos de uno o más sistemas fuente.

  • Transformación de dichos datos, dicho de otra forma, la oportunidad de reformatear y limpiar estos datos cuando sea necesario.

  • Carga de dichos datos en otro lugar o base de datos, un data mart o un almacén de datos, para analizarlos o dar soporte a un procedimiento empresarial.

Limpieza de datos como una etapa separada de los procesos ETL

Aunque podría entenderse como una acción integrada en la etapa de transformación de datos, hoy en día la tendencia es considerar la limpieza de datos como una etapa separada del procedimiento ETL.

Esta visión corresponde a una concepción más moderna y práctica del procedimiento. Para ahorrar tiempo y ser más eficaz, conviene unificar criterios, a modo de ejemplo introduciendo «av» en lugar de «avenue» en todos los registros de una base de datos de direcciones postales, ANTES de iniciar el procedimiento ETL en sí.

Tan importante es tener la información consolidada como que todos los datos sean correctos y con una visión única para todos los usuarios. Solo así se podrán obtener circuitos de trabajo y análisis verdaderamente óptimos y eficaces de dichos datos.

¿Qué sistemas se pueden integrar en un procedimiento ETL?

Los procesos ETL pueden incluir:

  • Sistemas legado. Dicho de otra forma, legado, heredado o antiguo.

  • Nuevos sistemas. Basado en Windows, Linux y además en redes sociales modernas: Facebook, Twitter, Linkedin, etc.

El sistemas legado o heredado se caracterizan de forma general por: estar cerrados, no permitir cambios y tener difícil acceso (de forma general algún tipo de conductor especial). Son sistemas que procesan hacia adentro y, por eso, no posibilitan la adición de una computadora que funcione en paralelo.

Caso contrario, sistemas nuevos o modernos (basados ​​en Windows o Linux) son abiertos, completos e interconectados. Un ejemplo sería una granja de servidores Linux, que posibilita que los diferentes nodos se interconecten entre sí.

Beneficios de los procesos ETL

Cualquier compañía u organización se beneficia de poner en práctica un procedimiento ETL para mover y transformar los datos que maneja por las siguientes razones:

  • Ser capaz de crear un Administración de datos maestros, dicho de otra forma, un repositorio central estandarizado de todos los datos de la organización. A modo de ejemplo, si tenemos un objeto de cliente en una base de datos de crédito y otro objeto de cliente en la base de datos de tarjetas de crédito, ¿cuál sería el Maestría Sería establecer, de forma concreta e inequívoca, un registro de cliente único con tu nombre y apellidos para la organización.

  • Posibilita a los gerentes tomar decisiones estratégicas basado en el análisis de los datos cargados en las bases de datos nuevas y actualizadas: el lady mart o almacén de datos.

  • Sirve para integrar sistemas. Las instituciones crecen orgánicamente y cada vez se agregan más fuentes de datos. Esto hace que comiencen a surgir nuevas necesidades, como integrar los datos de un banca en línea con datos antiguos de un sistema legado.

  • Poder tener una visión global de todos los datos consolidados en un almacén de datos. A modo de ejemplo, cree una estrategia de marketing basada en el análisis de los datos anteriores.

Procedimiento ETL: un sistema eficaz, pero con desafíos y problemas que solucionar

Como hemos visto, los procesos ETL son muy útiles y beneficiosos para las instituciones debido a su capacidad para integrar grandes bases de datos, logrando así una visión global única que permita a analistas y gerentes tomar las decisiones estratégicas adecuadas.

La implementación de un sistema ETL bien definido es un desafío dado que, para ser verdaderamente efectivo, debe permitir la integración de los sistemas. legado (algunas ya muy obsoletas) con las más modernas. Al mismo tiempo, el acceso a todos estos sistemas debe ocurrir no solo en modo lectura, sino además como escritura.

Posts Relacionados:

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.