9 Características de las herramientas ETL

Contenidos

en un Procedimiento ETL no todo vale, por lo tanto hay que saber seleccionar. Para hacerlo con conocimiento de los hechos, es necesario conocer las características más importantes que un Software ETL.

Según Gartner, son los siguientes:

  • Conectividad / capacidades adaptativas (con soporte para fuentes y destinos de datos): se refiere a la capacidad de conectarse con una amplia gama de tipos de estructuras de datos, que podrían incluir: bases de datos relacionales y no relacionales, varios formatos de archivo, XML, ERP (sistema de planificación de recursos empresariales), Aplicaciones CRM (sistema de administración de clientes) o SCM (administración de la cadena de suministro – administración de proveedores), formatos de mensajes estándar (EDI, SWIFT o HL7), colas de mensajes, correos electrónicos, sitios web, repositorios de contenido o herramientas de ofimática.
  • Capacidades de entrega de datos: implican la capacidad de proporcionar datos a otras aplicaciones, procesos o bases de datos de diversas formas, con capacidades para la programación de procesos por lotes, en tiempo real o a través de el lanzamiento de eventos.
  • Capacidades de transformación de datos: capacidad para transformar datos, desde transformaciones básicas (conversión de tipos, manipulación de cadenas o cálculos simples) o transformaciones intermedias (agregaciones, resúmenes, búsquedas) hasta transformaciones complejas, como análisis de texto de formato libre o texto enriquecido.
  • Capacidades de modelado de datos y metadatos: recuperación de modelos de datos de fuentes de datos o aplicaciones, creación y mantenimiento de modelos de datos, mapeo de modelo físico a lógico, repositorio de metadatos abierto (con oportunidad de interactuar con otras herramientas), sincronización de cambios en metadatos en los diferentes componentes de la herramienta , documentación, etc.
  • Capacidades de diseño y entorno de desarrollo: representación gráfica de objetos del repositorio, modelos de datos y flujos de datos, soporte para pruebas y, capacidades para el trabajo en equipo, administración de flujos de trabajo de procesos de desarrollo, etc.
  • Capacidades de administración de datos (calidad de datos, perfiles y minería).
  • Adaptación a diferentes plataformas de hardware y sistemas operativos existentes: mainframes (IBM Z / OS), AS / 400, HP Tandem, Unix, Wintel, Linux, Servidores Virtualizados, etc.
  • Habilidades de administración y operaciones: habilidades de administración, seguimiento y control de los procesos de integración de datostales como manejo de errores, recopilación de estadísticas de ejecución, controles de seguridad, etc.
  • Arquitectura e integración: grado de compacidad, consistencia e interoperabilidad de los diferentes componentes que componen la herramienta de integración de datos (con un número mínimo deseable de productos, un único repositorio, un entorno de desarrollo común, interoperabilidad con otras herramientas o vía API), etc. .
  • Capacidades SOA.

Es claro que seleccionar un Software ETL Puede ser una tarea compleja y, debido al impacto que tendrá en el desarrollo posterior de un proyecto, es una decisión que no se puede tomar a la ligera. Una elección correcta garantiza:

  • Un incremento en la velocidad de desarrollo del procedimiento.
  • La descentralización del control de la ejecución y de todos los procesos.
  • Mayor agilidad en el negocio.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.