¿Es la unificación de datos lo mismo que su integración? ¿Pueden intercambiarse? ¿Puede una acción reemplazar a la otra en un proyecto? ¿Puede su confusión afectar el rendimiento de una solución de inteligencia empresarial? Aunque es cierto que unificación de datos Necesita menos tiempo y, por tanto, implica menos costes que un procedimiento de integración, no es una alternativa y las compañías necesitan comprender la diferencia para evitar los inconvenientes de una mala decisión.
Créditos de las fotos: istock espíritu alfa
Diferencia entre integración y unificación de datos
La diferencia entre los dos conceptos es obvia:
- El unificación de datos Es el procedimiento de reunir las entidades y atributos en un data warehouse, cada uno manteniendo su forma, valor y características técnicas que existen en la fuente.
- El integración de datos es el procedimiento de combinar entidades y atributos para que tengan forma, significado y características técnicas comunes.
Mientras que la La integración es uno de los requerimientos prioritarios para la administración de datos maestros., la unificación de datos habitualmente plantea desafíos a las instituciones. Y lo hace tanto a nivel de almacén de datos como en los repositorios. El desafío tiene que ver con el hecho que se reduce la capacidad de los usuarios para comprender y analizar datos. ¿Por qué pasó esto? Hay muchas razones:
- Por una parte, los usuarios deben intentar determinar por sí mismos qué atributos y valores significan lo mismo. Como es fácil de adivinar, lo más común es que cada persona encuentre un significado distinto al de los demás usuarios empresariales.
- Y lo que es más, los procesos se ralentizana medida que se agrega tiempo para cada análisis y el valor del resultado a menudo se minimiza.
En respuesta a estos problemas, muchas veces, Las compañías intentan compensar este tipo de problemas a través de la creación de reglas de integración complejas. en las capas semánticas de las herramientas frontales. Pero no es una buena solución puesto que, en la práctica, al mismo tiempo del tiempo adicional que se necesita para crear el modelo, puede llegar a ralentizar significativamente el tiempo de respuesta, especialmente si las reglas están siendo procesadas por la herramienta de BI en lugar de por la base de datos. .
¿Cómo llegamos aquí?
Es claro que, para prevenir este tipo de En situaciones, es mejor dejar de confundir la unificación de datos con la integración de datos y no usarlos indistintamente, pero cada acción cuando sea apropiado. El primer paso para lograrlo es conocer el causas que llevan a que esto suceda, entre los que cabe resaltar:
- El participación de un usuario con perfil técnico pero sin experiencia en modelado de datos en entornos de Data Warehouse. Tristemente, la escasez de personal calificado en las compañías hace que a menudo sea necesario usar los recursos disponibles para determinadas tareas, quienes pueden tener más experiencia en el mundo OLTP.
- Otra razón es que se necesita más tiempo para integrar los datos. Necesita elaboración de perfiles de datos, análisis de datos e interacción con expertos en el campo. A estas limitaciones hay que agregar el hecho de que pueden existir factores políticos involucrados que confrontan diferentes áreas al momento de determinar un sentido común en determinados puntos.
- Para terminar, otro factible escenario que conduce a estos problemas relacionados con unificación de datos es en el que un almacén de datos funciona con una sola fuente y surgen problemas cuando se descubre que el modelo de datos no se ha creado para acomodar los datos integrados.