El método Data Vault para modelar un Armazem de dados nació por necesidad. Los proyectos de almacenamiento de datos a menudo tienen que lidiar con tiempos de implementación excesivamente largos. Esto implica que Las necesidades comerciales pueden cambiar en el transcurso del proyecto, poniendo en peligro el cumplimiento de los plazos de implementación y los costos del proyecto..
Para mejorar los tiempos de implementación, se introdujo el método Bóveda de datos para modelar el almacén de datos. El principio de diseño implica separar las claves comerciales, el contexto y las relaciones en diferentes tablas, como hub, satélite y enlaces.
Conceptos de hub, satélite y enlace
Un hub contiene la clave empresarial real (uno o más campos que identifican de forma única a una entidad para el negocio, por exemplo, un número de cliente) y una clave sustituta que se utiliza para conectar esta tabla con otras estructuras (equivalente a una clave primariaLa clave primaria es un concepto fundamental en bases de datos, utilizado para identificar de manera única cada registro dentro de una tabla. Consiste en uno o varios atributos que no pueden contener valores nulos y deben ser únicos. Su correcto diseño es crucial para mantener la integridad de los datos, facilitando relaciones entre tablas y optimizando consultas. Sin una clave primaria, se podrían generar ambigüedades y errores en la...). O que mais, también puede contener metadatos como marcas de tiempo o información sobre la Fonte de dadosUMA "Fonte de dados" refere-se a qualquer lugar ou meio onde as informações podem ser obtidas. Essas fontes podem ser primárias e, como levantamentos e experimentos, como secundário, como bancos de dados, Artigos acadêmicos ou relatórios estatísticos. A escolha certa de uma fonte de dados é crucial para garantir a validade e confiabilidade das informações em pesquisa e análise..... Los enlaces a continuación conectan los concentradores con una tabla simple de muchos a muchos que consta de las respectivas llaves de reemplazo..
Por la presente, Los concentradores y enlaces representan la parte más estable de un modelo y están enriquecidos por los llamados satélites.. Un satélite está conectado a un concentrador con su clave de reemplazo y contiene uno o más atributos descriptivos que generalmente se agrupan por un sistema de origen, un contexto comercial o un tipo de cambio.. O que mais, una tabla satélite también puede comprender diferentes tipos de metadatos, como períodos de fechas válidas e información sobre su origen.
Un modelo básico de Data Vault podría consistir en un centro de pedidos y un centro de clientes muy simples, así como enlaces y satélites relacionados.. Neste modelo, el centro de clientes podría tener dos satélites: uno con datos maestros que posiblemente provengan del sistema CRM y otro con un atributo llamado teléfono inteligente que puede provenir de un sistema de analítica web.
Beneficios de un almacén de datos en el ámbito de Data Vault
- Facilidad de expansión permite un enfoque de proyecto ágil.
- Los modelos creados son altamente escalável.
- Los procesos de carga se pueden paralelizar de forma óptima porque hay pocos puntos de sincronización.
- Los modelos son fáciles de auditar
Pero junto con los muchos beneficios, Data Vault también presenta una serie de desafíos.
Desafíos de un almacén de datos en el ámbito del almacén de datos
- Hay un gran aumento en el número de objetos de datos. (Pranchas, colunas) como resultado de separar los tipos de información y enriquecerlos con la metainformación para la carga.
- Esto da como resultado un mayor esfuerzo de modelado. que comprende numerosas tareas mecánicas poco sofisticadas
¿Cómo puede superar estos desafíos utilizando una herramienta de modelado de datos estándar? La estructura altamente esquemática de los modelos proporciona los requisitos previos ideales para generar modelos. Esto permite automatizar partes importantes del proceso de modelado, lo que permite acelerar drásticamente los proyectos de Data Vault.
Posibilidad de automatizar el Data Warehouse
¿Qué partes específicas del modelo se pueden automatizar? La arquitectura estándar de un almacén de datos incluye las siguientes capas:
- Sistema de origen: Sistema operacional, como sistemas ERP o CRM
- Área de ensayo: Aquí es donde se entregan los datos desde los sistemas operativos. La estructura del modelo de datos generalmente corresponde al sistema fuente, con mejoras para documentar la carga.
- Núcleo del almacén: Aquí se integran datos de varios sistemas. Esta capa se basa en el modelo de Data Vault y se subdivide en las áreas Raw Vault y Business Vault. Esto implica implementar todas las reglas comerciales en Business Vault para que solo se utilicen transformaciones muy simples en Raw Vault.
- Mercados de citas: La estructura de los mercados de datos se basa en los requisitos de análisis y se modela como un esquema en estrella.
Tanto el área de preparación como el Raw Vault son adecuados para la automatización, ya que se pueden establecer reglas de derivación claramente definidas a partir de la capa anterior.
(função(d, s, Eu iria) {
var js, fjs = d.getElementsByTagName(s)[0];
E se (d.getElementById(Eu iria)) Retorna;
js = d.createElement(s); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&status = 0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'roteiro', 'facebook-jssdk'));