Utilice Data Vault para diseñar correctamente su almacén de datos

Conteúdo

El método Data Vault para modelar un Armazem de dados nació por necesidad. Los proyectos de almacenamiento de datos a menudo tienen que lidiar con tiempos de implementación excesivamente largos. Esto implica que Las necesidades comerciales pueden cambiar en el transcurso del proyecto, poniendo en peligro el cumplimiento de los plazos de implementación y los costos del proyecto..

data20vault-8577141

Para mejorar los tiempos de implementación, se introdujo el método Bóveda de datos para modelar el almacén de datos. El principio de diseño implica separar las claves comerciales, el contexto y las relaciones en diferentes tablas, como hub, satélite y enlaces.

Conceptos de hub, satélite y enlace

Un hub contiene la clave empresarial real (uno o más campos que identifican de forma única a una entidad para el negocio, por exemplo, un número de cliente) y una clave sustituta que se utiliza para conectar esta tabla con otras estructuras (equivalente a una clave primaria). O que mais, también puede contener metadatos como marcas de tiempo o información sobre la Fonte de dados. Los enlaces a continuación conectan los concentradores con una tabla simple de muchos a muchos que consta de las respectivas llaves de reemplazo..

Por la presente, Los concentradores y enlaces representan la parte más estable de un modelo y están enriquecidos por los llamados satélites.. Un satélite está conectado a un concentrador con su clave de reemplazo y contiene uno o más atributos descriptivos que generalmente se agrupan por un sistema de origen, un contexto comercial o un tipo de cambio.. O que mais, una tabla satélite también puede comprender diferentes tipos de metadatos, como períodos de fechas válidas e información sobre su origen.

Un modelo básico de Data Vault podría consistir en un centro de pedidos y un centro de clientes muy simples, así como enlaces y satélites relacionados.. Neste modelo, el centro de clientes podría tener dos satélites: uno con datos maestros que posiblemente provengan del sistema CRM y otro con un atributo llamado teléfono inteligente que puede provenir de un sistema de analítica web.

Beneficios de un almacén de datos en el ámbito de Data Vault

  • Facilidad de expansión permite un enfoque de proyecto ágil.
  • Los modelos creados son altamente escalável.
  • Los procesos de carga se pueden paralelizar de forma óptima porque hay pocos puntos de sincronización.
  • Los modelos son fáciles de auditar

Pero junto con los muchos beneficios, Data Vault también presenta una serie de desafíos.

Desafíos de un almacén de datos en el ámbito del almacén de datos

  • Hay un gran aumento en el número de objetos de datos. (Pranchas, colunas) como resultado de separar los tipos de información y enriquecerlos con la metainformación para la carga.
  • Esto da como resultado un mayor esfuerzo de modelado. que comprende numerosas tareas mecánicas poco sofisticadas

¿Cómo puede superar estos desafíos utilizando una herramienta de modelado de datos estándar? La estructura altamente esquemática de los modelos proporciona los requisitos previos ideales para generar modelos. Esto permite automatizar partes importantes del proceso de modelado, lo que permite acelerar drásticamente los proyectos de Data Vault.

Posibilidad de automatizar el Data Warehouse

¿Qué partes específicas del modelo se pueden automatizar? La arquitectura estándar de un almacén de datos incluye las siguientes capas:

  • Sistema de origen: Sistema operacional, como sistemas ERP o CRM
  • Área de ensayo: Aquí es donde se entregan los datos desde los sistemas operativos. La estructura del modelo de datos generalmente corresponde al sistema fuente, con mejoras para documentar la carga.
  • Núcleo del almacén: Aquí se integran datos de varios sistemas. Esta capa se basa en el modelo de Data Vault y se subdivide en las áreas Raw Vault y Business Vault. Esto implica implementar todas las reglas comerciales en Business Vault para que solo se utilicen transformaciones muy simples en Raw Vault.
  • Mercados de citas: La estructura de los mercados de datos se basa en los requisitos de análisis y se modela como un esquema en estrella.

Tanto el área de preparación como el Raw Vault son adecuados para la automatización, ya que se pueden establecer reglas de derivación claramente definidas a partir de la capa anterior.

(função(d, s, Eu iria) {
var js, fjs = d.getElementsByTagName(s)[0];
E se (d.getElementById(Eu iria)) Retorna;
js = d.createElement(s); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&status = 0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'roteiro', 'facebook-jssdk'));

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.