El método Data Vault para modelar un data warehouse nació por necesidad. Los proyectos de almacenamiento de datos a menudo tienen que lidiar con tiempos de implementación excesivamente largos. Esto implica que Las necesidades comerciales pueden cambiar en el transcurso del proyecto, poniendo en peligro el cumplimiento de los plazos de implementación y los costos del proyecto..
Para mejorar los tiempos de implementación, se introdujo el método Bóveda de datos para modelar el almacén de datos. El principio de diseño implica separar las claves comerciales, el contexto y las relaciones en diferentes tablas, como hub, satélite y enlaces.
Conceptos de hub, satélite y enlace
Un hub contiene la clave empresarial real (uno o más campos que identifican de forma única a una entidad para el negocio, ad esempio, un número de cliente) y una clave sustituta que se utiliza para conectar esta tabla con otras estructuras (equivalente a una Chiave primariaLa chiave primaria è un concetto fondamentale nei database, Utilizzato per identificare in modo univoco ogni record all'interno di una tabella. È costituito da uno o più attributi che non possono contenere valori nulli e devono essere univoci. La sua corretta progettazione è fondamentale per mantenere l'integrità dei dati, facilitare le relazioni tra le tabelle e ottimizzare le query. Senza chiave primaria, Ambiguità ed errori potrebbero essere generati nel...). Cosa c'è di più, también puede contener metadatos como marcas de tiempo o información sobre la Origine datiUN "Origine dati" si riferisce a qualsiasi luogo o supporto in cui è possibile ottenere informazioni. Queste fonti possono essere sia primarie che, come sondaggi ed esperimenti, come secondario, come banche dati, articoli accademici o rapporti statistici. La scelta corretta di una fonte di dati è fondamentale per garantire la validità e l'affidabilità delle informazioni nella ricerca e nell'analisi..... Los enlaces a continuación conectan los concentradores con una tabla simple de muchos a muchos que consta de las respectivas llaves de reemplazo..
Por la presente, Los concentradores y enlaces representan la parte más estable de un modelo y están enriquecidos por los llamados satélites.. Un satélite está conectado a un concentrador con su clave de reemplazo y contiene uno o más atributos descriptivos que generalmente se agrupan por un sistema de origen, un contexto comercial o un tipo de cambio.. Cosa c'è di più, una tabla satélite también puede comprender diferentes tipos de metadatos, como períodos de fechas válidas e información sobre su origen.
Un modelo básico de Data Vault podría consistir en un centro de pedidos y un centro de clientes muy simples, así como enlaces y satélites relacionados.. In questo modello, el centro de clientes podría tener dos satélites: uno con datos maestros que posiblemente provengan del sistema CRM y otro con un atributo llamado teléfono inteligente que puede provenir de un sistema de analítica web.
Beneficios de un almacén de datos en el ámbito de Data Vault
- Facilidad de expansión permite un enfoque de proyecto ágil.
- Los modelos creados son GFS è un file system distribuito che supera gli svantaggi dei sistemi tradizionali.
- Los procesos de carga se pueden paralelizar de forma óptima porque hay pocos puntos de sincronización.
- Los modelos son fáciles de auditar
Pero junto con los muchos beneficios, Data Vault también presenta una serie de desafíos.
Desafíos de un almacén de datos en el ámbito del almacén de datos
- Hay un gran aumento en el número de objetos de datos. (tavole, colonne) como resultado de separar los tipos de información y enriquecerlos con la metainformación para la carga.
- Esto da como resultado un mayor esfuerzo de modelado. que comprende numerosas tareas mecánicas poco sofisticadas
¿Cómo puede superar estos desafíos utilizando una herramienta de modelado de datos estándar? La estructura altamente esquemática de los modelos proporciona los requisitos previos ideales para generar modelos. Esto permite automatizar partes importantes del proceso de modelado, lo que permite acelerar drásticamente los proyectos de Data Vault.
Posibilidad de automatizar el Data Warehouse
¿Qué partes específicas del modelo se pueden automatizar? La arquitectura estándar de un almacén de datos incluye las siguientes capas:
- Sistema de origen: Sistema operativo, como sistemas ERP o CRM
- Área de ensayo: Aquí es donde se entregan los datos desde los sistemas operativos. La estructura del modelo de datos generalmente corresponde al sistema fuente, con mejoras para documentar la carga.
- Núcleo del almacén: Aquí se integran datos de varios sistemas. Esta capa se basa en el modelo de Data Vault y se subdivide en las áreas Raw Vault y Business Vault. Esto implica implementar todas las reglas comerciales en Business Vault para que solo se utilicen transformaciones muy simples en Raw Vault.
- Mercados de citas: La estructura de los mercados de datos se basa en los requisitos de análisis y se modela como un esquema en estrella.
Tanto el área de preparación como el Raw Vault son adecuados para la automatización, ya que se pueden establecer reglas de derivación claramente definidas a partir de la capa anterior.
(funzione(D, S, ID) {
var js, fjs = d.getElementsByTagName(S)[0];
Se (d.getElementById(ID)) Restituzione;
js = d.createElement(S); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&stato=0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'copione', 'facebook-jssdk'));