Una definición de lo que es un almacén en relación con los datos., o más específicamente un almacén de datos, podría ser el siguiente: Un almacén de datos es un sistema que se utiliza para informar y analizar datos. El Los almacenes de datos son repositorios centrales de datos. que integran una o más fuentes de datos dispares. Almacenan datos actuales e históricos y se utilizan para crear informes analíticos para los trabajadores del conocimiento en toda la empresa.
Créditos fotográficos: MickeyCZ
Para comprender completamente qué es el almacén y el proceso de almacenamiento de datos Hay que tener en cuenta las tres capas generales, aunque no son obligatorias, se utilizan con frecuencia, dependiendo de la arquitectura de almacenamiento de datos:
- Capa de integración en el que se almacenan y preparan los datos brutos extraídos.
- Capa de datos principal depósito donde los datos se adaptan al modelo de datos homogéneo de la empresa.
- Data marts y capa de marts estratégicos, que proporciona extractos específicos del almacén de datos corporativo.
Estas capas a menudo cuentan con una lógica empresarial y de transformación interna compleja y, a veces, no se pueden distinguir fácilmente como bloques de construcción discretos. Los desarrollos recientes han simplificado esto y permiten optimizaciones significativas.
Comprender los diferentes componentes para saber qué es un almacén
Hoy dia, Quienes saben qué es un depósito entienden que este depósito de datos ya no solo se alimenta de la información generada por los sistemas internos. Esos tiempos han quedado atrás y la realidad a nivel de arquitectura de datos de cualquier organización es diferente. Nuevos formatos, fuentes de datos alternativas y diferentes tipos de información Dan complejidad a una estructura esencial en el proceso de generación de conocimiento.
Entre los elementos que componen el almacén de datos, y cuyo entendimiento permite saber que es el almacen, son los siguientes:
- Servicios de acceso a datos: A diferencia de los almacenes de información tradicionales, los actuales requieren capacidades de servicio de acceso a datos ampliadas. Solo así es posible garantizar el acceso a fuentes NoSQL, la conmutación flexible entre métodos de acceso a los datos, la transformación de datos no estructurados o la adaptación a fuentes en la nube. , acceso a fuentes NoSQL y capacidades de calidad y transformación para geocodificación y datos no estructurados. Todas estas diferentes tecnologías deben ser administradas y monitoreadas por el almacén de datos lógicos. Es importante que las soluciones de almacenamiento de datos ofrezcan un alto grado de flexibilidad en esta área.
- Preparación de datos: Este componente se encarga de realizar la revisiones y reparaciones de datos. Gracias a su intervención, se puede garantizar la fiabilidad de la fuente (linaje de datos), así como que se cumplan las condiciones mínimas de exhaustividad, integridad y demás atributos de la calidad de los datos. La preparación de los datos son especialmente importantes para trabajar con datos no estructurados, si bien, son precisamente estos los que requieren la participación de especialistas en el proceso, apoyados en las herramientas adecuadas.
- Modelado– En un entorno de almacenamiento de datos moderno, las necesidades de modelado están estrechamente relacionadas con la capacidad de tratar con diferentes semánticas de datos de diversas fuentes.. Entender qué es un almacén es asumir que El enfoque de modelado no debe ser único, sino adaptable a los procesos comerciales y las necesidades de la organización.
- Metadatos: los datos sobre datos adquieren importancia en los nuevos almacenes, ya que necesitan poder asimilar los cambios en la forma en que se representan los datos. Los metadatos permiten descubrir el contexto y la naturaleza independientemente de su representación real.
El almacén de datos diversificado actual debe estar preparado para satisfacer las necesidades de los usuarios., tanto si se trata de demandas relacionadas con la información local, como si se trata de big data o de la nube.
(function(d, s, id) {
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) return;
js = d.createElement(s); js.id = id;
js.src = «//connect.facebook.net/es_ES/all.js#xfbml=1&status=0»;
fjs.parentNode.insertBefore(js, fjs);
}(document, ‘script’, ‘facebook-jssdk’));