Perfiles de datos es el acto de analizar el contenido de sus datos. Junto con la elaboración de perfiles de datos, tenemos dos componentes más que integrarían la calidad de los datos. Se trata de corrección de datos y monitoreo de datos.
Créditos fotográficos: Eskemar
Corrección de datos Es el acto de corregir sus datos cuando están por debajo de los estándares. En segundo lugar, monitoreo de datos es el acto continuo de determinar estándares de calidad de datos sobre un conjunto de métricas significativas para el negocio, revise los resultados periódicamente y tome medidas correctivas que puedan superar los umbrales de calidad aceptables.
Pero hoy nos enfocamos solo en perfil de datos. Lo que proporciona a las instituciones la capacidad de analizar grandes cantidades de datos rápidamente en un procedimiento sistemático y repetible.
El análisis que realiza la elaboración de perfiles de datos
Una herramienta de perfilado de datos posibilita realizar diferentes tipos de análisis, cuya combinación posibilita obtener una perspectiva mucho más completa de este activo. Entre ellos están:
- Análisis de exhaustividad: A la vista de sus resultados, descubrirá con qué frecuencia se completa un determinado atributo y con qué frecuencia se deja en blanco o nulo.
- Análisis de distribución de valores: le posibilita averiguar cuál es la distribución de registros por medio de diferentes valores para un atributo dado.
- Análisis de unicidad: es la forma más rápida de saber cuántos valores únicos (distintos) se encuentran para un atributo dado en todos los registros. Por medio de esta analítica, identificará fácilmente los duplicados.
- Análisis de patrones: es el medio a través del cual perfil de datos posibilita saber qué formatos se encontraron para un atributo dado y cuál es la distribución de registros por medio de ese u otros formatos.
- Análisis de rango: se utiliza para averiguar cuáles son los valores mínimo, máximo y promedio que se dan para un atributo dado.
En la práctica, el La elaboración de perfiles de datos puede agregar valor en una amplia variedad de situaciones., algo que probablemente ya sepa si lo utiliza regularmente en su organización. Algunos de los escenarios donde su contribución es más enriquecedora son:
a) Iniciativas de calidad de datos del sistema de origen. Uno de los objetivos de un proyecto de este tipo es intentar corregir los problemas existentes y evitar que aparezcan otros en el futuro. La elaboración de perfiles de datos puede ayudar a maximizar el ROI del proyecto. A través de la creación de perfiles de datos, se pueden identificar las áreas dentro del sistema que sufren los problemas de calidad de datos más graves y / o numerosos. La creación de perfiles además facilitaría la detección de problemas de calidad relacionados con entradas manuales incorrectas o interfaces de sistema defectuosas.
B) Proyectos de migración de datos. La creación de perfiles de datos puede ayudar a minimizar el riesgo de trasladar datos de un sistema heredado al nuevo destino. Aquí, La elaboración de perfiles de datos permitiría descubrir los problemas de calidad existentes antes de migrar los datos.. Por eso, se podría actuar sobre el código o introduciendo los cambios necesarios en el sistema de destino.
c) Iniciativas de Data Warehousing e inteligencia empresarial. La nota común a ambos tipos de proyectos es la necesidad de compilar datos de sistemas dispares. Para este caso, La elaboración de perfiles puede ayudar a garantizar el éxito del proyecto al identificar tres tipos de problemas:
- Aquellos relacionados con la calidad de los datos en origen, para ser corregido allí.
- Aquellos por atributos de calidad que se pueden corregir en el procesamiento ETL.
- Aquellos que disponen que ver con el descubrimiento de reglas negocio que podría dar lugar a la revocación del proyecto.
De todos modos, todos estos beneficios se multiplican cuando la elaboración de perfiles de datos se realiza automáticamente, en lugar de hacerlo manualmente. El herramientas de creación de perfiles de datos Te ayudarán a ganar velocidad, completitud del análisis, permitiendo, en repetidas oportunidades, disfrutar además de un repositorio centralizado para el almacén de datos y metadatos que facilita el intercambio de información por diferentes usuarios empresariales.
(function(d, s, id) {
var js, fjs = d.getElementsByTagName(s)[0];
if (d.getElementById(id)) return;
js = d.createElement(s); js.id = id;
js.src = «//connect.facebook.net/es_ES/all.js#xfbml=1&status=0»;
fjs.parentNode.insertBefore(js, fjs);
}(document, ‘script’, ‘facebook-jssdk’));