Para abordar de manera integral el problema de la calidad de los datos, se debe realizar un análisis para cada una de las dimensiones de la calidad de los datos, logrando así solucionar cada una de las dudas existentes en el procedimiento y así mitigar los riesgos de falla en el procedimiento. proyectos de este tipo.
A tal efecto, lo importante y prioritario es tener un punto de partida, una métrica que permita identificar el estado actual de los datos.
Para esto, es fundamental realizar una auditoría inicial o perfilado de los datos, con el fin de conocer en qué estado se encuentran y a partir de ahí, detectar qué se debe corregir y a su vez determinar parámetros de control que ayuden a medir el avance en los procesos de calidad. .
Estos parámetros se conocen como las seis dimensiones de la calidad de los datos y se consideran los puntos clave que la calidad de los datos debe cubrir para garantizar nuestros procesos de limpieza y calidad.
¿Cuáles son las seis dimensiones de la calidad de los datos?
Lo completo
En algunos casos, los datos que no existen son irrelevantes, pero cuando se vuelven necesarios para un procedimiento empresarial, se vuelven críticos.
Conformidad
Los datos que se encuentran en los campos de la tabla deben estar en un formato estándar y legible.
Consistencia
Al comparar la información con los registros, debe evitar la información contradictoria.
Exactitud de la precisión
Si los datos no son precisos, no se pueden usar. A tal efecto, para detectar si estos son precisos, los datos se comparan con una fuente de referencia.
Duplicación
Es esencial saber si tiene la misma información en el mismo formato o en formatos similares dentro de la tabla.
Integridad
Otra dimensión de calidad importante radica en saber si toda la información relevante de un registro está presente de manera utilizable.
Comprender estas seis dimensiones es el primer paso para impulsar la calidad de los datos. Ser capaz de identificar y separar los defectos de los datos, clasificándolos por estas dimensiones, nos posibilita aplicar las técnicas adecuadas para impulsar tanto la información como los procesos que crean y manipulan la información.