Per affrontare in modo completo il problema della qualità dei dati, un'analisi deve essere eseguita per ciascuna delle dimensioni della qualità dei dati, riuscendo così a risolvere ciascuno dei dubbi della procedura e quindi a mitigare i rischi di fallimento della procedura. progetti di questo tipo.
A quello scopo, l'importante e prioritario è avere un punto di partenza, una metrica per identificare lo stato attuale dei dati.
Per questo, è essenziale un audit iniziale o una profilazione dei dati, per sapere in che stato si trovano e da lì, rilevare ciò che deve essere corretto e, a sua volta, determinare i parametri di controllo che aiutano a misurare i progressi nei processi di qualità. .
Questi parametri sono noti come le sei dimensioni della qualità dei dati e sono considerati i punti chiave che la qualità dei dati deve coprire per garantire i nostri processi di pulizia e qualità..
Quali sono le sei dimensioni della qualità dei dati??
lo completo
In alcuni casi, i dati che non esistono sono irrilevanti, ma quando diventano necessarie per una procedura aziendale, diventano critici.
accordo
I dati trovati nei campi della tabella devono essere in un formato standard e leggibile.
Consistenza
Quando si confrontano le informazioni con i record, dovrebbe evitare informazioni contraddittorie.
Accuratezza di precisione
Se i dati non sono accurati, non possono essere usati. A quello scopo, per rilevare se questi sono accurati, i dati vengono confrontati con una fonte di riferimento.
Duplicazione
È essenziale sapere se hai le stesse informazioni nello stesso formato o in formati simili all'interno della tabella.
Integrità
Un'altra importante dimensione della qualità consiste nel sapere se tutte le informazioni rilevanti in un record sono presenti in modo utilizzabile..
Comprendere queste sei dimensioni è il primo passo per promuovere la qualità dei dati. Essere in grado di identificare e separare i difetti dei dati, classificandoli per queste dimensioni, ci consente di applicare le tecniche appropriate per guidare sia le informazioni che i processi che creano e manipolano le informazioni.