Perfil de dados, o primeiro passo na qualidade dos dados

Conteúdo

Perfis de dados é o ato de analisar o conteúdo de seus dados. Juntamente com o perfil de dados, temos mais dois componentes que integrariam a qualidade dos dados. É tudo sobre correção de dados e monitoramento de dados.

istock-179220393-2989454

Créditos fotográficos: Eskemar

Correção de dados É o ato de corrigir seus dados quando estão abaixo dos padrões. Em segundo lugar, monitoramento de dados é o ato contínuo de determinar padrões de qualidade de dados em um conjunto de métricas significativas para os negócios, revisar resultados periodicamente e tomar medidas corretivas que podem exceder limites de qualidade aceitáveis.

Mas hoje nos concentramos apenas em perfil de dados. Fornecendo às instituições a capacidade de analisar grandes quantidades de dados rapidamente em um procedimento sistemático e repetível.

A análise realizada por perfil de dados

Uma ferramenta de criação de perfil de dados permite realizar diferentes tipos de análise, cuja combinação torna possível obter uma perspectiva muito mais completa deste ativo. Entre eles estão:

  • Análise de integralidade: Em vista de seus resultados, descobrir quantas vezes um determinado atributo é concluído e quantas vezes ele é deixado em branco ou nulo.
  • Análise de distribuição de valor: permite que você descubra qual é a distribuição de registros por meio de valores diferentes para um determinado atributo.
  • Análise de singularidade: é a maneira mais rápida de saber quantos valores únicos (Diferente) são encontrados para um determinado atributo em todos os registros. Através desta análise, identificar facilmente duplicatas.
  • Análise de padrões: é o meio através do qual perfil de dados possibilita saber quais formatos foram encontrados para um determinado atributo e qual é a distribuição de registros através desse ou de outros formatos.
  • Análise de intervalo: é usado para descobrir quais são os valores mínimos, máximo e médio dado por um determinado atributo.

Na prática, a O perfil de dados pode agregar valor em uma ampla variedade de situações., algo que você provavelmente já sabe se você usá-lo regularmente em sua organização. Alguns dos os cenários onde sua contribuição é mais enriquecedora filho:

uma) Iniciativas de qualidade de dados do sistema de origem. Um dos objetivos desse projeto é tentar corrigir os problemas existentes e impedir que outros apareçam no futuro.. Perfil de dados pode ajudar a maximizar o ROI do projeto. Através da criação de perfis de dados, você pode identificar as áreas dentro do sistema que sofrem com os problemas mais graves de qualidade de dados e / ou numerosos. O perfil também facilitaria a detecção de problemas de qualidade relacionados a entradas manuais incorretas ou interfaces de sistema defeituosas..

B) Projetos de migração de dados. A criação de perfis de dados pode ajudar a minimizar o risco de mover dados de um sistema legado para o novo destino. Aqui, O perfil de dados descobriria problemas de qualidade existentes antes de migrar dados.. Por isso, você poderia agir sobre o código ou fazer as mudanças necessárias para o sistema de destino.

c) Data Warehousing e Iniciativas de Business Intelligence. A nota comum para ambos os tipos de projetos é a necessidade de compilar dados de sistemas diferentes.. Para este caso, O perfil pode ajudar a garantir o sucesso do projeto identificando três tipos de problemas:

  • Aqueles relacionados com a qualidade dos dados na fonte, para ser corrigido lá.
  • Aqueles por atributos de qualidade que podem ser corrigidos no processamento de ETL.
  • Aqueles que têm a ver com a descoberta de regras o negócio o que poderia levar à revogação do projeto.

De qualquer forma, todos esses benefícios são multiplicados quando o perfil de dados é feito automaticamente, em vez de fazê-lo manualmente. o ferramentas de perfil de dados Eles vão ajudá-lo a ganhar velocidade, completude da análise, permitindo, repetidamente, também desfrute de um repositório centralizado para o armazém de dados e metadados que facilita a troca de informações por diferentes usuários de negócios.

(função(d, s, Eu iria) {
var js, fjs = d.getElementsByTagName(s)[0];
E se (d.getElementById(Eu iria)) Retorna;
js = d.createElement(s); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&status = 0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'roteiro', 'facebook-jssdk'));

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.