Introduction à la qualité des données: définition, contrôle et avantages

Contenu

Manque de qualité des données C'est l'un des principaux problèmes auxquels sont confrontés les responsables des systèmes d'information et les entreprises en général., car il représente clairement l'un des problèmes “caché” plus sérieux et persistant dans toute organisation.

qualité des données

En réalité, un bon la qualité des données est l'atout le plus puissant de l'entreprisecar il vous permet d'accélérer la croissance et de mieux gérer les coûts et les initiatives pour de meilleurs rendements.

Comment nous définissons la qualité des données

Selon Règle ISO 9000: 2000, la qualité peut être définie comme “le degré auquel un ensemble de caractéristiques inhérentes satisfait aux exigences, En d'autres termes, avec le besoin ou l'attente établi, généralement implicite ou obligatoire”.

Dans les paroles de David Loshin, Président de l'intégrité des connaissances, Inc: “Être capable de relier les problèmes de qualité des données à leur impact sur l'entreprise, nous devons pouvoir catégoriser à la fois nos attentes de qualité des données et les critères d'impact sur l'entreprise”.

Le Dr. Kaoru Ishikawa (1988), en même temps, considérer que: “Dans son interprétation la plus étroite, la qualité signifie la qualité du produit, mais dans son interprétation la plus large, cela signifie la qualité du travail, qualité de service, qualité des informations, qualité de la procédure, qualité de gestion et qualité d'entreprise “.

Comment nous le contrôlons

Pour obtenir un bon contrôle qualité Il faut couvrir toute une procédure pour atteindre notre objectif, qui est d'améliorer la qualité pour une meilleure et plus grande satisfaction du client et de soi-même en tant qu'entreprise ou industrie.

Pour connaître les détails de cette procédure, cliquez ici pour télécharger un e-book d'accompagnement à cet article qui couvre le sujet de manière beaucoup plus approfondie.

A travers les étapes, nous avons la possibilité de détecter toute anomalie pouvant survenir au cours de l'un de nos processus avant d'atteindre notre objectif, il est donc essentiel d'effectuer une, bon suivi et amélioration continue.

Les bénéfices

Des entreprises qui accordent de la pertinence à la qualité de leurs données, leur permettre d'obtenir des avantages clés pour ajouter de la valeur à l'entreprise et se différencier du reste de leurs concurrents, grillage:

  • Minimisez les risques dans vos projets, en particulier ceux liés aux technologies de l'information.

  • Économisez du temps et des ressources, mieux utiliser les infrastructures et les systèmes technologiques pour exploiter vos informations.

  • Prise de décision commerciale en temps opportun, sur la base d'informations fiables, validé et propre.

  • Adaptation aux normes ou réglementations internationales sur la gestion de l'information, permettant la facilité d'exécution.

  • Améliorer la confiance, bonnes relations et image de l'entreprise auprès de ses clients par rapport à la concurrence.

Quelle est la pertinence de la qualité du big data et ses enjeux?

Connaître quelle est la pertinence de la qualité données volumineuses nous devons faire attention qu'il s'agit d'une condition préalable à l'analyse et à l'utilisation des mégadonnées et pour garantir la valeur de ces données. Le développement de technologies telles que le cloud computing, l'internet des objets et les réseaux sociaux, a entraîné une augmentation continue de la quantité de données et une accumulation à un rythme sans précédent..

En obtenant et en analysant le big data de diverses sources et avec différents usages, Les chercheurs et tous ceux qui prennent des décisions dans les entreprises ont compris que cette quantité massive d'informations peut offrir de nombreux avantages pour comprendre les besoins des clients., améliorer la qualité de service et prévoir et prévenir les risques. Mais cependant, l'utilisation et l'analyse de Big Data doit être basé sur des données exactes ce qui nous fait voir quelle est la pertinence de la qualité des données, car c'est une condition nécessaire pour générer de la valeur à partir du big data.

Caractéristiques du Big Data

UNE mesure que los macrodatos introducen nuevas funciones, la qualité de vos données est également confrontée à de nombreux défis. Les caractéristiques Big Data sont réduites à 4V: le volume, la vitesse, variété et valeur:

  • Le volume fait référence à l'énorme volume de données. Nous utilisons généralement TB ou des quantités plus importantes pour mesurer ce volume de données.
  • Le la vitesse signifie que les données sont formées à une vitesse sans précédent et doivent être traitées en temps opportun.
  • Variété indique que le Big Data a toutes sortes de types de données, et cette diversité divise les données en données structurées et données non structurées. Ces données de divers types nécessitent des capacités de traitement de données plus importantes.
  • Enfin, Valeur représente une faible densité de valeur. La densité de la valeur est inversement proportionnelle à la taille totale des données, plus l'échelle des mégadonnées est grande, les données sont moins précieuses.

Les défis de la qualité des données volumineuses

Parce que les mégadonnées ont les caractéristiques du 4V, quand les entreprises utilisent et traitent le big data, extraire des données réelles de haute qualité à partir d'ensembles de données volumineux, variable et compliqué, cela devient un obstacle urgent. Actuellement, La qualité des données volumineuses est confrontée aux défis suivants:

  • La diversité des sources Les données fournissent des types de données riches et des structures de données complexes et augmentent la difficulté d'intégration des données.
  • Le volume de données est énorme, et il est difficile de juger de la qualité des données dans un délai raisonnable.
  • Les données changent très rapidement et la “ponctualité” des données est très brève, ce qui nécessite des exigences plus élevées pour la technologie de traitement.
  • Il n'y a pas trop de normes de qualité des données Qualité des données unifiée et approuvée et recherche sur les mégadonnées.

Critères de qualité du Big Data

Le Big Data est relativement nouveau et il n'y a pas de définition uniforme de la qualité de vos données ou des critères de qualité à utiliser.. Mais une chose est vraie: la qualité des données ne dépend pas seulement de ses propres caractéristiques, mais en plus de l'environnement commercial qui utilise les données, y compris les utilisateurs et les processus métier. Seules les données qui correspondent aux utilisations pertinentes et répondent aux exigences peuvent être considérées comme des données qualifiées (ou de bonne qualité).

Régulièrement, les normes de qualité des données sont élaborées du point de vue des producteurs de données. Autrefois, les consommateurs de données étaient des producteurs de données directs ou indirects, qui garantit la qualité des données. Mais cependant, À l'ère des mégadonnées, avec la diversité des sources de données, les utilisateurs de données ne sont pas nécessairement des producteurs de données. Pourtant, il est très difficile de mesurer la qualité des données.

Nous choisissons les dimensions de qualité des données communément acceptées et largement utilisées comme normes de qualité des mégadonnées et redéfinissons leurs concepts de base en fonction des besoins réels de l'entreprise.. En même temps, tous dimension se puede dividir en muchos ítems típicos asociados a ella, et chaque article a ses propres indicateurs de qualité correspondants. De cette manière, les normes de qualité hiérarchiques pour le big data:

  1. Disponibilité:
  • Accessibilité:
    • Si une interface d'accès aux données est fournie
    • Les données peuvent être rendues publiques ou facilement acquises
  • Possibilité:
    • Dans un délai déterminé, si les données arrivent à temps
    • Si les données sont périodiquement mises à jour
    • Si l'intervalle de temps entre la collecte et le traitement des données jusqu'à leur publication répond aux exigences.
  • Convivialité:
    • Crédibilité:
      • Les données proviennent d'institutions spécialisées dans un pays, domaine ou industrie.
      • Des experts ou des spécialistes auditent et vérifient régulièrement l'exactitude du contenu des données.
      • Les données existent dans la plage de valeurs connues ou acceptables
  • Fiabilité:
    • Précision
      • Les données fournies sont exactes
      • La représentation (la valeur) des données reflète bien l'état réel de l'information source.
      • Représentation des informations (Les données) ne causera pas d'ambiguïté
    • Cohérence:
      • Après traitement des données, vos conceptions, les domaines de valeur et les formats correspondent toujours comme avant le traitement.
      • Pendant un moment, les données restent cohérentes et vérifiables.
      • Toutes les données sont cohérentes ou vérifiables
    • Intégrité:
      • Le format des données est clair et répond aux critères.
      • Les données sont cohérentes avec l'intégrité structurelle
      • Les données sont cohérentes avec l'intégrité du contenu.
    • je le complète:
      • Si une déficience d'un composant affectera l'utilisation des données pour les données à plusieurs composants
      • Si une déficience d'un composant affectera l'exactitude et l'intégrité des données.
  • Pertinence:
    • Commodité:
      • Les données recueillies ne coïncident pas entièrement avec le thème, mais ils exposent un aspect
      • La plupart des ensembles de données récupérés se trouvent dans le sujet de récupération dont les utilisateurs ont besoin
      • Le sujet d'information correspond au sujet de récupération de l'utilisateur
  • Qualité de présentation:
    • Lisibilité:
      • Les données (Contenu, format, etc.) sont clairs et compréhensibles
      • Il est facile de juger que les données fournies répondent aux besoins
      • La description, la classification et le codage des données répondent aux spécifications et sont faciles à comprendre

    conclusion

    L'avènement de l'ère des mégadonnées a vu les données de divers secteurs et domaines afficher une croissance explosive. Comment garantir la qualité des données volumineuses et comment analyser et extraire les informations et les informations cachées derrière les données deviennent des problèmes majeurs pour les entreprises.. Une mauvaise qualité des données peut entraîner une faible efficacité dans l'utilisation des données et même de graves erreurs dans la prise de décision.


    Articles Similaires:


    Abonnez-vous à notre newsletter

    Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.