Définition, fonctionnalités, avantages et défis

Contenu


processus etlLe Processus ETL sont une définition standard utilisée pour désigner le déplacement et transformation des données. C'est la procédure qui permet aux établissements déplacer des données de plusieurs sources, reformatear y cargar en otra base de données (appelé magasin de données O entrepôt de données) pour les analyser. Ils peuvent également être envoyés vers un autre système d'exploitation pour prendre en charge une procédure commerciale.

En résumé, l'objectif principal de cette procédure est faciliter le mouvement et la transformation des données, intégrer les différents systèmes et sources dans l'organisation moderne.

Le terme ETL signifie:

  • OuiExtraire: Extraire.

  • Ttransformer: transformer.

  • Ldes haricots: charge.

Phases d'une procédure ETL

Les différentes phases ou séquences d'une procédure ETL sont les suivantes:

  • Extraction données d'un ou plusieurs systèmes sources.

  • Transformation desdites données, En d'autres termes, la possibilité de reformater et de nettoyer ces données si nécessaire.

  • Charge desdites données dans un autre endroit ou base de données, un magasin de données ou un entrepôt de données, pour les analyser ou accompagner une démarche commerciale.

Nettoyage des données en tant qu'étape distincte des processus ETL

Bien que cela puisse être compris comme une action intégrée dans la phase de transformation des données, aujourd'hui, la tendance est de considérer nettoyage des données en tant qu'étape distincte de la procédure ETL.

Cette vision correspond à une conception plus moderne et pratique de la procédure.. Pour gagner du temps et être plus efficace, il est commode d'unifier les critères, à titre d'exemple en saisissant « de » au lieu de « rue » sur tous les enregistrements d'une base de données d'adresses postales, AVANT de commencer la procédure ETL elle-même.

Il est aussi important d'avoir des informations consolidées que toutes les données sont correctes et avec une vision unique pour tous les utilisateurs. Ce n'est qu'ainsi qu'il sera possible d'obtenir des circuits de travail et une analyse desdites données vraiment optimaux et efficaces..

Quels systèmes peuvent être intégrés dans une procédure ETL?

Les processus ETL peuvent inclure:

  • Systèmes héritage. En d'autres termes, héritage, hérité ou ancien.

  • Nouveaux systèmes. Basé sur Windows, Linux et aussi dans les réseaux sociaux modernes: Facebook, Twitter, Linkedin, etc.

Le systèmes héritage ou hérité se caractérisent généralement par: sois fermé, ne pas autoriser les changements et avoir un accès difficile (en général une sorte de conducteur spécial). Ce sont des systèmes qui traitent vers l'intérieur et, pour cela, ne pas autoriser l'ajout d'un ordinateur qui fonctionne en parallèle.

Cas contraire, systèmes nouveaux ou modernes (basé sur Windows ou Linux) ils sont ouverts, complet et interconnecté. Un exemple serait une batterie de serveurs Linux, qui permet aux différents nœuds de s'interconnecter entre eux.

Avantages des processus ETL

Toute entreprise ou organisation bénéficie de la mise en place d'une procédure ETL pour déplacer et transformer les données qu'elle traite pour les raisons suivantes:

  • Être capable de créer un Gestion des données de référence, En d'autres termes, un référentiel central standardisé de toutes les données de l'organisation. Par exemple, si nous avons un objet client dans une base de données de crédit et un autre objet client dans la base de données de carte de crédit, Quel serait le une maîtrise Il s'agirait d'établir, concrètement et sans équivoque, une fiche client unique avec vos nom et prénom pour l'organisation.

  • Activer les gestionnaires prendre des décisions stratégiques basé sur l'analyse des données téléchargées dans des bases de données nouvelles et mises à jour: les lady mart ou entrepôt de données.

  • Ça sert à intégrer des systèmes. Les institutions se développent de manière organique et de plus en plus de sources de données sont ajoutées. Cela fait apparaître de nouveaux besoins, Quoi intégrer les données d'un banque en ligne avec les anciennes données d'un système héritage.

  • Pouvoir avoir une vision globale de tous les données consolidées dans un entrepôt de données. Par exemple, créer une stratégie marketing basée sur l'analyse des données ci-dessus.

Procédure ETL: un système efficace, mais avec des défis et des problèmes à résoudre

Comme nous l'avons vu, Les processus ETL sont très utiles et bénéfiques pour les institutions en raison de leur capacité à intégrer de grandes bases de données, réalisant ainsi une vision globale unique qui permet aux analystes et aux gestionnaires de prendre les décisions stratégiques appropriées.

La mise en œuvre d'un système ETL bien défini est difficile étant donné que, être vraiment efficace, devrait permettre l'intégration de systèmes. héritage (certains déjà très obsolètes) avec le plus moderne. En même temps, l'accès à tous ces systèmes doit se faire non seulement en mode lecture, mais aussi comme écriture.

Articles Similaires:

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.