Étape de données est un outil ETL qui Utilisé pour extraire des données, les transformer, leur appliquer des principes commerciaux, puis les charger dans un but spécifique.
Étape de données fait partie de la suite de solutions de plateforme d'information d'IBM ainsi qu'InfoSphere. DataStage utilise des notations graphiques pour créer des solutions d'intégration de données. Vous pouvez intégrer toutes sortes de données, y compris Big Data, à la fois au repos et en mouvement, et sur des plates-formes pouvant être à la fois distribuées et de gros serveurs.
Étape de données peuvent être classés en deux types d'outils différents:
- Ongle Outil ETL. Dans cette circonstance, Étape de données réside sur le serveur et des liens vers des sources de données. Après cela, traiter les données dans l'application. Les travaux dits DataStage, peuvent effectuer leur travail sur un seul serveur ou sur plusieurs machines en groupes ou en réseaux
- Un outil de suivi et Conception ETL. Ici, DataStage propose également un ensemble d'outils graphiques pris en charge par Windows.. Peut être utilisé pour concevoir des processus ETL, gérer les métadonnées associé à eux et, en même temps, surveiller les processus ETL.
Fonctionnalités clés de DataStage
Si vous cherchez à améliorer les capacités analytiques de votre entreprise, DataStage peut servir d'instrument pour atteindre cet objectif, car il vous aide à étendre la portée de votre intelligence d'affaires.
Des applications métier à l'analytique, des bases de données mainframe aux bases de données relationnelles, CRM, ERP et OLAP, junto con InfoSphere QualityStage, DataStage a la capacité d'accéder à un large éventail de données, de sources internes et externes, offrant aux institutions qui utilisent cet outil des options telles que les suivantes:
- Accompagnement dans les processus de traitement et de transformation associés au Big Data.
- Mise en place de règles de validation des données.
- Manipulation multiple Processus d'intégration.
- Approche évolutive du traitement parallèle.
- Capacité à fonctionner par lots, en tant que service Web ou en temps réel.
- Capacité à profiter métadonnées pour l'analyse et la maintenance.
- Connectivité directe aux applications métier telles que les sources ou les cibles.
Quels sont les principaux composants de DataStage?
Quatre composants principaux peuvent être distingués dans la structure de DataStage:
- Directeur: C'est l'interface principale du référentiel DataStage et c'est celle qui vous permet de visualiser et de modifier le contenu du référentiel. Le DataStage Manager est utilisé pour le stockage et la gestion des métadonnées réutilisables.
- Administrateur: prend en charge tous les problèmes liés à la configuration, tels que les critères de débogage ou les utilisateurs DataStage; ainsi que la création et le mouvement de projets. Il est destiné aux tâches administratives.
- Designer: Cette interface vous permet de créer des jobs ou des applications DataStage, qui seront compilés pour créer des exécutables programmés par le Directeur et lancés par le serveur lui-même. DataStage Designer spécifie la source de données, la transformation requise et la destination des données.
- Réalisateur: sa mission est de valider, programme, exécuter et surveiller les tâches du serveur DataStage, ainsi que les travaux qui ont été lancés en parallèle.
Comment DataStage aide votre entreprise
Optimiser l'utilisation du matériel, améliorer l'efficacité de l'ETL de l'entreprise, fournir le bon environnement pour chaque projet, s'assurer que les règles commerciales sont respectées, prioriser les tâches critiques, résoudre des problèmes complexes de Big Data, intégrer plus facilement les applications dans le cloud et pouvoir utiliser Hadoop à sa pleine puissance sont quelques-unes des raisons pour lesquelles implémenter DataStage ça peut être très intéressant pour l'entreprise.