ETL-Prozesse: Belastung. Woraus besteht es?

Inhalt

La última parte del ETL-Prozesse es la etapa de carga, el momento en el que los datos de la etapa de transformación werden auf das Zielsystem hochgeladen.

Hay que prestar atención que así como puede haber varios sistemas fuente o fuentes (como ya hemos comentado en puntos anteriores) además puede haber varios sistemas destino diferentes.

Tipos de sistemas de carga

Einfach, existen dos tipos de carga:

  • Inserta. Es un sistema de acumulación simple que se trata de el transporte de información en grandes bloques de datos, previamente calculados en función, allgemein, de un valor sumatorio o promedio de la magnitud considerada. Es la forma más sencilla y frecuente de realizar un procedimiento de carga, pero tiene el inconveniente de que en caso de accidente o problema (un corte de luz, un fallo de disco, etc.) se pierde la consistencia de los datos, Und es kann der Fall auftreten, dass die gesamte Ladung wiederholt werden muss.

  • Ladungen. Unter diesen Umständen, Die Ladung wird gestaffelter und sicherer durchgeführt. Dafür, Das System gruppiert die Informationen automatisch und transparent nach verschiedenen Variablen :, Termine, für eine bestimmte Anzahl von Datensätzen, etc. Dieser Modus ermöglicht es, den genauen Punkt zu verarbeiten, bis zu dem die Ladung durchgeführt wurde, was bedeutet, dass im Falle eines Fehlers, du das Ladeverfahren nur von diesem spezifischen Punkt aus fortsetzen musst, ohne alles noch einmal wiederholen zu müssen.

Hauptunterschiede zwischen Einsätze Ja Ladungen

Die Unterschiede zwischen den beiden Hauptladearten (auch wenn sie nicht die einzigen sind, da es auch Mischsysteme gibt) liegen auf der Ebene der Datenkonsistenz und der Ladezeit.

Bei der Verwendung eines Systems Einfügung das Konsistenzniveau wird reduziert, da ein Fehler eine vollständige Wiederholung des Verfahrens erzwingen kann. Trotz dieses, die Ladedauer ist kürzer.

Das System Ladungen Verlangsamt den Vorgang aufgrund der automatischen Verarbeitung des Ladezustands, gewinnt jedoch im Gegenzug an Daten- und Protokollkonsistenz.

Schlüssel zur Gewährleistung einer korrekten Datenladung

  • Verwenden Sie die geringstmögliche Menge verfügbarer Ressourcen.

  • Stellen Sie so gut wie möglich die Konsistenz der geladenen Daten sicher.

  • Priorisieren Sie die Qualität der Ladung gegenüber der Geschwindigkeit.

  • Versuchen Sie, nicht in andere laufende Prozesse einzugreifen.

Die Wahl der idealen Lademethode hängt vom Einzelfall ab

Die Wahl des Ladeverfahrtyps, cuya decisión final regularmente corresponde al propietario del procedimiento ETL, debe hacerse después de examinar una serie de parámetros: cantidad de datos a cargar, velocidad que verdaderamente se necesita, etc.

La recomendación general es que si el volumen de datos a cargar es esencial, es recomendable decantarse por un sistema que asegure una mayor consistencia de los datos, evitando así tener que repetir todo el procedimiento ante cualquier eventualidad.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.

Datenlautsprecher