Was ist ein Warehouse und was sollte ein modernes Data Warehouse berücksichtigen??

Inhalt

Eine Definition dessen, was ein Lager in Bezug auf Daten ist., oder genauer gesagt ein Data Warehouse, könnte folgendes sein: Ein Data Warehouse ist ein System zum Melden und Analysieren von Daten. Das Data Warehouses sind zentrale Datenspeicher. die eine oder mehrere unterschiedliche Datenquellen integrieren. Sie speichern aktuelle und historische Daten und werden verwendet, um analytische Berichte für Wissensarbeiter im gesamten Unternehmen zu erstellen.

istock-521808958-4548861

Bildnachweis: MickeyCZ

Zu verstehen, was das Warehouse ist und den Data-Warehousing-Prozess Die drei allgemeinen Ebenen müssen berücksichtigt werden, obwohl sie nicht verpflichtend sind, werden häufig verwendet, abhängig von Datenspeicherarchitektur:

  • Integrationsschicht in dem die extrahierten Rohdaten gespeichert und aufbereitet werden.
  • Hauptdatenschicht Anzahlung wobei die Daten an das homogene Datenmodell des Unternehmens angepasst werden.
  • Data Marts und Schicht strategischer Marts, Bereitstellung spezifischer Auszüge aus dem Corporate Data Warehouse.

Diese Schichten haben oft eine komplexe interne Transformations- und Geschäftslogik und, manchmal, nicht leicht als diskrete Bausteine ​​zu unterscheiden. Jüngste Entwicklungen haben dies vereinfacht und ermöglichen erhebliche Optimierungen.

Verstehen Sie die verschiedenen Komponenten, um zu wissen, was ein Lager ist

Heute, Diejenigen, die wissen, was ein Repository ist, wissen, dass dieses Datenrepository nicht mehr nur von den Informationen gespeist wird, die von internen Systemen generiert werden. Diese Zeiten liegen hinter uns und die Realität auf Datenarchitekturebene eines jeden Unternehmens sieht anders aus. Neue Formate, alternative Datenquellen und verschiedene Arten von Informationen Sie verleihen einer wesentlichen Struktur im Wissensgenerierungsprozess Komplexität.

Zwischen den Elemente, aus denen das Data Warehouse besteht, und deren Verständnis es erlaubt zu wissen was ist das lager, sind die folgenden:

  1. Datenzugriffsdienste: Im Gegensatz zu herkömmlichen Informationsspeichern, aktuelle erfordern erweiterte Funktionen für den Datenzugriffsdienst. Nur so ist es möglich, den Zugriff auf NoSQL-Quellen zu gewährleisten, flexibler Wechsel zwischen Datenzugriffsmethoden, unstrukturierte Datentransformation oder Anpassung an Cloud-Quellen. , Zugriff auf NoSQL-Quellen und Qualitäts- und Transformationsfunktionen für Geokodierung und unstrukturierte Daten. All diese unterschiedlichen Technologien müssen vom logischen Data Warehouse verwaltet und überwacht werden. Wichtig ist, dass Datenspeicherlösungen in diesem Bereich ein hohes Maß an Flexibilität bieten..
  2. Datenaufbereitung: Diese Komponente ist für die Durchführung der Datenüberprüfungen und Reparaturen. Dank eurer Intervention, Quellenzuverlässigkeit kann garantiert werden (Datenherkunft), sowie dass die Mindestvoraussetzungen der Vollständigkeit erfüllt sind, Integrität und andere Attribute der Datenqualität. Die Vorbereitung von Daten sind besonders wichtig für die Arbeit mit unstrukturierten Daten, ja ok, Gerade diese erfordern die Beteiligung von Spezialisten am Prozess, unterstützt durch die richtigen Tools.
  3. Modellieren– In einer modernen Datenspeicherumgebung, Die Anforderungen an die Modellierung hängen eng mit der Fähigkeit zusammen, mit unterschiedlicher Datensemantik aus verschiedenen Quellen umzugehen.. Um zu verstehen, was ein Lager ist, muss man davon ausgehen, dass Der Modellierungsansatz sollte nicht einzigartig sein, aber anpassungsfähig an Geschäftsprozesse und die Bedürfnisse der Organisation.
  4. Metadaten: Daten über Daten gewinnen in neuen Lagern an Bedeutung, da sie Strom brauchen absorbieren Änderungen in der Art und Weise, wie Daten dargestellt werden. Metadaten ermöglichen es, Kontext und Natur unabhängig von ihrer tatsächlichen Repräsentation zu entdecken.

Das diversifizierte Data Warehouse von heute muss auf die Bedürfnisse der Benutzer vorbereitet sein., ob es sich um Anforderungen in Bezug auf lokale Informationen handelt, als ob es sich um Big Data oder die Cloud handelt.

(Funktion(D, S, Ich würde) {
var js, fjs = d.getElementsByTagName(S)[0];
Wenn (d.getElementById(Ich würde)) Rückkehr;
js = d.createElement(S); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&Status=0”;
fjs.parentNode.insertBefore(js, fjs);
}(dokumentieren, 'Skript', 'facebook-jssdk'));

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.