So entfernen Sie synthetische Schlüssel in Qlikview

Inhalt

In einem meiner vorherigen Artikel, wir reden über synthetische schlüssel (synthetische Schlüssel in Qlikview – Vereinfacht). Wir diskutieren, warum synthetische Schlüssel generiert werden, und schließen daraus, dass, wenn wir mehrere synthetische Schlüssel in unserem Datenmodell haben, es könnte das Ergebnis eines falschen Datenmodells sein und unerwartete Ergebnisse erzeugen. Wir haben auch einige Möglichkeiten gesehen, synthetische Schlüssel zu entfernen und unser Datenmodell zu verbessern.

Dieser Artikel beginnt dort, wo wir unseren letzten Artikel beendet haben. Wir werden zwei weitere Techniken zum Entfernen synthetischer Schlüssel und zum Optimieren unseres Datenmodells in unserer QlikView-Anwendung diskutieren.. Diese beiden Techniken sind: –

  1. Verkettung
  2. Verknüpfungstabelle / Schlüssel

Lassen Sie uns diese beiden Techniken anhand von Beispielen im Detail verstehen:

Analysieren Sie den Umsatztrend über die Jahre mit Transaktionsdatensätzen im Jahresvergleich

Ein verkaufsorientiertes Unternehmen verfügt über jahresübergreifende Transaktionsdatensätze (ein Datensatz für jedes Jahr) mit ein oder zwei verschiedenen Feldern (aufgrund von Basissystemänderungen oder Defekten) aber der Rest der Felder ist ähnlich. Das Unternehmen möchte mit diesen Datensätzen Umsatztrends im Jahresvergleich aufzeigen.

In dieser Phase, Laden wir alle zwischenjährlichen Datensätze in QlikView. Wie erwartet, QlikView erstellt synthetische Schlüssel, um diese Tabellen zu verknüpfen, da diese Tabellen mehrere gemeinsame Felder haben. Sie können das Datenmodell mit synthetischem Schlüssel unten sehen. Jetzt, um den synthetischen Schlüssel zu entfernen, wir können nicht umbenennen / Entfernen Sie alle diese Felder, da sie wichtig sind und miteinander verwandt sind. Hier, wir brauchen alle Felder in einer Tabelle, um die Trends im Jahresvergleich anzuzeigen, monatliche Saisonalität im Jahresverlauf und vieles mehr. Wie du weißt, Qlikview-Verkettung / Tabellen automatisch verbinden, wenn sie die gleiche Granularität und Spalten haben. Aber trotzdem, auf unserer Bühne, einige der Spalten sind anders. Hier müssen wir die Verkettung mit erzwingen CONCATENAR und kombinieren Sie die Daten in einer einzigen Tabelle (Siehe Snapshot rechts).

qlik_view_concatenate1-8250113

Dann, das können Sie auch in der Tabelle VERKAUF sehen, Sowohl Employee_Type als auch Branch_Type erscheinen mit ihren verfügbaren Werten und die Gesamtzahl der Datensätze beträgt N1 (Anzahl der Datensätze in 2010) + N2 (Anzahl der Datensätze in 2011).

qlik_view_concatenate_2-1367217

Ähnlich, wenn Granularität und Spalten in Tabellen gleich sind, Dann können wir Concatenate verwenden, wodurch die Tabellen zu einer zusammengeführt werden und die resultierende Tabelle die Summe der Zeilen aus den beiden Tabellen enthält.

Analysieren Sie die Vertriebsleistung des Mitarbeiters anhand Ihrer Ziele (und analysieren Sie die Leistung über mehrere Dimensionen als Produkt, Gründungsjahr, Region):

Dazu haben wir fünf Tische, in denen zwei Faktentabellen sind und andere eine Dimension haben (die Tabellenstruktur ist unten dargestellt).

qlikview_link_table-7015942

Oben sehen Sie, dass die Tabellen, “Der Umsatz” Ja “Planen” sie haben drei gemeinsame Felder und die Dimensionstabellen sind auch mit beiden Faktentabellen verknüpft.

Jetzt, wenn wir all diese Tabellen direkt in QlikView laden, ergibt ein Datenmodell mit synthetischen Schlüsseln (Screenshot unten).

qlikview_link_table_synthetic_keys-2423710

Da Faktentabellen keine ähnlichen Spalten haben, wir können uns nicht für eine Verkettung entscheiden. Zur selben Zeit, wir brauchen sie auch für unsere Analyse. Jetzt, um den synthetischen Schlüssel in diesem Datenmodell zu entfernen, Wir sollten ... benutzen VERKNÜPFUNG mesa. Verknüpft zwei oder mehr Faktentabellen, indem alle gemeinsamen Felder aus den Originaltabellen entfernt und in einer neuen Tabelle platziert werden (sogenannte Linktabelle). Die neue Verknüpfungstabelle enthält alle möglichen Kombinationen von Werten für den Satz von Feldern durch einen eindeutigen Schlüssel und ist den Originaltabellen zugeordnet.

In einfachen Worten, Wir können sagen, dass die Linktabelle die synthetische Schlüsseltabelle ersetzt und alle Kombinationen der Schlüsselfelder enthält, die für Faktentabellen üblich sind. Wir sollten auch einen neuen zusammengesetzten Schlüssel erstellen, um die drei Tabellen zu verbinden (Zwei-Fakten-Tabellen und Link-Tabellen) und allgemeine Felder aus Faktentabellen entfernen.

Regeln zum Definieren der Linktabelle: –

  1. Erstellen Sie einen Schlüssel basierend auf gemeinsamen Feldern der Faktentabelle und brechen Sie alle anderen Assoziationen durch Kommentare oder Umbenennen auf.
  2. Stellen Sie sicher, dass alle Joins, die in beiden Faktentabellen vorhanden sind, in der erstellten Linktabelle verfügbar sind; andererseits, kann zum Verlust einiger Datensätze führen.
  3. Die Linktabelle muss unterschiedliche Datensätze haben.

Sehen wir uns nun die Methoden zur Entwicklung des Datenmodells mit Link Table an: –

Paso 1 Laden Sie die Faktentabelle, Formularschlüssel für alle gemeinsamen Felder und Kommentar alle gemeinsamen Felder.qlikview_link_table_scripts1-4950189

Paso 2 Erstellen Sie die Linktabelle, indem Sie die eindeutigen Werte aus den Faktentabellen laden

qlikview_link_table_scripts2-7435361

Paso 3 Andere Dimensionstabellen hochladen.

qlikview_link_table_scripts3-2512155

Paso 4 Laden Sie es neu und wir hätten das folgende Datenmodell ohne synthetischen Schlüssel.

qlikview_link_table_model-3702933

Über, Sie können ein Datenmodell mit Linktabelle sehen und es hat alle gemeinsamen Felder von Faktentabellen.

Tabelle der Links Vs verketten

In den Beispielen oben, wir beobachten beide szenarien, wohin wir mit der CONCATENATION- oder LINK-Tabelle gehen sollten. Beide Methoden haben ihre eigenen Vorteile. Sehen wir uns einige davon an:

  1. Wenn die Granularität und die Felder in den Faktentabellen gleich sind, wir sollten uns für die Verkettung entscheiden, wodurch die Tabellen zu einer zusammengeführt werden. Wenn diese unterschiedlich sind und an unterschiedlichen Dimensionen befestigt sind, wir werden die LINK-Tabelle verwenden.
  2. Mit Link Tables können Sie ein verständlicheres Datenmodell pflegen. Zweitens, Concatenate ist ein vereinfachter Ansatz mit hervorragender Leistung, um große Datenmengen zu verarbeiten.
  3. Die Wahl hängt auch davon ab, welche Art von Analyse wir durchführen möchten und welches Modell für unseren Zweck ausreichend ist..

Schlussbemerkung: –

Wie bereits erwähnt, mehrere synthetische Schlüssel spiegeln normalerweise ein falsches Datenmodell wider. Wir haben uns in der Vergangenheit einige Methoden zum Entfernen synthetischer Schlüssel angesehen. In diesem Artikel, wir analysieren insbesondere zwei Methoden: LINK-Tabelle und Verkettung. Beide Methoden haben ihre eigenen Vorteile und Anwendungen.. Die Wahl der Methode sollte von den geschäftlichen Anforderungen und der Art der erforderlichen Datenanalyse abhängen.

Hat dir diese Serie geholfen? Wir haben ein komplexes Thema vereinfacht: synthetische Tasten und wir haben versucht, sie einfach und verständlich darzustellen. Wenn Sie weitere Hilfe zum Datenmodell und zu synthetischen Schlüsseln benötigen, Fühlen Sie sich frei, Ihre Fragen in den Kommentaren unten zu stellen.

Wenn Ihnen das, was Sie gerade gelesen haben, gefällt und Sie Ihre Arbeit fortsetzen möchten analytisches Lernen, abonnieren Sie unsere E-Mails, Folge uns auf Twitter oder wie bei uns Facebook Seite.

Abonniere unseren Newsletter

Wir senden Ihnen keine SPAM-Mail. Wir hassen es genauso wie du.