Comment supprimer les clés synthétiques dans Qlikview

Contenu

Dans un de mes précédents articles, on parle de clés synthétiques (clés synthétiques dans Qlikview – Simplifié). Nous discutons pourquoi les clés synthétiques sont générées et nous concluons que si nous avons plusieurs clés synthétiques dans notre modèle de données, cela pourrait être le résultat d'un modèle de données incorrect et générer des résultats inattendus. Nous avons également vu des moyens de supprimer les clés synthétiques et d'améliorer notre modèle de données.

Cet article commence là où nous avons terminé notre dernier article. Nous discuterons de deux autres techniques pour supprimer les clés synthétiques et optimiser notre modèle de données dans notre application QlikView.. Ces deux techniques sont: –

  1. Enchaînement
  2. Tableau des liens / clés

Comprenons ces deux techniques en détail à l'aide d'exemples:

Analysez la tendance des ventes au fil des ans avec des ensembles de données de transaction d'une année sur l'autre

Une entreprise axée sur les ventes dispose d'ensembles de données de transaction d'une année sur l'autre (un ensemble de données pour chaque année) avec un ou deux champs différents (en raison de modifications ou de défauts du système de base) mais le reste des champs est similaire. L'entreprise souhaite afficher les tendances des ventes d'une année sur l'autre à l'aide de ces ensembles de données.

À ce stade, chargeons tous les jeux de données interannuels dans QlikView. Comme prévu, QlikView crée des clés synthétiques pour joindre ces tables, puisque ces tables ont plusieurs champs communs. Vous pouvez voir le modèle de données avec clé synthétique ci-dessous. À présent, retirer la clé synthétique, nous ne pouvons pas renommer / supprimer tous ces champs car ils sont importants et liés les uns aux autres. Ici, nous avons besoin de tous les champs d'un tableau pour afficher les tendances d'une année sur l'autre, saisonnalité mensuelle au cours de l'année et bien plus encore. Comme tu le sais, concaténation Qlikview / joindre automatiquement les tables si elles ont la même granularité et les mêmes colonnes. Cependant, sur notre scène, certaines colonnes sont différentes. Ici, nous devons forcer la concaténation en utilisant CONCATENAIRE et combiner les données dans un seul tableau (Voir Snapshot à droite).

qlik_view_concatenate1-8250113

Ensuite, vous pouvez également le voir dans la table SALES, Employee_Type et Branch_Type apparaissent avec leurs valeurs disponibles et le nombre total d'enregistrements est N1 (nombre d'enregistrements dans 2010) + N2 (nombre d'enregistrements dans 2011).

qlik_view_concatenate_2-1367217

de la même manière, si la granularité et les colonnes des tableaux sont les mêmes, alors nous pouvons utiliser Concaténer qui fusionnera les tables en une seule et la table résultante aura la somme des lignes des deux tables.

Analyser les performances de vente de l'employé par rapport à vos objectifs (et analysez les performances dans plusieurs dimensions en tant que produit, année de constitution, Région):

Pour ce faire, nous avons cinq tables, dans laquelle deux sont des tables de faits et d'autres sont de dimension (la structure du tableau est montrée ci-dessous).

qlikview_link_table-7015942

Ci-dessus, vous pouvez voir que les tableaux, “Ventes” Oui “Plan” ils ont trois champs communs et les tables de dimension sont également associées aux deux tables de faits.

À présent, si on charge toutes ces tables directement dans QlikView, se traduira par un modèle de données avec des clés synthétiques (capture d'écran ci-dessous).

qlikview_link_table_synthetic_keys-2423710

Étant donné que les tables de faits n'ont pas de colonnes similaires, on ne peut pas opter pour la concaténation. En même temps, nous en avons également besoin pour notre analyse. À présent, pour supprimer la clé synthétique dans ce modèle de données, nous devrions utiliser RELIER mesa. Lie deux ou plusieurs tables de faits en supprimant tous les champs communs des tables d'origine et en les plaçant dans une nouvelle table (table de liens appelée). La nouvelle table de liens contient toutes les combinaisons de valeurs possibles pour l'ensemble des champs via une clé unique et est associée aux tables d'origine.

En mots simples, on peut dire que la table de liens remplace la table de clés synthétiques et a toutes les combinaisons des champs clés qui sont communs aux tables de faits. Nous devrions également créer une nouvelle clé composite pour connecter les trois tables (tables à deux faits et table de liens) et supprimer les champs communs des tables de faits.

Règles de définition de la table de liens: –

  1. Créez une clé basée sur les champs communs de la table de faits et rompez toutes les autres associations via des commentaires ou en renommant.
  2. Assurez-vous que toutes les jointures qui existent dans les deux tables de faits sont disponibles dans la table de liens créée; au contraire, peut entraîner la perte de certains enregistrements.
  3. La table de liens doit avoir des enregistrements différents.

Voyons maintenant les méthodes pour développer le modèle de données à l'aide de Link Table: –

Paso 1 Charger la table des faits, clé de formulaire pour tous les champs communs et commenter tous les champs communs.qlikview_link_table_scripts1-4950189

Paso 2 Créez la table de liens en chargeant les valeurs distinctes des tables de faits

qlikview_link_table_scripts2-7435361

Paso 3 Télécharger d'autres tables de dimensions.

qlikview_link_table_scripts3-2512155

Paso 4 Rechargez-le et nous aurions le modèle de données suivant sans clé synthétique.

qlikview_link_table_model-3702933

Dessus, vous pouvez voir un modèle de données avec une table de liens et il contient tous les champs communs des tables de faits.

Tableau des liens Vs concaténer

Dans les exemples ci-dessus, nous observons les deux scénarios, où nous devrions aller avec la table CONCATENATION ou LINK. Les deux méthodes ont leurs propres avantages. Voyons quelques-uns de ces:

  1. Si la granularité et les champs des tables de faits sont les mêmes, nous devrions choisir de concaténer, qui fusionnera les tables en une seule. Lorsque ceux-ci sont différents et sont attachés à des dimensions différentes, nous utiliserons la table LINK.
  2. Avec Link Tables, vous pouvez maintenir un modèle de données plus compréhensible. D'un autre côté, Concaténer est une approche simpliste avec d'excellentes performances pour gérer un grand volume de données.
  3. Le choix dépend également du type d'analyse que nous voulons effectuer et du modèle qui sera suffisant pour notre objectif..

Note finale: –

Comme mentionné précédemment, plusieurs clés synthétiques reflètent généralement un mauvais modèle de données. Nous avions examiné certaines méthodes pour supprimer les clés synthétiques dans le passé. Dans cet article, nous analysons en particulier deux méthodes: LINK table et concaténation. Les deux méthodes ont leurs propres avantages et applications.. Le choix de la méthode doit dépendre des besoins de l'entreprise et du type d'analyse de données requis.

Cette série vous a-t-elle été utile? Nous avons simplifié un sujet complexe: clés synthétiques et nous avons essayé de le présenter de manière simple et compréhensible. Si vous avez besoin de plus d'aide sur le modèle de données et les clés synthétiques, n'hésitez pas à poser vos questions via les commentaires ci-dessous.

Si vous aimez ce que vous venez de lire et souhaitez continuer votre apprentissage analytique, abonnez-vous à nos e-mails, Suivez-nous sur Twitter ou comme le nôtre Facebook page.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.