Come rimuovere le chiavi sintetiche in Qlikview

Contenuti

In uno dei miei articoli precedenti, parliamo di chiavi sintetiche (chiavi sintetiche in Qlikview – Semplificato). Discutiamo del motivo per cui vengono generate le chiavi sintetiche e giungiamo alla conclusione che se abbiamo più chiavi sintetiche nel nostro modello di dati, potrebbe essere il risultato di un modello di dati errato e generare risultati imprevisti. Abbiamo anche visto alcuni modi per rimuovere le chiavi sintetiche e migliorare il nostro modello di dati.

Questo articolo inizia da dove abbiamo interrotto il nostro ultimo articolo. Discuteremo altre due tecniche per rimuovere le chiavi sintetiche e ottimizzare il nostro modello di dati nella nostra applicazione QlikView.. Queste due tecniche sono: –

  1. Concatenazione
  2. Tabella dei collegamenti / chiavi

Comprendiamo queste due tecniche in dettaglio usando esempi:

Analizza l'andamento delle vendite negli anni con i set di dati delle transazioni anno su anno

Un'azienda orientata alle vendite dispone di set di dati sulle transazioni anno su anno (un set di dati per ogni anno) con uno o due campi diversi (a causa di modifiche o difetti del sistema di base) ma il resto dei campi sono simili. L'azienda vuole mostrare le tendenze delle vendite anno su anno utilizzando questi set di dati.

In questa fase, carichiamo tutti i set di dati interannuali in QlikView. Come previsto, QlikView crea chiavi sintetiche per unire queste tabelle, poiché queste tabelle hanno più campi comuni. Puoi vedere il modello di dati con la chiave sintetica di seguito. Ora, per rimuovere la chiave sintetica, non possiamo rinominare / rimuovere tutti questi campi perché sono importanti e correlati tra loro. Qui, abbiamo bisogno di tutti i campi in una tabella per mostrare le tendenze anno su anno, stagionalità mensile durante l'anno e molto altro. Come sapete, Qlikview concatena / unire automaticamente le tabelle se hanno la stessa granularità e colonne. tuttavia, sul nostro palco, alcune colonne sono diverse. Qui dobbiamo forzare la concatenazione usando CONCATENA e combinare i dati in un'unica tabella (Vedi Istantanea a destra).

qlik_view_concatenate1-8250113

Prossimo, lo puoi vedere anche nella tabella delle VENDITE, vengono visualizzati sia Employee_Type che Branch_Type con i loro valori disponibili e il numero totale di record è N1 (numero di record in 2010) + N2 (numero di record in 2011).

qlik_view_concatenate_2-1367217

Allo stesso modo, se la granularità e le colonne nelle tabelle sono le stesse, quindi possiamo usare Concatenate che unirà le tabelle in una e la tabella risultante avrà la somma delle righe delle due tabelle.

Analizza le prestazioni di vendita del dipendente rispetto ai tuoi obiettivi (e analizzare le prestazioni in varie dimensioni come prodotto, anno di costituzione, regione):

Per fare questo abbiamo cinque tabelle, in cui due sono tabelle dei fatti e altre sono di dimensione (la struttura della tabella è mostrata di seguito).

qlikview_link_table-7015942

Sopra puoi vedere che le tabelle, “Saldi” e “Piano” hanno tre campi comuni e anche le tabelle delle dimensioni sono associate a entrambe le tabelle dei fatti.

Ora, se carichiamo tutte queste tabelle direttamente in QlikView, risulterà in un modello di dati con chiavi sintetiche (screenshot qui sotto).

qlikview_link_table_synthetic_keys-2423710

Poiché le tabelle dei fatti non hanno colonne simili, non possiamo optare per la concatenazione. Allo stesso tempo, ci servono anche per la nostra analisi. Ora, per rimuovere la chiave sintetica in questo modello di dati, dovremmo usare COLLEGAMENTO mesa. Collega due o più tabelle dei fatti rimuovendo tutti i campi comuni dalle tabelle originali e inserendoli in una nuova tabella (chiamato tabella dei collegamenti). La nuova tabella di collegamento contiene tutte le possibili combinazioni di valori per il campo impostato tramite una chiave univoca ed è associata alle tabelle originali.

In parole semplici, possiamo dire che la tabella dei collegamenti sostituisce la tabella delle chiavi sintetiche e ha tutte le combinazioni dei campi chiave comuni per le tabelle dei fatti. Dovremmo anche creare una nuova chiave composita per collegare le tre tabelle (tabelle a due fatti e tabella dei collegamenti) e rimuovere i campi comuni dalle tabelle dei fatti.

Regole per definire la tabella dei collegamenti: –

  1. Crea una chiave basata sui campi comuni della tabella dei fatti e interrompi tutte le altre associazioni commentando o rinominando.
  2. Assicurati che tutti i join esistenti in entrambe le tabelle dei fatti siano disponibili nella tabella dei collegamenti creata; altrimenti, può causare la perdita di alcuni record.
  3. La tabella dei collegamenti deve avere record distinti.

Vediamo ora i metodi per sviluppare il modello dati utilizzando Link Table: –

passo 1 Carica la tabella dei fatti, chiave del modulo per tutti i campi comuni e commenta tutti i campi comuni.qlikview_link_table_scripts1-4950189

passo 2 Crea la tabella dei collegamenti caricando i valori distinti dalle tabelle dei fatti

qlikview_link_table_scripts2-7435361

passo 3 Carica altre tabelle dimensionali.

qlikview_link_table_scripts3-2512155

passo 4 Ricaricalo e avremmo il seguente modello di dati senza una chiave sintetica.

qlikview_link_table_model-3702933

Al di sopra, puoi vedere un modello di dati con tabella di collegamento e ha tutti i campi comuni delle tabelle dei fatti.

Tabella dei collegamenti Vs concatenati

Negli esempi sopra, osserviamo entrambi gli scenari, dove dovremmo andare con la tabella CONCATENATION o LINK. Entrambi i metodi hanno i loro vantaggi. Vediamo alcuni di questi:

  1. Se la granularità e i campi nelle tabelle dei fatti sono gli stessi, dovremmo scegliere di concatenare, che unirà le tabelle in una sola. Quando questi sono diversi e sono attaccati a dimensioni diverse, useremo la tabella LINK.
  2. Con Link Tables puoi mantenere un modello di dati più comprensibile. In secondo luogo, Concatenare è un approccio semplicistico con prestazioni eccellenti per gestire un grande volume di dati.
  3. La scelta dipende anche dal tipo di analisi che vogliamo eseguire e da quale modello sarà sufficiente per il nostro scopo..

Nota finale: –

Come menzionato prima, più chiavi sintetiche di solito riflettono un modello di dati errato. Avevamo esaminato alcuni metodi per rimuovere le chiavi sintetiche in passato. In questo articolo, analizziamo in particolare due metodi: LINK tabella e concatenazione. Entrambi i metodi hanno i loro vantaggi e applicazioni.. La scelta del metodo dovrebbe dipendere dai requisiti aziendali e dal tipo di analisi dei dati richiesta..

Questa serie ti è stata utile?? Abbiamo semplificato un argomento complesso: chiavi sintetiche e abbiamo cercato di presentarlo in modo semplice e comprensibile. Se hai bisogno di ulteriore aiuto sul modello dati e sulle chiavi sintetiche, sentiti libero di fare le tue domande attraverso i commenti qui sotto.

Se ti piace quello che hai appena letto e vuoi continuare il tuo apprendimento analitico, iscriviti alle nostre email, Seguici su Twitter o come il nostro Facebook pagina.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.