Cosa c'è da sapere su un'architettura di data warehouse

Contenuti

Il l'architettura di un data warehouse può avere diverse strutture in diverse implementazioni. Alcuni possono avere un ODS (data warehouse operativo), mentre altri possono avere diversi data warehouse. Alcuni possono avere un piccolo numero di fonti dati, mentre altri possono avere dozzine di fonti dati. Dato ciò, è molto più ragionevole presentare i diversi livelli dell'architettura di un data warehouse piuttosto che discutere di un sistema specifico.

arquitectura20de20un20datawarehouse-1496408

Generalmente, ogni architettura di un datawarehouse ha i seguenti livelli:

  • Livello di estrazione dei dati
  • Livello di memorizzazione dei dati
  • Livello di presentazione dei dati
  • Livello di operazioni del sistema

Proprietà dell'architettura di un data warehouse

Le seguenti proprietà sono essenziali per l'architettura di un data warehouse:

  • Separazione– La procedura analitica e transazionale deve rimanere il più possibile separata.
  • Scalabilità: l'architettura di un data warehouse, sia hardware che software, deve essere facile da aggiornare man mano che cresce il volume di dati da gestire e processare, così come il numero di requisiti degli utenti che devono essere soddisfatti.
  • Estensibilità: L'architettura deve poter adattarsi a nuove applicazioni e tecnologie senza dover rivedere l'intero sistema.
  • Sicurezza: Monitorare l'accesso è essenziale a causa dei dati strategici memorizzati nel data warehouse.
  • Amministrabilità: la administración del almacén de datos no debería ser excesivamente difícil.

Capas de toda la arquitectura de almacenamiento de datos

Veamos cada una de las capas de la arquitectura de un datawarehouse a continuación:

  • Capa de Origine dati: Representa las diferentes fuentes de datos que alimentan los datos del almacén de datos. La fuente de datos puede estar en cualquier formato: archivo de texto plano, base de datos relacional, otros tipos de base de datos, archivo de Excel, eccetera. Todos estos pueden actuar como fuente de datos. Allo stesso tempo, los tipos de datos pueden ser muy variados:
    • Datos de operacionescomo datos de ventas, datos de recursos humanos, datos de productos, datos de inventario, datos de marketing y datos de sistemas.
    • Registros de un servidor web, con datos de navegación del usuario.
    • Dati di studi di mercato interni.
    • Dati di terzi, come dati dei censimenti, dati demografici o dati di sondaggi.
  • Livello di estrazione dei dati: I dati vengono estratti dalle fonti di dati e trasferiti nel sistema di archiviazione dei dati. È probabile che alcuni dati minimi vengano puliti in questo livello, ma non ci si aspetta una trasformazione significativa dei dati.
  • Area di test: qui è dove i dati vengono purificati e trasformati in un datamart e data warehouse. Avere un'area comune facilita la procedura e l'integrazione successiva dei dati.
  • Livello ETL: Qui è dove i dati acquisiscono intelligenza quando viene applicata la logica per trasformare i dati da una natura transazionale a una natura analitica. Questo livello è inoltre dove i dati vengono puliti. La fase di progettazione ETL è spesso la fase che richiede più tempo in un progetto di data warehouse e uno strumento ETL viene comunemente utilizzato in questo livello.
  • Livello di memorizzazione dei dati: Qui è dove vengono collocati i dati trasformati e puliti. In base alla portata e alla funzionalità, possono essere individuati tre tipi di entità: data warehouse, magazzino di dati e data warehouse operativo (ODS). In qualsiasi sistema, si può trovare solo uno dei 3, 2 del 3 o tutti e tre i tipi insieme.
  • Livello dei dati logici: Qui è dove vengono memorizzate le regole aziendali. Queste regole aziendali non influenzano le regole di trasformazione dei dati, ma influenzano ciò che si può vedere successivamente nei report.
  • Livello di presentazione dei dati: Si riferisce ai dati che arrivano agli utenti. Questo può essere sotto forma di un rapporto tabellare o grafico tramite un browser, un rapporto inviato via email che viene generato automaticamente e inviato quotidianamente, un avviso che informa gli utenti delle eccezioni, eccetera. Generalmente, in questo livello vengono utilizzati uno strumento OLAP e uno strumento di report.
  • Livello dei metadati: Qui è dove vengono memorizzate le informazioni sui dati contenuti nel data warehouse. Un modello di dati logici sarebbe un esempio di qualcosa che si trova in questo livello dei metadati. Spesso viene utilizzato uno strumento di metadati per gestire i metadati.
  • Livello di operazioni del sistema: Questo livello include informazioni su come sta funzionando il sistema di archiviazione dei dati, qual è lo stato di funzionamento dell'ETL, cuál es el rendimiento del sistema y el historial de acceso de los usuarios.

(funzione(D, S, ID) {
var js, fjs = d.getElementsByTagName(S)[0];
Se (d.getElementById(ID)) Restituzione;
js = d.createElement(S); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&stato=0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'copione', 'facebook-jssdk'));

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.

Altoparlante dati