I big data presentano nuove sfide per la gestione dei dati che vanno oltre la gestione di grandi volumi di dati. Una sfida spesso trascurata è il ciclo di vita e la standardizzazioneLa standardizzazione è un processo fondamentale in diverse discipline, che mira a stabilire norme e criteri uniformi per migliorare la qualità e l'efficienza. In contesti come l'ingegneria, Istruzione e amministrazione, La standardizzazione facilita il confronto, Interoperabilità e comprensione reciproca. Nell'attuazione degli standard, si promuove la coesione e si ottimizzano le risorse, che contribuisce allo sviluppo sostenibile e al miglioramento continuo dei processi.... di una Banca datiUn database è un insieme organizzato di informazioni che consente di archiviare, Gestisci e recupera i dati in modo efficiente. Utilizzato in varie applicazioni, Dai sistemi aziendali alle piattaforme online, I database possono essere relazionali o non relazionali. Una progettazione corretta è fondamentale per ottimizzare le prestazioni e garantire l'integrità delle informazioni, facilitando così il processo decisionale informato in diversi contesti.... in questo contesto di big data.
Crediti fotografici: iLexx
La governance dei dati, sia della Origine datiUN "Origine dati" si riferisce a qualsiasi luogo o supporto in cui è possibile ottenere informazioni. Queste fonti possono essere sia primarie che, come sondaggi ed esperimenti, come secondario, come banche dati, articoli accademici o rapporti statistici. La scelta corretta di una fonte di dati è fondamentale per garantire la validità e l'affidabilità delle informazioni nella ricerca e nell'analisi.... che dei suoi risultati, in questo tipo di database presenta grandi sfide. Il confronto tra il ciclo di vita e la normalizzazione di un database tradizionale con i big data aiuta a comprendere una delle sfide di governance dei dati più complesse in questo nuovo mondo dei dati.
Le fasi del ciclo di vita dei dati
UN ciclo di vita dei dati típico constará de cuatro etapas:
- Ingestión. No puedo pensar en el ciclo de vida y normalización de una base de datos sin comenzar por el principio, momento en el que se incorporan las distintas fuentes de datos a la plataforma de datos. En esta etapa además es común hallar procesos de verificación y validación de datos básico, aún cuando lo principal en este momento es borrar todos los datos disponibles en una ubicación central (que puede ser un almacén de datos, un almacén de datos o un lago de datos).
- ID / Pulizia / Arricchimento. Se reconocen los tipos de datos y los nombres con los que aparecen en las columnas. In questa fase, Los datos además se pueden enriquecer y limpiar.
- Standardizzazione. Este paso implica transformar los datos en un modelo de datos neutral acordado comercialmente. Qui, las relaciones se establecen entre las diferentes entidades de datos, esencialmente codificando el conocimiento interno y la estructura de los datos. Esta etapa además se conoce como etapa de integración de datos y coincide con el momento en que regularmente se introducen las reglas de negocio y comprobaciones de dominio, así como validación de datos maestros o de referencia
- Presentazione. Es el paso final del procedimiento, cuando se completa la transformación del modelo comercial neutral creado en el paso anterior en una o más representaciones de datos específicas de la compañía. Este modelo a menudo se denomina modelo dimensional. Es común que en este punto se apliquen reglas comerciales adicionales, así como agregaciones y la creación de datos derivados.
- Schema in lettura / schema in scrittura. Non si può parlare dell'intero ciclo di vita dei dati senza menzionare quando li utilizza l'utente. Una delle principali differenze tra l'archiviazione tradizionale dei dati e l'archiviazione dei big data è il punto in cui l'utente finale interagisce con le informazioni. Perché, mentre nell'ambiente di archiviazione dati tradizionale, il consumatore, in generale, utilizzerebbe uno schema di scrittura ben definito, le piattaforme BI e le soluzioni di analisi avanzata possono consumare dati dal livello di presentazione per fornire rapporti, cruscotti e analisi predittive, consentendo al consumatore di dati di avere accesso ai dati molto prima.
Ciclo de vida y normalización de una base de datos en entornos Big Data
Al considerar el ciclo de vida y normalización de una base de datos, todo lo vinculado con el uso de la información es determinante, tanto en términos de procesamiento como en vinculación con el costo del ciclo de vida de los datos. In particolare:
- En Big Data, las dos primeras etapas son de alto volumen y bajo costo y esfuerzo.. Los datos son abundantes y baratos, y la ingestión, identificación y limpieza de datos es relativamente simple. Nonostante questo, el desafío radica en la administración de Big Data. La dificultad de los dos últimos procesos del ciclo de vida y la normalización de una base de datos tiene que ver con la creación de significado. da un insieme di dati così grande e in gran parte disorganizzato (schema di lettura).
- In un ambiente tradizionale, al contrario, l'archiviazione dei dati richiede uno sforzo considerevole per garantire la qualità dei dati ingeriti e trasformare i dati in modelli dati adeguati. (bozza scritta). Qualcosa che si estende all'applicazione coerente delle regole aziendali. Nonostante questo, come tutti i consumatori hanno la stessa visione dell'universo dei dati, le prestazioni nelle query sono piuttosto elevate e la capacità di interrogazione dell'utente ne beneficia. La densità di valore dei dati è molto maggiore che negli ambienti di big data. Qui, ogni riga ha un valore intrinseco.
Finalmente, in materie associate al ciclo di vita e alla standardizzazione di un database, è necessario prestare attenzione all'agilità. E questo è qualcosa di intrinseco al big data. Sebbene i data warehouse siano notoriamente difficili, richiedano molto tempo e siano costosi da modificare, i consumatori di dati stabiliscono i propri criteri e tempi all'interno di un mondo di big data.
(funzione(D, S, ID) {
var js, fjs = d.getElementsByTagName(S)[0];
Se (d.getElementById(ID)) Restituzione;
js = d.createElement(S); js.id = id;
js.src = “//connect.facebook.net/es_ES/all.js#xfbml=1&stato=0”;
fjs.parentNode.insertBefore(js, fjs);
}(documento, 'copione', 'facebook-jssdk'));


