Varias investigaciones han revelado que cada vez que escuchamos un objeto, lo recuperamos utilizando una imagen de nuestro cerebro. Por ejemplo, si te pregunto «¿Te gustan las manzanas?» . No pensará en los alfabetos «a», «p», «p», «l», «e», sino que recordará toda la información relevante sobre la manzana utilizando la imagen de una manzana. Así es como posiblemente funcione nuestro procesamiento de datos en nuestro cerebro. Por supuesto que es complicado y muy eficiente. Ahora, si le pregunta «¿Qué es una base de datos?», Pensará principalmente en una colección de tablas relacionadas entre sí. Si se le hubiera planteado la misma pregunta a una persona en la década de 1990, posiblemente solo habría pensado en una única tabla grande de la que recuperaría toda la información, pero hoy realmente hemos avanzado desde esta definición simplista de bases de datos.
Este artículo lo ayudará a comprender qué tipo de base de datos existe actualmente en esta industria. También hice un ejercicio interesante de trazar estos tipos de bases de datos en una estructura de árbol con un eje de tiempo. Esto le ayudará a visualizar cómo la definición y la aplicación de la base de datos cambiaron con el tiempo.
Evolución del sistema de gestión de bases de datos
Estamos demasiado acostumbrados a las líneas de tiempo en Facebook. Pensé que sería una buena idea comenzar este artículo en una línea similar. A continuación se muestra un árbol que lo ayudará a mapear todos los tipos de sistemas de administración de bases de datos populares en una línea de tiempo:
El cronograma varía desde la década de 1980 hasta la fecha actual y no es exhaustivo de todas las formas de sistemas de gestión de datos. Sin embargo, podremos cubrir la mayor parte del popular sistema de gestión de datos.
Base de datos de archivos planos
Este es probablemente el más fácil de entender, pero en la actualidad rara vez se utiliza. Puedes pensar en esto como una sola mesa enorme. Este tipo de conjuntos de datos se utilizaron durante mucho tiempo en la década de 1990, cuando los datos solo se usaban para recuperar información en caso de inquietudes. En estas bases de datos era posible realizar análisis muy primitivos.
Base de datos relacional
Pronto la gente comienza a darse cuenta de que dichas tablas serán casi imposibles de almacenar a largo plazo. Flat File trajo muchos datos redundantes en cada entrada. Por ejemplo, si quiero crear un único conjunto de datos con todos los productos comprados en una tienda de comestibles con toda la información del cliente y el producto, tendremos cada fila que consta de toda la información del cliente y del producto. Dondequiera que tengamos un producto o un cliente repetidos, tenemos datos repetidos. La gente pensó en almacenar esto como tablas diferentes y definir una jerarquía para acceder a todos los datos, que se llamarán como base de datos jerárquica.
Base de datos jerárquica es muy similar a la estructura de carpetas de su computadora portátil. Cada carpeta puede contener subcarpetas y cada subcarpeta aún puede contener más subcarpetas. Finalmente en algunas carpetas almacenaremos archivos. Sin embargo, cada nodo hijo (subcarpeta) tendrá un único padre (carpeta o subcarpeta). Finalmente, podemos crear una jerarquía del conjunto de datos:
Las bases de datos jerárquicas, sin embargo, pueden resolver muchos propósitos, sus aplicaciones están restringidas a estructuras de datos de mapeo uno a uno. Por ejemplo, funcionará bien si está utilizando esta estructura de datos para mostrar la jerarquía del perfil de trabajo en una empresa. Pero la estructura fallará si los informes se vuelven un poco más complicados y un solo empleado informa a muchos gerentes. Por lo tanto, la gente pensó en estructuras de bases de datos que pueden tener diferentes tipos de relaciones. Este tipo de estructura debería permitir el mapeo de uno a varios. Dicha mesa llegó a conocerse como Sistema de gestión de bases de datos relacionales (RDBMS).
A continuación se muestra un ejemplo de estructura de datos RDBMS:
Como puede ver en el diagrama anterior, hay varias claves que pueden ayudarnos a fusionar diferentes conjuntos de datos en esta base de datos. Este tipo de almacenamiento de datos optimiza el espacio en disco ocupado sin comprometer los detalles de los datos. Esta es la base de datos que generalmente utiliza la industria analítica. Sin embargo, cuando los datos pierden una estructura, dicha base de datos no será de ayuda.
Base de datos NoSQL
NoSQL se conoce a menudo como «No solo SQL». Cuando las personas se dieron cuenta de que el texto no estructurado contenía toneladas de información que no podían extraer mediante RDBMS, comenzaron a explorar formas de almacenar dichos conjuntos de datos. Todo lo que no sea RDBMS hoy en día se conoce libremente como NoSQL. Después de que las redes sociales ganaron importancia en el mercado, dicha base de datos se volvió común en la industria. A continuación se muestra un ejemplo en el que será muy difícil almacenar los datos en RDBMS:
Facebook almacena terabytes de datos adicionales todos los días. Intentemos imaginar la estructura en la que se pueden estructurar estos datos:
En el diagrama anterior, el mismo cuadro de color cae en el mismo objeto de categoría. Por ejemplo, el usuario, los amigos del usuario, a quién le gustó y el autor de los comentarios, todos son usuarios de FB. Ahora, si intentamos almacenar todos los datos en RDBMS, para ejecutar una sola consulta que puede ser solo una respuesta de abrir la página de inicio, necesitamos unir varias tablas con billones de filas juntas para encontrar una tabla combinada y luego ejecutar algoritmos para encontrar la información más relevante para el usuario. Esto no parece ser un trabajo de segundos con seguridad. Por lo tanto, debemos pasar de la comprensión tabular de los datos a una estructura de datos más basada en el flujo (gráfico). Esto es lo que trajo las estructuras NoSQL. Discutiremos las bases de datos NoSQL en nuestro próximo artículo. También compararemos varios tipos de bases de datos NoSQL para comprender el ajuste de estas bases de datos.
Notas finales
Las bases de datos forman la base de la industria analítica. Incluso si no conocemos cada uno de ellos en detalle, deberíamos tener una descripción general de todo el espectro de bases de datos. En este artículo discutimos los tipos populares de conjuntos de datos y cómo la necesidad de bases de datos evolucionó con el tiempo. En el próximo artículo continuaremos la misma discusión y daremos un paso más al comprender los tipos de bases de datos NoSQL.
¿Le resultó útil el artículo? Comparta con nosotros sus experiencias con diferentes tipos de bases de datos. Háganos saber su opinión sobre este artículo en el cuadro a continuación.