Este artículo fue publicado como parte del Blogatón de ciencia de datos
Casi todo o todo tipo de información disponible en línea se almacena en algún tipo de base de datos. La cantidad de datos e información en línea es bastante grande. Tu foto de perfil de Facebook, tus tweets, tus pedidos de comida anteriores en Zomato: todo está almacenado en algún lugar.
Entonces, surge la pregunta, ¿dónde se almacenan todos estos? La respuesta es simple.
Una base de datos
(Imagen: https://www.pexels.com/photo/close-up-view-of-system-hacking-in-a-monitor-5380664/)
¿Que es una base de datos?
Una base de datos es una colección de información relacionada. Las bases de datos modernas contienen millones o incluso billones de piezas de información. Las bases de datos brindan conveniencia para un fácil almacenamiento y acceso a los datos.
La palabra ‘datum’ significa una sola pieza de información. La palabra datos es la forma plural de datum. Uno de los aspectos más importantes de una base de datos es administrar y operar fácilmente grandes cantidades de datos.
Las bases de datos modernas son administradas por algo llamado Sistema de administración de bases de datos.
¿Qué es un sistema de gestión de bases de datos?
Un sistema de administración de bases de datos es un software que ayuda a los usuarios a crear y mantener una base de datos. Los sistemas de gestión de bases de datos gestionan grandes cantidades de información, gestionan la seguridad, se encargan de las copias de seguridad de los datos, importan o exportan datos y permiten que los usuarios accedan a los datos.
¿Qué es una base de datos relacional?
Una base de datos que sigue el modelo relacional y almacena datos en un formato tabular se conoce como base de datos relacional. La base de datos tiene filas y columnas y una clave única para cada punto de datos.
Las bases de datos relacionales son muy comunes y se utilizan mucho. Casi todo lo que ha ingresado en línea en un formulario o algo así generalmente se almacena en una base de datos relacional. Ejemplos de bases de datos relacionales: Microsoft SQL Server, Oracle, MYSQL.
Creemos una base de datos relacional simple usando SQL.
Los comandos SQL se escriben de la siguiente manera.
CREATE TABLE student_data( studentID int PRIMARY KEY NOT NULL, student_name varchar(30), gender VARCHAR(1), course varchar(15), marks float, fees int, admission_year int );
Se creará una tabla simple que consta de datos de muestra. Para dar una breve información sobre la tabla creada, el alumno es la LLAVE PRIMARIA. Por lo general, este será el número de registro de un estudiante en una universidad o escuela. No puede ser NULL, es decir, este campo debe tener un valor. La palabra clave «NOT NULL» se utiliza para definir esto.
Otras columnas de datos incluyen el nombre del estudiante, el género, el curso, las calificaciones, las tarifas y el año de admisión.
Se creará una tabla simple que consta de datos de muestra. Para dar una breve información sobre la tabla creada, el studentID es la CLAVE PRINCIPAL. Por lo general, este será el número de registro de un estudiante en una universidad o escuela. No puede ser NULL, es decir, este campo debe tener un valor. La palabra clave «NOT NULL» se utiliza para definir esto.
Otras columnas de datos incluyen el nombre del estudiante, el género, el curso, las calificaciones, las tarifas y el año de admisión.
Ahora, ingresemos datos en la tabla.
INSERT INTO student_data VALUES ('1', 'Rahul','M', 'BA English', 89.2, 15000, 2019); INSERT INTO student_data VALUES ('2', 'Riya', 'F','BA History', 68, 12000, 2018); INSERT INTO student_data VALUES ('3', 'Sagnik','M', 'MBBS', 96, 19000, 2019); INSERT INTO student_data VALUES ('4', 'Aditya', 'M','BA English', 95, 8000, 2018); INSERT INTO student_data VALUES ('5', 'Sunny', 'M','Btech', 78, 14000, 2019); INSERT INTO student_data VALUES ('6', 'Anshuman', 'M','Btech', 67, 6000, 2018); INSERT INTO student_data VALUES ('7', 'Soumya','M', 'Btech', 86.8, 17000, 2019); INSERT INTO student_data VALUES ('8', 'Ravi', 'M','MBBS', 87.9, 18000, 2018); INSERT INTO student_data VALUES ('9', 'Priya', 'F','BA English', 93, 12000, 2019); INSERT INTO student_data VALUES ('10', 'Ankita', 'F','BA History', 89.2, 14000, 2018);
Insertamos 10 entradas en la tabla.
La tabla ahora se ve así.
Si ha encontrado Excel, ahora comprenderá que la visualización se parece a Excel. Por ejemplo, cada hoja contiene algunos datos en un archivo de Excel, cada tabla contiene algún tipo de información.
Una tabla es una colección de entradas de datos relacionados y usa columnas y filas para almacenar datos.
Cada columna es un atributo de datos, en la tabla anterior, género, curso, marcas, etc. son los campos de datos o atributos. Las filas se denominan registros, son las entradas individuales de la tabla.
Esta forma de almacenar datos es fácil, flexible y eficiente. Las nuevas entradas simplemente se pueden agregar al final de la tabla. El informático Edgar F. Codd desarrolló el modelo relacional de almacenamiento de datos en 1970.
¿Cómo funcionan las bases de datos relacionales?
Todas las partes mencionadas anteriormente son aspectos importantes de las bases de datos relacionales. Para resumir, las tablas, conocidas como relaciones, consisten en datos en filas y columnas. Todas las tablas tienen una clave primaria. La conexión lógica entre dos o más tablas se puede establecer con la ayuda de claves externas. Una clave externa es una columna que hace referencia a la clave principal de otra tabla.
Las relaciones entre varias tablas se pueden definir o modelar mediante un diagrama de relación de entidad. Tiene todas las entidades y atributos. En los RDBM, a medida que los datos se almacenan en formato de tabla, las relaciones también se almacenan en formato de tabla.
Las bases de datos relacionales son las más utilizadas, admiten la independencia de los datos y los datos almacenados como tablas se pueden analizar y procesar fácilmente.
Por ejemplo, consideremos los datos de los estudiantes anteriores. Aquí, hay 10 entradas, pero supongamos una situación de la vida real y hay 5000 estudiantes. No podemos analizar cada punto de datos individualmente.
Digamos que tenemos que ver la distribución de las calificaciones, contar el número de estudiantes masculinos y femeninos y realizar otras tareas de exploración de datos. RDBMS facilitará estas cosas.
Lo que hay que hacer es bastante sencillo. Los datos se pueden extraer, convertir a un archivo de Excel y analizar en Excel. O puede convertirse a un archivo csv y analizarse en Excel. Después de esto, resulta bastante sencillo trabajar con los datos.
El modelo relacional de RDBM ayuda a separar las estructuras de datos lógicas de las estructuras de almacenamiento físico. Esto permite a los administradores de bases de datos administrar el almacenamiento de datos físicos sin afectar el acceso a esos datos como una estructura lógica.
Las bases de datos relacionales proporcionan una forma de almacenar datos y representarlos, que puede ser utilizada por cualquier aplicación o software. La principal fortaleza de las bases de datos relacionales es el uso de tablas para almacenar datos. Las tablas son una forma sencilla, sólida y flexible de almacenar datos.
SQL se ha convertido en el lenguaje más popular para consultas de bases de datos. SQL se puede utilizar fácilmente para recuperar datos de bases de datos. Implementemos algunas consultas SQL simples.
Consultas SQL:
Ahora, de la base de datos de estudiantes creada anteriormente, digamos, queremos obtener todas las calificaciones de los estudiantes, ordenadas en orden ascendente. La consulta SQL será:
SELECT student_data.student_name, student_data.marks FROM student_data ORDER BY marks;
Producción:
Ahora, queremos el mismo resultado, pero en orden descendente.
La consulta SQL será:
SELECT student_data.student_name, student_data.marks FROM student_data ORDER BY marks DESC;
Producción:
Ahora, queremos analizar las tarifas de los estudiantes, veamos cómo implementarlas.
La consulta SQL es bastante simple.
SELECT student_name, fees FROM student_data ORDER BY fees;
Producción:
Ahora, tomemos a los estudiantes que están en el curso BTech.
La consulta es la siguiente.
SELECT student_name, course,fees, marks FROM student_data WHERE course= "Btech";
Producción:
La herramienta SQL en línea utilizada es: https://sqliteonline.com/
Ahora, verifiquemos qué estudiantes tienen tarifas superiores a 15000.
SELECT student_name, fees, marks FROM student_data WHERE fees > 15000;
Producción:
Ahora, revisemos a los estudiantes cuyas tarifas son mayores a 15000, y las entradas están ordenadas por sus calificaciones.
SELECT student_name, fees, marks FROM student_data WHERE fees > 15000 ORDER BY marks;
Producción:
Ahora, elijamos a los estudiantes que hayan tomado una licenciatura en inglés o MBBS, luego los ordenaremos por las tarifas.
SELECT student_name, fees, marks, course FROM student_data WHERE course in('BA English','MBBS') ORDER BY fees;
Producción:
Entonces, podemos ver que obtener y recuperar datos de una base de datos relacional es muy fácil.
La estructura tabular de las bases de datos relacionales es la principal ventaja de dichas bases de datos. Estas bases de datos también son muy simples y las consultas se pueden utilizar para extraer datos o modificar datos existentes. Los datos almacenados también son muy precisos. Las comprobaciones de validez de los datos y la tipificación de datos garantizan la integridad de los datos. Al permitir el acceso a personas específicas, los RDBM también se ocupan del problema de seguridad.
Las bases de datos relacionales tienen una relación bien definida entre tablas. Las tablas están relacionadas entre sí, lo que facilita la búsqueda de datos y hace que los informes de datos sean fáciles y sencillos. Las bases de datos relacionales son muy importantes, ya que han creado un modelo universal para almacenar información y datos. La mayoría de las computadoras modernas pueden usar bases de datos relacionales.
Las personas las entienden bien, el escalado y la expansión son fáciles, y también se ajustan al caso de uso la mayor parte del tiempo. Es por eso que se utilizan principalmente bases de datos relacionales.
Sobre mí:
Prateek Majumder
Analítica | Creación de contenido
Conéctate conmigo en Linkedin.
Mis otros artículos sobre DataPeaker: Link.
Gracias.
Los medios que se muestran en este artículo no son propiedad de DataPeaker y se utilizan a discreción del autor.