Si tu sais 10 des personnes qui travaillent dans le domaine de la science des données depuis plus de 5 ans, Tout le monde connaît ou a probablement utilisé SQL à un moment donné d'une manière ou d'une autre !! Tel est le degré d'influence que SQL a eu sur tout ce qui concerne les données structurées.
Dans ce billet, nous allons apprendre les bases de SQL et nous concentrer sur SQL pour SGBDR. Comme vous le verrez, SQL est assez facile à apprendre et à comprendre.
Qu'est-ce que SQL?
SQL signifie Structured Query Language. Es un lenguaje de programación estándar para tener acceso a una base de donnéesUne base de données est un ensemble organisé d’informations qui vous permet de stocker, Gérez et récupérez efficacement les données. Utilisé dans diverses applications, Des systèmes d’entreprise aux plateformes en ligne, Les bases de données peuvent être relationnelles ou non relationnelles. Une bonne conception est essentielle pour optimiser les performances et garantir l’intégrité de l’information, facilitant ainsi la prise de décision éclairée dans différents contextes.... relacional. Il a été conçu pour la gestion des données dans les systèmes de gestion de bases de données relationnelles (SGBDR) como Oracle, MySQL, Serveur MS SQL, IBM DB2.
SQL est l'un des premiers langages commerciaux utilisés pour le modèle relationnel d'Edgar F.. Morue, décrit plus en détail dans son article influent de 1970, "Un modèle de données relationnel pour les grandes bases de données partagées. “
Précédemment, SQL était un langage de facto pour la génération de professionnels des technologies de l'information. Cela était dû au fait que les magasins de données étaient constitués de l'un ou l'autre des SGBDR. La simplicité et la beauté du langage ont permis aux professionnels de l'entreposage de données d'interroger et de fournir des données aux analystes commerciaux.
Malgré cela, le problème avec les SGBDR est qu'ils ne conviennent souvent que pour des informations structurées. Pour des informations non structurées, las bases de datos más nuevas como MongoDB y HBaseHBase es una base de datos NoSQL diseñada para manejar grandes volúmenes de datos distribuidos en clústeres. Basada en el modelo de columnas, permite un acceso rápido y escalable a la información. HBase se integra fácilmente con Hadoop, lo que la convierte en una opción popular para aplicaciones que requieren almacenamiento y procesamiento de datos masivos. Su flexibilidad y capacidad de crecimiento la hacen ideal para proyectos de big data.... (le Hadoop) s'avérer plus adapté. Une partie de cela est une compensation dans les bases de données, ce qui est dû au théorème CAP.
Qu'est-ce que le théorème CAP?
Le théorème CAP indique que, Dans le meilleur des cas, nous pouvons aspirer à deux des trois propriétés suivantes. CAP signifie:
Cohérence – Cela signifie que les données de la base de données restent cohérentes après l'exécution d'une opération.
Disponibilité – Cela signifie que le système de base de données est toujours opérationnel pour garantir la disponibilité..
Tolérance de partition – Cela signifie que le système continue de fonctionner même si le transfert d'informations entre les serveurs n'est pas fiable..
Les différentes bases de données et leurs relations avec le théorème CAP sont présentées ci-dessous:
Propriétés de la base de données:
Malgré cela, ongle transactionLa "transaction" fait référence au processus par lequel un échange de biens a lieu, services ou argent entre deux ou plusieurs parties. Ce concept est fondamental dans le domaine économique et juridique, puisqu’il implique un accord mutuel et la prise en compte de conditions spécifiques. Les transactions peuvent être formelles, sous forme de contrats, ou informel, et sont essentielles au fonctionnement des marchés et des entreprises.... de base de datos debe ser compatible con ACID. ACID signifie atomique, cohérent, isolé et durable, comme expliqué ci-dessous:
Atomique: Une transaction doit être complétée avec toutes vos modifications de données ou non.
Cohérent: A la fin de l'opération, toutes les données doivent rester cohérentes.
Isolé : Les modifications de données effectuées par une transaction doivent être indépendantes des autres transactions.
Durable : A la fin de l'opération, les effets des modifications apportées par la transaction doivent être permanents dans le système.
Pour contrer l'ACIDE, des services cohérents fournissent des fonctionnalités BASE (Disponible simplement, état doux, cohérence à terme).
Jeu de commandes en SQL
SÉLECTIONNER- El siguiente es un ejemplo de una consulta SÉLECTIONNERLa commande "SÉLECTIONNER" es fundamental en SQL, utilizado para consultar y recuperar datos de una base de datos. Permite especificar columnas y tablas, filtrando resultados mediante cláusulas como "OÙ" y ordenando con "COMMANDÉ PAR". Su versatilidad lo convierte en una herramienta esencial para la manipulación y análisis de datos, facilitando la obtención de información específica de manera eficiente.... que devuelve una lista de libros económicos. La requête récupère toutes les lignes du Une bibliothèque tableau dans lequel le le prix La colonne contient une valeur inférieure à 10,00. Le résultat est trié par ordre croissant par le prix. L'astérisque dans le choisir la liste indique que toutes les colonnes du Livre
SÉLECTIONNER * DE Bibliothèque OÙ"OÙ" est un terme anglais qui se traduit par "où" en espagnol. Utilisé pour poser des questions sur l’emplacement des personnes, Objets ou événements. Dans des contextes grammaticaux, Il peut fonctionner comme un adverbe de lieu et est fondamental dans la formation des questions. Son application correcte est essentielle dans la communication quotidienne et dans l’enseignement des langues, faciliter la compréhension et l’échange d’informations sur les positions et les orientations.... le prix < 10.00 ORDRE PAR le prix;
Le tableau doit être inclus dans le jeu de résultats.
AMÉLIORER –
Cette requête permet de mettre à jour les tables d'une base de données. Además se puede combinar la consulta SELECT con el operador GROUP BYLa cláusula "GROUP BY" en SQL se utiliza para agrupar filas que comparten valores en columnas específicas. Esto permite realizar funciones de agregación, comme SOMME, COUNT o AVG, sobre los grupos resultantes. Su uso es fundamental para analizar datos y obtener resúmenes estadísticos. Es importante recordar que todas las columnas seleccionadas que no forman parte de una función de agregación deben incluirse en la cláusula "GROUP BY".... para agregar estadísticas de una variableEn statistique et en mathématiques, ongle "variable" est un symbole qui représente une valeur qui peut changer ou varier. Il existe différents types de variables, et qualitatif, qui décrivent des caractéristiques non numériques, et quantitatif, représentation de grandeurs numériques. Les variables sont fondamentales dans les expériences et les études, puisqu’ils permettent l’analyse des relations et des modèles entre différents éléments, faciliter la compréhension de phénomènes complexes.... numérica por una variable categórica.
LES ARTICULATIONS-
Pour cela, SQL est largement utilisé non seulement pour interroger des données, mais aussi de joindre les données renvoyées par de telles requêtes ou tables. La fusión de datosLa fusión de datos es un proceso que integra información de diversas fuentes para obtener un conjunto unificado y coherente. Esta técnica es fundamental en áreas como la inteligencia artificial, la minería de datos y la analítica, ya que permite mejorar la precisión y la calidad de los análisis. Al combinar datos heterogéneos, se pueden descubrir patrones y tendencias que, d'une autre manière, pasarían desapercibidos.... en SQL se realiza a través de ‘uniones’. L'infographie suivante est souvent utilisée pour expliquer les jointures SQL:
Cómo utilizar rejoindre"REJOINDRE" es una operación fundamental en bases de datos que permite combinar registros de dos o más tablas basándose en una relación lógica entre ellas. Existen diferentes tipos de JOIN, como INNER JOIN, LEFT JOIN y RIGHT JOIN, cada uno con sus propias características y usos. Esta técnica es esencial para realizar consultas complejas y obtener información más relevante y detallada a partir de múltiples fuentes de datos.... et SQL
CAS- Nous avons l'opérateur de cas / lorsque / alors / autre / qu'un SQL. Fonctionne comme mais
dans d'autres langages de programmation:
CAS LORSQUE m > 0 ALORS 'positif' LORSQUE m < 0 ALORS 'négatif' AUTRE 'zéro' FINIR
Sous-requêtes imbriquées – Les requêtes peuvent être imbriquées afin que les résultats d'une requête puissent être utilisés dans une autre requête via un opérateur relationnel ou une fonction d'agrégation. Une requête imbriquée est également appeléesous-requêteUna subconsulta es una consulta dentro de otra consulta en SQL. Se utiliza para obtener resultados de una base de datos que dependan de los resultados de una consulta externa. Las subconsultas pueden aparecer en cláusulas SELECT, WHERE o FROM, y permiten realizar operaciones más complejas al filtrar o modificar datos de manera eficiente. Su uso adecuado optimiza el rendimiento y la claridad del código SQL....
.
Où utilisons-nous SQL?
- SQL a été largement utilisé pour récupérer des données, fusionner des données, groupe de requêtes et cas imbriqués sur des décennies. Même pour la science des données, SQL a été largement adopté. Ensuite, quelques exemples d'utilisation spécifique de l'analyse SQL sont présentés:
- Dans le cas du langage SAS qui utilise PROC SQL, nous pouvons écrire des requêtes SQL pour interroger, mettre à jour et manipuler les données.
- Un R, Le package sqldf peut être utilisé pour exécuter des requêtes SQL sur des trames de données.
Et Python, La bibliothèque pandasql vous permet d'interroger les Pandas DataFrames à l'aide de la syntaxe SQL.
SQL influence-t-il également d'autres langages?
L'inconvénient des bases de données relationnelles est qu'elles ne peuvent pas gérer les données non structurées. Pour faire face à l'apparence, De nouvelles bases de données ont émergé et reçoivent NoSQL comme nom alternatif au SGBD. Mais SQL n'est pas encore mort. Voir également:
Un mappage de SQL vers MongoDB
Voici quelques langages dans lesquels SQL a une influence significative:
.
SQL-Mapreduce
– Teradata utiliza la base de datos Aster que utiliza SQL con CarteRéduireMapReduce es un modelo de programación diseñado para procesar y generar grandes conjuntos de datos de manera eficiente. Desarrollado por Google, este enfoque Divide el trabajo en tareas más pequeñas, las cuales se distribuyen entre múltiples nodos en un clúster. Cada nodo procesa su parte y luego se combinan los resultados. Este método permite escalar aplicaciones y manejar volúmenes masivos de información, siendo fundamental en el mundo del Big Data.... para grandes conjuntos de datos en la era de Big Data. SQL-MapReduce® est un framework créé par Teradata Aster pour permettre aux développeurs d'écrire des fonctions SQL-MapReduce puissantes et très expressives dans des langages tels que Java, C #, Python, C ++ et R et les amener sur la plate-forme de découverte pour des analyses hautes performances. Après, les analystes peuvent invoquer les fonctions SQL-MapReduce en utilisant SQL standard ou R via la base de données Aster.
Spark SQL – Le projet Spark d'Apache est destinéTraitement en temps réel, données Hadoop en mémoire et parallèles
. Spark SQL s'appuie dessus pour permettre l'écriture de requêtes SQL dans les données. Dans Impala de Cloudera, los datos almacenados en HDFSHDFS, o Sistema de Archivos Distribuido de Hadoop, es una infraestructura clave para el almacenamiento de grandes volúmenes de datos. Diseñado para ejecutarse en hardware común, HDFS permite la distribución de datos en múltiples nodos, garantizando alta disponibilidad y tolerancia a fallos. Su arquitectura se basa en un modelo maestro-esclavo, donde un nodo maestro gestiona el sistema y los nodos esclavos almacenan los datos, facilitando el procesamiento eficiente de información... o HBase se pueden consultar, y la sintaxis SQL es la misma que la de Apache RucheHive es una plataforma de redes sociales descentralizada que permite a sus usuarios compartir contenido y conectar con otros sin la intervención de una autoridad central. Utiliza tecnología blockchain para garantizar la seguridad y la propiedad de los datos. A diferencia de otras redes sociales, Hive permite a los usuarios monetizar su contenido a través de recompensas en criptomonedas, lo que fomenta la creación y el intercambio activo de información.....
Voir également: En savoir plus sur les manières d'interroger Hadoop à l'aide de SQLici
.
Remarques finales
Dans cet article, nous discutons de SQL, ses utilisations, le théorème CAP et l'influence de SQL sur d'autres langages. Une connaissance de base de SQL est très pertinente dans le monde d'aujourd'hui, où python, R, Les SAS sont des langages dominants en science des données. SQL est toujours d'actualité à l'ère du BIG DATA. La beauté de la langue reste sa structure élégante et simple. Pot de réflexion:
Pensez-vous que SQL est devenu une arme incontournable pour la gestion des données? Recommanderiez-vous d'autres langues de base de données?
Partagez vos points de vue / opinion / commentaires avec nous dans la section commentaire ci-dessous. Nous serions ravis de vous entendre!! Si vous aimez ce que vous venez de lire et souhaitez continuer à apprendre sur l'analyse,abonnez-vous à nos e-mails , Suivez-nous sur Twitter ou comme le nôtrepage le Facebook
.
En rapport