Bases de SQL | Commandes et utilisations SQL

Contenu

Si tu sais 10 des personnes qui travaillent dans le domaine de la science des données depuis plus de 5 ans, Tout le monde connaît ou a probablement utilisé SQL à un moment donné d'une manière ou d'une autre !! Tel est le degré d'influence que SQL a eu sur tout ce qui concerne les données structurées.

Dans ce billet, nous allons apprendre les bases de SQL et nous concentrer sur SQL pour SGBDR. Comme vous le verrez, SQL est assez facile à apprendre et à comprendre.

Qu'est-ce que SQL?

SQL signifie Structured Query Language. C'est un langage de programmation standard pour accéder à une base de données relationnelle. Il a été conçu pour la gestion des données dans les systèmes de gestion de bases de données relationnelles (SGBDR) como Oracle, MySQL, Serveur MS SQL, IBM DB2.

SQL est l'un des premiers langages commerciaux utilisés pour le modèle relationnel d'Edgar F.. Morue, décrit plus en détail dans son article influent de 1970, "Un modèle de données relationnel pour les grandes bases de données partagées. “

Précédemment, SQL était un langage de facto pour la génération de professionnels des technologies de l'information. Cela était dû au fait que les magasins de données étaient constitués de l'un ou l'autre des SGBDR. La simplicité et la beauté du langage ont permis aux professionnels de l'entreposage de données d'interroger et de fournir des données aux analystes commerciaux.

Malgré cela, le problème avec les SGBDR est qu'ils ne conviennent souvent que pour des informations structurées. Pour des informations non structurées, bases de données plus récentes comme MongoDB et HBase (le Hadoop) s'avérer plus adapté. Une partie de cela est une compensation dans les bases de données, ce qui est dû au théorème CAP.

Qu'est-ce que le théorème CAP?

Le théorème CAP indique que, Dans le meilleur des cas, nous pouvons aspirer à deux des trois propriétés suivantes. CAP signifie:

Cohérence – Cela signifie que les données de la base de données restent cohérentes après l'exécution d'une opération.

Disponibilité – Cela signifie que le système de base de données est toujours opérationnel pour garantir la disponibilité..

Tolérance de partition – Cela signifie que le système continue de fonctionner même si le transfert d'informations entre les serveurs n'est pas fiable..

Les différentes bases de données et leurs relations avec le théorème CAP sont présentées ci-dessous:

Guide visuel NoSQL

Propriétés de la base de données:

Malgré cela, une transaction de base de données doit être conforme à ACID. ACID signifie atomique, cohérent, isolé et durable, comme expliqué ci-dessous:

Atomique: Une transaction doit être complétée avec toutes vos modifications de données ou non.

Cohérent: A la fin de l'opération, toutes les données doivent rester cohérentes.

Isolé : Les modifications de données effectuées par une transaction doivent être indépendantes des autres transactions.

Durable : A la fin de l'opération, les effets des modifications apportées par la transaction doivent être permanents dans le système.

Pour contrer l'ACIDE, des services cohérents fournissent des fonctionnalités BASE (Disponible simplement, état doux, cohérence à terme).

Jeu de commandes en SQL

SÉLECTIONNER- Ce qui suit est un exemple de requête SELECT qui renvoie une liste de livres bon marché. La requête récupère toutes les lignes du Une bibliothèque tableau dans lequel le le prix La colonne contient une valeur inférieure à 10,00. Le résultat est trié par ordre croissant par le prix. L'astérisque dans le choisir la liste indique que toutes les colonnes du Livre

SÉLECTIONNER *
 DE  Bibliothèque
  le prix < 10.00
 ORDRE PAR le prix;

Le tableau doit être inclus dans le jeu de résultats.

AMÉLIORER –

Cette requête permet de mettre à jour les tables d'une base de données. De plus, la requête SELECT peut être combinée avec l'opérateur GROUP BY pour ajouter des statistiques d'une variable numérique par une variable catégorielle.

LES ARTICULATIONS-

Pour cela, SQL est largement utilisé non seulement pour interroger des données, mais aussi de joindre les données renvoyées par de telles requêtes ou tables. La fusion de données en SQL se fait via des « jointures ». L'infographie suivante est souvent utilisée pour expliquer les jointures SQL:

Comment utiliser la jointure en SQL

CAS- Nous avons l'opérateur de cas / lorsque / alors / autre / qu'un SQL. Fonctionne comme mais

dans d'autres langages de programmation:

CAS LORSQUE m > 0
 ALORS 'positif'
 LORSQUE m < 0
 ALORS 'négatif'
 AUTRE 'zéro'
 FINIR


Sous-requêtes imbriquées – Les requêtes peuvent être imbriquées afin que les résultats d'une requête puissent être utilisés dans une autre requête via un opérateur relationnel ou une fonction d'agrégation. Une requête imbriquée est également appeléesous-requête

.

Où utilisons-nous SQL?

  1. SQL a été largement utilisé pour récupérer des données, fusionner des données, groupe de requêtes et cas imbriqués sur des décennies. Même pour la science des données, SQL a été largement adopté. Ensuite, quelques exemples d'utilisation spécifique de l'analyse SQL sont présentés:
  2. Dans le cas du langage SAS qui utilise PROC SQL, nous pouvons écrire des requêtes SQL pour interroger, mettre à jour et manipuler les données.
  3. Un R, Le package sqldf peut être utilisé pour exécuter des requêtes SQL sur des trames de données.

Et Python, La bibliothèque pandasql vous permet d'interroger les Pandas DataFrames à l'aide de la syntaxe SQL.

SQL influence-t-il également d'autres langages?

L'inconvénient des bases de données relationnelles est qu'elles ne peuvent pas gérer les données non structurées. Pour faire face à l'apparence, De nouvelles bases de données ont émergé et reçoivent NoSQL comme nom alternatif au SGBD. Mais SQL n'est pas encore mort. Voir également:

Un mappage de SQL vers MongoDB

Voici quelques langages dans lesquels SQL a une influence significative:

Ruche – Apache Hive fournit un mécanisme pour projeter la structure sur les données dans Hadoop et interroger ces données à l'aide d'un langage de type SQL appelé HiveQL (HQL). Il s'agit d'une infrastructure de stockage de données construite sur Apache ™ Hadoop® pour fournir un résumé des données, requêtes ad hoc et analyse de grands ensembles de données. Même HQL, un langage de requête utilisé dans Hadoop, utilise fortement les influences SQL. Vous pouvez en savoir plusici

.

SQL-Mapreduce

– Teradata utilise la base de données Aster en utilisant SQL avec MapReduce pour les grands ensembles de données à l'ère du Big Data. SQL-MapReduce® est un framework créé par Teradata Aster pour permettre aux développeurs d'écrire des fonctions SQL-MapReduce puissantes et très expressives dans des langages tels que Java, C #, Python, C ++ et R et les amener sur la plate-forme de découverte pour des analyses hautes performances. Après, les analystes peuvent invoquer les fonctions SQL-MapReduce en utilisant SQL standard ou R via la base de données Aster.

Spark SQL – Le projet Spark d'Apache est destinéTraitement en temps réel, données Hadoop en mémoire et parallèles

. Spark SQL s'appuie dessus pour permettre l'écriture de requêtes SQL dans les données. Dans Impala de Cloudera, les données stockées dans HDFS ou HBase peuvent être interrogées, et la syntaxe SQL est la même qu'Apache Hive.

Voir également: En savoir plus sur les manières d'interroger Hadoop à l'aide de SQLici

.

Remarques finales

Dans cet article, nous discutons de SQL, ses utilisations, le théorème CAP et l'influence de SQL sur d'autres langages. Une connaissance de base de SQL est très pertinente dans le monde d'aujourd'hui, où python, R, Les SAS sont des langages dominants en science des données. SQL est toujours d'actualité à l'ère du BIG DATA. La beauté de la langue reste sa structure élégante et simple. Pot de réflexion:

Pensez-vous que SQL est devenu une arme incontournable pour la gestion des données? Recommanderiez-vous d'autres langues de base de données?

Partagez vos points de vue / opinion / commentaires avec nous dans la section commentaire ci-dessous. Nous serions ravis de vous entendre!! Si vous aimez ce que vous venez de lire et souhaitez continuer à apprendre sur l'analyse,abonnez-vous à nos e-mails , Suivez-nous sur Twitter ou comme le nôtrepage le Facebook

En rapport

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.