Nozioni di base su SQL | Comandi SQL e usi

Contenuti

Se sai 10 persone che si occupano di data science da più di 5 anni, Probabilmente tutti conoscono o hanno usato SQL in qualche modo!! Tale è il grado di influenza che SQL ha avuto su tutto ciò che ha a che fare con i dati strutturati.

In questo post, impareremo le basi di SQL e ci concentreremo su SQL per RDBMS. Come vedrai, SQL è abbastanza facile da imparare e capire.

Cos'è SQL??

SQL è l'acronimo di Structured Query Language. È un linguaggio di programmazione standard per accedere a un database relazionale. È stato progettato per la gestione dei dati nei sistemi di gestione di database relazionali (RDBMS) come Oracle, MySQL, MS SQL Server, IBM DB2.

SQL è uno dei primi linguaggi commerciali utilizzati per il modello relazionale di Edgar F.. merluzzo, ulteriormente descritto nel suo influente post da 1970, “Un modello di dati relazionale per grandi database condivisi. “

In precedenza, SQL era di fatto un linguaggio per la generazione di professionisti della tecnologia dell'informazione. Ciò era dovuto al fatto che gli archivi di dati consistevano in uno o l'altro RDBMS. La semplicità e la bellezza del linguaggio hanno consentito ai professionisti del data warehousing di interrogare e fornire dati agli analisti aziendali.

Nonostante questo, il problema con RDBMS è che spesso sono adatti solo per informazioni strutturate. Per informazioni non strutturate, database più recenti come MongoDB e HBase (l'Hadoop) dimostra di essere più adatto. Parte di questo è un compenso nei database, che è dovuto al teorema CAP.

Cos'è il teorema della CAP??

Il teorema CAP afferma che, nel migliore dei casi, possiamo aspirare a due delle seguenti tre proprietà. CAP significa:

Consistenza – Ciò significa che i dati nel database rimangono coerenti dopo l'esecuzione di un'operazione.

Disponibilità – Ciò significa che il sistema di database è sempre in grado di garantire la disponibilità..

Tolleranza della partizione – Ciò significa che il sistema continua a funzionare anche se il trasferimento delle informazioni tra i server non è affidabile..

Di seguito sono riportati i vari database e le loro relazioni con il teorema CAP:

Guida visiva NoSQL

Proprietà del database:

Nonostante questo, una transazione del database deve essere compatibile con ACID. ACIDO significa atomico, coerente, isolato e durevole, come spiegato di seguito:

Atomico: Una transazione deve essere completata con tutte le modifiche ai dati o meno.

coerente: Alla fine della transazione, tutti i dati devono essere lasciati coerenti.

Isolato : Le modifiche ai dati apportate da una transazione devono essere indipendenti da altre transazioni.

Durevole : Alla fine della transazione, gli effetti delle modifiche apportate dalla transazione devono essere permanenti nel sistema.

Per contrastare l'ACID, servizi coerenti forniscono funzionalità BASE (Semplicemente disponibile, stato morbido, consistenza finale).

Set di comandi in SQL

SELEZIONARE- Quello che segue è un esempio di una query SELECT che restituisce un elenco di libri economici. La query recupera tutte le righe dal Biblioteca tavolo in cui il prezzo La colonna contiene un valore minore di 10,00. Il risultato è ordinato in ordine crescente per prezzo. L'asterisco a scegli la lista indica che tutte le colonne di Prenotare

SELEZIONARE *
 A PARTIRE DAL  Biblioteca
 DOVE prezzo < 10.00
 ORDINE DI prezzo;

La tabella deve essere inclusa nel set di risultati.

AGGIORNAMENTO –

Questa query aiuta ad aggiornare le tabelle in un database. Inoltre, puoi combinare la query SELECT con l'operatore GROUP BY per aggiungere statistiche di una variabile numerica da una variabile categoriale.

GIUNTI-

Perché, SQL è ampiamente utilizzato non solo per l'interrogazione dei dati, ma anche per unire i dati restituiti da tali query o tabelle. La fusione dei dati in SQL viene eseguita tramite "unioni". La prossima infografica viene spesso utilizzata per spiegare i join SQL:

Come usare join in SQL

ASTUCCIO- Abbiamo l'operatore del caso / quando / poi / altro / di un SQL. Funziona come ma

in altri linguaggi di programmazione:

ASTUCCIO QUANDO n > 0
 POI 'positivo'
 QUANDO n < 0
 POI 'negativo'
 ALTRO 'zero'
 FINE


Subquery nidificate – Le query possono essere nidificate in modo che i risultati di una query possano essere utilizzati in un'altra query tramite un operatore relazionale o una funzione aggregata. Una query nidificata è anche nota comesottoquery

.

Dove usiamo SQL??

  1. SQL è stato ampiamente utilizzato per recuperare i dati, unire i dati, gruppo di query e casi nidificati per decenni. Anche per la scienza dei dati, SQL è stato ampiamente adottato. Prossimo, sono mostrati alcuni esempi dell'uso specifico dell'analisi SQL:
  2. Nel caso del linguaggio SAS che utilizza PROC SQL, possiamo scrivere query SQL per interrogare, aggiornare e manipolare i dati.
  3. un R, Il pacchetto sqldf può essere utilizzato per eseguire query SQL su frame di dati.

e pitone, La libreria pandasql ti consente di interrogare Pandas DataFrames utilizzando la sintassi SQL.

SQL influenza anche altri linguaggi??

Lo svantaggio dei database relazionali è che non possono gestire dati non strutturati. Per far fronte all'apparenza, sono emersi nuovi database e viene dato NoSQL come nome alternativo a DBMS. Ma SQL non è ancora morto. Guarda anche:

Una mappatura da SQL a MongoDB

Ecco alcuni linguaggi in cui SQL ha un'influenza significativa:

Alveare – Apache Hive fornisce un meccanismo per proiettare la struttura sui dati in Hadoop e interrogare tali dati utilizzando un linguaggio simile a SQL chiamato HiveQL (HQL). È un'infrastruttura di archiviazione dati costruita su Apache ™ Hadoop® per fornire un riepilogo dei dati, query ad hoc e analisi di grandi set di dati. Anche HQL, un linguaggio di interrogazione usato in Hadoop, utilizza pesantemente le influenze SQL. Puoi saperne di piùqui

.

SQL Mapreduce

– Teradata utilizza il database Aster utilizzando SQL con MapReduce per grandi set di dati nell'era dei Big Data. SQL-MapReduce® è un framework creato da Teradata Aster per consentire agli sviluppatori di scrivere funzioni SQL-MapReduce potenti e altamente espressive in linguaggi come Java, C #, Pitone, C ++ e R e portarli alla piattaforma di scoperta per l'analisi ad alte prestazioni. Dopo, gli analisti possono invocare le funzioni SQL-MapReduce utilizzando SQL standard o R tramite il database Aster.

Spark SQL – Il progetto Spark di Apache è perElaborazione in tempo reale, dati Hadoop in memoria e paralleli

. Spark SQL si basa su di esso per consentire la scrittura delle query SQL nei dati. Nell'Impala di Cloudera, è possibile interrogare i dati archiviati in HDFS o HBase, e la sintassi SQL è la stessa di Apache Hive.

Guarda anche: Scopri di più sui modi per interrogare Hadoop usando SQLqui

.

Note finali

In questo post discutiamo di SQL, i suoi usi, il teorema CAP e l'influenza di SQL su altri linguaggi. Una conoscenza di base di SQL è molto rilevante nel mondo di oggi, dove pitone?, R, I SAS sono i linguaggi dominanti nella scienza dei dati. SQL è ancora rilevante nell'era dei BIG DATA. La bellezza del linguaggio rimane la sua struttura elegante e semplice. Thinkpot:

Pensi che SQL sia diventato un'arma inevitabile per la gestione dei dati?? Consiglieresti altre lingue del database??

Condividi le tue opinioni / opinione / feedback con noi nella sezione commenti qui sotto. Ci piacerebbe avere tue notizie!! Se ti piace quello che hai appena letto e vuoi continuare a imparare l'analisi,iscriviti alle nostre email , Seguici su Twitter o come il nostropagina Facebook

Imparentato

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.