Noções básicas de SQL | Comandos e usos SQL

Conteúdo

Se você sabe 10 pessoas que trabalham na ciência de dados há mais de 5 anos, Todo mundo provavelmente conhece ou já usou SQL em algum ponto de alguma forma!! Esse é o grau de influência que o SQL teve em qualquer coisa a ver com dados estruturados.

Neste post, aprenderemos o básico de SQL e nos concentraremos em SQL para RDBMS. Como você verá, SQL é muito fácil de aprender e entender.

O que é SQL?

SQL significa Structured Query Language. É uma linguagem de programação padrão para acessar um banco de dados relacional. Ele foi projetado para gerenciamento de dados em sistemas de gerenciamento de banco de dados relacional (RDBMS) como oracle, MySQL, MS SQL Server, IBM DB2.

SQL é uma das primeiras linguagens comerciais usadas para o modelo relacional de Edgar F.. Codd, descrito mais detalhadamente em sua influente postagem por 1970, “Um modelo de dados relacionais para grandes bancos de dados compartilhados. “

Anteriormente, SQL era uma linguagem de fato para a geração de profissionais de tecnologia da informação. Isso se devia ao fato de que os armazenamentos de dados consistiam em um ou outro RDBMS. A simplicidade e beleza da linguagem permitiram aos profissionais de armazenamento de dados consultar e fornecer dados aos analistas de negócios.

Apesar disto, o problema com RDBMS é que muitas vezes são adequados apenas para informações estruturadas. Para informações não estruturadas, bancos de dados mais recentes, como MongoDB e HBase (o Hadoop) provar ser mais adequado. Parte disso é uma compensação nas bases de dados, que é devido ao teorema CAP.

Qual é o teorema CAP?

O teorema CAP afirma que, no melhor dos casos, podemos aspirar a duas das três propriedades a seguir. CAP significa:

Consistência – Isso significa que os dados no banco de dados permanecem consistentes após a execução de uma operação.

Disponibilidade – Isso significa que o sistema de banco de dados está sempre ativo para garantir a disponibilidade..

Tolerância de partição – Isso significa que o sistema continua a funcionar mesmo que a transferência de informações entre os servidores não seja confiável..

Os vários bancos de dados e suas relações com o teorema CAP são mostrados abaixo:

Guia visual NoSQL

Propriedades do banco de dados:

Apesar disto, uma transação de banco de dados deve ser compatível com ACID. ACID significa atômico, consistente, isolado e durável, como explicado abaixo:

Atômico: Uma transação deve ser concluída com todas as modificações de seus dados ou não.

Consistente: No final da transação, todos os dados devem ser mantidos consistentes.

Isolado : As modificações de dados feitas por uma transação devem ser independentes de outras transações.

Durável : No final da transação, os efeitos das modificações feitas pela transação devem ser permanentes no sistema.

Para neutralizar o ACID, serviços consistentes fornecem recursos BASE (Simplesmente disponível, estado mole, consistência eventual).

Conjunto de comandos em SQL

SELECIONE- A seguir está um exemplo de uma consulta SELECT que retorna uma lista de livros baratos. A consulta recupera todas as linhas do Biblioteca mesa na qual o preço A coluna contém um valor menor que 10,00. O resultado é classificado em ordem crescente por preço. O asterisco no escolha a lista indica que todas as colunas do Livro

SELECIONE *
 A PARTIR DE  Biblioteca
 ONDE preço < 10.00
 PEDIDO POR preço;

A tabela deve ser incluída no conjunto de resultados.

MELHORIA –

Esta consulta ajuda a atualizar tabelas em um banco de dados. Além disso, você pode combinar a consulta SELECT com o operador GROUP BY para adicionar estatísticas de uma variável numérica por uma variável categórica.

JUNTAS-

Por isso, SQL é amplamente usado não apenas para consultar dados, mas também para juntar os dados retornados por tais consultas ou tabelas. A fusão de dados em SQL é feita por meio de 'uniões'. O próximo infográfico é frequentemente usado para explicar junções SQL:

Como usar o join em SQL

CASO- Temos o operador de caso / quando / então / outro / do que um SQL. Funciona como mas

em outras linguagens de programação:

CASO QUANDO n > 0
 ENTÃO 'positivo'
 QUANDO n < 0
 ENTÃO 'negativo'
 OUTRO 'zero'
 FIM


Subconsultas aninhadas – As consultas podem ser aninhadas para que os resultados de uma consulta possam ser usados ​​em outra consulta por meio de um operador relacional ou de uma função agregada. Uma consulta aninhada também é conhecida comosubconsulta

.

Onde usamos SQL?

  1. SQL tem sido usado extensivamente para recuperar dados, mesclar dados, grupo de consulta e casos aninhados ao longo de décadas. Mesmo para ciência de dados, SQL foi amplamente adotado. A seguir, alguns exemplos do uso específico de análise SQL são mostrados:
  2. No caso da linguagem SAS que utiliza PROC SQL, podemos escrever consultas SQL para consultar, atualizar e manipular dados.
  3. Um R, O pacote sqldf pode ser usado para executar consultas SQL em quadros de dados.

E Python, A biblioteca pandasql permite que você consulte Pandas DataFrames usando a sintaxe SQL.

O SQL também influencia outras linguagens?

A desvantagem dos bancos de dados relacionais é que eles não podem lidar com dados não estruturados. Para lidar com a aparência, novos bancos de dados surgiram e recebem NoSQL como um nome alternativo para DBMS. Mas o SQL ainda não morreu. Veja também:

Um mapeamento de SQL para MongoDB

Aqui estão algumas linguagens em que o SQL tem uma influência significativa:

Colmeia – O Apache Hive fornece um mecanismo para projetar estrutura em dados no Hadoop e consultar esses dados usando uma linguagem semelhante a SQL chamada HiveQL (HQL). É uma infraestrutura de armazenamento de dados construída em Apache ™ Hadoop® para fornecer um resumo de dados, consultas ad hoc e análise de grandes conjuntos de dados. Even HQL, uma linguagem de consulta usada no Hadoop, usa fortemente influências SQL. Você pode descobrir maisaqui

.

SQL-Mapreduce

– O Teradata usa o banco de dados Aster usando SQL com MapReduce para grandes conjuntos de dados na era do Big Data. SQL-MapReduce® é uma estrutura criada pelo Teradata Aster para permitir que os desenvolvedores escrevam funções SQL-MapReduce poderosas e altamente expressivas em linguagens como Java, C #, Pitão, C ++ e R e trazê-los para a plataforma de descoberta para análises de alto desempenho. Depois de, analistas podem invocar funções SQL-MapReduce usando SQL ou R padrão por meio do banco de dados Aster.

Spark SQL – O projeto Spark do Apache é paraProcessamento em tempo real, dados na memória e Hadoop paralelos

. Spark SQL se baseia nele para permitir que consultas SQL sejam gravadas nos dados. No Impala de Cloudera, dados armazenados em HDFS ou HBase podem ser consultados, e a sintaxe SQL é a mesma do Apache Hive.

Veja também: Saiba mais sobre as maneiras de consultar o Hadoop usando SQLaqui

.

Notas finais

Nesta postagem, discutimos SQL, seus usos, o teorema CAP e a influência do SQL em outras linguagens. Um conhecimento básico de SQL é muito relevante no mundo de hoje, onde python, R, SAS são linguagens dominantes em ciência de dados. SQL ainda é relevante na era dos BIG DATA. A beleza da linguagem continua sendo sua estrutura simples e elegante. Thinkpot:

Você acha que o SQL se tornou uma arma inevitável para o gerenciamento de dados? Você recomendaria alguma outra linguagem de banco de dados?

Compartilhe suas opiniões / opinião / feedback conosco na seção de comentários abaixo. Gostaríamos muito de ouvir de você!! Se você gostou do que acabou de ler e deseja continuar seu aprendizado sobre análise,inscreva-se em nossos e-mails , Siga-nos no Twitter ou como o nossopágina do Facebook

Relacionado

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.