8 gráficos que você deve conhecer para se destacar na arte da visualização de dados!

Conteúdo

Introdução

Os humanos estão entre as espécies mais criativas deste planeta. Desde tempos imemoriais, a arte assumiu várias formas, de pinturas em cavernas paleolíticas a arte moderna. Por exemplo, as pinturas rupestres de Bhimbetka davam muitas informações sobre a vida das pessoas daquela época. A gênese da arte visual remonta à idade da pedra.

Agora, como parte da quarta geração da revolução, que testemunhou arte e criatividade em vários campos e formas, aqui vêm várias ferramentas e linguagens de programação em nosso resgate para resolver problemas de negócios complexos usando a arte da visualização.

As empresas de hoje usam várias técnicas de visualização para entender e obter insights de dados para tomar decisões de negócios baseadas em dados.. Hoje, existem muitas ferramentas de visualização disponíveis, como o Tableau, Power BI, Looker, Qlik sense e muitos mais. Nesse assunto, vamos cobrir vários tipos de gráficos usando Python.

A necessidade de visualização de dados

Os dados fazem mais sentido e são fáceis de entender quando apresentados em um formato simples e visualizado, pois é difícil para o olho humano decifrar o padrão, tendência e sazonalidade dos dados brutos. Portanto, os dados são visualizados para entender como diferentes parâmetros se comportam.

Vários tipos de gráficos e seus usos.

77887types-8926814

1. Gráficos de barras e colunas

É um dos gráficos mais simples de entender como nosso campo quantitativo está se saindo em várias categorias. Se utiliza para comparação.

62660bar20chart-3112001

No gráfico de colunas acima, podemos ver que as vendas de tecnologia são as mais altas e os suprimentos de escritório são os mais baixos.

87230128ac916-d348-4938-9d90-2b0456ffedfd-image2005-1-01-4988350

O gráfico mostrado acima é um gráfico de barras que mostra quais categorias L têm melhor desempenho.

2. Gráfico de dispersão e gráfico de bolhas

Os diagramas de dispersão e bolha nos ajudam a entender como espalhar em toda a gama considerada. Pode ser usado para identificar padrões, a presença de outliers e o relação entre as duas variáveis.

37256scatter20pot-2678654

Podemos ver que com o aumento dos descontos os lucros estão diminuindo.

12315screen-shot-2015-02-04-at-4-41-48-pm201-6749829

O gráfico mostrado acima é um gráfico de bolhas.

3. Gráfico de linha

Preferido quando os dados dependentes do tempo devem ser apresentados. É mais adequado para analisar o tendência.

74740download202-9889025

No gráfico acima, podemos ver que as vendas estão aumentando ao longo dos meses, mas há uma queda repentina no mês de julho e as vendas são mais altas em novembro.

4. Histograma

Um histograma é um gráfico de frequência que registra o número de ocorrências de uma entrada em um conjunto de dados. É útil quando você deseja compreender o distribuição de uma série.

93299download203-8822264

5. Box plot

Os gráficos de caixa são eficazes para resumir espalhar big data. Eles usam percentil para dividir o intervalo de dados. Isso nos ajuda a entender o ponto de dados que está abaixo ou acima de um ponto de dados escolhido. Isso nos ajuda a identificar outliers nos dados.

32022bx-1958681

O gráfico de caixa divide os dados completos em três categorias

* Valor mediano: divida os dados em duas metades iguais

* IQR: varia entre os valores percentuais 25 e 75.

* Valores atípicos: esses dados diferem significativamente e ficam fora dos bigodes.

71836download204-2769081

Os círculos no gráfico acima mostram a presença de outliers.

6. Subparcelas

Às vezes é melhor rastrear enredos diferentes na mesma grade para entender e comparar os dados melhor.

75883download206-1079091

Aqui você pode ver que no único gráfico fomos capazes de entender as vendas ao longo de um período de tempo em diferentes regiões.

7. Rosquinha, gráficos de pizza e gráficos de colunas empilhadas

Quando queremos encontrar o composição dos gráficos de dados mencionados acima é o melhor.

93779tableau_donut_chart-1579621

O gráfico de rosca acima mostra a composição das vendas de diferentes categorias de produtos.

82710072120_1431_7secretsoft7-1244548

O gráfico de pizza acima mostra a porcentagem de vendas em anos diferentes.

68789stackedbar2-5668916

O gráfico de colunas acima mostra a venda de dois produtos em trimestres distintos..

8. Mapas de calor

É o gráfico preferido quando queremos verificar se há algum. correlação entre variáveis.

37847download207-4874757

Aqui, o valor positivo mostra uma correlação positiva e o valor negativo mostra uma correlação negativa. A cor indica a intensidade da correlação, quanto mais escura a cor, quanto maior a correlação positiva e mais clara a cor, quanto maior a correlação negativa.

Compreenda a visualização com Python

Python oferece várias bibliotecas para entender os dados graficamente como Matplotlib e Seaborn etc. Vamos começar nossa jornada no mundo da visualização.

Anubhav é uma empresa baseada em produtos que vende diferentes tipos de produtos. Vamos explorar os dados para encontrar suas vendas durante um período, que categoria / subcategoria de produto gera as vendas mais altas, a proporção de lucro para um aumento no desconto.

1. Vamos importar as bibliotecas relevantes primeiro.

importar numpy como np
importar pandas como pd
import matplotlib.pyplot as plt
importado do mar como sns

avisos de importação

warnings.filterwarnings ('ignorar')


2. A próxima etapa seria carregar o conjunto de dados.

vendas = pd.read_excel('Maven Supplies Raw.xlsx',skiprows = 3)
sales.head(2)
48566data-7806500

3. Levando o conjunto de dados conosco, vamos explorar os dados

# Verifique o número de linhas e colunas no dataframe
sales.shape
(9994, 24)
# Verifique as informações das colunas do dataframe
sales.info()
16089info-4654611
# Verifique o resumo para as colunas numéricas
sales.describe()
90434desc-2566653
sales.columns
50314colunas-5837594

4. Agora que entendemos melhor os dados disponíveis, vamos visualizá-los para entendê-los melhor.

– Primeiro, explore a composição da categoria com% das vendas.

sales.groupby(['Categoria'])['Vendas'].soma().enredo(kind = 'torta',autopct ="%1.2f %%")
plt.title("% De vendas de categoria diferente")
plt.ylabel(" ")
plt.show();
13886download208-6824856

Podemos ver que a tecnologia está funcionando melhor em comparação com outras categorias.

– Existem muitas subcategorias nos dados, permite que você veja o desempenho das diferentes subcategorias.

plt.figure(figsize =(10,3))
sales.groupby(['Subcategoria'])['Vendas'].soma().sort_values(ascendente = falso).enredo(kind = 'bar',color ="verde Mar")
plt.show();
32177download209-2254155

Podemos ver que as vendas por telefone são as mais altas, seguido por cadeiras e assim por diante.

– As vendas em diferentes regiões serão diferentes. Vamos a ver

sales.groupby(['Região'])['Vendas'].soma().sort_values(ascendente = falso).enredo(kind = 'bar',color ="verde Mar")
plt.show();
88153download2014-8868949

As vendas na região oeste são altas e na região sul é a mais baixa.

– Agora vamos ver como as regiões se saem em termos de lucros.

sales.groupby(['Região'])['Lucro'].soma().sort_values(ascendente = falso).enredo(kind = 'bar',color ="verde Mar")
plt.show();
49877download2015-7939149

A região sul com pior desempenho em termos de vendas apresenta melhor desempenho em comparação com a região centro.

– Os mapas de calor nos dão uma melhor compreensão de como diferentes variáveis ​​estão correlacionadas entre si.

plt.figure(figsize = (10, 5))
sns.heatmap(sales.corr(),annot = True,cmap ="verão")
plt.show()
13747download2010-3799728

Claramente, os descontos estão negativamente correlacionados com os ganhos.

– Vamos descobrir como o lucro é afetado pelo aumento dos descontos.

sns.scatterplot(x = 'Desconto', y = 'Lucro', dados = vendas ,color ="verde Mar")
plt.show;
88975download2011-3807705

Podemos ver que com o aumento do desconto os ganhos também estão diminuindo.

– As vendas não são constantes, aumentar ou diminuir com base em vários fatores. Vamos ver como as vendas estão se saindo nos diferentes meses.

sales.groupby(['mês'])['Vendas'].soma().enredo(kind = 'linha',color ="verde Mar")
53397download2013-8369825

Como mencionado anteriormente, está apresentando um padrão com as vendas mais altas no mês de novembro e as vendas mais baixas no mês de fevereiro.

– Não é necessário que mesmo que as vendas sejam altas, ganhos mostrarão um padrão semelhante. Vamos ver como os ganhos mudam ao longo do tempo. Isso pode ser devido à venda de produtos com desconto, conforme visto no gráfico de dispersão.

sales.groupby(['mês'])['Lucro'].soma().enredo(kind = 'linha',color ="verde Mar")
44823lucro-5239337

podemos ver que os benefícios são altos durante o mês de setembro e menores durante o mês de julho.

– As vendas podem apresentar um padrão crescente ou decrescente ao longo do ano.

sales.groupby(['ano'])['Vendas'].soma().enredo(kind = 'linha',color ="verde Mar")
plt.xticks([2015,2016,2017,2018])
plt.show()
91907download2016-8680470

Podemos perceber que as vendas apresentam tendência de queda no ano 2016 à medida que cresce com o passar dos anos.

De um conjunto de dados, Conseguimos entender que os telefones geraram a maioria das vendas e que a região Oeste contribuiu com as maiores vendas e lucros. Durante um período de tempo, as vendas aumentaram, mas com o aumento do desconto, lucro apresentou tendência de queda. Vimos que houve meses específicos em que vendas e lucros maiores foram registrados.

Portanto, podemos dizer que a visualização fala muito, você sempre terá uma história para contar que ajuda as empresas a tomar decisões baseadas em dados.

conclusão

Neste artigo, falamos sobre vários tipos de gráficos e seus usos. Lidamos com um conjunto de dados para entender como usar bibliotecas Python para visualizar os dados e dar sentido a eles. Portanto, podemos dizer que através da visualização, é fácil decifrar um padrão ou tendência oculta nos dados. Com alguns exemplos, vimos que os gráficos ajudam na comparação e, o mais importante, eles são fáceis de entender.

Notas finais

Obrigado pela leitura!!!

Espero que você tenha gostado de ler o artigo e tenha aumentado seu conhecimento sobre vários tipos de gráficos e seu uso..

Se eu não mencionei nada ou se você quiser compartilhar suas idéias, sinta-se à vontade para comentar abaixo na seção de comentários.

Sobre o autor

Sruthi ER

Sou um entusiasta da ciência de dados com interesse em análise e visualização de dados, e atualmente estou buscando a certificação de pós-graduação em ciência de dados IIIT-Bangalore. Venho de uma carreira na Engenharia Civil com 4 anos de experiência na indústria de construção.

Não hesite em me contatar em Linkedin

A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.