Crie visualizações de dados interativas com Plotly

Conteúdo

Introdução

No mundo real, a cada segundo os dados ficam maiores. Para entender rapidamente os dados e obter informações, a visualização de dados torna-se necessária.

Por exemplo, Considere um caso em que você é solicitado a ilustrar aspectos cruciais de vendas (como desempenho de vendas, objetivo, renda, custo de aquisição, etc.) de grandes quantidades de dados de vendas, qual você prefere:

  1. Explore os dados usando o Excel (ou planilhas) e acompanhar todos os aspectos das vendas manualmente.
  2. Explore os dados usando diferentes tipos de gráficos e tabelas de vendas.

Obviamente, Eu preferiria gráficos e tabelas. Portanto, a visualização de dados desempenha um papel fundamental na exploração e análise de dados.

Visualização de dados é a técnica para representar os dados / informações em formato pictórico ou gráfico. Permite que as partes interessadas e tomadores de decisão analisem e explorem visualmente os dados e descubram insights profundos.

“A visualização dá respostas a perguntas que você não sabia que tinha”. – Ben Schneiderman

Benefícios da visualização de dados

  • Ajuda na análise de dados, exploração de dados e torna os dados mais compreensíveis.
  • Resuma informações quantitativas complexas em um espaço confinado.
  • Ajude a descobrir as últimas tendências, padrões ocultos nos dados.
  • Identificar relacionamentos / correlações entre variáveis.
  • Ajuda a examinar as áreas que precisam de atenção ou melhoria.

Por que Plotly?

Existem várias bibliotecas disponíveis em Python, como Matplotlib, Seaborn, etc. para visualização de dados. Mas eles representam apenas as imagens estáticas dos gráficos / gráficos e, devido a isto, muitas coisas cruciais se perdem na visualização. Não seria incrível se pudéssemos interagir melhor com os gráficos passando o mouse sobre (o) chegando perto? Completamente nos permite fazer o mesmo.

  • Plotly é uma biblioteca de visualização de dados de código aberto para a criação de gráficos / gráficos interativos com qualidade de publicação.
  • Plotly oferece a implementação de muitos tipos de gráficos / objetos diferentes como diagrama de linha, Diagrama de dispersão, diagrama de área, histograma, enredo de caixa, gráfico de barras, etc.
  • Plotly suporta plotagem interativa em linguagens de programação comumente usadas, como Python, R, MATLAB, Javascript, etc.

Neste post, vamos cobrir os tipos de gráfico mais comumente usados ​​usando Completamente. Então, vamos começar a usar Cars93 conjunto de dados disponível em Kaggle.

O conjunto de dados contém 27 parâmetros do carro (como fabricante, marca, preço, cavalos de força, tamanho do motor, peso, cilindros, bolsas de ar, passageiros, etc.) a partir de 93 carros diferentes.

O conjunto de dados se parece com este:

48818df_head-3681508

Nota adicional: Para acessar todo o código Python, siga o kernel kaggle aqui(https://www.kaggle.com/vikashrajluhaniwal/interactive-visualizations-using-plotly).

Plotly installation

Para instalar Completamente, use o seguinte comando no terminal.

pip instalar plotmente

Plotly vem com alguns módulos para criar visualizações, quer dizer, nos dá a opção de usá-lo.

  • Rápido: Uma interface de alto nível para a criação de visualizações rápidas. É um embrulho em torno de Plotly Graph_objects módulo.
  • Graph_objects: Uma interface de baixo nível para figuras, traços e desenhos. É altamente personalizável em geral para diferentes gráficos / Pranchas.
  • figure_factory: Fábricas de formas são funções dedicadas para a criação de tipos muito específicos de gráficos. Estava disponível antes da existência de Plotly Rápido, portanto, obsoleto como “herdado”.

Tendo conhecido e instalado Completamente, agora vamos desenhar gráficos diferentes / tabelas usando isso.

1. Box plot

  • Um box plot (ou trama de caixa e bigode) é uma forma padronizada de exibir a distribuição de dados quantitativos com base em um resumo de cinco pontos (mínimo, primeiro quartil (T1), mediana (Q2), terceiro quartil (3º T), e máximo).
  • A caixa se estende dos valores do quartil Q1 a Q3, enquanto os bigodes se estendem das bordas da caixa ao IQR de 1,5 *. IQR = (3º T – T1)

Agora vamos criar um box plot para carros ‘ Preço característica.
box-plot-of-price-2477278
A melhor coisa sobre esta visualização é que podemos começar a interagir com ela movendo para ver os valores dos quantis.

Do mesmo modo, podemos personalizá-lo de acordo com os requisitos. Por exemplo, desenhe um gráfico de caixa de Preço para cada Airbags escreve.

box-plot-of-price-across-airbags-types-1590059

2. Histograma

  • Um histograma é uma representação precisa da distribuição de dados numéricos.
  • Para construir um histograma, Siga esses passos:
    • Compartimento (o depósito) a gama de valores: divida toda a gama de valores em uma série de intervalos.
    • Contar quantos valores caem em cada intervalo.

Vamos desenhar um histograma para carros ‘ Potência característica.

histograma de potência-6600776

Aqui, o eixo x é sobre intervalos de bin de Potência enquanto o eixo Y fala sobre frequência / conte em cada recipiente.

3. Gráfico de densidade

  • O gráfico de densidade é uma variação de um histograma, onde em vez de representar a frequência no eixo Y, representa os valores PDF (Função densidade de probabilidade).
  • É útil determinar visualmente a assimetria da variável.
  • O que mais, útil para avaliar a importância de uma variável contínua para um problema de classificação.

O gráfico de densidade de Potência baseado em Airbags tipo é como mostrado abaixo.

densidade-plot-4179624

4. Gráfico de barras

  • Um gráfico de barras representa dados categóricos com barras retangulares com pesos proporcionais aos valores que representam.
  • Um gráfico de barras mostra comparações entre categorias discretas.

O gráfico de barras do Escreve recurso é como mostrar abaixo.

barplot-of-type-3868219

Do mesmo modo, podemos personalizá-lo para mostrar MPG.city significa no eixo Y, em vez de mostrar a contagem.barplot-of-type-2-mpg-city-mean-9948082

5. Gráfico de pizza

  • O gráfico de pizza é usado para representar a proporção numérica dos dados em um gráfico de pizza.
  • Toda a área do gráfico representa o 100% dos dados, o comprimento do arco de cada corte representa a porcentagem relativa do todo.

O gráfico de pizza de Escreve função é como mostrado abaixo.

gráfico de pizza-1816478

6. Gráfico de dispersão

  • Um gráfico de dispersão usa pontos para representar valores para duas variáveis ​​numéricas diferentes.
  • É muito útil observar a relação entre duas variáveis ​​numéricas.

Vamos desenhar um gráfico de dispersão para avaliar a relação entre Potência e MPG.city.

scatter-plot-of-horsepower-vs-mpg-city_-9991322

A partir deste gráfico, podemos observar isso como Potência aumenta, MPG na cidade diminui.

Plotly também oferece uma maneira de desenhar gráficos de dispersão 3D. Vamos desenhar o mesmo usando Potência, MPG.city, e Preço caracteristicas.

3d-scatter-plot-2807458

de forma similar, podemos desenhar uma matriz de gráficos de dispersão (uma grade / matriz de gráfico de dispersão) para avaliar relações de pares para cada combinação de variáveis.

scatter-plot-matrix-2311020

7. Gráfico de linha

  • Um gráfico de linha é um tipo de gráfico que exibe informações como uma série de pontos de dados chamados 'marcadores.’ conectado por segmentos de linha reta.
  • É semelhante a um gráfico de dispersão, exceto que os pontos de medição são ordenados (geralmente por seu valor do eixo x) e unidos com segmentos de linha reta.
  • Os gráficos de linha geralmente são usados ​​para encontrar relacionamentos entre duas variáveis ​​numéricas ou para visualizar uma tendência em dados de série temporal..

Vamos desenhar um gráfico de dispersão para avaliar a relação entre Potência e MPG.city.

line-chart-of-horsepower-vs-mpg-city_-3581886

8. Mapa de calor

  • Um mapa de calor é uma representação gráfica bidimensional de dados, enquanto os valores da matriz são representados em diferentes tons de cores.
  • Um mapa de calor destina-se a fornecer um resumo visual codificado por cores dos dados / em formação.
  • Seaborn também permite mapas de calor anotados.

Vamos desenhar um mapa de calor para representar a matriz de correlação de cars93 dados.

mapa de calor de correlação-7631883

9. Moldura de violino

  • Os enredos de violino são semelhantes aos enredos de caixa, exceto que eles também mostram a densidade de probabilidade dos dados em valores diferentes. Em outras palavras, o diagrama de violino é uma combinação de gráfico de caixa e gráfico de densidade.
  • Seções mais amplas do enredo do violino indicam uma probabilidade maior, enquanto as seções estreitas indicam uma probabilidade menor.

A trama do violino do Preço A função é mostrada abaixo.

violin-plot-of-price-8180280

Do mesmo modo, podemos personalizá-lo usando Completamente para exibir a tabela e todos os pontos de dados.

violin-plot-of-price-with-box-and-all-points-7638628

10. Palavra nuvem

  • Nuvem de palavras é uma técnica de visualização para representar a frequência das palavras em um determinado segmento de texto.
  • O tamanho de uma palavra indica a frequência com que ela aparece no texto. Quanto maior o tamanho, quanto maior a importância (frequência), enquanto quanto menor o tamanho, menos será a importância (frequência).
  • As nuvens de palavras costumam ser usadas para representar a frequência das palavras em documentos de texto., relatórios, dados do site, discursos públicos, etc.

Nuvem de palavras de um escolhido Documento de texto é como mostrado abaixo.

53286wordcloud-6360280

Notas finais

Neste artigo, discutimos diferentes tipos de gráficos / gráficos usando Completamente e Python. Completamente altamente recomendado para a criação de visualizações interativas.

A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.