Introdução
No mundo real, a cada segundo os dados ficam maiores. Para entender rapidamente os dados e obter informações, a visualização de dados torna-se necessária.
Por exemplo, Considere um caso em que você é solicitado a ilustrar aspectos cruciais de vendas (como desempenho de vendas, objetivo, renda, custo de aquisição, etc.) de grandes quantidades de dados de vendas, qual você prefere:
- Explore os dados usando o Excel (ou planilhas) e acompanhar todos os aspectos das vendas manualmente.
- Explore os dados usando diferentes tipos de gráficos e tabelas de vendas.
Obviamente, Eu preferiria gráficos e tabelas. Portanto, a visualização de dados desempenha um papel fundamental na exploração e análise de dados.
Visualização de dados é a técnica para representar os dados / informações em formato pictórico ou gráfico. Permite que as partes interessadas e tomadores de decisão analisem e explorem visualmente os dados e descubram insights profundos.
“A visualização dá respostas a perguntas que você não sabia que tinha”. – Ben Schneiderman
Benefícios da visualização de dados
- Ajuda na análise de dados, exploração de dados e torna os dados mais compreensíveis.
- Resuma informações quantitativas complexas em um espaço confinado.
- Ajude a descobrir as últimas tendências, padrões ocultos nos dados.
- Identificar relacionamentos / correlações entre variáveis.
- Ajuda a examinar as áreas que precisam de atenção ou melhoria.
Por que Plotly?
Existem várias bibliotecas disponíveis em Python, como Matplotlib, Seaborn, etc. para visualização de dados. Mas eles representam apenas as imagens estáticas dos gráficos / gráficos e, devido a isto, muitas coisas cruciais se perdem na visualização. Não seria incrível se pudéssemos interagir melhor com os gráficos passando o mouse sobre (o) chegando perto? Completamente nos permite fazer o mesmo.
- Plotly é uma biblioteca de visualização de dados de código aberto para a criação de gráficos / gráficos interativos com qualidade de publicação.
- Plotly oferece a implementação de muitos tipos de gráficos / objetos diferentes como diagrama de linha, Diagrama de dispersãoO gráfico de dispersão é uma ferramenta gráfica usada em estatística para visualizar a relação entre duas variáveis. Consiste em um conjunto de pontos em um plano cartesiano, onde cada ponto representa um par de valores correspondentes às variáveis analisadas. Este tipo de gráfico permite identificar padrões, Tendências e possíveis correlações, facilitando a interpretação dos dados e a tomada de decisão com base nas informações visuais apresentadas...., diagrama de área, histograma, enredo de caixa, gráfico de barras, etc.
- Plotly suporta plotagem interativa em linguagens de programação comumente usadas, como Python, R, MATLAB, Javascript, etc.
Neste post, vamos cobrir os tipos de gráfico mais comumente usados usando Completamente. Então, vamos começar a usar Cars93 conjunto de dados disponível em Kaggle.
O conjunto de dados contém 27 parametroso "parametros" são variáveis ou critérios usados para definir, medir ou avaliar um fenômeno ou sistema. Em vários domínios, como a estatística, Ciência da Computação e Pesquisa Científica, Os parâmetros são essenciais para estabelecer normas e padrões que orientam a análise e interpretação dos dados. Sua seleção e manuseio adequados são cruciais para obter resultados precisos e relevantes em qualquer estudo ou projeto.... de automóvil (como fabricante, marca, preço, cavalos de força, tamanho do motor, peso, cilindros, bolsas de ar, passageiros, etc.) a partir de 93 carros diferentes.
O conjunto de dados se parece com este:
Nota adicional: Para acessar todo o código Python, siga o kernel kaggle aqui(https://www.kaggle.com/vikashrajluhaniwal/interactive-visualizations-using-plotly).
Plotly installation
Para instalar Completamente, use o seguinte comando no terminal.
pip instalar plotmente
Plotly vem com alguns módulos para criar visualizações, quer dizer, nos dá a opção de usá-lo.
- Rápido: Uma interface de alto nível para a criação de visualizações rápidas. É um embrulho em torno de Plotly Graph_objects módulo.
- Graph_objects: Uma interface de baixo nível para figuras, traços e desenhos. É altamente personalizável em geral para diferentes gráficos / Pranchas.
- figure_factory: Fábricas de formas são funções dedicadas para a criação de tipos muito específicos de gráficos. Estava disponível antes da existência de Plotly Rápido, portanto, obsoleto como “herdado”.
Tendo conhecido e instalado Completamente, agora vamos desenhar gráficos diferentes / tabelas usando isso.
1. Box plot
- Um box plot (ou trama de caixa e bigode) é uma forma padronizada de exibir a distribuição de dados quantitativos com base em um resumo de cinco pontos (mínimo, primeiro quartil (T1), mediana (Q2), terceiro quartil (3º T), e máximo).
- A caixa se estende dos valores do quartil Q1 a Q3, enquanto os bigodes se estendem das bordas da caixa ao IQR de 1,5 *. IQR = (3º T – T1)
Agora vamos criar um box plot para carros ‘ Preço característica.
A melhor coisa sobre esta visualização é que podemos começar a interagir com ela movendo para ver os valores dos quantis.
Do mesmo modo, podemos personalizá-lo de acordo com os requisitos. Por exemplo, desenhe um gráfico de caixa de Preço para cada Airbags escreve.
2. Histograma
- Um histograma é uma representação precisa da distribuição de dados numéricos.
- Para construir um histograma, Siga esses passos:
- Compartimento (o depósito) a gama de valores: divida toda a gama de valores em uma série de intervalos.
- Contar quantos valores caem em cada intervalo.
Vamos desenhar um histograma para carros ‘ Potência característica.
Aqui, o eixo x é sobre intervalos de bin de Potência enquanto o eixo Y fala sobre frequência / conte em cada recipiente.
3. Gráfico de densidade
- O gráfico de densidade é uma variação de um histograma, onde em vez de representar a frequência no eixo Y, representa os valores PDF (Função densidade de probabilidade).
- Es útil para determinar visualmente la asimetría de la variávelEm estatística e matemática, uma "variável" é um símbolo que representa um valor que pode mudar ou variar. Existem diferentes tipos de variáveis, e qualitativo, que descrevem características não numéricas, e quantitativo, representando quantidades numéricas. Variáveis são fundamentais em experimentos e estudos, uma vez que permitem a análise de relações e padrões entre diferentes elementos, facilitando a compreensão de fenômenos complexos.....
- O que mais, útil para avaliar a importância de uma variável contínua para um problema de classificação.
O gráfico de densidade de Potência baseado em Airbags tipo é como mostrado abaixo.
4. Gráfico de barrasO gráfico de barras é uma representação visual de dados que usa barras retangulares para mostrar comparações entre diferentes categorias. Cada barra representa um valor e seu comprimento é proporcional a ele. Esse tipo de gráfico é útil para visualizar e analisar tendências, facilitar a interpretação de informações quantitativas. É amplamente utilizado em várias disciplinas, como estatísticas, Marketing e pesquisa, devido à sua simplicidade e eficácia....
- Um gráfico de barras representa dados categóricos com barras retangulares com pesos proporcionais aos valores que representam.
- Um gráfico de barras mostra comparações entre categorias discretas.
O gráfico de barras do Escreve recurso é como mostrar abaixo.
Do mesmo modo, podemos personalizá-lo para mostrar MPG.city significa no eixo Y, em vez de mostrar a contagem.
5. Gráfico de pizzaO gráfico de pizza, Também conhecido como gráfico de pizza, é uma representação visual que mostra a proporção de diferentes partes para um todo. É comumente usado em estatística para ilustrar a distribuição de dados categóricos. Cada seção do gráfico representa uma porcentagem do total, facilitando a comparação entre categorias. Seu design claro e conciso o torna uma ferramenta eficaz para a apresentação de informações quantitativas....
- O gráfico de pizza é usado para representar a proporção numérica dos dados em um gráfico de pizza.
- Toda a área do gráfico representa o 100% dos dados, o comprimento do arco de cada corte representa a porcentagem relativa do todo.
O gráfico de pizza de Escreve função é como mostrado abaixo.

6. Gráfico de dispersãoUm gráfico de dispersão é uma representação visual que mostra a relação entre duas variáveis numéricas usando pontos em um plano cartesiano. Cada eixo representa uma variável, e a localização de cada ponto indica seu valor em relação a ambos. Esse tipo de gráfico é útil para identificar padrões, Correlações e tendências nos dados, facilitando a análise e interpretação de relações quantitativas....
- Um gráfico de dispersão usa pontos para representar valores para duas variáveis numéricas diferentes.
- É muito útil observar a relação entre duas variáveis numéricas.
Vamos desenhar um gráfico de dispersão para avaliar a relação entre Potência e MPG.city.
A partir deste gráfico, podemos observar que a mediro "medir" É um conceito fundamental em várias disciplinas, que se refere ao processo de quantificação de características ou magnitudes de objetos, Fenômenos ou situações. Na matemática, Usado para determinar comprimentos, Áreas e volumes, enquanto nas ciências sociais pode se referir à avaliação de variáveis qualitativas e quantitativas. A precisão da medição é crucial para obter resultados confiáveis e válidos em qualquer pesquisa ou aplicação prática.... naquela Potência aumenta, MPG na cidade diminui.
Plotly também oferece uma maneira de desenhar gráficos de dispersão 3D. Vamos desenhar o mesmo usando Potência, MPG.city, e Preço caracteristicas.
de forma similar, podemos desenhar uma matriz de gráficos de dispersão (uma grade / matriz de gráfico de dispersão) para avaliar relações de pares para cada combinação de variáveis.
7. Gráfico de linhaO gráfico de linhas é uma ferramenta visual usada para representar dados ao longo do tempo. Consiste em uma série de pontos conectados por linhas, que permite observar tendências, Flutuações e padrões nos dados. Esse tipo de gráfico é especialmente útil em áreas como economia, Meteorologia e pesquisa científica, facilitando a comparação de diferentes conjuntos de dados e a identificação de comportamentos em geral..
- Um gráfico de linha é um tipo de gráfico que exibe informações como uma série de pontos de dados chamados 'marcadores.’ conectado por segmentos de linha reta.
- É semelhante a um gráfico de dispersão, exceto que os pontos de medição são ordenados (geralmente por seu valor do eixo x) e unidos com segmentos de linha reta.
- Os gráficos de linha geralmente são usados para encontrar relacionamentos entre duas variáveis numéricas ou para visualizar uma tendência em dados de série temporal..
Vamos desenhar um gráfico de dispersão para avaliar a relação entre Potência e MPG.city.
8. Mapa de caloruma "mapa de calor" é uma representação gráfica que usa cores para mostrar a densidade de dados em uma área específica. Comumente usado em análise de dados, Estudos de marketing e comportamentais, Esse tipo de visualização permite identificar padrões e tendências rapidamente. Através de variações cromáticas, Os mapas de calor facilitam a interpretação de grandes volumes de informações, ajudando a tomar decisões informadas....
- Um mapa de calor é uma representação gráfica bidimensional de dados, enquanto os valores da matriz são representados em diferentes tons de cores.
- Um mapa de calor destina-se a fornecer um resumo visual codificado por cores dos dados / em formação.
- Seaborn também permite mapas de calor anotados.
Vamos desenhar um mapa de calor para representar a matriz de correlação de cars93 dados.
9. Moldura de violino
- Los diagramas de violín son similares a los plotagens de caixaDiagramas de caixa, Também conhecido como diagramas de caixa e bigode, são ferramentas estatísticas que representam a distribuição de um conjunto de dados. Esses diagramas mostram a mediana, Quartis e outliers, permitindo que a variabilidade e a simetria dos dados sejam visualizadas. Eles são úteis na comparação entre diferentes grupos e na análise exploratória, facilitando a identificação de tendências e padrões nos dados...., exceto que eles também mostram a densidade de probabilidade dos dados em valores diferentes. Em outras palavras, a diagrama de violinoO diagrama de violino é uma representação gráfica que combina características de um boxplot e um gráfico de densidade. Usado para visualizar a distribuição de um conjunto de dados, mostrando a mediana e a variabilidade através de sua forma, que se assemelha a um violino. Este tipo de gráfico é muito útil na análise estatística, ya que permite comparar múltiples distribuciones de forma clara y efectiva.... es una combinación de diagrama de caja y diagrama de densidad.
- Seções mais amplas do enredo do violino indicam uma probabilidade maior, enquanto as seções estreitas indicam uma probabilidade menor.
A trama do violino do Preço A função é mostrada abaixo.
Do mesmo modo, podemos personalizá-lo usando Completamente para exibir a tabela e todos os pontos de dados.
10. Palavra nuvem
- Nuvem de palavras é uma técnica de visualização para representar a frequência das palavras em um determinado segmento de texto.
- O tamanho de uma palavra indica a frequência com que ela aparece no texto. Quanto maior o tamanho, quanto maior a importância (frequência), enquanto quanto menor o tamanho, menos será a importância (frequência).
- As nuvens de palavras costumam ser usadas para representar a frequência das palavras em documentos de texto., relatórios, dados do site, discursos públicos, etc.
Nuvem de palavras de um escolhido Documento de texto é como mostrado abaixo.
Notas finais
Neste artigo, discutimos diferentes tipos de gráficos / gráficos usando Completamente e Python. Completamente altamente recomendado para a criação de visualizações interativas.
A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.