Visualizações de dados em Python | R | Foto

Conteúdo

Visão geral

  • Uma olhada 11 Visualizações de dados inovadoras e alucinantes em Python, R, Tabela y D3.js
  • Essas visualizações de dados cobrem uma variedade de tópicos do mundo real.
  • Eu forneci o código-fonte aberto (sua planilha) para cada visualização.

Introdução

“A visualização dá respostas a perguntas que você não sabia que tinha”. – Ben Shneiderman

Estou envolvido no campo da ciência de dados há alguns anos, mas eu venho de um treinamento não técnico (aprendendo e desenvolvendo). Demorei um pouco realmente transição para ciência de dados. Dizer “verdadeiramente” porque as primeiras semanas foram um turbilhão de mudanças (como menciono em detalhes no curso de pensamento estruturado para ciência de dados).

Uma das maiores mudanças em meu pensamento girou em torno de como eu olhava para os dados. Inicialmente, quando meu gerente me pediu para analisar certos dados, usado para criar visualizações de dados comuns (diagramas de dispersão, gráficos de barras, etc.). Mal imaginei as possibilidades infinitas que me aguardavam!

Não consigo me relacionar com a citação de Ben Shneiderman acima. O verdadeiro domínio das técnicas de visualização de dados abre portas e oportunidades que você nunca sonhou antes. A visualização bem pensada remove as camadas que circundam um conjunto de dados bruto.

E isso geralmente pode ser a diferença entre um projeto de ciência de dados bem-sucedido e um mundano..

data_visualization_python_r_tableau-9507285

Então, neste artigo, meu objetivo é mostrar a você o incrível poder da visualização de dados. Eu juntei 11 visualizações alucinantes cobrindo uma variedade de tópicos. E para demonstrar que você pode fazer isso em qualquer ferramenta de sua escolha, vamos cobrir essas visualizações em Python, R, Tabela y D3.js.

O desafio para você? Escolha a tela (código fornecido para todos eles) e crie sua própria versão na ferramenta de sua escolha.

Visualização de dados em R

A criação de ggplot2 A biblioteca tornou o R a ferramenta ideal para visualização de dados (Pelo menos para programadores!). Comecei minha própria jornada de ciência de dados usando R e fui instantaneamente cativado pela beleza e poder de ggplot.

Monitores elegantes, informação instantânea, padrões de descoberta, tudo isso em apenas algumas linhas de código. Não é de se admirar que até programadores especialistas em Python importem ggplot2 para seus blocos de anotações Jupyter (sim, isso é possível agora).

Se você está usando R e não explorou ggplot2 ainda, certifique-se de fazer isso HOJE:

Crie visualizações no estilo BBC em R

r_data_visualization-2842167

Isso não é estritamente uma visualização, embora certamente não seja um problema, verdade? O painel acima é uma combinação de visualizações publicadas pela equipe de dados da BBC. Há anos que acompanho o site da BBC, então este foi um lançamento bem-vindo.

A equipe de dados da BBC desenvolveu e lançou um pacote R e um livro de receitas R para gerar visualizações como a acima.. O pacote R é chamado bbplot. Fornece funções para criar e exportar visualizações feitas em ggplot no estilo usado pela equipe de dados da BBC.

Estes são os principais recursos para seguir seu caminho:

Gráficos interativos em R

gganimato-2330393

Quem não gosta de histórias interativas? Eles são um dos aspectos mais atraentes de uma apresentação (se usado corretamente). Esta visualização nos mostra como a expectativa de vida mudou ao longo dos anos em diferentes continentes, comparando com o PIB per capita.

Tanta informação compactada em um espaço tão pequeno. O pacote é usado para criar a visualização acima? gganimato! Não é surpreendente ver que o poder de ggplot estende-se a outro tipo de tela impressionante.

Você pode verificar nosso guia para construir plotagens interativas em R:

Diagramas de Sankey em R

r_data_visualization1-6554023

¿Intrigado? Este é um exemplo clássico de um diagrama de Sankey. Basicamente, mostra o fluxo de informações, onde a largura das setas é proporcional à quantidade de fluxo. A visualização acima mostra a relevância da Publicidade de Lista Personalizada do Facebook.

Esta visualização foi criada usando o ggaluvial pacote em R. Combina o estilo e a flexibilidade do original aluvial embalar com o poder de tidyverse.

Você pode encontrar o código completo, consistindo em algumas linhas. aqui.

Visualização de dados no Tableau

"Em uma boa visualização das informações, sem regras, diretrizes, modelos, tecnologias padrão ou livros de estilo. Você só tem que fazer o que for preciso “. – Edward Tufte

Edward Tufte é um pioneiro no campo da visualização de dados. Desculpe por esta citação De verdade aplica-se às visualizações que geramos com o Tableau. A abundância de recursos e personalizações que o Tableau oferece é quase incomparável.

Se você estiver interessado em começar a usar o Tableau, Você veio ao lugar certo! A seguir, você encontrará uma série de artigos para ajudá-lo a ir de iniciante a especialista no Tableau:

A maior votação do mundo: Eleições indianas exibidas

data_visualization_tableau-4365383

Esta é uma visualização realmente impressionante. Eu só participei de todo o conselho. O escopo desta visualização e a quantidade de dados cobertos são surpreendentes e realmente úteis para qualquer pessoa interessada neste tipo de análise..

Cada ponto de dados representa detalhes sobre cada assento, incluindo o nome do vencedor, O estado, o partido e o eleitorado). Veja como essa visualização é legal, apesar de embalar muitas informações. Isso é algo que todos podemos aspirar em nosso relatório diário / semanalmente / por mês, verdade?

Aqui está o painel completo do Tableau o que você pode baixar.

Monitore o desempenho de vendas com o Tableau

tableau_data_visualization-5523760

Eu queria incluir um painel de negócios do mundo real. Se você está lutando para visualizar onde pode usar essas visualizações no mundo real (use sua imaginação!), Isso será muito útil para você.

Esta é uma análise dos dados de vendas para medir a distância da cota original. Gostei especialmente da primeira guia horizontal que resumiu claramente os números-chave que um cliente ou parte interessada precisa saber..

a pasta de trabalho completa do Tableau contém cinco painéis abrangentes que analisam esses números de vendas de diferentes perspectivas. Eu realmente acho que você deve usar isso como uma referência se você trabalha na área de vendas ou marketing.

Popularidade do gênero cinematográfico – 1910-2018

data_visualization_python_film_genre-4253414

Eu sou um grande cinéfilo, então, essa visualização chamou minha atenção instantaneamente para a galeria pública do Tableau. Observe que esta é a popularidade dos gêneros cinematográficos. ao longo do tempo. Cada gênero tem uma gama de eixos diferente, portanto, olhe para eles daquela lente (em vez de uma comparação individual).

O que me chamou a atenção é que você pode pensar nisso como um painel com vários pontos de dados apresentados. Você consegue pensar em um caso de uso semelhante em sua vida profissional em que tal painel seria útil?

Você pode baixe a planilha completa e brincar com ele no Tableau.

Visualização de dados em D3.js

Se você deseja criar visualizações animadas incríveis, D3.js deve ser sua ferramenta de referência. É uma biblioteca poderosa que permite criar visualizações personalizadas para qualquer tipo de narrativa que você possa imaginar para a web..

Esta seção é talvez a minha favorita das quatro que abordamos neste artigo.. Você deve considerar seriamente a adição de D3.js ao seu conjunto de habilidades, especialmente se você deseja trabalhar com visualização de dados regularmente.

Aqui estão dois artigos populares sobre como começar a usar D3.js:

Mapa conceitual – Relação entre conceitos

concept_map-3292842

Eu uso um mapa conceitual com bastante frequência. Posso facilmente representar as relações entre diferentes conceitos ou pontos de conhecimento. Como diz a Wikipedia, “Um mapa conceitual geralmente representa ideias e informações como caixas ou círculos., conectando-se com setas rotuladas em uma estrutura hierárquica que se ramifica para baixo”.

Você vai achar que é útil para mapear decisões de negócios, diagramas de fluxo de processo, design de informação, visualização de conhecimento, entre outras coisas. É uma ferramenta subestimada, mas útil para ter em seu arsenal.

Este mapa conceitual é muito interativo e você também pode brincar com os diferentes nós.

Visualizando Sequências Sunburst em D3.js

sequence_sunburst_visualization_d3js-7071722

¡Ah, genial! Esta visualização mostra como usar o conceito de raios solares com dados que descrevem a sequência de eventos.

Pense nisso: você pode visualizar a jornada do cliente com este. Em vez de um funil estático, você pode ver todas as rotas possíveis usando esta visualização. Sua equipe de marketing vai adorar que você o implemente. 🙂

O código D3.js completo para gerar esta sequência sunburst é aqui.

Visualização da interação entre os personagens de Game of Thrones

screen-shot-2017-08-26-at-16-32-581-9762094

Você é fã de Game of Thrones?? Então você vai adorar esta visualização. Representa a influência de cada personagem com base no número de vezes que sua interação apareceu no livro “Uma tempestade de espadas”.

Observe que os nós representam os personagens e os links a interação entre eles. O tamanho do nó e o nome representam a influência do personagem. Não é de admirar que Tyrion tenha mais influência, verdade?

Você pode criar sua própria visualização de Game of Thrones usando este tutorial.

Visualização de dados em Python

Muitas vezes pensamos em Python como a linguagem de programação definitiva para ciência de dados. Nós o associamos à limpeza de dados, construir modelos preditivos e até mesmo certas tarefas de engenharia de dados. Mas você sabia que Python é bastante útil para gerar visualizações de dados?

Assim é, Python vem com duas bibliotecas exclusivas para visualização: matplotlib y seaborn. Você pode consultar este artigo para saber mais sobre essas bibliotecas e vê-las em ação.

Um mapa geológico de Marte

data_visualization_python_mars-2052802

Esta visualização é uma beleza. Eu me deparei com este mapa geológico de Marte há alguns dias e ainda me surpreende que ele tenha sido criado em Python (com uma ajudinha do Adobe Illustrator). Surpreendente!

As bibliotecas Python usadas para criar esta visualização maravilhosa são:

  • Matplotlib
  • NumPy
  • Pandas
  • Cartopia

Se a fonte for muito pequena para ler ou se você quiser imprimi-la como um pôster, obter a imagem de alta resolução completa. aqui. E você pode obter o código Python para esta visualização. aqui. O repositório GitHub tem o tutorial completo para começar.

Traçando satélites geoestacionários em Python

Estou fascinado pela pesquisa que nossa comunidade de ciência de dados está fazendo sobre dados de satélite. Vimos a descoberta de novos planetas, a recriação de imagens ao nível do solo, Previsão de terremoto da NASA, entre outras coisas.

a Pacote PyEphem foi usado para criar este enredo incrível em Python. PyEphem basicamente nos permite implementar algoritmos astronômicos em Python.

Um bom número de entusiastas da ciência de dados tentou plotar essa visualização e você pode encontrar todos os recursos. aqui.

Notas finais

Eu me diverti muito montando esta lista. Eu trabalho principalmente com R e Tableau, então foi revelador ver o tipo de visualizações que podemos gerar usando D3.js. Com certeza vou tentar a sorte lá.

Existe uma visualização que você encontrou que o deixou boquiaberto? Vá em frente e compartilhe-os conosco na seção de comentários abaixo. Este é o melhor lugar para ser criativo e aprender com a comunidade!!

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.