Visualisations de données en Python | R | Peinture

Contenu

Vue d'ensemble

  • Un coup d'oeil 11 Visualisations de données innovantes et époustouflantes en Python, R, Tableau y D3.js
  • Ces visualisations de données couvrent une variété de sujets du monde réel.
  • J'ai fourni le code open source (ta feuille de travail) pour chaque visualisation.

introduction

“La visualisation vous donne des réponses à des questions que vous ne saviez pas que vous aviez”. – Ben Shneiderman

Je suis impliqué dans le domaine de la science des données depuis quelques années, mais je viens d'une formation non technique (Apprentissage et développement). ça m'a pris du temps vraiment transition vers la science des données. Dire “vraiment” car les premières semaines ont été un tourbillon de changements (comme je le mentionne en détail dans le cours de réflexion structurée pour la science des données).

L'un des plus grands changements dans ma façon de penser a tourné autour de la façon dont j'ai regardé les données. Initialement, quand mon manager m'a demandé d'analyser certaines données, utilisé pour créer des visualisations de données ordinaires (diagrammes de dispersion, graphiques à barres, etc.). J'imaginais peu les possibilités infinies qui m'attendaient!

Je ne peux pas me rapporter à la citation de Ben Shneiderman ci-dessus. La maîtrise réelle des techniques de visualisation des données ouvre des portes et des opportunités dont vous n'aviez pas rêvé auparavant. Une visualisation bien pensée enlève les couches qui entourent un jeu de données brutes.

Et cela peut souvent faire la différence entre un projet de science des données réussi et un projet banal..

data_visualization_python_r_tableau-9507285

Ensuite, dans cet article, mon objectif est de vous montrer l'incroyable puissance de la visualisation des données. j'ai rassemblé 11 des visualisations époustouflantes couvrant une variété de sujets. Et pour montrer que vous pouvez le faire dans n'importe quel outil de votre choix, nous couvrirons ces visualisations en Python, R, Tableau y D3.js.

Le défi pour vous? Choisissez l'affichage (code fourni pour chacun d'eux) et créez votre propre version dans l'outil de votre choix.

Visualisation des données dans R

La création de ggplot2 La bibliothèque a fait de R l'outil incontournable pour la visualisation des données (Au moins pour les programmeurs!). J'ai commencé mon propre parcours en science des données en utilisant R et j'ai été instantanément captivé par la beauté et la puissance de ggplot.

Des écrans élégants, informations instantanées, modèles de découverte, tout ça en quelques lignes de code. Pas étonnant que même les programmeurs Python experts importent ggplot2 dans leurs cahiers Jupyter (Oui, c'est possible maintenant).

Si vous utilisez R et n'avez pas exploré ggplot2 encore, assurez-vous de le faire AUJOURD'HUI:

Créez des visualisations de style BBC dans R

r_data_visualization-2842167

Ce n'est pas strictement une visualisation, même si ce n'est certainement pas un problème, vérité? Le panneau ci-dessus est une combinaison de visualisations publiées par l'équipe de données de la BBC. Je suis le site de la BBC depuis des années, c'était donc une sortie bienvenue.

L'équipe de données de la BBC a développé et publié un package R et un livre de recettes R pour générer des visualisations comme celle ci-dessus.. Le package R s'appelle bbplot. Fournit des fonctions pour créer et exporter des visualisations réalisées dans ggplot dans le style utilisé par l'équipe de données de la BBC.

Ce sont les ressources clés pour suivre votre chemin:

Graphiques interactifs en R

gganimate-2330393

Qui n'aime pas les scénarios interactifs? Ils sont l'un des aspects les plus attrayants d'une présentation (si utilisé correctement). Cette visualisation nous montre comment l'espérance de vie a changé au fil des ans sur différents continents, en le comparant au PIB par habitant.

Tant d'informations emballées dans un si petit espace. Le package est-il utilisé pour créer la visualisation ci-dessus? ganimer! Il n'est pas surprenant de voir que le pouvoir de ggplot s'étend à un autre type d'affichage impressionnant.

Vous pouvez consulter notre guide pour construire des parcelles interactives dans R:

Diagrammes de Sankey en R

r_data_visualization1-6554023

Intrigué? Ceci est un exemple classique d'un diagramme de Sankey. Essentiellement, montre le flux d'informations, où la largeur des flèches est proportionnelle à la quantité de flux. La visualisation ci-dessus montre la pertinence de Facebook Custom List Advertising.

Cette visualisation a été créée à l'aide du galuvial paquet en R. Combine le style et la flexibilité de l'original alluvial emballer avec la puissance de bien rangé.

Vous pouvez trouver le code complet, composé de quelques lignes. ici.

Visualisation des données dans Tableau

« Dans une bonne visualisation de l'information, pas de règles, des lignes directrices, modèles, technologies standard ou livres de style. Tu n'as qu'à faire ce qu'il faut “. – Edouard Tufté

Edward Tufte est un pionnier dans le domaine de la visualisation de données. Désolé pour cette citation Vraiment s'applique aux visualisations que nous générons avec Tableau. La pléthore de fonctionnalités et de personnalisations offertes par Tableau est presque inégalée.

Si vous souhaitez démarrer avec Tableau, Vous êtes au bon endroit! Ensuite, vous trouverez une série d'articles pour vous aider à passer de débutant à expert Tableau:

Le plus grand vote au monde: Les élections indiennes affichées

data_visualization_tableau-4365383

C'est une visualisation vraiment impressionnante. Je n'ai pris qu'une partie de l'ensemble du conseil. La portée de cette visualisation et la quantité de données couvertes sont stupéfiantes et vraiment utiles pour toute personne intéressée par ce type d'analyse..

Chaque point de données représente des détails sur chaque siège, y compris le nom du gagnant, l'état, le parti et la circonscription). Regardez à quel point cette visualisation est soignée, malgré beaucoup d'informations. C'est quelque chose à quoi nous pouvons tous aspirer dans notre rapport quotidien / hebdomadaire / mensuel, vérité?

Voici le tableau de bord complet de Tableau que pouvez-vous télécharger.

Surveillez les performances commerciales avec Tableau

tableau_data_visualization-5523760

Je voulais inclure un panel d'entreprises du monde réel. Si vous avez du mal à visualiser où vous pouvez utiliser ces visualisations dans le monde réel (Utilise ton imagination!), Cela vous sera très utile.

Il s'agit d'une analyse des données de vente pour mesurer la distance par rapport au quota d'origine. J'ai particulièrement aimé le premier onglet horizontal qui résumait clairement les chiffres clés qu'un client ou une partie prenante doit connaître.

Les classeur Tableau complet contient cinq panneaux complets qui analysent ces chiffres de vente sous différents angles. Je pense vraiment que vous devriez l'utiliser comme référence si vous travaillez dans le domaine des ventes ou du marketing.

Popularité du genre cinématographique – 1910-2018

data_visualization_python_film_genre-4253414

je suis un grand cinéphile, donc cette visualisation a instantanément attiré mon attention sur la galerie publique de Tableau. Veuillez noter qu'il s'agit de la popularité des genres cinématographiques. au fil du temps. Chaque genre a une plage d'axes différente, donc, regarde-les de cet objectif (au lieu d'une comparaison individuelle).

Ce qui a attiré mon attention, c'est que vous pouvez considérer cela comme un tableau de bord avec plusieurs points de données présentés. Pouvez-vous penser à un cas d'utilisation similaire dans votre vie professionnelle où un tel tableau de bord serait utile?

Vous pouvez télécharger la fiche complète et jouez avec dans Tableau.

Visualisation des données dans D3.js

Si vous voulez créer des visualisations animées étonnantes, D3.js devrait être votre outil de référence. Il s'agit d'une bibliothèque puissante qui vous permet de créer des visualisations personnalisées pour tout type de narration que vous pouvez imaginer pour le Web..

Cette section est peut-être ma préférée des quatre que nous avons couvertes dans cet article.. Vous devriez sérieusement envisager d'ajouter D3.js à vos compétences, surtout si vous souhaitez travailler régulièrement avec la visualisation de données.

Voici deux articles populaires sur la prise en main de D3.js:

Carte conceptuelle – Relation entre les concepts

concept_map-3292842

J'utilise assez souvent une carte conceptuelle. Je peux facilement représenter les relations entre différents concepts ou points de connaissance. Comme dit Wikipédia, “Une carte conceptuelle représente généralement des idées et des informations sous forme de cases ou de cercles., connexion avec des flèches étiquetées dans une structure hiérarchique qui se ramifie”.

Vous le trouverez utile pour cartographier les décisions commerciales, diagrammes de flux de processus, conception d'informations, visualisation des connaissances, entre autres choses. C'est un outil sous-estimé mais utile à avoir dans votre arsenal.

Cette carte conceptuelle il est très interactif et vous pouvez également jouer avec les différents nœuds.

Affichage des séquences Sunburst dans D3.js

sequence_sunburst_visualization_d3js-7071722

Ah, génial! Cette visualisation montre comment utiliser le concept de rayons solaires avec des données décrivant la séquence d'événements.

Pensez-y: vous pouvez visualiser votre parcours client avec ce. Au lieu d'un entonnoir statique, vous pouvez voir tous les itinéraires possibles en utilisant cette visualisation. Votre équipe marketing adorera que vous le mettiez en œuvre. 🙂

Le code D3.js complet pour générer cette séquence sunburst est ici.

Visualisation de l'interaction entre les personnages de Game of Thrones

capture d

Êtes-vous un fan de Game of Thrones? Alors vous allez adorer cette visualisation. Représente l'influence de chaque personnage en fonction du nombre de fois où leur interaction est apparue dans le livre “Une tempête d'épées”.

Notez que les nœuds représentent les caractères et les liens l'interaction entre eux. La taille du nœud et le nom représentent l'influence du caractère. Ce n'est pas étonnant que Tyrion ait le plus d'influence, vérité?

Vous pouvez créer votre propre visualisation Game of Thrones à l'aide de ce didacticiel.

Visualisation des données en Python

Nous pensons souvent à Python comme le langage de programmation ultime pour la science des données. Nous l'associons au nettoyage des données, construire des modèles prédictifs et même certaines tâches d'ingénierie des données. Mais saviez-vous que Python est très utile pour générer des visualisations de données?

C'est comme ca, Python est livré avec deux bibliothèques exclusives pour la visualisation: matplotlib y seaborn. Vous pouvez vous référer à cet article pour en savoir plus sur ces bibliothèques et les voir en action.

Une carte géologique de Mars

data_visualization_python_mars-2052802

Cette visualisation est une beauté. Je suis tombé sur cette carte géologique de Mars il y a quelques jours et ça m'étonne toujours qu'elle ait été créée en Python (avec un peu d'aide d'Adobe Illustrator). Incroyable!

Les bibliothèques Python utilisées pour créer cette merveilleuse visualisation sont:

  • Matplotlib
  • NumPy
  • Pandas
  • Cartopie

Si la police est trop petite pour être lue ou si vous souhaitez l'imprimer sous forme d'affiche, obtenir l'image haute résolution complète. ici. Et vous pouvez obtenir le code python pour cette visualisation. ici. Le référentiel GitHub contient le didacticiel complet pour commencer.

Tracer des satellites géostationnaires en Python

Je suis fasciné par les recherches que notre communauté de science des données effectue sur les données satellitaires. Nous avons vu la découverte de nouvelles planètes, la recréation d'images au niveau du sol, Prédiction de tremblement de terre de la NASA, entre autres choses.

Les Paquet PyEphem a été utilisé pour créer cette intrigue géniale en Python. PyEphem nous permet essentiellement d'implémenter des algorithmes astronomiques en Python.

Un bon nombre de passionnés de la science des données ont essayé de tracer cette visualisation et vous pouvez trouver toutes les ressources. ici.

Remarques finales

j'ai pris beaucoup de plaisir à faire cette liste. Je travaille principalement avec R et Tableau, il était donc révélateur de voir le type de visualisations que nous pouvons générer à l'aide de D3.js. je vais certainement tenter ma chance là bas.

Y a-t-il une visualisation que vous avez rencontrée qui vous a époustouflé? Allez-y et partagez-les avec nous dans la section commentaires ci-dessous. C'est le meilleur endroit pour faire preuve de créativité et apprendre de la communauté !!

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.