Bibliothèques d'affichage de données Python

Contenu

introduction

“La visualisation vous donne des réponses à des questions que vous ne saviez pas que vous aviez”. – Ben Shneiderman

Mon travail de jour en tant que data scientist nécessite beaucoup d'expérimentation. Cela signifie que j'ai beaucoup confiance Visualisation de données pour explorer l'ensemble de données sur lequel je travaille.

Et je ne pourrais pas m'identifier plus à la citation de Ben Shneiderman !! La visualisation des données me donne des réponses à des questions que je n'avais même pas envisagées auparavant. Après tout, une image vaut mille points de données!

Cela conduit naturellement à la question du million de dollars., Quoi Piton Quelle bibliothèque dois-je utiliser pour la visualisation des données? Il y en a pas mal à tous les niveaux. Même les data scientists chevronnés peuvent se perdre dans la myriade de fonctionnalités offertes par chaque bibliothèque Python..

data-viz-tools-5086575

C'est pourquoi j'ai voulu écrire cet article exposant les avantages et les caractéristiques uniques des différentes bibliothèques de visualisation de données Python.. Nous couvrirons certaines des bibliothèques d'affichage les plus étonnantes prises en charge par Python.. Chacune de ces bibliothèques a son propre style et est vraiment utile pour un type particulier de tâche de visualisation..

Alors sans plus tarder, Commençons!

Si vous débutez avec Python et / ou visualisation de données, Je vous suggère de consulter les ressources Analytics Vidhya suivantes:

Le 6 Bibliothèques de visualisation de données Python que nous couvrirons

  1. Matplotlib
  2. Seaborn
  3. Bokeh
  4. Altaïr
  5. comploter
  6. ggplot

1. Matplotlib

matplotlib-300x72-3246294

Il y a de fortes chances que vous ayez déjà utilisé matplotlib dans votre parcours en science des données. Des débutants en science des données aux professionnels chevronnés créant des visualisations de données complexes, matplotlib est généralement la visualisation par défaut sur laquelle les data scientists de la bibliothèque Python se rabattent.

matplotlib est connu pour la grande flexibilité qu'il offre en tant que bibliothèque de traçage 2D en Python. Si vous avez de l'expérience en programmation MATLAB, L'interface Pyplot de Matplotlib vous semblera très familière. Vous serez prêt pour votre premier visionnage en un rien de temps !!

Fonctionnalités uniques de Matplotlib

Matplotlib peut être utilisé de plusieurs manières en Python, y compris les scripts python, les shells de Python et iPython, Carnets Jupyter et autres choses. C'est pourquoi il est souvent utilisé pour créer des visualisations non seulement par les scientifiques des données., mais aussi par des chercheurs pour créer des graphiques de qualité publication.

Matplotlib prend en charge tous les graphiques populaires (beaucoup, histogrammes, spectres de puissance, graphiques à barres, graphiques d'erreur, diagrammes de dispersion, etc.) dès le début. Il existe également des extensions que vous pouvez utiliser pour créer des visualisations avancées telles que des graphiques 3D., etc.

ezgif-com-webp-to-png-7653980

Ce que j'aime personnellement à propos de matplotlib, c'est que, parce qu'il est si flexible, permet à l'utilisateur de contrôler les aspects de l'affichage au niveau le plus granulaire, d'une seule ligne ou d'un point sur le graphique à l'ensemble du graphique. Cela signifie que vous pouvez le personnaliser au plus haut niveau..

Didacticiel (il est) apprendre matplotlib

Voici quelques tutoriels utiles pour apprendre matplotlib:

Voici le créateur de Matplotlib donnant un tutoriel d'introduction:

2. Seaborn

Quand je regarde les visualisations créées par Seaborn, un seul mot me vient à l'esprit: Beau! Seaborn est construit sur matplotlib et fournit une interface très simple mais intuitive pour créer des visualisations. Al usar Seaborn, vous remarquerez également que de nombreux paramètres par défaut dans les graphiques fonctionnent assez bien dès la sortie de la boîte.

Caractéristiques Seaborn uniques

La première caractéristique unique de Seaborn est qu'il est conçu de manière à écrire beaucoup moins de code pour obtenir des visualisations de haute qualité.. Voici un exemple de cette simplicité. Découvrez comment nous pouvons créer une visualisation complexe avec une seule ligne de code de traçage:

capture d

La source: Seaborn

La deuxième caractéristique utile de Seaborn est qu'il prend en charge un grand nombre de graphiques avancés tels que le traçage catégoriel. (catplot), le diagramme de distribution en utilisant kde (distplotter), la carte de l'essaim, etc. dès le début. Oui, bien sûr, nous avons vu un exemple de relplot sur.

À présent, parce que Seaborn est construit sur matplotlib, est très compatible avec lui. Cela signifie que lors de la création de visualisations, vous pouvez commencer avec des cartes avancées que Seaborn prend déjà en charge, puis les personnaliser autant que vous le souhaitez à l'aide de matplotlib.

Didacticiel (il est) apprendre Seaborn

Voici quelques ressources utiles que vous pouvez utiliser pour commencer à utiliser la bibliothèque Seaborn pour la visualisation des données:

3. Bokeh

Bokeh est une bibliothèque conçue pour générer des visualisations conviviales sur l'interface Web et les navigateurs. Et c'est ce que cette bibliothèque d'affichage cible spécifiquement..

bokeh-logo-twitter-6950383

Vous remarquerez également que les visualisations générées à partir de Bokeh sont de nature interactive., ce qui signifie essentiellement que vous pouvez transmettre des informations de manière plus intuitive à travers vos graphiques.

Caractéristiques uniques du bokeh

Bokeh prend en charge des visualisations uniques telles que les diagrammes géospatiaux, graphiques de réseau, etc. dès le début. Si vous souhaitez afficher ces visualisations dans un navigateur, il existe des options disponibles pour les exporter et vous pouvez également les utiliser via javascript.

Tutoriel pour apprendre le Bokeh

Voici un bon tutoriel pour apprendre Bokeh pour la visualisation de données:

4. Altaïr

altair-logo-light-4152043

Altair est une bibliothèque déclarative pour la visualisation de données. Son principe est que, au lieu de se concentrer sur la partie code, il faut se concentrer sur la partie affichage et écrire le moins de code possible tout en étant capable de créer de beaux graphiques intuitifs. C'est dans ma ruelle!

Caractéristiques uniques d'Altaïr

Étant donné qu'Altair utilise un style déclaratif pour créer des graphiques, il est très facile et rapide de parcourir les visualisations et les expériences à un rythme rapide lors de l'utilisation de cette bibliothèque.

Didacticiel (il est) apprendre Altaïr

Voici une bonne introduction à Altair en Python:

5. comploter

La première chose qui me vient à l'esprit quand je pense à Plotly, c'est l'interactivité !! Cette bibliothèque de visualisation de données est, avec beaucoup, ma bibliothèque vers laquelle je me tourne lorsque je veux créer des visualisations qui doivent être hautement interactives pour l'utilisateur.

Il suffit de regarder cette visualisation créée à l'aide de Plotly:

687474703a2f2f692e696d6775722e636f6d2f643379346e776d2e676966-7709068

Caractéristiques uniques de Plotly

Plotly est hautement compatible avec Jupyter Notebook et les navigateurs Web. Cela signifie que toute intrigue interactive que vous créez peut être facilement partagée de la même manière avec vos coéquipiers ou utilisateurs finaux..

Je tiens également à souligner que Plotly prend en charge une gamme de graphiques à partir de types de graphiques de base, des graphismes magnifiques et avancés similaires à ceux de Seaborn, Graphiques 3D, visualisations cartographiques, graphiques scientifiques, etc. La liste est interminable!

Les graphiques Plotly peuvent également prendre en charge les capacités d'animation. Donc, est une bibliothèque assez utile si vous voulez raconter des histoires à travers des visualisations.

Tutoriel pour apprendre Plotly

Voici quelques tutoriels pour vous permettre de démarrer avec Plotly pour la visualisation de données:

6. ggplot

ggplot-9749486

ggplot est la version Python du célèbre ggplot2 de R et du langage Grammer of Graphics. Si vous l'avez déjà utilisé dans R, vous saurez à quel point il est simple de créer des graphiques à l'aide de cette bibliothèque.

Personnellement, j'aime la flexibilité de ggplot. Nous pouvons facilement discuter des données tout en construisant des parcelles à la volée, Un concept super utile!

Caractéristiques uniques de ggplot

ggplot est également une bibliothèque de styles déclaratifs comme Bokeh, mais il est aussi étroitement lié à Pandas. Cela signifie que vous pouvez facilement créer des visualisations à l'aide de votre propre bloc de données Pandas !!

Didacticiel (il est) apprendre ggplot

Vous pouvez en savoir plus sur ggplot et comment travailler avec ici:

Remarques finales

Dans cet article, Nous explorons certaines des bibliothèques indispensables pour la visualisation de données en Python. Chacune de ces bibliothèques est assez populaire en soi et brille dans différents contextes..

J'espère que cet article est comme une pierre de rosette au moment de décider quelle bibliothèque utiliser pour votre prochain projet..

Pensez-vous que d'autres bibliothèques de visualisation de données devraient figurer sur cette liste? Avez-vous aimé l'article? Si c'est ainsi, Commentaires ci-dessous!

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.