Introdução
“Visualização dá-lhe respostas para perguntas que você não sabia que tinha”. – Ben Shneiderman
Mi trabajo diario como científico de datos requiere mucha experimentación. Eso significa que confío mucho en Visualização de dados para explorar el conjunto de datos en el que estoy trabajando.
¡Y no podría relacionarme más con la cita de Ben Shneiderman! La visualización de datos me da respuestas a preguntas que ni siquiera había considerado antes. Depois de tudo, una imagen vale mil puntos de datos!
Esto naturalmente lleva a la pregunta del millón de dólares, naquela Piton ¿Qué biblioteca debería utilizar para la visualización de datos? Hay bastantes en todos los ámbitos. Incluso los científicos de datos experimentados pueden perderse en la miríada de características que ofrece cada biblioteca de Python.
Es por eso que quería escribir este artículo exponiendo las ventajas y características únicas de las diferentes bibliotecas Python de visualización de datos. Cubriremos algunas de las bibliotecas de visualización más sorprendentes que admite Python. Cada una de estas bibliotecas posee su propio estilo y es realmente útil para un tipo particular de tarea de visualización.
Así que sin más preámbulos, Vamos começar!
Si es nuevo en Python y / o visualización de datos, le sugiero que consulte los siguientes recursos de Analytics Vidhya:
As 6 bibliotecas de Python de visualización de datos que cubriremos
- Matplotlib
- Seaborn
- Bokeh
- Altair
- Completamente
- ggplot
1. Matplotlib
Lo más probable es que ya haya utilizado matplotlib en su viaje por la ciencia de datos. Desde principiantes en ciencia de datos hasta profesionales experimentados que crean visualizaciones de datos complejas, matplotlib suele ser la visualización predeterminada a la que recurren los científicos de datos de bibliotecas de Python.
matplotlib es conocido por la gran cantidad de flexibilidad que proporciona como biblioteca de trazado 2-D en Python. Si tiene experiencia en programación MATLAB, la interfaz Pyplot de Matplotlib le resultará muy familiar. ¡Estarás listo con tu primera visualización en muy poco tiempo!
Características únicas de Matplotlib
Matplotlib se puede utilizar de varias formas en Python, incluidos los scripts de Python, los shells de Python e iPython, los cuadernos de Jupyter y otras cosas. Es por eso que a menudo se usa para crear visualizaciones no solo por los científicos de datos, sino también por los investigadores para crear gráficos con calidad de publicación.
Matplotlib admite todos los gráficos populares (Muito, histogramasHistogramas são representações gráficas que mostram a distribuição de um conjunto de dados. Eles são construídos dividindo o intervalo de valores em intervalos, o "Caixas", e contando quantos dados caem em cada intervalo. Essa visualização permite identificar padrões, tendências e variabilidade de dados de forma eficaz, facilitando a análise estatística e a tomada de decisões informadas em várias disciplinas...., espectros de potencia, gráficos de barras, gráficos de error, diagramas de dispersão, etc.) desde el primer momento. También hay extensiones que puede utilizar para crear visualizaciones avanzadas como gráficos tridimensionales, etc.
Lo que personalmente me gusta de matplotlib es que, debido a que es tan flexible, permite al usuario controlar aspectos de la visualización en el nivel más granular, desde una sola línea o punto en el gráfico hasta el gráfico completo. Esto significa que puede personalizarlo al más alto nivel.
Tutorial (isto é) para aprender matplotlib
Aquí hay algunos tutoriales útiles para aprender matplotlib:
Aquí está el creador de Matplotlib dando un tutorial introductorio:
2. Seaborn
Cuando miro las visualizaciones creadas por Seaborn, solo me viene a la mente una palabra: ¡hermoso! Seaborn está construido sobre matplotlib y proporciona una interfaz muy simple pero intuitiva para crear visualizaciones. Al usar Seaborn, también notará que muchas de las configuraciones predeterminadas en los gráficos funcionan bastante bien desde el primer momento.
Características únicas de Seaborn
La primera característica única de Seaborn es que está diseñado de tal manera que escribe un código mucho menor para lograr visualizaciones de alto grado. He aquí un ejemplo de esta simplicidad. Observe cómo podemos crear una visualización compleja con una sola línea de código de trazado:
La segunda característica útil de Seaborn es que admite una gran cantidad de gráficos avanzados como el trazado categórico (catplot), el trazado de distribución utilizando kde (distplot), el gráfico de enjambre, etc. desde el primer momento. E, claro, vimos un ejemplo de relplot acima de.
Agora, debido a que Seaborn está construido sobre matplotlib, es altamente compatible con él. Eso significa que al crear visualizaciones, puede comenzar con gráficos avanzados que seaborn ya admite y luego personalizarlos tanto como desee con la ayuda de matplotlib.
Tutorial (isto é) para aprender Seaborn
Aquí hay algunos recursos útiles que puede utilizar para comenzar a usar la biblioteca seaborn para la visualización de datos:
3. Bokeh
Bokeh es una biblioteca diseñada para generar visualizaciones que son amigables en la interfaz web y los navegadores. Y eso es a lo que se dirige específicamente esta biblioteca de visualización.
También notará que las visualizaciones generadas a partir de Bokeh son de naturaleza interactiva, lo que básicamente significa que puede transmitir información de una manera más intuitiva a través de sus gráficos.
Características únicas de Bokeh
Bokeh admite visualizaciones únicas como diagramas geoespaciales, gráficos de red, etc. desde el primer momento. Si desea mostrar estas visualizaciones en un navegador, hay opciones disponibles para exportarlas y también puede usarlas a través de JavaScript.
Tutorial para aprender Bokeh
Aquí hay un buen tutorial para aprender Bokeh para la visualización de datos:
4. Altair
Altair es una biblioteca declarativa para visualización de datos. Su principio es que, en lugar de centrarse en la parte del código, uno debe centrarse en la parte de visualización y escribir la menor cantidad de código posible y aún así poder crear gráficos hermosos e intuitivos. ¡Eso es en mi callejón!
Características únicas de Altair
Dado que Altair usa un estilo declarativo para crear gráficos, resulta muy fácil y rápido iterar a través de visualizaciones y experimentos a un ritmo rápido cuando se usa esta biblioteca.
Tutorial (isto é) para aprender Altair
Aquí hay una buena introducción a Altair en Python:
5. Completamente
¡Lo primero que me viene a la mente cuando pienso en Plotly es la interactividad! Esta biblioteca de visualización de datos es, com muito, mi biblioteca a la que recurro cuando quiero crear visualizaciones que deben ser altamente interactivas para el usuario.
Solo mira esta visualización creada usando Plotly:
Características únicas de Plotly
Plotly es altamente compatible con Jupyter Notebook y navegadores web. Esto significa que cualquier trama interactiva que cree se puede compartir fácilmente de la misma manera con sus compañeros de equipo o usuarios finales.
También quiero señalar que Plotly admite una gama de gráficos desde tipos de gráficos básicos, gráficos hermosos y avanzados similares a los de Seaborn, gráficos 3-D, visualizaciones basadas en mapas, gráficos científicos, etc. ¡La lista es interminable!
Los gráficos de Plotly también pueden admitir capacidades de animación. Portanto, es una biblioteca bastante útil si desea contar historias a través de visualizaciones.
Tutorial para aprender Plotly
Aquí hay un par de tutoriales para que pueda comenzar a trabajar con Plotly para la visualización de datos:
6. ggplot
ggplot es la versión Python del famoso ggplot2 de R y el lenguaje Grammer of Graphics. Si lo ha usado en R antes, sabrá lo simple que es crear gráficos usando esta biblioteca.
Pessoalmente, me encanta la flexibilidad de ggplot. Podemos discutir fácilmente los datos mientras construimos parcelas sobre la marcha, ¡un concepto súper útil!
Características únicas de ggplot
ggplot también es una biblioteca de estilo declarativo como Bokeh, pero también está estrechamente acoplada con Pandas. ¡Esto significa que puede crear visualizaciones fácilmente utilizando su propio marco de datos de Pandas!
Tutorial (isto é) para aprender ggplot
Puede obtener más información sobre ggplot y cómo trabajar con él aquí:
Notas finais
Neste artigo, exploramos algunas de las bibliotecas imprescindibles para realizar la visualización de datos en Python. Cada una de estas bibliotecas es bastante popular por derecho propio y brilla en diferentes escenarios.
Espero que este artículo sea como una piedra de rosetta cuando decida qué biblioteca usar para su próximo proyecto.
¿Cree que alguna otra biblioteca de visualización de datos debería estar en esta lista? ¿Te gustó el artículo? Sim é assim, ¡comenta a continuación!