Visión general
- Un vistazo a 11 visualizaciones de datos innovadoras y alucinantes en Python, R, Tableau y D3.js
- Estas visualizaciones de datos abarcan una variedad de temas del mundo real.
- He proporcionado el código de fuente abierta (u hoja de trabajo) para cada visualización.
Introducción
«La visualización te da respuestas a preguntas que no sabías que tenías». – Ben Shneiderman
He estado involucrado en el campo de la ciencia de datos durante algunos años, pero vengo de una formación no técnica (aprendizaje y desarrollo). Me tomó un tiempo realmente transición a la ciencia de datos. Digo «verdaderamente» porque las primeras semanas fueron un torbellino de cambios (como menciono en detalle en el curso de pensamiento estructurado para ciencia de datos).
Uno de los mayores cambios en mi forma de pensar giró en torno a cómo miraba los datos. Inicialmente, cuando mi gerente me pidió que analizara ciertos datos, solía crear visualizaciones de datos comunes y corrientes (diagramas de dispersión, gráficos de barras, etc.). ¡Poco imaginaba las infinitas posibilidades que me esperaban!
No puedo relacionarme más con la cita de Ben Shneiderman anterior. Dominar verdaderamente las técnicas de visualización de datos abre puertas y oportunidades con las que no había soñado antes. Una visualización bien pensada despega las capas que rodean un conjunto de datos sin procesar.
Y esa a menudo puede ser la diferencia entre un proyecto de ciencia de datos exitoso y uno mundano.
Entonces, en este artículo, mi objetivo es mostrarles el increíble poder de la visualización de datos. He reunido 11 visualizaciones alucinantes que cubren una variedad de temas. Y para demostrar que puede hacer esto en cualquier herramienta de su elección, cubriremos estas visualizaciones en Python, R, Tableau y D3.js.
¿El desafío para ti? Elija la visualización (código proporcionado para todos ellos) y cree su propia versión en la herramienta que elija.
Visualización de datos en R
La creación del ggplot2 Library ha convertido a R en la herramienta de referencia para la visualización de datos (¡al menos para los programadores!). Comencé mi propio viaje de ciencia de datos usando R y al instante me cautivó la belleza y el poder de ggplot.
Visualizaciones con estilo, información instantánea, patrones de descubrimiento, todo esto en solo unas pocas líneas de código. No es de extrañar que incluso los programadores expertos de Python importen ggplot2 en sus cuadernos de Jupyter (sí, eso es posible ahora).
Si está usando R y no ha explorado ggplot2 aún, asegúrate de hacerlo HOY:
Cree visualizaciones al estilo BBC en R
Esta no es estrictamente una visualización, aunque ciertamente no es un problema, ¿verdad? El panelUn panel es un grupo de expertos que se reúne para discutir y analizar un tema específico. Estos foros son comunes en conferencias, seminarios y debates públicos, donde los participantes comparten sus conocimientos y perspectivas. Los paneles pueden abordar diversas áreas, desde la ciencia hasta la política, y su objetivo es fomentar el intercambio de ideas y la reflexión crítica entre los asistentes.... anterior es una combinación de visualizaciones publicadas por el equipo de datos de la BBC. He estado siguiendo el sitio web de la BBC durante años, así que este fue un lanzamiento bienvenido.
El equipo de datos de la BBC ha desarrollado y lanzado un paquete R y un libro de cocina R para generar visualizaciones como la anterior. El paquete R se llama bbplot. Proporciona funciones para crear y exportar visualizaciones realizadas en ggplot en el estilo utilizado por el equipo de datos de la BBC.
Estos son los recursos clave para seguir su camino:
Gráficos interactivos en R
¿Quién no disfruta de las tramas interactivas? Son uno de los aspectos más atractivos de una presentación (si se usan correctamente). Esta visualización nos muestra cómo ha cambiado la esperanza de vida a lo largo de los años en diferentes continentes, comparándolo con el PIB per cápita.
Tanta información empaquetada en un espacio tan pequeño. ¿El paquete utilizado para crear la visualización anterior? gganimate! No sorprende ver que el poder de ggplot se extiende a otro tipo de visualización impresionante.
Puede consultar nuestra guía para construir parcelas interactivas en R:
Diagramas de Sankey en R
¿Intrigado? Este es un ejemplo clásico de un diagrama de Sankey. Básicamente, muestra el flujo de información, donde el ancho de las flechas es proporcional a la cantidad de flujo. La visualización anterior muestra la relevancia de la publicidad de lista personalizada de Facebook.
Esta visualización se creó utilizando el ggaluvial paquete en R. Combina el estilo y la flexibilidad del original aluvial paquete con el poder del tidyverse.
Puede encontrar el código completo, que consta de unas pocas líneas. aquí.
Visualización de datos en Tableau
“En una buena visualización de la información, no hay reglas, pautas, plantillas, tecnologías estándar ni libros de estilo. Simplemente debes hacer lo que sea necesario «. – Edward Tufte
Edward Tufte es un pionero en el campo de la visualización de datos. Siento esta cita De Verdad se aplica a las visualizaciones que generamos con Tableau. La gran cantidad de funciones y personalizaciones que ofrece Tableau es casi incomparable.
Si está interesado en comenzar con Tableau, ¡ha venido al lugar correcto! A continuación, encontrará una serie de artículos que le ayudarán a pasar de un principiante a un experto en Tableau:
La votación más grande del mundo: las elecciones de la India visualizadas
Esta es una visualización realmente impresionante. Solo he tomado una parte del tablero completo. El alcance de esta visualización y la cantidad de datos cubiertos es asombroso y realmente útil para cualquier persona interesada en este tipo de análisis.
Cada punto de datos representa detalles sobre cada escaño, incluido el nombre del ganador, el estado, el partido y la circunscripción). Mire lo ordenada que es esta visualización, a pesar de empacar un montón de información. Esto es algo a lo que todos podemos aspirar en nuestro informe diario / semanal / mensual, ¿verdad?
Aquí está el panel completo de Tableau que puedes descargar.
Supervisar el rendimiento de ventas con Tableau
Quería incluir un panel de negocios del mundo real. Si estás luchando por visualizar dónde puedes usar estas visualizaciones en el mundo real (¡usa tu imaginación!), Esto te resultará muy útil.
Este es un análisis de los datos de ventas para medir la distancia desde la cuota original. Me gustó especialmente la primera pestaña horizontal que resumía claramente las cifras clave que un cliente o una parte interesada necesita conocer.
los libro de trabajo completo de Tableau contiene cinco paneles completos que analizan estas cifras de ventas desde diferentes perspectivas. Realmente creo que debería usar esto como referencia si trabaja en el campo de las ventas o el marketing.
Popularidad del género cinematográfico – 1910-2018
Soy un gran aficionado al cine, por lo que esta visualización llamó instantáneamente mi atención sobre la galería pública de Tableau. Tenga en cuenta que esta es la popularidad de los géneros cinematográficos. tiempo extraordinario. Cada género tiene un rango de ejes diferente, por lo tanto, mírelos desde esa lente (en lugar de una comparación de uno contra uno).
Lo que me llamó la atención es que puede considerar esto como un tablero con múltiples puntos de datos presentados. ¿Puede pensar en un caso de uso similar en su vida profesional en el que un panel de control de este tipo sería útil?
Usted puede descargar la hoja de trabajo completa y juegue con él en Tableau.
Visualización de datos en D3.js
Si desea crear visualizaciones animadas asombrosas, D3.js debería ser su herramienta de referencia. Es una biblioteca poderosa que le permite crear visualizaciones personalizadas para cualquier tipo de narración que pueda imaginar para la web.
Esta sección es quizás mi favorita de las cuatro que hemos cubierto en este artículo. Debería considerar seriamente agregar D3.js a su conjunto de habilidades, especialmente si desea trabajar con visualización de datos con regularidad.
Aquí hay dos artículos populares sobre cómo comenzar con D3.js:
Mapa conceptual – Relación entre conceptos
Utilizo un mapa conceptual con bastante frecuencia. Puedo representar fácilmente las relaciones entre diferentes conceptos o puntos de conocimiento. Como dice Wikipedia, «Un mapa conceptual generalmente representa ideas e información como cuadros o círculos, que conecta con flechas etiquetadas en una estructura jerárquica que se ramifica hacia abajo».
Lo encontrará útil para mapear decisiones comerciales, diagramas de flujo de procesos, diseño de información, visualización de conocimiento, entre otras cosas. Es una herramienta infravalorada pero útil para tener en su arsenal.
Este mapa conceptual es muy interactivo y también puedes jugar con los diferentes nodos.
Visualización de secuencias Sunburst en D3.js
¡Ah, genial! Esta visualización muestra cómo utilizar el concepto de rayos solares con datos que describen la secuencia de eventos.
Piénselo: puede visualizar el recorrido de su cliente con esto. En lugar de un embudo estático, puede ver todas las rutas posibles utilizando esta visualización. A su equipo de marketing le encantará que lo implemente. 🙂
El código D3.js completo para generar este estallido solar de secuencias es aquí.
Visualización de la interacción entre los personajes de Game of Thrones
¿Eres fan de Juego de Tronos? Entonces te encantará esta visualización. Representa la influencia de cada personaje en función del número de veces que su interacción ha aparecido en el libro «A Storm of Swords».
Tenga en cuenta que los nodos representan los personajes y los vínculos la interacción entre ellos. El tamaño del nodoNodo es una plataforma digital que facilita la conexión entre profesionales y empresas en busca de talento. A través de un sistema intuitivo, permite a los usuarios crear perfiles, compartir experiencias y acceder a oportunidades laborales. Su enfoque en la colaboración y el networking hace de Nodo una herramienta valiosa para quienes desean expandir su red profesional y encontrar proyectos que se alineen con sus habilidades y objetivos.... y el nombre representa la influencia del personaje. No es de extrañar que Tyrion tenga la mayor influencia, ¿verdad?
Puedes crear tu propia visualización de Game of Thrones usando este tutorial.
Visualización de datos en Python
A menudo pensamos en Python como el lenguaje de programación definitivo para la ciencia de datos. Lo asociamos con la limpieza de datos, la construcción de modelos predictivos e incluso ciertas tareas de ingeniería de datos. ¿Pero sabías que Python es bastante útil para generar visualizaciones de datos?
Así es, Python viene con dos bibliotecas exclusivas para visualización: matplotlib y seaborn. Puede consultar este artículo para saber más sobre estas bibliotecas y verlas en acción.
Un mapa geológico de Marte
Esta visualización es una belleza. Me encontré con este mapa geológico de Marte hace unos días y todavía me sorprende que haya sido creado en Python (con un poco de ayuda de Adobe Illustrator). ¡Increíble!
Las bibliotecas de Python utilizadas para crear esta maravillosa visualización son:
- Matplotlib
- NumPy
- Pandas
- Cartopy
Si la fuente es demasiado pequeña para leerla o si desea imprimirla como póster, obtenga la imagen de alta resoluciónLa "resolución" se refiere a la capacidad de tomar decisiones firmes y cumplir con los objetivos establecidos. En contextos personales y profesionales, implica definir metas claras y desarrollar un plan de acción para alcanzarlas. La resolución es fundamental para el crecimiento personal y el éxito en diversas áreas de la vida, ya que permite superar obstáculos y mantener el enfoque en lo que realmente importa.... completa. aquí. Y puede obtener el código Python para esta visualización. aquí. El repositorio de GitHub tiene el tutorial completo para comenzar.
Trazado de satélites geoestacionarios en Python
Estoy fascinado por la investigación que está haciendo nuestra comunidad de ciencia de datos sobre datos satelitales. Hemos visto el descubrimiento de nuevos planetas, la recreación de imágenes a nivel del suelo, la predicción de terremotos de la NASA, entre otras cosas.
los Paquete PyEphem se utilizó para crear esta impresionante trama en Python. PyEphem básicamente nos permite implementar algoritmos astronómicos en Python.
Un buen número de entusiastas de la ciencia de datos intentaron trazar esta visualización y puede encontrar todos los recursos. aquí.
Notas finales
Me divertí mucho armando esta lista. Trabajo principalmente con R y Tableau, por lo que fue revelador ver el tipo de visualizaciones que podemos generar usando D3.js. Definitivamente voy a probar suerte allí.
¿Hay alguna visualización con la que te hayas encontrado que te haya dejado boquiabierto? Continúe y compártalos con nosotros en la sección de comentarios a continuación. ¡Este es el mejor lugar para ser creativo y aprender de la comunidad!