Panoramica
- uno sguardo a 11 Visualizzazioni di dati innovative e strabilianti in Python, R, Tabella y D3.js
- Queste visualizzazioni dei dati coprono una varietà di argomenti del mondo reale.
- Ho fornito il codice open source (tu foglio di lavoro) per ogni visualizzazione.
introduzione
“La visualizzazione ti dà risposte a domande che non sapevi di avere”. – Ben Shneiderman
Mi occupo di data science da alcuni anni, ma vengo da una formazione non tecnica (Apprendimento e sviluppo). Mi ci è voluto un po' davvero passaggio alla scienza dei dati. Dire “veramente” perché le prime settimane sono state un turbinio di cambiamenti (come ho menzionato in dettaglio nel corso di pensiero strutturato per la scienza dei dati).
Uno dei più grandi cambiamenti nel mio modo di pensare ruotava attorno al modo in cui guardavo i dati. Inizialmente, quando il mio manager mi ha chiesto di analizzare determinati dati, utilizzato per creare visualizzazioni di dati ordinari (diagrammi a dispersione, grafici a barre, eccetera.). Non immaginavo le infinite possibilità che mi aspettavano!
Non riesco a relazionarmi con la citazione di Ben Shneiderman sopra. La vera padronanza delle tecniche di visualizzazione dei dati apre porte e opportunità che non avresti mai sognato prima. La visualizzazione ben congegnata rimuove gli strati che circondano un set di dati non elaborato.
E spesso questa può essere la differenza tra un progetto di data science di successo e uno banale..
Quindi, in questo articolo, il mio obiettivo è mostrarti l'incredibile potere della visualizzazione dei dati. ho raccolto 11 visualizzazioni strabilianti che coprono una varietà di argomenti. E per dimostrare che puoi farlo con qualsiasi strumento a tua scelta, tratteremo queste visualizzazioni in Python, R, Tabella y D3.js.
La sfida per te? Scegli il display (codice fornito per tutti loro) e crea la tua versione nello strumento che preferisci.
Visualizzazione dei dati in R
La creazione di ggplot2 La libreria ha reso R lo strumento ideale per la visualizzazione dei dati (Almeno per i programmatori!). Ho iniziato il mio viaggio nella scienza dei dati utilizzando R e sono rimasto immediatamente affascinato dalla bellezza e dalla potenza di ggplot.
Display eleganti, informazioni istantanee, modelli di scoperta, tutto questo in poche righe di codice. Non c'è da stupirsi che anche i programmatori esperti di Python importino ggplot2 nei loro notebook Jupyter (sì, ora è possibile).
Se stai usando R e non hai esplorato ggplot2 ancora, assicurati di farlo OGGI:
Crea visualizzazioni in stile BBC in R
Questa non è strettamente una visualizzazione, anche se di certo non è un problema, verità? Il pannelloUn panel è un gruppo di esperti che si riunisce per discutere e analizzare un argomento specifico. Questi forum sono comuni alle conferenze, seminari e dibattiti pubblici, dove i partecipanti condividono le loro conoscenze e prospettive. I pannelli possono riguardare una varietà di aree, Dalla scienza alla politica, e il suo obiettivo è quello di favorire lo scambio di idee e la riflessione critica tra i partecipanti.... anterior es una combinación de visualizaciones publicadas por el equipo de datos de la BBC. Seguo il sito della BBC da anni, quindi questa è stata una gradita uscita.
Il team di dati della BBC ha sviluppato e rilasciato un pacchetto R e un libro di cucina R per generare visualizzazioni come quella sopra.. Il pacchetto R si chiama trama. Fornisce funzioni per la creazione e l'esportazione di visualizzazioni realizzate in ggplot nello stile utilizzato dal team di dati della BBC.
Queste sono le risorse chiave per seguire il tuo percorso:
Grafici interattivi in R
A chi non piacciono le trame interattive? Sono uno degli aspetti più attraenti di una presentazione (se usato correttamente). Questa visualizzazione ci mostra come l'aspettativa di vita è cambiata nel corso degli anni nei diversi continenti, confrontandolo con il PIL pro capite.
Così tante informazioni racchiuse in uno spazio così piccolo. Il pacchetto utilizzato per creare la visualizzazione sopra?? gganimato! Non sorprende vedere che il potere di ggplot si estende a un altro tipo di display impressionante.
Puoi consultare la nostra guida alla costruzione di trame interattive in R:
diagrammi di Sankey in R
incuriosito? Questo è un classico esempio di diagramma di Sankey. Fondamentalmente, mostra il flusso di informazioni, dove la larghezza delle frecce è proporzionale alla quantità di flusso. La visualizzazione sopra mostra la pertinenza della pubblicità su elenchi personalizzati di Facebook.
Questa visualizzazione è stata creata utilizzando il ggaluviale pacchetto in R. Combina lo stile e la flessibilità dell'originale alluvionale pacchetto con il potere di ordinatoverso.
Puoi trovare il codice completo, composto da poche righe. qui.
Visualizzazione dei dati in Tableau
"In una buona visualizzazione delle informazioni, senza regole, linee guida, modelli, tecnologie standard o libri di stile. Devi solo fare tutto il necessario “. – Edward Tufte
Edward Tufte è un pioniere nel campo della visualizzazione dei dati. Scusate per questa citazione Veramente si applica alle visualizzazioni che generiamo con Tableau. La pletora di funzionalità e personalizzazioni offerte da Tableau è quasi impareggiabile.
Se sei interessato a iniziare con Tableau, Siete venuti nel posto giusto! Prossimo, troverai una serie di articoli per aiutarti a passare da principiante a esperto di Tableau:
Il voto più grande del mondo: Elezioni indiane visualizzate
Questa è una visualizzazione davvero impressionante. Ho preso solo una parte dell'intero consiglio. La portata di questa visualizzazione e la quantità di dati coperti è sbalorditiva e davvero utile per chiunque sia interessato a questo tipo di analisi..
Ogni punto dati rappresenta i dettagli su ogni posto, compreso il nome del vincitore, lo stato, il partito e il collegio elettorale). Guarda quanto è bella questa visualizzazione, nonostante abbia molte informazioni. Questo è qualcosa a cui tutti possiamo aspirare nel nostro resoconto quotidiano / settimanalmente / mensile, verità?
Ecco la dashboard completa di Tableau cosa puoi scaricare?.
Monitora le prestazioni di vendita con Tableau
Volevo includere un pannello aziendale del mondo reale. Se stai lottando per visualizzare dove puoi usare queste visualizzazioni nel mondo reale (Usa la tua immaginazione!), Questo ti sarà molto utile.
Questa è un'analisi dei dati di vendita per misurare la distanza dalla quota originale. Mi è piaciuta particolarmente la prima scheda orizzontale che riassumeva chiaramente le cifre chiave che un cliente o una persona interessata ha bisogno di conoscere..
il cartella di lavoro completa di Tableau contiene cinque pannelli completi che analizzano questi dati di vendita da diverse prospettive. Penso davvero che dovresti usarlo come riferimento se lavori nel campo delle vendite o del marketing.
Popolarità del genere cinematografico – 1910-2018
Sono un grande appassionato di cinema, quindi questa visualizzazione ha immediatamente attirato la mia attenzione sulla galleria pubblica di Tableau. Si prega di notare che questa è la popolarità dei generi cinematografici. col tempo. Ogni genere ha una diversa gamma di assi, così, guardali da quella lente (invece di un confronto uno a uno).
Quello che ha attirato la mia attenzione è che puoi pensare a questo come una dashboard con più punti dati presentati. Riesci a pensare a un caso d'uso simile nella tua vita professionale in cui una tale dashboard sarebbe utile??
Puoi scarica il foglio di lavoro completo e giocaci con Tableau.
Visualizzazione dei dati in D3.js
Se vuoi creare fantastiche visualizzazioni animate, D3.js dovrebbe essere il tuo strumento di riferimento. È una potente libreria che ti consente di creare visualizzazioni personalizzate per qualsiasi tipo di narrazione che puoi immaginare per il web..
Questa sezione è forse la mia preferita delle quattro che abbiamo trattato in questo articolo.. Dovresti seriamente considerare di aggiungere D3.js al tuo set di abilità, soprattutto se vuoi lavorare regolarmente con la visualizzazione dei dati.
Ecco due articoli popolari su come iniziare con D3.js:
Mappa concettuale – Relazione tra concetti
Uso abbastanza spesso una mappa concettuale. Riesco a rappresentare facilmente le relazioni tra diversi concetti o punti di conoscenza. Come dice Wikipedia, “Una mappa concettuale generalmente rappresenta idee e informazioni come scatole o cerchi., collegandosi con frecce etichettate in una struttura gerarchica che si dirama verso il basso”.
Lo troverai utile per mappare le decisioni aziendali, diagrammi di flusso di processo, progettazione delle informazioni, visualizzazione della conoscenza, tra l'altro. È uno strumento sottovalutato ma utile da avere nel proprio arsenale.
Questa mappa concettuale è molto interattivo e puoi anche giocare con i diversi nodi.
Visualizzazione delle sequenze Sunburst in D3.js
¡Ah, geniale! Questa visualizzazione mostra come utilizzare il concetto di raggi solari con dati che descrivono la sequenza degli eventi.
Pensaci: puoi visualizzare il percorso del tuo cliente con questo. Invece di un imbuto statico, puoi vedere tutti i percorsi possibili usando questa visualizzazione. Il tuo team di marketing adorerà che tu lo implementi. ?
Il codice D3.js completo per generare questa sequenza sunburst è qui.
Visualizzazione dell'interazione tra i personaggi di Game of Thrones
Sei un fan di Game of Thrones?? Allora adorerai questa visualizzazione. Rappresenta l'influenza di ogni personaggio in base al numero di volte in cui la loro interazione è apparsa nel libro “Una tempesta di spade”.
Nota che i nodi rappresentano i personaggi e i collegamenti l'interazione tra di loro. El tamaño del nodoNodo è una piattaforma digitale che facilita la connessione tra professionisti e aziende alla ricerca di talenti. Attraverso un sistema intuitivo, Consente agli utenti di creare profili, condividere esperienze e accedere a opportunità di lavoro. La sua attenzione alla collaborazione e al networking rende Nodo uno strumento prezioso per chi vuole ampliare la propria rete professionale e trovare progetti in linea con le proprie competenze e obiettivi.... y el nombre representa la influencia del personaje. Non c'è da meravigliarsi se Tyrion ha la maggiore influenza, verità?
Puoi creare la tua visualizzazione di Game of Thrones usando questo tutorial.
Visualizzazione dei dati in Python
Spesso pensiamo a Python come al linguaggio di programmazione definitivo per la scienza dei dati. Lo associamo alla pulizia dei dati, costruire modelli predittivi e persino determinate attività di ingegneria dei dati. Ma sapevi che Python è abbastanza utile per generare visualizzazioni di dati??
Ecco com'è, Python viene fornito con due librerie esclusive per la visualizzazione: matplotlib y seaborn. Puoi fare riferimento a questo articolo per saperne di più su queste librerie e vederle in azione.
Una mappa geologica di Marte
Questa visualizzazione è una bellezza. Qualche giorno fa mi sono imbattuta in questa mappa geologica di Marte e mi stupisce ancora che sia stata creata in Python (con un piccolo aiuto da Adobe Illustrator). Sorprendente!
Le librerie Python utilizzate per creare questa meravigliosa visualizzazione sono:
- Matplotlib
- NumPy
- panda
- Cartopia
Se il carattere è troppo piccolo per essere letto o se vuoi stamparlo come poster, obtenga la imagen de alta risoluzioneIl "risoluzione" si riferisce alla capacità di prendere decisioni ferme e raggiungere gli obiettivi prefissati. In contesti personali e professionali, Implica la definizione di obiettivi chiari e lo sviluppo di un piano d'azione per raggiungerli. La risoluzione è fondamentale per la crescita personale e il successo in vari ambiti della vita, In quanto ti permette di superare gli ostacoli e mantenere la concentrazione su ciò che conta davvero.... completo. qui. E puoi ottenere il codice Python per questa visualizzazione. qui. Il repository GitHub ha il tutorial completo per iniziare.
Tracciare satelliti geostazionari in Python
Sono affascinato dalla ricerca che la nostra comunità di data science sta facendo sui dati satellitari. Abbiamo assistito alla scoperta di nuovi pianeti, la ricreazione di immagini a livello del suolo, Previsione del terremoto della NASA, tra l'altro.
il Pacchetto PyEphem è stato usato per creare questa fantastica trama in Python. PyEphem ci permette fondamentalmente di implementare algoritmi astronomici in Python.
Un buon numero di appassionati di data science ha provato a tracciare questa visualizzazione e puoi trovare tutte le risorse. qui.
Note finali
Mi sono divertito molto a mettere insieme questa lista. Lavoro principalmente con R e Tableau, quindi è stato rivelatore vedere il tipo di visualizzazioni che possiamo generare usando D3.js. Cercherò sicuramente la mia fortuna lì.
C'è una visualizzazione in cui ti sei imbattuto che ti ha fatto impazzire?? Vai avanti e condividili con noi nella sezione commenti qui sotto. Questo è il posto migliore per essere creativi e imparare dalla comunità!!