Cos'è la visualizzazione dei dati??
“Un'immagine vale più di mille parole.” Allo stesso modo, un'infografica / visual può aiutarci ad analizzare dati e schemi nascosti in un modo molto più semplice. Questa è una guida completa per coprire le basi della visualizzazione. Ho cercato di incorporare un esempio utilizzando i dati sulla sopravvivenza al cancro di Haberman per mostrare come le immagini possono aiutarci a trovare modelli nei dati che i numeri non mostrano.. Cominciamo!
Perché visualizzare i dati?
La visualizzazione dei dati è un modo per creare una storia attraverso i tuoi dati. Quando i dati sono complessi e la comprensione dei micro dettagli è essenziale, il modo migliore è analizzare i dati attraverso le immagini.
Le immagini possono essere utilizzate per due scopi:
1. Analisi esplorativa dei dati: utilizzato dagli analisti di dati, statistici e data scientist per comprendere meglio i dati. Come si chiama con ragione, usato per esplorare le tendenze nascoste, i modelli nei dati.
2. Analisi esplicativa dei dati: una volta che gli analisti comprendono i dati e trovano i risultati, il modo migliore per trasmettere le tue idee e le tue scoperte è attraverso le immagini. Questo viene utilizzato per creare una storia che coinvolga lo spettatore e offra approfondimenti più profondi..
Analisi esplorativa dei dati di sopravvivenza di Haberman
Il set di dati contiene casi di uno studio condotto tra 1958 e 1970 presso l'Università di Chicago Billings Hospital sulla sopravvivenza dei pazienti che hanno subito un intervento chirurgico per il cancro al seno.
Gli attributi includono:
- Età del paziente al momento dell'intervento (numerico)
- Anno di funzionamento del paziente (anno – 1900, numerico)
- Numero di linfonodi ascellari positivi rilevati (numerico)
- stato di sopravvivenza (attributo di classe)
1 = il paziente è sopravvissuto 5 anni o più
2 = il paziente è morto entro 5 anni
Iniziamo utilizzando le statistiche per comprendere prima i dati.:
Vediamo che c'è 306 righe e 4 colonne. Cosa c'è di più, durante la visualizzazione degli attributi, capiamo come vengono distribuiti i dati. Per saperne di più quanti esempi di ogni classe abbiamo, podemos usar un grafico a barreEl gráfico de barras es una representación visual de datos que utiliza barras rectangulares para mostrar comparaciones entre diferentes categorías. Cada barra representa un valor y su longitud es proporcional a este. Este tipo de gráfico es útil para visualizar y analizar tendencias, facilitando la interpretación de información cuantitativa. Es ampliamente utilizado en diversas disciplinas, como la estadística, el marketing y la investigación, debido a su simplicidad y efectividad.....
Vediamo che i dati sono sbilanciati con più sopravvissuti di quelli che non potrebbero sopravvivere. Per scansionare ulteriormente i dati, vediamo una grafica diversa.
Densità di probabilità
Una grande parte, vale a dire, a partire dal 30 un 80 anni, sovrapposizioni tra le due classi.
Persone nella fascia di età di 20 un 40 hanno maggiori probabilità di sopravvivere, 40 un 60 hanno maggiori probabilità di non sopravvivere, gruppi di 60 un 80 hanno le stesse possibilità di sopravvivenza e di morte, e> 80 avere maggiori possibilità di non sopravvivere.
L'età da sola non può dire se una persona sopravviverà o no.
Trama scatola
Il box plotDiagrammi a scatola, Conosciuto anche come diagrammi a scatola e baffi, sono strumenti statistici che rappresentano la distribuzione di un dataset. Questi diagrammi mostrano la mediana, quartili e valori anomali, Consentire la visualizzazione della variabilità e della simmetria dei dati. Sono utili nel confronto tra diversi gruppi e nell'analisi esplorativa, Rendendo più facile identificare tendenze e modelli nei dati.... nos informan sobre la distribución de datos y escanean valores atípicos. Nota che i sopravvissuti hanno meno nodi di quelli che non potrebbero sopravvivere. Interessante! Non è così? Si noti inoltre che sebbene il numero di nodi sia una caratteristica più utile, c'è qualche sovrapposizione con entrambe le classi.
Grafico a dispersione
Vediamo nei punti sparsi che, indipendentemente dall'anno, il numero di pazienti che hanno 0 gangli sono stati sopravvissuti. Questo significa che? 0 i nodi assicurano la sopravvivenza? Guarda la trama del violino!
Cornice per violino
Nel grafico sopra, vediamo che non ci sono sopravvissuti con 0 nodi. I grafici a violino ci consentono di vedere la distribuzione e i grafici a scatola in una singola immagine. Utile! Non è così? C'è molto che possiamo imparare dalle immagini. Visualizzare per capire. Visualizza per spiegare la tua comprensione. Ho raccolto alcuni suggerimenti e strumenti per iniziare.
Strumenti di visualizzazione dei dati
Foto: Facile da usare, efficace e sicuro. È molto popolare e viene utilizzato per preelaborare e visualizzare efficacemente i dati. È anche possibile condividere i dati.
Microsoft Power BI: Piattaforma di visualizzazione dei dati focalizzata sulla creazione di soluzioni basate sui dati per problemi aziendali. Utilizzato per la preelaborazione, analizzare e condividere intuizioni significative con facilità. Altri strumenti includono FusionCharts, Trattino, trama, QlikView.
MS Excel: Questo è lo strumento più comune utilizzato dagli analisti per gestire i dati, ordine, visualizzare e preelaborare rapidamente i dati.
Buone pratiche e suggerimenti
Usa una combinazione di colori coerente per le tue immagini: Mentre il colore aggiunge significato e bellezza a una grafica, spesso è meglio usare i colori per evidenziare dettagli importanti e non solo per attrattiva. Troppi colori distruggeranno lo scopo colorante, mentre l'utilizzo di un solo colore o troppe sfumature di un colore può confondere gli spettatori. Cosa c'è di più, considerare i non vedenti quando si progettano le immagini. Usa i colori in modo intuitivo. Ad esempio: per l'analisi del sentimento, possiamo usare il colore verde per le emozioni positive, rosso per le emozioni negative e verde per i neutri.
Usa la taglia, la forma e il formato per trasmettere la semantica: Utilizzo delle dimensioni, forme come cerchi e quadrati possono aggiungere significato semantico e, così, aiuta gli spettatori ad assorbire i dati con facilità. Cosa c'è di più, notare che, A volte, disporre i grafici a barre in ordine crescente ha più senso (nel caso di dati ordinali) per organizzarli in ordine alfabetico o casuale.
Usa leyendas, parole per registrare correttamente i dati: Usa le etichette dove necessario, ma non ingombrare il grafico con il testo. Usa i dati di testo con saggezza. Posiziona i dati visivi in un modo che sia facile da capire.
Usa grafici interattivi: I grafici di gara e i grafici interattivi aggiungono valore e aiutano gli spettatori a interagire con i dati in modo più approfondito.
Rimuovi la posta indesiderata dal grafico: Elimina la spazzatura grafica non necessaria che potrebbe distrarre gli spettatori. Non combinare più viste in un'unica immagine al punto che è difficile da capire. Usa la bilancia per contare l'immagine reale.
Etichettatura dei dati: Etichetta i tuoi dati in modo accurato. Non etichettare troppo. Assicurati che le etichette siano visibili e orientate correttamente. Non aggiungere dimensioni alle immagini che possono portare a pregiudizi.
Crea una storia completa: Concentrati sull'immagine più grande che stai cercando di catturare. Si prega di non fornire immagini imprecise o fuorvianti. Usa saggiamente gli strumenti visivi per parlare più del testo.
Errori comuni da evitare durante la visualizzazione dei dati
Utilizzo di una visuale quando potrebbe non essere necessario: Se i dati possono essere comunicati in modo efficace con le statistiche, non c'è bisogno di creare immagini. Le immagini facilitano l'analisi di ciò che i numeri non possono trasmettere. Perciò, scegli saggiamente quando usare uno strumento visivo.
Sei davvero sicuro di quello che stai cercando di trasmettere?? : La correlazione non implica causa. Dobbiamo assicurarci che i nostri risultati siano supportati da un'adeguata ricerca e sperimentazione prima di saltare alle cause.
Utilizzo di immagini 3D: Assicurati che la vista 3D non nasconda una parte dei dati o li distorca. Usa la grafica 3D con estrema cura. Non aggiungere indicazioni che potrebbero fuorviare lo spettatore e distruggere lo scopo del display.
Dove trovare più risorse e corsi?
Ci sono molti corsi, blog e libri per aiutarci a comprendere in profondità la visualizzazione.
Per meravigliosi siti web di blog: https://www.tableau.com/learn/articles/best-data-visualization-blogs, Visualizzazione dati, e Reddit essere il mio preferito.
Per i corsi gratuiti: Foto offre corsi di visualizzazione dei dati gratuiti che sono obbligatori. Kaggle ha anche corsi di visualizzazione dei dati di base gratuiti con esercizi pratici. Ci sono diversi corsi disponibili in DataPeaker, Coursera, Udemy, Audacia che aiuta nell'apprendimento.
Per i libri: dai un'occhiata a questo elenco curato di libri https://www.tableau.com/learn/articles/books-about-data-visualization essere i miei preferiti La presentazione visiva delle informazioni quantitative di Edward Tufte e Raccontare con i dati di Cole.
Ultime parole
Come produttori di dati, dobbiamo assicurarci di visualizzare sempre le informazioni corrette. Manipolare i consumatori per fargli vedere ciò che vogliamo deve essere evitato a tutti i costi.
Come consumatori di dati, abbiamo bisogno di vedere ogni elemento visivo in modo critico per assicurarci di vedere oltre ciò che l'elemento visivo ci persuade a vedere.
Spero ti sia piaciuto il contenuto. Per qualsiasi domanda, puoi raggiungermi a [e-mail protetta] o lascia un commento qui sotto.
Riferimenti
https://www.tableau.com/learn/articles/best-data-visualization-blogs
https://www.toptal.com/designers/ux/data-visualization-mistakes
https://blog.hubspot.com/marketing/great-data-visualization-examples
Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.
Imparentato
Articoli correlati:
- Visualizzazione dei dati in Python | Visualizzazione dei dati per principianti
- Visualizzazione dei dati in R | Guida alla visualizzazione dei dati in R
- Seaborn per la visualizzazione dei dati | Una guida per principianti a Seaborn
- Strumenti di visualizzazione dei dati | I migliori strumenti di visualizzazione dei dati da padroneggiare 2021