Visualizzazione dati | Guida alla visualizzazione dei dati per principianti

Contenuti

Cos'è la visualizzazione dei dati??

“Un'immagine vale più di mille parole.” Allo stesso modo, un'infografica / visual può aiutarci ad analizzare dati e schemi nascosti in un modo molto più semplice. Questa è una guida completa per coprire le basi della visualizzazione. Ho cercato di incorporare un esempio utilizzando i dati sulla sopravvivenza al cancro di Haberman per mostrare come le immagini possono aiutarci a trovare modelli nei dati che i numeri non mostrano.. Cominciamo!

Perché visualizzare i dati?

La visualizzazione dei dati è un modo per creare una storia attraverso i tuoi dati. Quando i dati sono complessi e la comprensione dei micro dettagli è essenziale, il modo migliore è analizzare i dati attraverso le immagini.

Le immagini possono essere utilizzate per due scopi:

1. Analisi esplorativa dei dati: utilizzato dagli analisti di dati, statistici e data scientist per comprendere meglio i dati. Come si chiama con ragione, usato per esplorare le tendenze nascoste, i modelli nei dati.

2. Analisi esplicativa dei dati: una volta che gli analisti comprendono i dati e trovano i risultati, il modo migliore per trasmettere le tue idee e le tue scoperte è attraverso le immagini. Questo viene utilizzato per creare una storia che coinvolga lo spettatore e offra approfondimenti più profondi..

Analisi esplorativa dei dati di sopravvivenza di Haberman

Il set di dati contiene casi di uno studio condotto tra 1958 e 1970 presso l'Università di Chicago Billings Hospital sulla sopravvivenza dei pazienti che hanno subito un intervento chirurgico per il cancro al seno.

Gli attributi includono:

  1. Età del paziente al momento dell'intervento (numerico)
  2. Anno di funzionamento del paziente (anno – 1900, numerico)
  3. Numero di linfonodi ascellari positivi rilevati (numerico)
  4. stato di sopravvivenza (attributo di classe)
    1 = il paziente è sopravvissuto 5 anni o più
    2 = il paziente è morto entro 5 anni

Iniziamo utilizzando le statistiche per comprendere prima i dati.:

Vediamo che c'è 306 righe e 4 colonne. Cosa c'è di più, durante la visualizzazione degli attributi, capiamo come vengono distribuiti i dati. Per saperne di più quanti esempi di ogni classe abbiamo, Possiamo usare un grafico a barre.

Vediamo che i dati sono sbilanciati con più sopravvissuti di quelli che non potrebbero sopravvivere. Per scansionare ulteriormente i dati, vediamo una grafica diversa.

Densità di probabilità

37539pngbase64f4179042f7cb83af-3563474
  1. Una grande parte, vale a dire, a partire dal 30 un 80 anni, sovrapposizioni tra le due classi.

  2. Persone nella fascia di età di 20 un 40 hanno maggiori probabilità di sopravvivere, 40 un 60 hanno maggiori probabilità di non sopravvivere, gruppi di 60 un 80 hanno le stesse possibilità di sopravvivenza e di morte, e> 80 avere maggiori possibilità di non sopravvivere.

  3. L'età da sola non può dire se una persona sopravviverà o no.

Trama scatola

92077pngbase64b6efaacb25db3b16-8064648

Il box plot Ci informano sulla distribuzione dei dati e sui valori anomali della scansione. Nota che i sopravvissuti hanno meno nodi di quelli che non potrebbero sopravvivere. Interessante! Non è così? Si noti inoltre che sebbene il numero di nodi sia una caratteristica più utile, c'è qualche sovrapposizione con entrambe le classi.

Grafico a dispersione

53033pngbase64daeac30b9f2205c9-3137052

Vediamo nei punti sparsi che, indipendentemente dall'anno, il numero di pazienti che hanno 0 gangli sono stati sopravvissuti. Questo significa che? 0 i nodi assicurano la sopravvivenza? Guarda la trama del violino!

Cornice per violino

85156pngbase6473ecdfb915bf8322-3770793

Nel grafico sopra, vediamo che non ci sono sopravvissuti con 0 nodi. I grafici a violino ci consentono di vedere la distribuzione e i grafici a scatola in una singola immagine. Utile! Non è così? C'è molto che possiamo imparare dalle immagini. Visualizzare per capire. Visualizza per spiegare la tua comprensione. Ho raccolto alcuni suggerimenti e strumenti per iniziare.

Strumenti di visualizzazione dei dati

  1. Foto: Facile da usare, efficace e sicuro. È molto popolare e viene utilizzato per preelaborare e visualizzare efficacemente i dati. È anche possibile condividere i dati.

  2. Microsoft Power BI: Piattaforma di visualizzazione dei dati focalizzata sulla creazione di soluzioni basate sui dati per problemi aziendali. Utilizzato per la preelaborazione, analizzare e condividere intuizioni significative con facilità. Altri strumenti includono FusionCharts, Trattino, trama, QlikView.

  3. MS Excel: Questo è lo strumento più comune utilizzato dagli analisti per gestire i dati, ordine, visualizzare e preelaborare rapidamente i dati.

Buone pratiche e suggerimenti

Usa una combinazione di colori coerente per le tue immagini: Mentre il colore aggiunge significato e bellezza a una grafica, spesso è meglio usare i colori per evidenziare dettagli importanti e non solo per attrattiva. Troppi colori distruggeranno lo scopo colorante, mentre l'utilizzo di un solo colore o troppe sfumature di un colore può confondere gli spettatori. Cosa c'è di più, considerare i non vedenti quando si progettano le immagini. Usa i colori in modo intuitivo. Ad esempio: per l'analisi del sentimento, possiamo usare il colore verde per le emozioni positive, rosso per le emozioni negative e verde per i neutri.

Usa la taglia, la forma e il formato per trasmettere la semantica: Utilizzo delle dimensioni, forme come cerchi e quadrati possono aggiungere significato semantico e, così, aiuta gli spettatori ad assorbire i dati con facilità. Cosa c'è di più, notare che, A volte, disporre i grafici a barre in ordine crescente ha più senso (nel caso di dati ordinali) per organizzarli in ordine alfabetico o casuale.

Usa leyendas, parole per registrare correttamente i dati: Usa le etichette dove necessario, ma non ingombrare il grafico con il testo. Usa i dati di testo con saggezza. Posiziona i dati visivi in ​​un modo che sia facile da capire.

Usa grafici interattivi: I grafici di gara e i grafici interattivi aggiungono valore e aiutano gli spettatori a interagire con i dati in modo più approfondito.

Rimuovi la posta indesiderata dal grafico: Elimina la spazzatura grafica non necessaria che potrebbe distrarre gli spettatori. Non combinare più viste in un'unica immagine al punto che è difficile da capire. Usa la bilancia per contare l'immagine reale.

Etichettatura dei dati: Etichetta i tuoi dati in modo accurato. Non etichettare troppo. Assicurati che le etichette siano visibili e orientate correttamente. Non aggiungere dimensioni alle immagini che possono portare a pregiudizi.

Crea una storia completa: Concentrati sull'immagine più grande che stai cercando di catturare. Si prega di non fornire immagini imprecise o fuorvianti. Usa saggiamente gli strumenti visivi per parlare più del testo.

Errori comuni da evitare durante la visualizzazione dei dati

  1. Utilizzo di una visuale quando potrebbe non essere necessario: Se i dati possono essere comunicati in modo efficace con le statistiche, non c'è bisogno di creare immagini. Le immagini facilitano l'analisi di ciò che i numeri non possono trasmettere. Perciò, scegli saggiamente quando usare uno strumento visivo.

  2. Sei davvero sicuro di quello che stai cercando di trasmettere?? : La correlazione non implica causa. Dobbiamo assicurarci che i nostri risultati siano supportati da un'adeguata ricerca e sperimentazione prima di saltare alle cause.

  3. Utilizzo di immagini 3D: Assicurati che la vista 3D non nasconda una parte dei dati o li distorca. Usa la grafica 3D con estrema cura. Non aggiungere indicazioni che potrebbero fuorviare lo spettatore e distruggere lo scopo del display.

Dove trovare più risorse e corsi?

Ci sono molti corsi, blog e libri per aiutarci a comprendere in profondità la visualizzazione.

Per meravigliosi siti web di blog: https://www.tableau.com/learn/articles/best-data-visualization-blogs, Visualizzazione dati, e Reddit essere il mio preferito.

Per i corsi gratuiti: Foto offre corsi di visualizzazione dei dati gratuiti che sono obbligatori. Kaggle ha anche corsi di visualizzazione dei dati di base gratuiti con esercizi pratici. Ci sono diversi corsi disponibili in DataPeaker, Coursera, Udemy, Audacia che aiuta nell'apprendimento.

Per i libri: dai un'occhiata a questo elenco curato di libri https://www.tableau.com/learn/articles/books-about-data-visualization essere i miei preferiti La presentazione visiva delle informazioni quantitative di Edward Tufte e Raccontare con i dati di Cole.

Ultime parole

Come produttori di dati, dobbiamo assicurarci di visualizzare sempre le informazioni corrette. Manipolare i consumatori per fargli vedere ciò che vogliamo deve essere evitato a tutti i costi.

Come consumatori di dati, abbiamo bisogno di vedere ogni elemento visivo in modo critico per assicurarci di vedere oltre ciò che l'elemento visivo ci persuade a vedere.

Spero ti sia piaciuto il contenuto. Per qualsiasi domanda, puoi raggiungermi a [e-mail protetta] o lascia un commento qui sotto.

Riferimenti

  1. https://www.tableau.com/learn/articles/data-visualization

  2. https://www.tableau.com/learn/articles/best-data-visualization-blogs

  3. https://www.toptal.com/designers/ux/data-visualization-mistakes

  4. https://blog.hubspot.com/marketing/great-data-visualization-examples

Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.