Crea visualizzazioni di dati interattive con Plotly

Contenuti

introduzione

Nel mondo reale, ogni secondo i dati diventano più grandi. Per comprendere rapidamente i dati e ottenere informazioni, la visualizzazione dei dati diventa necessaria.

Ad esempio, Considera un caso in cui ti viene chiesto di illustrare aspetti di vendita cruciali (come performance di vendita, obbiettivo, reddito, costo di acquisizione, eccetera.) da grandi quantità di dati di vendita, quale preferiresti:

  1. Esplora i dati usando Excel (o fogli di calcolo) e monitorare manualmente ogni aspetto delle vendite.
  2. Esplora i dati utilizzando diversi tipi di grafici e tabelle di vendita.

Ovviamente, Preferirei grafici e tabelle. Perciò, la visualizzazione dei dati svolge un ruolo chiave nell'esplorazione e nell'analisi dei dati.

Visualizzazione dati è la tecnica per rappresentare i dati / informazioni in formato pittorico o grafico. Consente alle parti interessate e ai decisori di analizzare ed esplorare visivamente i dati e scoprire approfondimenti.

“La visualizzazione ti dà risposte a domande che non sapevi di avere”. – Ben Schneiderman

Vantaggi della visualizzazione dei dati

  • Aiuto nell'analisi dei dati, esplorazione dei dati e rende i dati più comprensibili.
  • Riassumi informazioni quantitative complesse in uno spazio ristretto.
  • Aiutaci a scoprire le ultime tendenze, modelli nascosti nei dati.
  • Identificare le relazioni / correlazioni tra variabili.
  • Aiuta a esaminare le aree che richiedono attenzione o miglioramento.

Perché trama??

Ci sono diverse librerie disponibili in Python come Matplotlib, Seaborn, eccetera. per la visualizzazione dei dati. Ma rappresentano solo le immagini statiche della grafica / grafica e, A causa di ciò, molte cose cruciali si perdono nella visualizzazione. Non sarebbe fantastico se potessimo interagire meglio con la grafica passandoci sopra con il mouse (oh) avvicinarsi? trama ci permette di fare lo stesso.

  • Plotly è una libreria di visualizzazione dati open source per la creazione di grafici / grafica interattiva di qualità da pubblicazione.
  • Plotly offre l'implementazione di molti tipi di grafici / oggetti diversi come il diagramma a linee, Diagramma di dispersione, diagramma di area, istogramma, trama a scatola, grafico a barre, eccetera.
  • Plotly supporta la stampa interattiva nei linguaggi di programmazione comunemente usati come Python, R, MATLAB, Javascript, eccetera.

In questo post, tratteremo i tipi di grafici più comunemente usati usando trama. Quindi iniziamo a usare Auto93 set di dati disponibile in Kaggle.

Il set di dati contiene 27 parametri Automobile (come produttore, segnare, prezzo, potenza, dimensione del motore, il peso, cilindri, airbag, passeggeri, eccetera.) a partire dal 93 auto diverse.

Il set di dati è simile a questo:

48818df_head-3681508

Nota aggiuntiva: Per accedere a tutto il codice Python, segui il kernel di Kaggle qui(https://www.kaggle.com/vikashrajluhaniwal/interactive-visualizations-using-plotly).

Installazione della trama

Per installare trama, usa il seguente comando nel terminale.

pip install plotly

Plotly viene fornito con pochi moduli per creare visualizzazioni, vale a dire, ci dà la possibilità di usarlo.

  • Veloce: Un'interfaccia di alto livello per creare visualizzazioni rapide. È un avvolgimento intorno a Plotly Graph_oggetti modulo.
  • Graph_oggetti: Un'interfaccia di basso livello per le figure, tratti e disegni. È altamente personalizzabile in generale per diverse grafiche / tavole.
  • figure_factory: Le fabbriche di forme sono funzioni dedicate alla creazione di tipi di grafica molto specifici. Era disponibile prima dell'esistenza di Plotly Veloce, così, obsoleto come “ereditato”.

Avendo conosciuto e installato trama, ora disegniamo grafici diversi / tabelle che lo usano.

1. Trama scatola

  • Un complotto a scatola (o trama a scatola e baffi) è un modo standardizzato di visualizzare la distribuzione dei dati quantitativi sulla base di un riepilogo in cinque punti (minimo, primo quartile (Q1), mediano (Q2), terzo quartile (Q3), e massimo).
  • Il riquadro si estende dai valori del quartile Q1 a Q3, mentre i baffi si estendono dai bordi della scatola fino all'IQR di 1,5 *. IQR = (Q3 – Q1)

Ora creiamo un box plot per le auto ‘ Prezzo caratteristica.
box-plot-of-price-2477278
La cosa migliore di questa visualizzazione è che possiamo iniziare a interagire con essa spostandoci per vedere i valori dei quantili.

Nello stesso modo, possiamo personalizzarlo secondo il requisito. Ad esempio, disegna un box plot di Prezzo per ciascuno AirBag scrive.

box-plot-di-prezzo-attraverso-i-tipi-airbag-1590059

2. Istogramma

  • Un istogramma è una rappresentazione accurata della distribuzione dei dati numerici.
  • Per costruire un istogramma, Segui questi passi:
    • Scomparto (il deposito) la gamma di valori: dividere l'intero intervallo di valori in una serie di intervalli.
    • Raccontare quanti valori cadono in ogni intervallo.

Disegniamo un istogramma per le auto ‘ Potenza caratteristica.

istogramma-di-cavalli-6600776

Qui, l'asse x riguarda gli intervalli di bin di Potenza mentre l'asse Y parla di frequenza / contare in ogni contenitore.

3. Grafico della densità

  • Il grafico della densità è una variazione di un istogramma, dove invece di rappresentare la frequenza sull'asse Y, rappresenta i valori PDF (Densità di probabilità).
  • È utile per determinare visivamente l'asimmetria del variabile.
  • Cosa c'è di più, utile per valutare l'importanza di una variabile continua per un problema di classificazione.

Il grafico della densità di Potenza basato su AirBag il tipo è come mostrato di seguito.

densità-plot-4179624

4. Grafico a barre

  • Un grafico a barre rappresenta dati categoriali con barre rettangolari con pesi proporzionali ai valori che rappresentano.
  • Un grafico a barre mostra i confronti tra categorie discrete.

Il grafico a barre del scrive la funzione è come mostrato di seguito.

barplot-di-tipo-3868219

Nello stesso modo, possiamo personalizzarlo per mostrare MPG.città significa sull'asse Y, invece di mostrare il conteggio.barplot-di-tipo-2-mpg-city-mean-9948082

5. Grafico a torta

  • Il grafico a torta viene utilizzato per rappresentare la proporzione numerica dei dati in un grafico a torta.
  • L'intera area del grafico rappresenta il 100% dei dati, la lunghezza dell'arco di ogni taglio rappresenta la percentuale relativa del tutto.

Il grafico a torta di scrive la funzione è come mostrato di seguito.

grafico a torta-1816478

?

6. Grafico a dispersione

  • Un grafico a dispersione utilizza i punti per rappresentare i valori per due diverse variabili numeriche.
  • È davvero utile osservare la relazione tra due variabili numeriche.

Tracciamo un grafico a dispersione per valutare la relazione tra Potenza e MPG.città.

trama-dispersione-di-cavalli-vs-mpg-city_-9991322

Da questo grafico, Possiamo vedere che misura Quello Potenza aumenta, MPG in città diminuisce.

Plotly fornisce anche un modo per disegnare grafici a dispersione 3D. Disegniamo lo stesso usando Potenza, MPG.città, e Prezzo caratteristiche.

3d-scatter-plot-2807458

Allo stesso modo, possiamo disegnare una matrice di grafici a dispersione (una griglia / matrice di grafici a dispersione) per valutare le relazioni a coppie per ogni combinazione di variabili.

matrice-trama-a dispersione-2311020

7. Grafico a linee

  • Un grafico a linee è un tipo di grafico che visualizza le informazioni come una serie di punti dati chiamati "marcatori".’ collegati da segmenti di linea retta.
  • È simile a un grafico a dispersione, tranne che i punti di misurazione sono ordinati (di solito dal suo valore sull'asse x) e uniti con segmenti di linea retta.
  • I grafici a linee vengono generalmente utilizzati per trovare relazioni tra due variabili numeriche o per visualizzare una tendenza nei dati delle serie temporali..

Tracciamo un grafico a dispersione per valutare la relazione tra Potenza e MPG.città.

grafico-linea-della-potenza-vs-mpg-city_-3581886

8. Mappa di calore

  • Una mappa termica è una rappresentazione grafica bidimensionale dei dati, mentre i valori della matrice sono rappresentati in diverse tonalità di colori.
  • Una mappa termica ha lo scopo di fornire un riepilogo visivo dei dati codificato a colori / informazione.
  • Seaborn consente anche mappe di calore annotate.

Disegniamo una mappa termica per rappresentare la matrice di correlazione di automobili93 dati.

correlazione-heatmap-7631883

9. Cornice per violino

  • I diagrammi per violino sono simili al box plot, tranne che mostrano anche la densità di probabilità dei dati a valori diversi. In altre parole, il diagramma di violino È una combinazione di box plot e diagramma di densità.
  • Sezioni più ampie della trama del violino indicano una probabilità maggiore, mentre le sezioni strette indicano una probabilità inferiore.

La trama del violino del Prezzo La funzione è mostrata di seguito.

violino-trama-del-prezzo-8180280

Nello stesso modo, possiamo personalizzarlo usando trama per visualizzare la tabella e tutti i punti dati.

violino-trama-del-prezzo-con-scatola-e-tutti-i-punti-7638628

10. nuvola di parole

  • Word Cloud è una tecnica di visualizzazione per rappresentare la frequenza delle parole all'interno di un dato segmento di testo.
  • La dimensione di una parola indica quanto spesso appare nel testo. Più grande è la taglia, maggiore è l'importanza (frequenza), mentre più piccola è la taglia, meno sarà l'importanza (frequenza).
  • Le nuvole di parole vengono spesso utilizzate per rappresentare la frequenza delle parole nei documenti di testo., rapporti, dati del sito web, discorsi pubblici, eccetera.

Nuvola di parole di un prescelto documento di testo è come mostrato di seguito.

53286wordcloud-6360280

Note finali

In questo articolo, discutiamo diversi tipi di grafica / grafica usando trama e Python. trama altamente raccomandato per la creazione di visualizzazioni interattive.

Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.