introduzione
Nel mondo reale, ogni secondo i dati diventano più grandi. Per comprendere rapidamente i dati e ottenere informazioni, la visualizzazione dei dati diventa necessaria.
Ad esempio, Considera un caso in cui ti viene chiesto di illustrare aspetti di vendita cruciali (come performance di vendita, obbiettivo, reddito, costo di acquisizione, eccetera.) da grandi quantità di dati di vendita, quale preferiresti:
- Esplora i dati usando Excel (o fogli di calcolo) e monitorare manualmente ogni aspetto delle vendite.
- Esplora i dati utilizzando diversi tipi di grafici e tabelle di vendita.
Ovviamente, Preferirei grafici e tabelle. Perciò, la visualizzazione dei dati svolge un ruolo chiave nell'esplorazione e nell'analisi dei dati.
Visualizzazione dati è la tecnica per rappresentare i dati / informazioni in formato pittorico o grafico. Consente alle parti interessate e ai decisori di analizzare ed esplorare visivamente i dati e scoprire approfondimenti.
“La visualizzazione ti dà risposte a domande che non sapevi di avere”. – Ben Schneiderman
Vantaggi della visualizzazione dei dati
- Aiuto nell'analisi dei dati, esplorazione dei dati e rende i dati più comprensibili.
- Riassumi informazioni quantitative complesse in uno spazio ristretto.
- Aiutaci a scoprire le ultime tendenze, modelli nascosti nei dati.
- Identificare le relazioni / correlazioni tra variabili.
- Aiuta a esaminare le aree che richiedono attenzione o miglioramento.
Perché trama??
Ci sono diverse librerie disponibili in Python come Matplotlib, Seaborn, eccetera. per la visualizzazione dei dati. Ma rappresentano solo le immagini statiche della grafica / grafica e, A causa di ciò, molte cose cruciali si perdono nella visualizzazione. Non sarebbe fantastico se potessimo interagire meglio con la grafica passandoci sopra con il mouse (oh) avvicinarsi? trama ci permette di fare lo stesso.
- Plotly è una libreria di visualizzazione dati open source per la creazione di grafici / grafica interattiva di qualità da pubblicazione.
- Plotly offre l'implementazione di molti tipi di grafici / oggetti diversi come il diagramma a linee, Diagramma di dispersioneIl grafico a dispersione è uno strumento grafico utilizzato in statistica per visualizzare la relazione tra due variabili. Consiste in un insieme di punti in un piano cartesiano, dove ogni punto rappresenta una coppia di valori corrispondenti alle variabili analizzate. Questo tipo di grafico consente di identificare i modelli, Tendenze e possibili correlazioni, facilitare l'interpretazione dei dati e il processo decisionale sulla base delle informazioni visive presentate...., diagramma di area, istogramma, trama a scatola, grafico a barre, eccetera.
- Plotly supporta la stampa interattiva nei linguaggi di programmazione comunemente usati come Python, R, MATLAB, Javascript, eccetera.
In questo post, tratteremo i tipi di grafici più comunemente usati usando trama. Quindi iniziamo a usare Auto93 set di dati disponibile in Kaggle.
Il set di dati contiene 27 parametriIl "parametri" sono variabili o criteri che vengono utilizzati per definire, misurare o valutare un fenomeno o un sistema. In vari campi come la statistica, Informatica e Ricerca Scientifica, I parametri sono fondamentali per stabilire norme e standard che guidano l'analisi e l'interpretazione dei dati. La loro corretta selezione e gestione sono fondamentali per ottenere risultati accurati e pertinenti in qualsiasi studio o progetto.... de automóvil (come produttore, segnare, prezzo, potenza, dimensione del motore, il peso, cilindri, airbag, passeggeri, eccetera.) a partire dal 93 auto diverse.
Il set di dati è simile a questo:
Nota aggiuntiva: Per accedere a tutto il codice Python, segui il kernel di Kaggle qui(https://www.kaggle.com/vikashrajluhaniwal/interactive-visualizations-using-plotly).
Installazione della trama
Per installare trama, usa il seguente comando nel terminale.
pip install plotly
Plotly viene fornito con pochi moduli per creare visualizzazioni, vale a dire, ci dà la possibilità di usarlo.
- Veloce: Un'interfaccia di alto livello per creare visualizzazioni rapide. È un avvolgimento intorno a Plotly Graph_oggetti modulo.
- Graph_oggetti: Un'interfaccia di basso livello per le figure, tratti e disegni. È altamente personalizzabile in generale per diverse grafiche / tavole.
- figure_factory: Le fabbriche di forme sono funzioni dedicate alla creazione di tipi di grafica molto specifici. Era disponibile prima dell'esistenza di Plotly Veloce, così, obsoleto come “ereditato”.
Avendo conosciuto e installato trama, ora disegniamo grafici diversi / tabelle che lo usano.
1. Trama scatola
- Un complotto a scatola (o trama a scatola e baffi) è un modo standardizzato di visualizzare la distribuzione dei dati quantitativi sulla base di un riepilogo in cinque punti (minimo, primo quartile (Q1), mediano (Q2), terzo quartile (Q3), e massimo).
- Il riquadro si estende dai valori del quartile Q1 a Q3, mentre i baffi si estendono dai bordi della scatola fino all'IQR di 1,5 *. IQR = (Q3 – Q1)
Ora creiamo un box plot per le auto ‘ Prezzo caratteristica.
La cosa migliore di questa visualizzazione è che possiamo iniziare a interagire con essa spostandoci per vedere i valori dei quantili.
Nello stesso modo, possiamo personalizzarlo secondo il requisito. Ad esempio, disegna un box plot di Prezzo per ciascuno AirBag scrive.
2. Istogramma
- Un istogramma è una rappresentazione accurata della distribuzione dei dati numerici.
- Per costruire un istogramma, Segui questi passi:
- Scomparto (il deposito) la gamma di valori: dividere l'intero intervallo di valori in una serie di intervalli.
- Raccontare quanti valori cadono in ogni intervallo.
Disegniamo un istogramma per le auto ‘ Potenza caratteristica.
Qui, l'asse x riguarda gli intervalli di bin di Potenza mentre l'asse Y parla di frequenza / contare in ogni contenitore.
3. Grafico della densità
- Il grafico della densità è una variazione di un istogramma, dove invece di rappresentare la frequenza sull'asse Y, rappresenta i valori PDF (Densità di probabilità).
- Es útil para determinar visualmente la asimetría de la variabileIn statistica e matematica, un "variabile" è un simbolo che rappresenta un valore che può cambiare o variare. Esistono diversi tipi di variabili, e qualitativo, che descrivono caratteristiche non numeriche, e quantitativo, che rappresentano quantità numeriche. Le variabili sono fondamentali negli esperimenti e negli studi, poiché consentono l'analisi delle relazioni e dei modelli tra elementi diversi, facilitare la comprensione di fenomeni complessi.....
- Cosa c'è di più, utile per valutare l'importanza di una variabile continua per un problema di classificazione.
Il grafico della densità di Potenza basato su AirBag il tipo è come mostrato di seguito.
4. Grafico a barreEl gráfico de barras es una representación visual de datos que utiliza barras rectangulares para mostrar comparaciones entre diferentes categorías. Cada barra representa un valor y su longitud es proporcional a este. Este tipo de gráfico es útil para visualizar y analizar tendencias, facilitando la interpretación de información cuantitativa. Es ampliamente utilizado en diversas disciplinas, como la estadística, el marketing y la investigación, debido a su simplicidad y efectividad....
- Un grafico a barre rappresenta dati categoriali con barre rettangolari con pesi proporzionali ai valori che rappresentano.
- Un grafico a barre mostra i confronti tra categorie discrete.
Il grafico a barre del scrive la funzione è come mostrato di seguito.
Nello stesso modo, possiamo personalizzarlo per mostrare MPG.città significa sull'asse Y, invece di mostrare il conteggio.
5. Grafico a tortaEl gráfico circular, también conocido como diagrama de sectores, es una representación visual que muestra la proporción de diferentes partes respecto a un todo. Se utiliza comúnmente en estadísticas para ilustrar la distribución de datos categóricos. Cada sección del gráfico representa un porcentaje del total, facilitando la comparación entre categorías. Su diseño claro y conciso lo convierte en una herramienta efectiva para la presentación de información cuantitativa....
- Il grafico a torta viene utilizzato per rappresentare la proporzione numerica dei dati in un grafico a torta.
- L'intera area del grafico rappresenta il 100% dei dati, la lunghezza dell'arco di ogni taglio rappresenta la percentuale relativa del tutto.
Il grafico a torta di scrive la funzione è come mostrato di seguito.
?
6. Grafico a dispersioneUn gráfico de dispersión es una representación visual que muestra la relación entre dos variables numéricas mediante puntos en un plano cartesiano. Cada eje representa una variable, y la ubicación de cada punto indica su valor en relación con ambas. Este tipo de gráfico es útil para identificar patrones, correlaciones y tendencias en los datos, facilitando el análisis y la interpretación de relaciones cuantitativas....
- Un grafico a dispersione utilizza i punti per rappresentare i valori per due diverse variabili numeriche.
- È davvero utile osservare la relazione tra due variabili numeriche.
Tracciamo un grafico a dispersione per valutare la relazione tra Potenza e MPG.città.
Da questo grafico, podemos observar que a misuraIl "misura" È un concetto fondamentale in diverse discipline, che si riferisce al processo di quantificazione delle caratteristiche o delle grandezze degli oggetti, fenomeni o situazioni. In matematica, Utilizzato per determinare le lunghezze, Aree e volumi, mentre nelle scienze sociali può riferirsi alla valutazione di variabili qualitative e quantitative. L'accuratezza della misurazione è fondamentale per ottenere risultati affidabili e validi in qualsiasi ricerca o applicazione pratica.... Quello Potenza aumenta, MPG in città diminuisce.
Plotly fornisce anche un modo per disegnare grafici a dispersione 3D. Disegniamo lo stesso usando Potenza, MPG.città, e Prezzo caratteristiche.
Allo stesso modo, possiamo disegnare una matrice di grafici a dispersione (una griglia / matrice di grafici a dispersione) per valutare le relazioni a coppie per ogni combinazione di variabili.
7. Grafico a lineeEl gráfico de líneas es una herramienta visual utilizada para representar datos a lo largo del tiempo. Consiste en una serie de puntos conectados por líneas, lo que permite observar tendencias, fluctuaciones y patrones en los datos. Este tipo de gráfico es especialmente útil en áreas como la economía, la meteorología y la investigación científica, facilitando la comparación de diferentes conjuntos de datos y la identificación de comportamientos a lo...
- Un grafico a linee è un tipo di grafico che visualizza le informazioni come una serie di punti dati chiamati "marcatori".’ collegati da segmenti di linea retta.
- È simile a un grafico a dispersione, tranne che i punti di misurazione sono ordinati (di solito dal suo valore sull'asse x) e uniti con segmenti di linea retta.
- I grafici a linee vengono generalmente utilizzati per trovare relazioni tra due variabili numeriche o per visualizzare una tendenza nei dati delle serie temporali..
Tracciamo un grafico a dispersione per valutare la relazione tra Potenza e MPG.città.
8. Mappa di caloreun "mappa di calore" es una representación gráfica que utiliza colores para mostrar la densidad de datos en un área específica. Comúnmente utilizado en análisis de datos, marketing y estudios de comportamiento, este tipo de visualización permite identificar patrones y tendencias rápidamente. A través de variaciones cromáticas, los mapas de calor facilitan la interpretación de grandes volúmenes de información, ayudando a la toma de decisiones informadas....
- Una mappa termica è una rappresentazione grafica bidimensionale dei dati, mentre i valori della matrice sono rappresentati in diverse tonalità di colori.
- Una mappa termica ha lo scopo di fornire un riepilogo visivo dei dati codificato a colori / informazione.
- Seaborn consente anche mappe di calore annotate.
Disegniamo una mappa termica per rappresentare la matrice di correlazione di automobili93 dati.
9. Cornice per violino
- Los diagramas de violín son similares a los box plotDiagrammi a scatola, Conosciuto anche come diagrammi a scatola e baffi, sono strumenti statistici che rappresentano la distribuzione di un dataset. Questi diagrammi mostrano la mediana, quartili e valori anomali, Consentire la visualizzazione della variabilità e della simmetria dei dati. Sono utili nel confronto tra diversi gruppi e nell'analisi esplorativa, Rendendo più facile identificare tendenze e modelli nei dati...., tranne che mostrano anche la densità di probabilità dei dati a valori diversi. In altre parole, il diagramma di violinoEl diagrama de violín es una representación gráfica que combina características de un boxplot y un gráfico de densidad. Se utiliza para visualizar la distribución de un conjunto de datos, mostrando tanto la mediana como la variabilidad a través de su forma, que se asemeja a un violín. Este tipo de gráfico es muy útil en análisis estadísticos, ya que permite comparar múltiples distribuciones de forma clara y efectiva.... es una combinación de diagrama de caja y diagrama de densidad.
- Sezioni più ampie della trama del violino indicano una probabilità maggiore, mentre le sezioni strette indicano una probabilità inferiore.
La trama del violino del Prezzo La funzione è mostrata di seguito.
Nello stesso modo, possiamo personalizzarlo usando trama per visualizzare la tabella e tutti i punti dati.
10. nuvola di parole
- Word Cloud è una tecnica di visualizzazione per rappresentare la frequenza delle parole all'interno di un dato segmento di testo.
- La dimensione di una parola indica quanto spesso appare nel testo. Più grande è la taglia, maggiore è l'importanza (frequenza), mentre più piccola è la taglia, meno sarà l'importanza (frequenza).
- Le nuvole di parole vengono spesso utilizzate per rappresentare la frequenza delle parole nei documenti di testo., rapporti, dati del sito web, discorsi pubblici, eccetera.
Nuvola di parole di un prescelto documento di testo è come mostrato di seguito.
Note finali
In questo articolo, discutiamo diversi tipi di grafica / grafica usando trama e Python. trama altamente raccomandato per la creazione di visualizzazioni interattive.
Il supporto mostrato in questo articolo non è di proprietà di DataPeaker e viene utilizzato a discrezione dell'autore.