introduzione
“La visualizzazione ti dà risposte a domande che non sapevi di avere”. – Ben Shneiderman
Il mio lavoro quotidiano come data scientist richiede molta sperimentazione. Questo significa che mi fido molto Visualizzazione dati per esplorare il set di dati su cui sto lavorando.
E non potrei relazionarmi di più con la citazione di Ben Shneiderman!! La visualizzazione dei dati mi dà risposte a domande che non avevo nemmeno considerato prima. Dopotutto, un'immagine vale mille punti dati!
Questo porta naturalmente alla domanda da un milione di dollari., Quello Chiodo Quale libreria dovrei usare per la visualizzazione dei dati? Ce ne sono parecchi su tutta la linea. Anche i data scientist esperti possono perdersi nella miriade di funzionalità offerte da ogni libreria Python..
Ecco perché ho voluto scrivere questo articolo esponendo i vantaggi e le caratteristiche uniche delle diverse librerie di visualizzazione dei dati Python.. Tratteremo alcune delle librerie di visualizzazione più sorprendenti supportate da Python.. Ognuna di queste librerie ha il proprio stile ed è davvero utile per un particolare tipo di attività di visualizzazione..
Quindi senza ulteriori indugi, Iniziamo!
Se non conosci Python e / o visualizzazione dei dati, Ti suggerisco di dare un'occhiata alle seguenti risorse di Analytics Vidhya:
Il 6 Librerie di visualizzazione dei dati Python di cui parleremo
- Matplotlib
- Seaborn
- bokeh
- Altair
- trama
- ggplot
1. Matplotlib
È probabile che tu abbia già utilizzato matplotlib nel tuo viaggio nella scienza dei dati. Dai principianti della scienza dei dati ai professionisti esperti che creano visualizzazioni di dati complesse, matplotlib è di solito la visualizzazione predefinita su cui ricorrono gli scienziati dei dati della libreria Python.
matplotlib è noto per la grande flessibilità che offre come libreria di plottaggio 2D in Python. Se hai esperienza nella programmazione MATLAB, L'interfaccia Pyplot di Matplotlib ti sembrerà molto familiare. Sarai pronto con la tua prima visione in pochissimo tempo!!
Caratteristiche uniche di Matplotlib
Matplotlib può essere usato in diversi modi in Python, inclusi gli script Python, le shell di Python e iPython, Quaderni Jupyter e altre cose. Ecco perché viene spesso utilizzato per creare visualizzazioni non solo dai data scientist., ma anche dai ricercatori per creare grafica di qualità da pubblicazione.
Matplotlib supporta tutti i grafici più diffusi (molte, istogrammiGli istogrammi sono rappresentazioni grafiche che mostrano la distribuzione di un set di dati. Sono costruiti dividendo l'intervallo di valori in intervalli, oh "Bidoni", e il conteggio della quantità di dati che cadono in ogni intervallo. Questa visualizzazione consente di identificare i modelli, tendenze e variabilità dei dati in modo efficace, facilitare l'analisi statistica e il processo decisionale informato in varie discipline...., spettri di potenza, grafici a barre, grafica di errore, diagrammi a dispersione, eccetera.) Dal primo momento. Ci sono anche estensioni che puoi usare per creare visualizzazioni avanzate come la grafica 3D., eccetera.
Quello che personalmente mi piace di matplotlib è che, perché è così flessibile, consente all'utente di controllare gli aspetti del display al livello più granulare, da una singola linea o punto sul grafico all'intero grafico. Ciò significa che puoi personalizzarlo al massimo livello..
Tutorial (è) per imparare matplotlib
Ecco alcuni tutorial utili per imparare matplotlib:
Ecco il creatore di Matplotlib che offre un tutorial introduttivo:
2. Seaborn
Quando guardo le visualizzazioni create da Seaborn, mi viene in mente solo una parola: bello! Seaborn è basato su matplotlib e fornisce un'interfaccia molto semplice ma intuitiva per la creazione di visualizzazioni. Al usar Seaborn, noterai anche che molte delle impostazioni predefinite nei grafici funzionano abbastanza bene fin da subito.
Caratteristiche uniche di Seaborn
La prima caratteristica unica di Seaborn è che è progettato in modo tale da scrivere molto meno codice per ottenere visualizzazioni di alto livello.. Ecco un esempio di questa semplicità. Guarda come possiamo creare una visualizzazione complessa con una singola riga di codice di stampa:
La seconda caratteristica utile di Seaborn è che supporta un gran numero di grafica avanzata come la stampa categorica. (trama del gatto), il grafico di distribuzione usando kde (distplot), il grafico dello sciame, eccetera. Dal primo momento. E, Certo, abbiamo visto un esempio di replot sopra.
Ora, perché Seaborn è costruito su matplotlib, è altamente compatibile con lui. Ciò significa che quando si creano visualizzazioni, puoi iniziare con grafici avanzati già supportati da seaborn e poi personalizzarli quanto vuoi con l'aiuto di matplotlib.
Tutorial (è) per imparare Seaborn
Ecco alcune risorse utili che puoi utilizzare per iniziare a utilizzare la libreria Seaborn per la visualizzazione dei dati:
3. bokeh
Bokeh è una libreria progettata per generare visualizzazioni intuitive sull'interfaccia web e sui browser. Ed è proprio questo l'obiettivo specifico di questa libreria display..
Noterai anche che le visualizzazioni generate da Bokeh sono di natura interattiva., il che significa sostanzialmente che puoi trasmettere informazioni in modo più intuitivo attraverso la tua grafica.
Caratteristiche uniche del bokeh
Bokeh supporta visualizzazioni uniche come i diagrammi geospaziali, grafica di rete, eccetera. Dal primo momento. Se vuoi mostrare queste visualizzazioni in un browser, ci sono opzioni disponibili per esportarli e puoi anche usarli tramite javascript.
Tutorial per imparare il Bokeh
Ecco un buon tutorial per imparare Bokeh per la visualizzazione dei dati:
4. Altair
Altair è una libreria dichiarativa per la visualizzazione dei dati. Il suo principio è che, invece di concentrarti sulla parte del codice, uno dovrebbe concentrarsi sulla parte del display e scrivere il minor codice possibile ed essere ancora in grado di creare una grafica bella e intuitiva. Questo è nel mio vicolo!
Le caratteristiche uniche di Altair
Poiché Altair utilizza uno stile dichiarativo per creare la grafica, è molto facile e veloce scorrere le visualizzazioni e gli esperimenti a un ritmo veloce quando si utilizza questa libreria.
Tutorial (è) per imparare Altair
Ecco una buona introduzione ad Altair in Python:
5. trama
La prima cosa che mi viene in mente quando penso a Plotly è l'interattività!! Questa libreria di visualizzazione dei dati è, con molto, la mia libreria a cui mi rivolgo quando voglio creare visualizzazioni che dovrebbero essere altamente interattive per l'utente.
Basta guardare questa visualizzazione creata usando Plotly:
Caratteristiche uniche di Plotly
Plotly è altamente compatibile con Jupyter Notebook e browser web. Ciò significa che qualsiasi trama interattiva che crei può essere facilmente condivisa allo stesso modo con i tuoi compagni di squadra o utenti finali..
Voglio anche sottolineare che Plotly supporta una gamma di grafici dai tipi di grafici di base, grafica bella e avanzata simile a Seaborn, Grafica 3D, visualizzazioni basate su mappe, grafica scientifica, eccetera. La lista è infinita!
I grafici di trama possono anche supportare funzionalità di animazione. Perciò, è una libreria piuttosto utile se vuoi raccontare storie attraverso le visualizzazioni.
Tutorial per imparare Plotly
Ecco un paio di tutorial in modo da poter iniziare con Plotly per la visualizzazione dei dati:
6. ggplot
ggplot è la versione Python del famoso ggplot2 di R e del linguaggio Grammer of Graphics. Se l'hai usato in R prima, saprai quanto è semplice creare grafici utilizzando questa libreria.
Personalmente, amo la flessibilità di ggplot. Possiamo facilmente discutere i dati mentre costruiamo appezzamenti al volo, Un concetto super utile!
Caratteristiche uniche di ggplot
ggplot è anche una libreria di stili dichiarativa come Bokeh, ma è anche strettamente associato a panda. Ciò significa che puoi creare facilmente visualizzazioni utilizzando il tuo frame di dati Pandas!!
Tutorial (è) imparare ggplot
Puoi saperne di più su ggplot e su come lavorarci qui:
Note finali
In questo articolo, Esploriamo alcune delle librerie indispensabili per eseguire la visualizzazione dei dati in Python. Ognuna di queste librerie è abbastanza popolare a sé stante e brilla in diverse impostazioni..
Spero che questo articolo sia come una stele di rosetta quando decidi quale libreria utilizzare per il tuo prossimo progetto..
Pensi che qualsiasi altra libreria di visualizzazione dei dati dovrebbe essere in questo elenco?? Ti è piaciuto l'articolo? Se è così, Commenta qui sotto!