Librerie di visualizzazione dati Python

Contenuti

introduzione

“La visualizzazione ti dà risposte a domande che non sapevi di avere”. – Ben Shneiderman

Il mio lavoro quotidiano come data scientist richiede molta sperimentazione. Questo significa che mi fido molto Visualizzazione dati per esplorare il set di dati su cui sto lavorando.

E non potrei relazionarmi di più con la citazione di Ben Shneiderman!! La visualizzazione dei dati mi dà risposte a domande che non avevo nemmeno considerato prima. Dopotutto, un'immagine vale mille punti dati!

Questo porta naturalmente alla domanda da un milione di dollari., Quello Chiodo Quale libreria dovrei usare per la visualizzazione dei dati? Ce ne sono parecchi su tutta la linea. Anche i data scientist esperti possono perdersi nella miriade di funzionalità offerte da ogni libreria Python..

data-viz-tools-5086575

Ecco perché ho voluto scrivere questo articolo esponendo i vantaggi e le caratteristiche uniche delle diverse librerie di visualizzazione dei dati Python.. Tratteremo alcune delle librerie di visualizzazione più sorprendenti supportate da Python.. Ognuna di queste librerie ha il proprio stile ed è davvero utile per un particolare tipo di attività di visualizzazione..

Quindi senza ulteriori indugi, Iniziamo!

Se non conosci Python e / o visualizzazione dei dati, Ti suggerisco di dare un'occhiata alle seguenti risorse di Analytics Vidhya:

Il 6 Librerie di visualizzazione dei dati Python di cui parleremo

  1. Matplotlib
  2. Seaborn
  3. bokeh
  4. Altair
  5. trama
  6. ggplot

1. Matplotlib

matplotlib-300x72-3246294

È probabile che tu abbia già utilizzato matplotlib nel tuo viaggio nella scienza dei dati. Dai principianti della scienza dei dati ai professionisti esperti che creano visualizzazioni di dati complesse, matplotlib è di solito la visualizzazione predefinita su cui ricorrono gli scienziati dei dati della libreria Python.

matplotlib è noto per la grande flessibilità che offre come libreria di plottaggio 2D in Python. Se hai esperienza nella programmazione MATLAB, L'interfaccia Pyplot di Matplotlib ti sembrerà molto familiare. Sarai pronto con la tua prima visione in pochissimo tempo!!

Caratteristiche uniche di Matplotlib

Matplotlib può essere usato in diversi modi in Python, inclusi gli script Python, le shell di Python e iPython, Quaderni Jupyter e altre cose. Ecco perché viene spesso utilizzato per creare visualizzazioni non solo dai data scientist., ma anche dai ricercatori per creare grafica di qualità da pubblicazione.

Matplotlib supporta tutti i grafici più diffusi (molte, istogrammi, spettri di potenza, grafici a barre, grafica di errore, diagrammi a dispersione, eccetera.) Dal primo momento. Ci sono anche estensioni che puoi usare per creare visualizzazioni avanzate come la grafica 3D., eccetera.

ezgif-com-webp-to-png-7653980

Quello che personalmente mi piace di matplotlib è che, perché è così flessibile, consente all'utente di controllare gli aspetti del display al livello più granulare, da una singola linea o punto sul grafico all'intero grafico. Ciò significa che puoi personalizzarlo al massimo livello..

Tutorial (è) per imparare matplotlib

Ecco alcuni tutorial utili per imparare matplotlib:

Ecco il creatore di Matplotlib che offre un tutorial introduttivo:

2. Seaborn

Quando guardo le visualizzazioni create da Seaborn, mi viene in mente solo una parola: bello! Seaborn è basato su matplotlib e fornisce un'interfaccia molto semplice ma intuitiva per la creazione di visualizzazioni. Al usar Seaborn, noterai anche che molte delle impostazioni predefinite nei grafici funzionano abbastanza bene fin da subito.

Caratteristiche uniche di Seaborn

La prima caratteristica unica di Seaborn è che è progettato in modo tale da scrivere molto meno codice per ottenere visualizzazioni di alto livello.. Ecco un esempio di questa semplicità. Guarda come possiamo creare una visualizzazione complessa con una singola riga di codice di stampa:

screenshot-da-2020-03-04-07-39-44-7932763

Fonte: Seaborn

La seconda caratteristica utile di Seaborn è che supporta un gran numero di grafica avanzata come la stampa categorica. (trama del gatto), il grafico di distribuzione usando kde (distplot), il grafico dello sciame, eccetera. Dal primo momento. E, Certo, abbiamo visto un esempio di replot sopra.

Ora, perché Seaborn è costruito su matplotlib, è altamente compatibile con lui. Ciò significa che quando si creano visualizzazioni, puoi iniziare con grafici avanzati già supportati da seaborn e poi personalizzarli quanto vuoi con l'aiuto di matplotlib.

Tutorial (è) per imparare Seaborn

Ecco alcune risorse utili che puoi utilizzare per iniziare a utilizzare la libreria Seaborn per la visualizzazione dei dati:

3. bokeh

Bokeh è una libreria progettata per generare visualizzazioni intuitive sull'interfaccia web e sui browser. Ed è proprio questo l'obiettivo specifico di questa libreria display..

bokeh-logo-twitter-6950383

Noterai anche che le visualizzazioni generate da Bokeh sono di natura interattiva., il che significa sostanzialmente che puoi trasmettere informazioni in modo più intuitivo attraverso la tua grafica.

Caratteristiche uniche del bokeh

Bokeh supporta visualizzazioni uniche come i diagrammi geospaziali, grafica di rete, eccetera. Dal primo momento. Se vuoi mostrare queste visualizzazioni in un browser, ci sono opzioni disponibili per esportarli e puoi anche usarli tramite javascript.

Tutorial per imparare il Bokeh

Ecco un buon tutorial per imparare Bokeh per la visualizzazione dei dati:

4. Altair

altair-logo-light-4152043

Altair è una libreria dichiarativa per la visualizzazione dei dati. Il suo principio è che, invece di concentrarti sulla parte del codice, uno dovrebbe concentrarsi sulla parte del display e scrivere il minor codice possibile ed essere ancora in grado di creare una grafica bella e intuitiva. Questo è nel mio vicolo!

Le caratteristiche uniche di Altair

Poiché Altair utilizza uno stile dichiarativo per creare la grafica, è molto facile e veloce scorrere le visualizzazioni e gli esperimenti a un ritmo veloce quando si utilizza questa libreria.

Tutorial (è) per imparare Altair

Ecco una buona introduzione ad Altair in Python:

5. trama

La prima cosa che mi viene in mente quando penso a Plotly è l'interattività!! Questa libreria di visualizzazione dei dati è, con molto, la mia libreria a cui mi rivolgo quando voglio creare visualizzazioni che dovrebbero essere altamente interattive per l'utente.

Basta guardare questa visualizzazione creata usando Plotly:

687474703a2f2f692e696d6775722e636f6d2f643379346e776d2e676966-7709068

Caratteristiche uniche di Plotly

Plotly è altamente compatibile con Jupyter Notebook e browser web. Ciò significa che qualsiasi trama interattiva che crei può essere facilmente condivisa allo stesso modo con i tuoi compagni di squadra o utenti finali..

Voglio anche sottolineare che Plotly supporta una gamma di grafici dai tipi di grafici di base, grafica bella e avanzata simile a Seaborn, Grafica 3D, visualizzazioni basate su mappe, grafica scientifica, eccetera. La lista è infinita!

I grafici di trama possono anche supportare funzionalità di animazione. Perciò, è una libreria piuttosto utile se vuoi raccontare storie attraverso le visualizzazioni.

Tutorial per imparare Plotly

Ecco un paio di tutorial in modo da poter iniziare con Plotly per la visualizzazione dei dati:

6. ggplot

ggplot-9749486

ggplot è la versione Python del famoso ggplot2 di R e del linguaggio Grammer of Graphics. Se l'hai usato in R prima, saprai quanto è semplice creare grafici utilizzando questa libreria.

Personalmente, amo la flessibilità di ggplot. Possiamo facilmente discutere i dati mentre costruiamo appezzamenti al volo, Un concetto super utile!

Caratteristiche uniche di ggplot

ggplot è anche una libreria di stili dichiarativa come Bokeh, ma è anche strettamente associato a panda. Ciò significa che puoi creare facilmente visualizzazioni utilizzando il tuo frame di dati Pandas!!

Tutorial (è) imparare ggplot

Puoi saperne di più su ggplot e su come lavorarci qui:

Note finali

In questo articolo, Esploriamo alcune delle librerie indispensabili per eseguire la visualizzazione dei dati in Python. Ognuna di queste librerie è abbastanza popolare a sé stante e brilla in diverse impostazioni..

Spero che questo articolo sia come una stele di rosetta quando decidi quale libreria utilizzare per il tuo prossimo progetto..

Pensi che qualsiasi altra libreria di visualizzazione dei dati dovrebbe essere in questo elenco?? Ti è piaciuto l'articolo? Se è così, Commenta qui sotto!

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.