Panoramica
- La scienza dei dati è in continua evoluzione con nuovi strumenti, framework e tecnologie.
- Ogni strumento / tecnica ha il suo caso d'uso unico insieme a caratteristiche e funzioni
- Dai un'occhiata a questo elenco completo di cheat sheet su concetti popolari di data science.
introduzione
La scienza dei dati è un campo in costante crescita, ci sono numerosi strumenti e tecniche da ricordare. Nessuno può ricordare tutte le funzioni, operazioni e formule di ogni concetto. Ecco perché abbiamo i cheat sheet. Ma ci sono molti cheat sheet disponibili., scegliere il cheat sheet corretto è un compito difficile. Quindi, Ho deciso di scrivere questo articolo.
Qui ho selezionato i cheat sheet con i seguenti criteri: completezza, chiarezza e contenuto.
Dopo aver applicato questi filtri, ne ho compilati alcuni 28 schede di apprendimento automatico, scienza dei dati, probabilità, SQL e Big Data. Per tua comodità, Ho separato i cheat sheet separatamente per ciascuno degli argomenti di cui sopra. Ci sono cheat sheet su strumenti e tecniche, varie biblioteche e lingue.
Continua a leggere per scoprire quale cheat sheet usare per un particolare argomento..
Cheat sheet di Python per la scienza dei dati
1.Guida rapida all'apprendimento di Python per la scienza dei dati
Se stai iniziando a imparare Python, questo cheat sheet è la migliore risorsa per te. In questo cheat sheet, troverai una guida passo passo per imparare Python. Offre risorse da seguire, Librerie Python che dovresti conoscere e alcuni suggerimenti utili.
2. Python per Data Science Cheat sheet
Questo cheat sheet di Datacamp copre tutte le basi di Python necessarie per la scienza dei dati. Se hai appena iniziato a lavorare in Python, tienilo come riferimento rapido. Salva questi cheat code per le variabili e le funzioni del tipo di dati, operazione su stringa, conversione di tipo, Elenchi e operazioni NumPy comunemente usati. L'aspetto unico di questo cheat sheetèche elenca le importanti librerie Python e fornisce cheat code per selezionare e importare queste librerie.
3. Python per la scienza dei dati cheat sheet NumPy
NumPy è una libreria di base per il calcolo scientifico in Python. In questo cheat sheet di DataCamp, troverai cheat code per creare array NumPy, eseguire operazioni matematiche su matrici, sottoinsiemi, segmentazioni, indicizzazione e manipolazione di array. L'aspetto unico di questo cheat sheet è che ogni funzione è stata categorizzata e spiegata in un inglese semplice.
4. Analisi esplorativa dei dati in Python
La tua migliore risorsa per eseguire l'esplorazione dei dati in Python usando NumPy, Panda e Matplotlib. Con questo cheat sheet, imparerai come caricare file in Python, convertire variabili, ordinare i dati, creare grafici, creare set di dati di esempio, gestire i valori mancanti e molto altro. È uno dei cheat sheet semplificati sull'esplorazione dei dati.
5. Esplorazione dei dati utilizzando Pandas in Python
Pandas è una delle importanti librerie Python. Questo cheat sheet sull'operazione di esplorazione dei dati in Python utilizzando Pandas è la tua risorsa di riferimento per ogni passaggio coinvolto nell'esplorazione dei dati.. Troverai cheat code per leggere e scrivere dati, anteprima dei frame di dati, rinominare le colonne del frame di dati, aggiungi i dati, eccetera.
6. Visualizzazione dei dati in Python
Che tu sia uno scienziato dei dati o un non tecnico, entrambi interpretano facilmente il display. In grafici e grafici visivi, i dati prendono vita e parlano da soli. In questo cheat sheet, impara come eseguire la visualizzazione dei dati in Python. Esplora i diversi modi in cui puoi tracciare i tuoi dati. Trova un approccio passo passo per tracciare gli istogrammi, grafici a barre, grafici a linee, grafici a dispersione, eccetera.
7. Python per la scienza dei dati cheat sheet Bokeh
Questo cheat sheet su Bokeh, una libreria di visualizzazione interattiva in Python, è particolarmente utile con grandi set di dati. In questo cheat sheet di DataCamp, otterrai i passaggi di base per tracciare, renderizzare e personalizzare visivamente, salva grafici e crea grafici statistici.
8. Cheat sheet: Scikit Impara
Ecco un cheat sheet su scikit-learn per ogni tecnica in Python. Fornisce diverse funzioni utilizzate per la preelaborazione, regressione, classificazione, raggruppamento, riduzione dimensionale, selezione del modello e della metrica insieme alla sua descrizione. L'aspetto unico di questo cheat sheet è che descrive le fasi complete dell'apprendimento automatico.
9. Passaggi per ripulire i dati di testo in Python
La pulizia del testo può essere un processo ingombrante. E conoscere le procedure corrette è la chiave per ottenere il risultato desiderato.. Dai un'occhiata a questo cheat sheet per eseguire la pulizia dei dati di testo in Python passo dopo passo. Segui questo cheat sheet per scoprire quando rimuovere le stopword, il punteggio, le espressioni, eccetera. L'aspetto unico di questo cheat sheet è che ogni passaggio è stato spiegato con codici ed esempi.
R per i cheat sheet sulla scienza dei dati
1.Scheda di riferimento R
Usa questo cheat sheet del codice per tutte le funzioni e gli operatori sotto R. Comprendere cosa significano i diversi termini sotto R. Spiega tutte le funzioni nella creazione dei dati, elaborazione dati, manipolazione di dati, funzione del modello, selezione e molto altro.
2. Importazione di dati in R
Scopri come importare i dati con readr, tibble y tidyr. Trova funzioni per scrivere e leggere funzioni in tibble. Ti fornisce anche argomenti utili, rimodellare i dati, unire le celle con tidyr.
3. Trasformazione dei dati con dplyr
Questo cheat sheet di RStudio è un materiale di riferimento per la trasformazione dei dati con dplyr. Ottieni shortcode e operatori per tutte le operazioni durante la trasformazione dei dati. Dopo, è riassumere i casi, casi di gruppo, manipolare, vettorizzare e combinare variabili.
4. Cheat sheet: 11 passaggi per l'esplorazione dei dati in R (con codici)
Questo cheat sheet offre una guida passo passo per esplorare i dati in R. Scopri come caricare file in R, convertire le variabili in diversi tipi di dati, trasporre un set di dati, ordina i frame di dati, creare grafici e molto altro.
5. Visualizzazione dei dati in R
Sopra abbiamo visto un cheat sheet sulla visualizzazione dei dati in Python. Ecco un cheat sheet per la visualizzazione dei dati per fornire i diversi grafici in base ai quali è possibile tracciare i dati. Con poche righe di codice, può creare bellissimi grafici e storie di dati. R ha fantastiche librerie per creare visualizzazioni di base e più avanzate come il grafico a barre, istogramma, Diagramma di dispersione, visualizzazione della mappa, schema mosaico e vari altri.
6. Visualizzazione dei dati con ggplot2
Questo cheat sheet è specifico per creare una visualizzazione in R usando ggplot2. ggplot2 funziona con la grammatica dei grafici e si basa su una serie di segni visivi che rappresentano punti dati. Ottieni cheat code per creare una variabile e due componenti grafici variabili. Insieme a diverse tecniche per la creazione di grafici in R.
7. Cheat sheet: Pacchetto caret
Il pacchetto Caret fornisce una serie di funzionalità che semplificano il processo di modellazione predittiva. Il cheat sheet include funzioni per la divisione dei dati, pre-elaborazione, selezione della funzione, montare e visualizzare il modello.
8. Scheda di riferimento R per il data mining
Questo cheat sheet fornisce funzioni per il text mining, rilevamento di valori atipici, raggruppamento, classificazione, analisi dei social media, grandi dati, calcolo parallelo usando R. Questo cheat sheet ti offre tutte le funzioni e gli operatori utilizzati per il data mining in R.
9. Guida per imparare rapidamente il cloud computing nella programmazione R
Il cloud computing ci ha facilitato l'accesso ai nostri file e dati da qualsiasi luogo. In questo cheat sheet, imparerai come usare il cloud computing in R. Segui questa guida passo passo per utilizzare la programmazione R su AWS.
Schede di apprendimento automatico
1.Cheat sheet: Codici Python e R per algoritmi di machine learning comuni
In questo cheat sheet, otterrai codici in python & R per vari algoritmi di apprendimento automatico comunemente usati. Gli algoritmi inclusi sono regressione lineare, Regressione logistica, albero decisionale, SVM, Ingenuo Bayes, KNN, K-significa, foresta casuale e alcuni altri.
2. Scikit Learn Algorithm Cheat Sheet
Questo cheat sheet è fornito dai creatori ufficiali di scikit-learn. Molte persone si trovano ad affrontare il problema di scegliere un particolare algoritmo di apprendimento automatico per diversi tipi di dati e problemi.. Con l'aiuto di questo cheat sheet, ha il flusso completo per risolvere un problema di apprendimento automatico.
3. Microsoft Azure Machine Learning: algoritmo cheat sheet
Questo cheat sheet ti aiuta a scegliere il miglior algoritmo di Azure Machine Learning Studio per la tua soluzione di analisi predittiva.. Sviluppato dal team di Microsoft Azure, cheat sheet ti dà un percorso chiaro in base alla natura dei dati.
Probabilità cheat sheet
1. Foglio informativo di base sulle probabilità
Questo cheat sheet fornisce materiale di riferimento completo su probabilità e statistiche. Ogni concetto è stato spiegato meravigliosamente con una spiegazione schematica. Copre dalle regole di base della probabilità a concetti statistici avanzati in modo molto preciso ed esatto. Sviluppato dall'Università della Pennsylvania, è uno dei cheat sheet più completi su cui puoi mettere le mani.
2. Probabilità cheat sheet per la distribuzione
Dai un'occhiata a questo cheat sheet per una rapida panoramica della distribuzione di Poisson, distribuzione normale, la distribuzione binomiale, distribuzione geometrica e molto altro. Fornire notazione, formule e una breve spiegazione in inglese semplice per ogni distribuzione.
Schede SQL e MySQL
1. Foglio informativo SQL
In questo cheat sheet, impara a eseguire operazioni di base in SQL. Ottieni la funzione per inserire i dati, aggiornare i dati, cancellare i dati, dati di gruppo, ordinare i dati, eccetera. Se hai iniziato a utilizzare SQL, questa è la migliore guida di riferimento.
2. MySQL e SQL Cheat Sheet
In questo cheat sheet, troverai i comandi MySQL e SQL comunemente usati. Ottieni codici cheat per la funzione matematica di MySQL, Funzione stringa MySQL, i comandi di base di MySQL. Troverai anche comandi SQL da modificare e interrogare.
Cheat sheet di Big Data
1. Cheat Sheet di Hadoop
Si dice giustamente che Hadoop abbia un vasto ecosistema e comprende varie operazioni. Conosci i diversi operatori, come funzionano e di quale operazione sono responsabili. Il cheat sheet è stato suddiviso in una rispettiva funzione generale, come sistemi distribuiti, elaborazione dati, iscrizione / uscita e gestione dei dati.
2. Apache Spark cheat sheet
Ecco un cheat sheet per Apache Spark per varie operazioni come la trasformazione, Azioni, metodi di persistenza, trasformazione e azioni aggiuntive, RDD esteso, trasformazione della trasmissione, persistenza di ASD, eccetera.
3. Cheat sheet della funzione Hive
In questo cheat sheet, ottenere i comandi per le funzioni Hive. Fornire codici cheat per le funzioni dei dati, funzione matematica, funzione stringa, funzione di raccolta, funzione di aggregazione integrata, funzione di generazione della tabella integrata, funzione condizionale e funzioni per l'analisi del testo.
Note finali
Spero che ti sia piaciuto leggere questo articolo. Se ho perso qualche cheat sheet che penso dovrebbe essere elencato. Quindi pubblicali nella sezione commenti. L'altro lettore e io vorremmo conoscerli.
Se hai qualche suggerimento / commento, non dimenticare di condividerlo inserendo i tuoi commenti. Dicci cos'altro cheat sheet che vorresti che pubblicassimo.