Formazione su Python | Python per la scienza dei dati

Contenuti

Viaggio da principiante di Python a Kaggler in Python

Poi fai finta di niente Diventa un Data Scientist O forse lo sei già e vuoi espandere il tuo repository di strumenti. Sei atterrato nel posto giusto. L'obiettivo di questa pagina è fornire un percorso di apprendimento completo per le persone che non conoscono Python per la scienza dei dati. Questo percorso fornisce una panoramica completa dei passaggi necessari per imparare a usare. Python per la scienza dei dati. Se hai già un po' di background, o non hai bisogno di tutti i componenti, Sentiti libero di adattare i tuoi percorsi e facci sapere come hai apportato le modifiche lungo il percorso.

Además puede consultar la versión mini de esta ruta de aprendizaje -> Infografía: Guida rapida all'apprendimento della scienza dei dati in Python.

Leggendo questo in 2019? Abbiamo progettato un Percorso di apprendimento aggiornato Per te! Dai un'occhiata al nostro portale dei corsi e inizia oggi stesso il tuo viaggio nella scienza dei dati.

passo 0: Riscaldamento

Prima di iniziare il tuo viaggio, La prima domanda a cui rispondere è:

Perché usare Python?

oh

In che modo Python sarebbe utile?

Dai un'occhiata ai primi 30 minuti da questo Parla di Jeremy, Fondatore di DataRobot presso PyCon 2014, Ucraina, per avere un'idea di quanto potrebbe essere utile Python.

passo 1: Configurazione della macchina

Ora che hai preso una decisione, È il momento di configurare la tua macchina. Il modo più semplice di procedere è semplicemente Scarica Anaconda di Continuum.io. Viene fornito con la maggior parte delle cose di cui avrai bisogno. Lo svantaggio principale di seguire questa strada è che dovrai aspettare che Continuum aggiorni i tuoi pacchetti, anche quando potrebbe essere disponibile un aggiornamento per le librerie sottostanti. Se sei un principiante, Non dovrebbe avere importanza.

In caso di problemi durante l'installazione, Puoi trovare di più Istruzioni dettagliate per vari sistemi operativi qui.

passo 2: imparare le basi del linguaggio Python

È necessario iniziare comprendendo le basi della lingua, Librerie e struttura dati. il gratuito Corso DataPeaker Python È uno dei posti migliori per iniziare il tuo viaggio. Questo corso si concentra su come iniziare a usare Python per la scienza dei dati e, alla fine, Dovresti sentirti a tuo agio con le basi della lingua.

Incarico: Prendi il Fantastico corso Python gratuito di DataPeaker

Risorse alternative: Se la codifica interattiva non è il tuo stile di apprendimento, Puoi anche dare un'occhiata a The Classe Google per Python. Si tratta di una serie di tipi di 2 giorni e copre anche alcune delle parti discusse di seguito.

passo 3: impara le espressioni regolari in Python

Dovrai usarli molto per la pulizia dei dati, Soprattutto se si lavora con dati di testo. Il modo migliore per Impara le espressioni regolari è quello di passare attraverso la classe di Google e mantenere questo Cheat Sheet pratico.

Incarico: Rendere il file Esercizio per il nome del bambino

Se hai ancora bisogno di più pratica, Segui questo tutorial per la pulizia del testo. Ti metterà alla prova in varie fasi coinvolte nella gestione dei dati.

passo 4: Impara le librerie scientifiche in Python: NumPy, SciPy, Matplotlib e Panda

È qui che inizia il divertimento! Ecco una breve introduzione alle varie librerie. Iniziamo a praticare alcune operazioni comuni.

  • Esercitati con il Tutorial de NumPy completamente, in particolare gli array NumPy. Questo costituirà una buona base per ciò che verrà.
  • Prossimo, Dai un'occhiata al Tutorial di fantascienza. Ripassa l'introduzione e le nozioni di base e fai il resto secondo necessità.
  • Se hai indovinato i tutorial di Matplotlib qui sotto, Ti sbagli! Sono troppo completi per le nostre esigenze qui. Invece, Dai un'occhiata a questo Taccuino IPYTHON Fino alla linea 68 (In altre parole, alle animazioni)
  • In conclusione, Diamo un'occhiata ai Panda. Pandas fornisce la funzionalità DataFrame (come R) per Python. Questo è anche il luogo in cui dovresti divertirti a esercitarti. Pandas diventerebbe lo strumento più efficace per tutte le analisi dei dati di medie dimensioni. Inizia con una breve introduzione, 10 Minuti per i panda. Dopo, Vai a una descrizione più dettagliata. Panda Tutorial.

Inoltre, è possibile controllare l'analisi esplorativa dei dati con Pandas e l'analisi dei dati con Pandas.

Risorse addizionali:

Incarico: Capiscilo Assegnazione del corso CS109 Harvard.

passo 5: Visualizzazione efficace dei dati

Passa attraverso questo Modulo conferenza CS109. È possibile ignorare l'opzione 2 Minuti di apertura, Ma quello che segue è sorprendente! Segui questa conferenza con Questo incarico.

passo 6: Impara Scikit-learn e Machine Learning

Ora, Entriamo nel vivo di tutta questa procedura. Scikit-learn è la libreria più utile in Python per l'apprendimento automatico. Ecco una breve panoramica della biblioteca. Andare oltre la lezione 10 Vai alla lezione 18 a partire dal Corso Harvard CS109. Verrà fornita una panoramica dell'apprendimento automatico, Algoritmi di apprendimento supervisionato come le regressioni, alberi decisionali, Modellazione di ensemble e algoritmi di apprendimento non supervisionato come il clustering. Segui le conferenze individuali con il Compiti di tali conferenze.

Dovresti anche dare un'occhiata al ‘Introduzione alla scienza dei datiSicuramente per darti una grande spinta nella tua ricerca per ottenere una posizione di data scientist.

Risorse addizionali:

passo 7: Praticare, Pratica & Pratica

Congratulazioni, Ce l'hai fatta!

Ora hai tutto ciò di cui hai bisogno in termini di competenze tecniche. È una questione di pratica e quale posto migliore per esercitarsi se non quello di competere con altri data scientist del settore. Piattaforma DataHack. Vedere, Immergiti in una delle competizioni dal vivo che si svolgono in questo momento a Hai mai lottato per migliorare il tuo grado in un hackathon di apprendimento automatico e Kaggle e prova tutto ciò che hai imparato.

passo 8: apprendimento profondo

Ora che hai appreso la maggior parte delle tecniche di machine learning, È ora di dare una possibilità al deep learning. Ci sono buone probabilità che tu sappia già cos'è il deep learning, Ma se hai ancora bisogno di una breve introduzione, Eccolo.

Io stesso sono nuovo nel deep learning, Quindi, prendi questi suggerimenti con le pinze. La risorsa più completa è deeplearning.net. Qui troverete tutto: Conferenze, set di dati, sfide, tutorial. Puoi anche provare il Corso di Geoff Hinton Un tentativo nel tentativo di comprendere le basi delle reti neurali.

Introduzione a Python: Un tutorial completo per imparare la scienza dei dati con Python da zero

P.S. Nel caso in cui sia necessario utilizzare librerie di Big Data, prova Pydoop e PyMongo. Non incluso qui, poiché il percorso di apprendimento dei Big Data è un argomento completo a sé stante.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.