Questo corso tratterà i modi di base in cui è possibile ottenere i dati. Il corso riguarderà l'acquisizione di dati dal web, de API, di database e colleghi in vari formati. Tratterà anche le basi della pulizia dei dati e come ripulire i dati. “organizzato”. I dati ordinati accelerano notevolmente le successive attività di analisi dei dati. Il corso tratterà anche i componenti di un set di dati completo che include dati grezzi., istruzioni di elaborazione, codici e dati elaborati. Il corso tratterà le basi necessarie per raccogliere, pulire e condividere i dati.
Video di lezioni e quiz settimanali e un progetto finale peer-reviewed.
Come parte di questa classe, ti verrà chiesto di creare un account GitHub. GitHub è uno strumento per la modifica e la condivisione collaborativa del codice. Durante questo corso e altri corsi di specializzazione, invia collegamenti ai file che pubblichi pubblicamente sul tuo account GitHub come parte della revisione tra pari. Se sei preoccupato di preservare il tuo anonimato, dovresti impostare un account GitHub anonimo e fare attenzione a non includere informazioni che non vuoi siano disponibili per i peer tester.
Programma del corso:
Al termine di questo corso, sarai in grado di ottenere dati da una serie di fonti. Conoscerai i principi dei dati ordinati e dello scambio di dati. Finire, comprendere ed essere in grado di applicare gli strumenti di base per la pulizia e la manipolazione dei dati.
Valutare:
Gratuito
Durata:
4 settimane (4-9 ore / settimana)
Data importante:
6 aprile 2015-4 Maggio 2015