Este curso irá cobrir as formas básicas de obtenção de dados. O curso cobrirá a obtenção de dados da web, de API, de bancos de dados e colegas em vários formatos. Ele também cobrirá os fundamentos da limpeza de dados e como torná-los limpos. “organizado”. Os dados classificados aceleram drasticamente as tarefas de análise de dados subsequentes. O curso também cobrirá os componentes de um conjunto de dados completo que inclui dados brutos., instruções de processamento, livros de código e dados processados. O curso cobrirá o básico necessário para coletar, limpar e compartilhar dados.
Vídeos de palestras e questionários semanais e um projeto final revisado por pares.
Como parte desta aula, você será solicitado a configurar uma conta GitHub. GitHub é uma ferramenta para edição e compartilhamento de código colaborativo. Durante este curso e outros cursos de especialização, enviar links para arquivos que você postar publicamente em sua conta do GitHub como parte da revisão por pares. Se você está preocupado em preservar seu anonimato, você deve configurar uma conta GitHub anônima e ter cuidado para não incluir nenhuma informação que não queira disponibilizar para os testadores de pares.
Programa do curso:
Após a conclusão deste curso, você poderá obter dados de uma variedade de fontes. Você conhecerá os princípios de dados solicitados e troca de dados. Para terminar, compreender e ser capaz de aplicar as ferramentas básicas para limpar e manipular dados.
Avaliar:
De graça
Duração:
4 semanas (4-9 horas / semana)
Data importante:
6 abril 2015-4 Poderia 2015