Treinamento Python | Python para ciência de dados

Conteúdo

Jornada do Python Iniciante ao Python Kaggler

Então você finge torne-se um cientista de dados ou pode ser que você já seja e queira expandir seu repositório de ferramentas. Você pousou no lugar certo. O objetivo desta página é fornecer um caminho de aprendizado abrangente para pessoas novas no Python para ciência de dados.. Este caminho fornece uma visão geral completa das etapas que você precisa aprender a usar. Python para ciência de dados. Se você já tem alguma experiência, ou você não precisa de todos os componentes, sinta-se à vontade para adaptar seus próprios caminhos e deixe-nos saber como você fez as mudanças ao longo do caminho.

Además puede consultar la versión mini de esta ruta de aprendizaje -> Infografía: Guia rápido para aprender ciência de dados em Python.

lendo isso em 2019? Nós projetamos um caminho de aprendizado atualizado para você! Confira em nosso portal de cursos e comece sua jornada de ciência de dados hoje.

Paso 0: Aquecimento

Antes de iniciar sua jornada, a primeira pergunta a responder é:

Por que usar Python?

o

Como o Python seria útil??

olha o primeiro 30 minutos disso falar sobre jeremy, Fundador da DataRobot na PyCon 2014, Ucrânia, para ter uma ideia de quão útil o Python pode ser.

Paso 1: configuração da sua máquina

Agora que você se decidiu, é hora de configurar sua máquina. A maneira mais fácil de proceder é simplesmente baixar Anaconda por Continuum.io. Vem embalado com a maioria das coisas que você precisa. A principal desvantagem de seguir esse caminho é que você terá que esperar que o Continuum atualize seus pacotes., mesmo quando uma atualização pode estar disponível para as bibliotecas subjacentes. Se você é iniciante, isso não deveria importar.

Se você enfrentar quaisquer desafios na instalação, pode encontrar mais instruções detalhadas para vários sistemas operacionais aqui.

Paso 2: aprenda o básico da linguagem Python

Você deve começar entendendo o básico da linguagem, bibliotecas e estrutura de dados. a de graça Curso DataPeaker em Python é um dos melhores lugares para começar sua jornada. Este curso se concentra em como começar a usar o Python para ciência de dados e, ao final, você deve estar confortável com o básico do idioma.

Atribuição: Levar a incrível curso gratuito de Python do DataPeaker

Recursos alternativos: Se a codificação interativa não for o seu estilo de aprendizagem, Você também pode verificar o Classe do Google para Python. É uma série de aulas 2 dias e também cobre algumas das partes discutidas posteriormente.

Paso 3: aprender expressões regulares em python

Você precisará usá-los muito para limpeza de dados, especialmente se você estiver trabalhando com dados de texto. o melhor caminho para aprender expressões regulares é passar pela classe do google e manter isso folha de dicas prático.

Atribuição: Fazer o exercicio de nomes de bebe

Se você ainda precisa de mais prática, siga este tutorial para limpeza de texto. Ele irá desafiá-lo em várias etapas envolvidas no gerenciamento de dados.

Paso 4: Aprenda as bibliotecas científicas em Python: NumPy, SciPy, Matplotlib e Pandas

Isto é onde a diversão começa! Aqui está uma breve introdução a várias bibliotecas. Vamos começar a praticar algumas operações comuns.

  • Pratique o Tutorial NumPy a fundo, especialmente matrizes NumPy. Isso formará uma boa base para o que está por vir..
  • A seguir, olhe para a tutoriais de ficção científica. Revise a introdução e os fundamentos e faça o resto conforme necessário.
  • Se você adivinhou os tutoriais do Matplotlib abaixo, está errado! Eles são muito completos para nossa necessidade aqui. No lugar disso, olha isto notebook ipython acima da linha 68 (Em outras palavras, até as animações)
  • Em conclusão, vamos dar uma olhada em pandas. Pandas fornece funcionalidade DataFrame (como R) para Python. Este é também o lugar onde você deve se divertir praticando. Pandas se tornaria a ferramenta mais eficiente para todas as análises de dados de médio porte. Comece com uma breve introdução, 10 minutos para pandas. Depois de, vá para uma descrição mais detalhada. tutorial do panda.

Você também pode consultar a análise de dados exploratórios com Pandas e a análise de dados com Pandas.

Recursos adicionais:

  • Se você precisa de um livro sobre Pandas e NumPy, “Python para análise de dados por Wes McKinney “
  • Existem muitos tutoriais como parte da documentação do Pandas. Você pode dar uma olhada neles aqui

Atribuição: resolver isso Trabalho de curso CS109 a Harvard.

Paso 5: visualização de dados eficaz

passar por isso Formulário de conferência CS109. Você pode ignorar o 2 minutos iniciais, mas o que se segue é incrível! Acompanhe esta conferência com esta tarefa.

Paso 6: Aprenda Scikit-learn y Machine Learning

Agora, chegamos ao cerne de todo este procedimento. Scikit-learn é a biblioteca mais útil em Python para aprendizado de máquina. Aqui está uma breve descrição da biblioteca. passar a lição 10 para a lição 18 a partir de Curso CS109 de Harvard. Você passará por uma visão geral do aprendizado de máquina, algoritmos de aprendizado supervisionado como regressões, Árvores de decisão, modelagem de conjunto e algoritmos de aprendizado não supervisionado, como clustering. Acompanhe conferências individuais com o atribuições dessas conferências.

Além disso, você deve verificar a ‘Introdução à ciência de dadoscertamente para se dar um grande impulso em sua busca por uma posição de cientista de dados.

Recursos adicionais:

Paso 7: prática, praticar e praticar

Parabéns, conseguiu!

Agora você tem tudo o que precisa em habilidades técnicas. É uma questão de prática e qual o melhor lugar para praticar do que competir com outros cientistas de dados no Plataforma DataHack. E, mergulhe em uma das competições ao vivo que estão acontecendo agora no DataHack e Kaggle e teste tudo o que você aprendeu.

Paso 8: aprendizado profundo

Agora que você aprendeu a maioria das técnicas de aprendizado de máquina, É hora de dar uma chance ao aprendizado profundo. Você provavelmente já sabe o que é deep learning, mas se você ainda precisar de uma breve introdução, Nosso objetivo aqui é fornecer um caminho de aprendizado para todos aqueles que são novos no aprendizado profundo e também para aqueles que desejam explorá-lo ainda mais..

Eu mesmo sou novo no aprendizado profundo, portanto, tome essas sugestões com cautela. O recurso mais completo é deeplearning.net. Aqui você encontra tudo: conferências, conjuntos de dados, desafios, tutoriais. Você também pode tentar o curso de Geoff Hinton uma tentativa de tentar entender o básico das redes neurais.

Comece com o Python: Um tutorial completo para aprender ciência de dados com Python do zero

P.S. Caso você precise usar bibliotecas de Big Data, tente Pydoop e PyMongo. não incluído aqui, já que o caminho de aprendizado de Big Data é um tópico completo em si.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.