Jornada do Python Iniciante ao Python Kaggler
Então você finge torne-se um cientista de dados ou pode ser que você já seja e queira expandir seu repositório de ferramentas. Você pousou no lugar certo. O objetivo desta página é fornecer um caminho de aprendizado abrangente para pessoas novas no Python para ciência de dados.. Este caminho fornece uma visão geral completa das etapas que você precisa aprender a usar. Python para ciência de dados. Se você já tem alguma experiência, ou você não precisa de todos os componentes, sinta-se à vontade para adaptar seus próprios caminhos e deixe-nos saber como você fez as mudanças ao longo do caminho.
Además puede consultar la versión mini de esta ruta de aprendizaje -> Infografía: Guia rápido para aprender ciência de dados em Python.
lendo isso em 2019? Nós projetamos um caminho de aprendizado atualizado para você! Confira em nosso portal de cursos e comece sua jornada de ciência de dados hoje.
Paso 0: Aquecimento
Antes de iniciar sua jornada, a primeira pergunta a responder é:
Por que usar Python?
o
Como o Python seria útil??
olha o primeiro 30 minutos disso falar sobre jeremy, Fundador da DataRobot na PyCon 2014, Ucrânia, para ter uma ideia de quão útil o Python pode ser.
Paso 1: configuração da sua máquina
Agora que você se decidiu, é hora de configurar sua máquina. A maneira mais fácil de proceder é simplesmente baixar Anaconda por Continuum.io. Vem embalado com a maioria das coisas que você precisa. A principal desvantagem de seguir esse caminho é que você terá que esperar que o Continuum atualize seus pacotes., mesmo quando uma atualização pode estar disponível para as bibliotecas subjacentes. Se você é iniciante, isso não deveria importar.
Se você enfrentar quaisquer desafios na instalação, pode encontrar mais instruções detalhadas para vários sistemas operacionais aqui.
Paso 2: aprenda o básico da linguagem Python
Você deve começar entendendo o básico da linguagem, bibliotecas e estrutura de dados. a de graça Curso DataPeaker em Python é um dos melhores lugares para começar sua jornada. Este curso se concentra em como começar a usar o Python para ciência de dados e, ao final, você deve estar confortável com o básico do idioma.
Atribuição: Levar a incrível curso gratuito de Python do DataPeaker
Recursos alternativos: Se a codificação interativa não for o seu estilo de aprendizagem, Você também pode verificar o Classe do Google para Python. É uma série de aulas 2 dias e também cobre algumas das partes discutidas posteriormente.
Paso 3: aprender expressões regulares em python
Você precisará usá-los muito para limpeza de dados, especialmente se você estiver trabalhando com dados de texto. o melhor caminho para aprender expressões regulares é passar pela classe do google e manter isso folha de dicas prático.
Atribuição: Fazer o exercicio de nomes de bebe
Se você ainda precisa de mais prática, siga este tutorial para limpeza de texto. Ele irá desafiá-lo em várias etapas envolvidas no gerenciamento de dados.
Paso 4: Aprenda as bibliotecas científicas em Python: NumPy, SciPy, Matplotlib e Pandas
Isto é onde a diversão começa! Aqui está uma breve introdução a várias bibliotecas. Vamos começar a praticar algumas operações comuns.
- Pratique o Tutorial NumPy a fundo, especialmente matrizes NumPy. Isso formará uma boa base para o que está por vir..
- A seguir, olhe para a tutoriais de ficção científica. Revise a introdução e os fundamentos e faça o resto conforme necessário.
- Se você adivinhou os tutoriais do Matplotlib abaixo, está errado! Eles são muito completos para nossa necessidade aqui. No lugar disso, olha isto notebook ipython acima da linha 68 (Em outras palavras, até as animações)
- Em conclusão, vamos dar uma olhada em pandas. Pandas fornece funcionalidade DataFrame (como R) para Python. Este é também o lugar onde você deve se divertir praticando. Pandas se tornaria a ferramenta mais eficiente para todas as análises de dados de médio porte. Comece com uma breve introdução, 10 minutos para pandas. Depois de, vá para uma descrição mais detalhada. tutorial do panda.
Você também pode consultar a análise de dados exploratórios com Pandas e a análise de dados com Pandas.
Recursos adicionais:
- Se você precisa de um livro sobre Pandas e NumPy, “Python para análise de dados por Wes McKinney “
- Existem muitos tutoriais como parte da documentação do Pandas. Você pode dar uma olhada neles aqui
Atribuição: resolver isso Trabalho de curso CS109 a Harvard.
Paso 5: visualização de dados eficaz
passar por isso Formulário de conferência CS109. Você pode ignorar o 2 minutos iniciais, mas o que se segue é incrível! Acompanhe esta conferência com esta tarefa.
Paso 6: Aprenda Scikit-learn y Machine Learning
Agora, chegamos ao cerne de todo este procedimento. Scikit-learn é a biblioteca mais útil em Python para aprendizado de máquina. Aqui está uma breve descrição da biblioteca. passar a lição 10 para a lição 18 a partir de Curso CS109 de Harvard. Você passará por uma visão geral do aprendizado de máquina, algoritmos de aprendizagem supervisionadaO aprendizado supervisionado é uma abordagem de aprendizado de máquina em que um modelo é treinado usando um conjunto de dados rotulados. Cada entrada no conjunto de dados está associada a uma saída conhecida, permitindo que o modelo aprenda a prever resultados para novas entradas. Este método é amplamente utilizado em aplicações como classificação de imagens, Reconhecimento de fala e previsão de tendências, destacando sua importância em... como regresiones, Árvores de decisão, modelagem de conjunto e algoritmos de aprendizado não supervisionado, como clustering. Acompanhe conferências individuais com o atribuições dessas conferências.
Além disso, você deve verificar a ‘Introdução à ciência de dadoscertamente para se dar um grande impulso em sua busca por uma posição de cientista de dados.
Recursos adicionais:
Paso 7: prática, praticar e praticar
Parabéns, conseguiu!
Agora você tem tudo o que precisa em habilidades técnicas. É uma questão de prática e qual o melhor lugar para praticar do que competir com outros cientistas de dados no Plataforma DataHack. E, mergulhe em uma das competições ao vivo que estão acontecendo agora no DataHack e Kaggle e teste tudo o que você aprendeu.
Paso 8: aprendizado profundoAqui está o caminho de aprendizado para dominar o aprendizado profundo em, Uma subdisciplina da inteligência artificial, depende de redes neurais artificiais para analisar e processar grandes volumes de dados. Essa técnica permite que as máquinas aprendam padrões e executem tarefas complexas, como reconhecimento de fala e visão computacional. Sua capacidade de melhorar continuamente à medida que mais dados são fornecidos a ele o torna uma ferramenta fundamental em vários setores, da saúde...
Agora que você aprendeu a maioria das técnicas de aprendizado de máquina, É hora de dar uma chance ao aprendizado profundo. Você provavelmente já sabe o que é deep learning, mas se você ainda precisar de uma breve introdução, Nosso objetivo aqui é fornecer um caminho de aprendizado para todos aqueles que são novos no aprendizado profundo e também para aqueles que desejam explorá-lo ainda mais..
Eu mesmo sou novo no aprendizado profundo, portanto, tome essas sugestões com cautela. O recurso mais completo é deeplearning.net. Aqui você encontra tudo: conferências, conjuntos de dados, desafios, tutoriais. Você também pode tentar o curso de Geoff Hinton uma tentativa de tentar entender o básico das redes neurais.
Comece com o Python: Um tutorial completo para aprender ciência de dados com Python do zero
P.S. Caso você precise usar bibliotecas de Big Data, tente Pydoop e PyMongo. não incluído aqui, já que o caminho de aprendizado de Big Data é um tópico completo em si.
Postagens Relacionadas:
- SQL para ciência de dados | Guia do iniciante em SQL para ciência de dados
- Estatísticas para ciência de dados | Um guia para iniciantes em estatística para ciência de dados
- As 13 melhores bibliotecas python | Bibliotecas Python para ciência de dados
- Estágio em Ciência de Dados | Guia de Iniciantes para obter um estágio em ciência de dados