Visão geral
- Python é uma excelente linguagem para ciência de dados, mas nem todo mundo é especialista em Python
- Aqui nós apresentamos 7 Truques do Python para ajudá-lo a navegar em seu código Python em tempo duplamente rápido!
Introdução
“Falar é fácil. Me mostre o código “. – Linus Torvalds
Vamos começar com uma pergunta curiosa: Você já pensou em criar modelos de aprendizado de máquina usando apenas papel e caneta? Na realidade, é uma ótima maneira de aprender como um algoritmo funciona. Mas aqui está o truque: vivemos no meio de uma explosão de dados. Isso significa que não podemos calcular ou projetar nada manualmente.
Os dados com os quais trabalhamos em projetos de aprendizado de máquina são enormes (e eu quero dizer ENORME). Para construir um modelo de aprendizado de máquina nessa escala, precisamos de dois recursos que funcionem simultaneamente: O cientista de dados e a máquina! E é aí que o poder da programação Python vem à tona..
Honestamente, Python é uma das linguagens mais versáteis com que já trabalhei. É fácil de aprender e implementar e, Apesar disto, é altamente eficaz em tarefas complexas de aprendizado de máquina. E o fato de haver um grande número de bibliotecas Python para nos ajudar a realizar essas tarefas rapidamente, é apenas a cereja do bolo.
Embora seja essencial ter um conhecimento decente de programação para fazer ciência de dados, não há necessidade de ter a experiência de um desenvolvedor python. É essencial focar no que é importante: criar melhores modelos de aprendizado de máquina.
Neste post, eu criei 7 Truques do Python que definitivamente vão economizar muito tempo e esforço, e eles o tornarão muito mais eficaz em seu trabalho.
Esta é a quarta parte da minha série de truques, dicas e truques de ciência de dados. Recomendo a leitura das postagens anteriores para se tornar um cientista ou analista de dados mais eficiente:
Também transformei meu aprendizado em um curso gratuito que você pode consultar:
Ao mesmo tempo, se você tem seus próprios truques, dicas e truques de ciência de dados, você pode compartilhá-los com a comunidade aberta neste repositório GitHub: Truques, dicas e truques de ciência de dados no GitHub.
Postamos esses truques diariamente em plataformas de mídia social como LinkedIn, Twitter, Facebook. Certifique-se de seguir #avhackoftheday para obter sua dose diária de cheats!, dicas e truques recém-elaborados de ciência de dados!
Tabela de conteúdo
Neste post, nós cobriremos os truques, Dicas e truques de Python para ciência de dados abaixo:
- Hack de ciência de dados Python # 1 – Zen de Python
- Hack de ciência de dados Python # 2 – Formate seu código usando preto
- Hack de ciência de dados Python # 3 – Depurando código com o depurador Python
- Hack de ciência de dados Python # 4 – Noções básicas sobre listas de geradores v / s
- Hack de ciência de dados Python # 5 – Estruturas de dados de impressão bonita
- Hack de ciência de dados Python # 6 – Rastreamento de tempo para loops aninhados
- Hack de ciência de dados Python # 7 – Bibliotecas de ciência de dados de importação preguiçosa usando Pyforest
Hack de ciência de dados Python # 1 – O Zen de Python
Se em algum momento você estivesse procurando algumas dicas sobre como se tornar um desenvolvedor Python melhor, Este é o lugar. Este truque por si só vai te dar 20 dicas de uma vez.
O Zen de Python, escrito por Tim Peters, fornece um conjunto lindamente escrito de 20 princípios orientadores para escrever programas de computador que influenciam o design da linguagem Python.
Você vai notar que 20 começo, só 19 eles foram escritos. Tim deixou o número inicial 20 para que Guido van Rossum (Autor da linguagem Python) vai completá-lo, mas deixou vazio.
Isso está incluído como um ovo de páscoa no interpretador Python que você pode inserir digitando import this
.
Observação: Estas não são regras rígidas e rápidas, mas será benéfico para você tornar esses princípios seu hábito, porque eles são os princípios orientadores que influenciam o design da linguagem Python.
Hack de ciência de dados Python # 2 – Formate seu código usando preto
Imagine viver em uma casa mágica que se limpa automaticamente quando você acorda.. A folha está dobrada, os pratos estão prontos e você pode desfrutar do seu café da manhã. Isso não parece ótimo?
Isso é o que o preto pode fazer com o seu código!! O negro se autodenomina “O formatador de código intransigente” o que eu acho que é porque simplificou minha vida e meus colegas que lêem meu código.
Black é um formatador de código automático para Python, por isso, apenas escreva o código em seu estilo e, em seguida, formate-o em preto em um código formatado de forma consistente. Isso realmente ajuda a focar no conteúdo ao invés da estrutura.. Ao mesmo tempo, torna a revisão de código mais rápida. Você pode ver este fantástico playground que mostra o poder do preto.
Siga estas etapas para formatar seu código automaticamente:
- Salve seu arquivo Python com a extensão .py.
- Vá para o terminal e digite: “negro [filename.py]”
- Parabéns! Seu arquivo agora está formatado
Hack de ciência de dados Python # 3 – Depurando código com o depurador Python
Todos nós já passamos por momentos em que ficamos presos a um erro bastante persistente e gastamos muito tempo no StackOverflow tentando encontrar uma solução. O depurador Python tornará sua vida mais fácil nessas situações.
PDP é um depurador interativo para programas Python. Sempre que você encontrar um bug, você pode usar PDB para inspecionar seu código linha por linha. Neste exemplo, he usado% pdb, que é um comando mágico em notebooks Jupyter para invocar o depurador python padrão.
Hack de ciência de dados n. ° 4: Geradores Python ou compreensões de lista
O gerador Python produz um item ao mesmo tempo e os gera apenas quando há demanda. Geradores, por isso, eles são muito mais eficientes em termos de memória. Você já usou em seu ciclo de programação diário?
Sim, não é assim, Vou tentar dar-lhe razões para incorporá-lo em sua prática por meio deste código no qual comparei o uso de memória e o consumo de tempo de compreensão de lista e geradores Python.
Hack de ciência de dados n. ° 5: boas estruturas de dados de impressão em python
pprint é um módulo embutido em Python. Oferece a capacidade de imprimir estruturas de dados arbitrárias em um formato “bonito” que é bem formatado e muito mais legível.
Vamos ver neste exemplo, onde tentamos imprimir uma biblioteca aninhada. Este é um truque bastante útil do Python para entender melhor as estruturas de dados.
Hack de ciência de dados n. ° 6: rastreamento de tempo para loops aninhados
A maioria de vocês deve ter ouvido falar do tqdm Biblioteca Python e você pode até mesmo usá-la para rastrear o progresso da execução permanente de loops 'for'. Na maioria das vezes, escrevemos funções complexas com loops “para” aninhado. tqdm torna possível rastrear isso além.
É assim que você pode rastrear loops aninhados usando tdqm sobre Piton:
Hack de ciência de dados Python # 7: Importação preguiçosa de bibliotecas de ciência de dados usando Pyforest
Você já passou por uma situação em que sente que está gastando muito tempo pensando sobre quais bibliotecas importar no início de qualquer projeto de ciência de dados?? Acontece com a maioria de nós!
Eu tenho uma notícia incrível para você: PyForest é a resposta para todos os problemas de importação de sua biblioteca!!
PyForest importa todas as bibliotecas populares de ciência de dados em sua bancada SOMENTE quando você precisa delas. Isso é conhecido como importação lenta em Python. Não se preocupe, não importa toda a lista de bibliotecas ao mesmo tempo. Não importará bibliotecas ou funções de bibliotecas que você não importou.
Veja este vídeo para saber mais sobre ele:
Notas finais
Neste post, nós cobrimos 7 truques, Dicas e truques da ciência de dados Python para se tornar um cientista de dados melhor e mais eficiente. Espero que esses truques ajudem você com suas tarefas de nicho do dia-a-dia e economizem muito tempo..
Me conte seus truques, dicas e truques de ciência de dados na seção de comentários abaixo!