Vue d'ensemble
- Python est un excellent langage pour la science des données, mais tout le monde n'est pas un expert en Python
- Nous présentons ici 7 Astuces Python qui vous aideront à naviguer dans votre code Python en un temps doublement rapide!
introduction
“Parler ne coûte pas cher. Montre moi le code “. – Linus Torvalds
Commençons par une question curieuse: Avez-vous envisagé de créer des modèles d'apprentissage automatique en utilisant uniquement un stylo et du papier? En réalité, c'est un excellent moyen d'apprendre comment fonctionne un algorithme. Mais voici le piège: nous vivons au milieu d'un boom des données. Cela signifie que nous ne pouvons rien calculer ou concevoir manuellement.
Les données avec lesquelles nous travaillons dans les projets d'apprentissage automatique sont énormes (et je veux dire ÉNORME). Pour créer un modèle d'apprentissage automatique à cette échelle, nous avons besoin de deux ressources qui fonctionnent simultanément: Le data scientist et la machine! Et c'est là que la puissance de la programmation Python vient au premier plan..
Franchement, Python est l'un des langages les plus polyvalents avec lesquels j'ai jamais travaillé. Il est facile à apprendre et à mettre en œuvre et, malgré cela, est très efficace dans les tâches d'apprentissage machine complexes. Et le fait qu'il existe un grand nombre de bibliothèques Python pour nous aider à accomplir rapidement ces tâches, c'est juste la cerise sur le gâteau.
Bien qu'il soit essentiel d'avoir une bonne connaissance de la programmation pour faire de la science des données, pas besoin d'avoir l'expérience d'un développeur python. Il est essentiel de se concentrer sur ce qui est important: créer de meilleurs modèles d'apprentissage automatique.
Dans ce billet, j'ai créé 7 Des astuces Python qui vous feront économiser beaucoup de temps et d'efforts, et ils le rendront beaucoup plus efficace dans leur travail.
Ceci est la quatrième partie de ma série d'astuces, trucs et astuces en science des données. Je recommande de lire les articles précédents pour devenir un scientifique ou un analyste de données plus efficace:
J'ai aussi fait de mon apprentissage un cours gratuit que vous pouvez consulter:
En même temps, si tu as tes propres trucs, trucs et astuces en science des données, vous pouvez les partager avec la communauté ouverte dans ce référentiel GitHub: Des trucs, trucs et astuces de science des données sur GitHub.
Nous publions ces astuces quotidiennement sur des plateformes de médias sociaux comme LinkedIn, Twitter, Facebook. Assurez-vous de suivre #avhackoftheday pour obtenir votre dose quotidienne d'astuces !, trucs et astuces de science des données fraîchement conçus!
Table des matières
Dans ce billet, nous allons couvrir les astuces, Trucs et astuces Python pour la science des données ci-dessous:
- Piratage de la science des données Python # 1 – Zen de Python
- Piratage de la science des données Python # 2 – Formatez votre code en utilisant Black
- Piratage de la science des données Python # 3 – Déboguer du code avec le débogueur Python
- Piratage de la science des données Python # 4 – Comprendre les listes de générateurs v / s
- Piratage de la science des données Python # 5 – Jolies structures de données d'impression
- Piratage de la science des données Python # 6 – Suivi du temps pour les boucles imbriquées
- Piratage de la science des données Python # 7 – Lazy Import Data Science Libraries à l'aide de Pyforest
Piratage de la science des données Python # 1 – Le Zen de Python
Si à tout moment vous cherchiez des conseils pour devenir un meilleur développeur Python, c'est l'endroit. Cette astuce elle-même vous donnera 20 conseils à la fois.
Le Zen de Python, écrit par Tim Peters, fournit un ensemble magnifiquement écrit de 20 principes directeurs pour l'écriture de programmes informatiques qui influencent la conception du langage Python.
Vous remarquerez que de 20 début, solo 19 ils ont été écrits. Tim a laissé le numéro de début 20 pour Guido van Rossum (auteur du langage Python) le complétera, mais je l'ai laissé vide.
Ceci est inclus comme un œuf de Pâques dans l'interpréteur Python que vous pouvez entrer en tapant import this
.
Noter: Ce ne sont pas des règles strictes et rapides, mais il vous sera bénéfique de faire de ces principes votre habitude car ce sont les principes directeurs qui influencent la conception du langage Python.
Piratage de la science des données Python # 2 – Formatez votre code en utilisant Black
Imaginez vivre dans une maison magique qui se nettoie automatiquement à votre réveil.. La feuille est pliée, les plats sont prêts et vous pouvez profiter de votre café du matin. N'est-ce pas génial?
C'est ce que le noir peut faire avec votre code !! Le noir s'appelle “Le formateur de code sans compromis” ce qui je pense est parce que cela a simplifié ma vie et mes collègues qui lisent mon code.
Black est un formateur de code automatique pour Python, pour cela, écrivez simplement le code dans votre style, puis formatez-le en noir dans un code formaté de manière cohérente. Cela aide vraiment à se concentrer sur le contenu plutôt que sur la structure.. En même temps, rend la revue de code plus rapide. Vous pouvez voir ce terrain de jeu fantastique qui montre la puissance du noir.
Suivez ces étapes pour formater votre code automatiquement:
- Enregistrez votre fichier Python avec l'extension .py.
- Allez au terminal et tapez: “nègre [nom de fichier.py]”
- Toutes nos félicitations! Votre fichier est maintenant formaté
Piratage de la science des données Python # 3 – Déboguer du code avec le débogueur Python
Nous avons tous connu des moments où nous sommes coincés avec une erreur assez persistante et passons beaucoup de temps sur StackOverflow à essayer de trouver une solution. Le débogueur Python vous facilitera la vie dans ces situations.
pdp est un débogueur interactif pour les programmes Python. Chaque fois que vous trouvez un bug, vous pouvez utiliser pdb pour inspecter votre code ligne par ligne. Dans cet exemple, il a utilisé %pdb, qui est une commande magique dans les cahiers Jupyter pour appeler le débogueur python standard.
piratage de la science des données n. ° 4: Générateurs Python ou compréhensions de liste
Le générateur Python produit un élément en même temps et ne les génère que lorsqu'il y a une demande. Générateurs, pour cela, ils sont beaucoup plus efficaces en mémoire. L'avez-vous déjà utilisé dans votre cycle de programmation quotidien?
Si ce n'est pas comme ça, Je vais essayer de vous donner des raisons pour l'intégrer dans votre pratique au moyen de ce code dans lequel j'ai comparé l'utilisation de la mémoire et la consommation de temps de la compréhension de liste et des générateurs Python.
piratage de la science des données n. ° 5: belles structures de données d'impression en python
pprint est un module intégré à Python. Vous donne la possibilité d'imprimer des structures de données arbitraires dans un format “beau” qui est bien formaté et beaucoup plus lisible.
Voyons cela dans cet exemple où nous essayons d'imprimer une bibliothèque imbriquée. C'est une astuce Python assez utile pour mieux comprendre les structures de données.
piratage de la science des données n. ° 6: suivi du temps pour les boucles imbriquées
La plupart d'entre vous doivent avoir entendu parler du tqdm bibliothèque Python et vous pouvez même l'utiliser pour suivre la progression de l'exécution permanente des boucles 'for'. La plupart du temps, nous écrivons des fonctions complexes avec des boucles “pour” imbriqué. tqdm permet de suivre cela en plus.
Voici comment vous pouvez tracer des boucles imbriquées en utilisant tdqm dans Piton:
Piratage de la science des données Python # 7: bibliothèques de science des données d'importation paresseuse à l'aide de Pyforest
Avez-vous été dans une situation où vous avez l'impression de passer trop de temps à réfléchir aux bibliothèques à importer au début de tout projet de science des données? ça arrive à la plupart d'entre nous!
J'ai des nouvelles incroyables pour vous: PyForest est la réponse à tous vos problèmes d'importation de bibliothèque !!
PyForest importe toutes les bibliothèques populaires de science des données dans votre plan de travail UNIQUEMENT lorsque vous en avez besoin. Ceci est connu sous le nom d'importation paresseuse en Python. Ne t'inquiète pas, peu importe la liste entière des bibliothèques en même temps. N'importera pas de bibliothèques ou de fonctions à partir de bibliothèques que vous n'avez pas importées.
Regardez cette vidéo pour en savoir plus sur lui:
Remarques finales
Dans ce billet, nous couvrons 7 des trucs, Trucs et astuces de science des données Python pour devenir un scientifique des données meilleur et plus efficace. J'espère que ces astuces vous aideront dans vos tâches de niche quotidiennes et vous feront gagner beaucoup de temps..
Dis moi tes trucs, trucs et astuces en science des données dans la section des commentaires ci-dessous!