Hacks de Python | Consejos y trucos de Python

Contenidos

Visión general

  • Python es un excelente lenguaje para la ciencia de datos, pero no todos son expertos en Python
  • ¡Aquí presentamos 7 trucos de Python que lo ayudarán a navegar por su código de Python en un tiempo doblemente rápido!

Introducción

«Hablar es barato. Muéstrame el código «. – Linus Torvalds

Comencemos con una pregunta un poco curiosa: ¿ha considerado crear modelos de aprendizaje automático usando solo lápiz y papel? En realidad, es un método fenomenal para aprender cómo funciona un algoritmo. Pero aquí está el truco: vivimos en medio de un boom de datos. Esto significa que no podemos calcular ni diseñar nada manualmente.

Los datos con los que trabajamos en proyectos de aprendizaje automático son enormes (y me refiero a ENORMES). Para construir un modelo de aprendizaje automático a esa escala, necesitamos dos recursos que trabajen simultáneamente: ¡el científico de datos y la máquina! Y ahí es donde el poder de la programación Python pasa a primer plano.

Honestamente, Python es uno de los lenguajes más versátiles con los que he trabajado. Es fácil de aprender e poner en práctica y, a pesar de esto, es sumamente eficaz en tareas complejas de aprendizaje automático. Y el hecho de que haya una gran cantidad de bibliotecas de Python para ayudarnos a realizar rápidamente estas tareas, es solo la guinda del pastel.

Python_hacks

Aunque es esencial tener un conocimiento de programación decente para realizar ciencia de datos, no es necesario tener la experiencia de un desarrollador de Python. Es esencial centrarse en lo importante: crear mejores modelos de aprendizaje automático.

En este post, he creado 7 trucos de Python que definitivamente le ahorrarán mucho tiempo y esfuerzo, y lo harán mucho más efectivo en su trabajo.

Esta es la cuarta parte de mi serie de trucos, consejos y trucos de ciencia de datos. Recomiendo leer los posts anteriores para convertirse en un científico o analista de datos más eficiente:

Además he convertido mi aprendizaje en un curso sin costes que puedes consultar:

Al mismo tiempo, si tiene sus propios trucos, consejos y trucos de ciencia de datos, puede compartirlos con la comunidad abierta en este repositorio de GitHub: Trucos, consejos y trucos de ciencia de datos en GitHub.

Publicamos estos trucos a diario en plataformas de redes sociales como LinkedIn, Gorjeo, Facebook. ¡Asegúrese de seguir #avhackoftheday para obtener su dosis diaria de trucos, consejos y trucos de ciencia de datos recién elaborados!

Tabla de contenido

En este post, cubriremos los trucos, consejos y trucos de Python para la ciencia de datos a continuación:

  1. Python Data Science Hack # 1 – Zen of Python
  2. Python Data Science Hack # 2 – Formatee su código usando Black
  3. Python Data Science Hack # 3 – Depuración de código con Python Debugger
  4. Python Data Science Hack # 4 – Comprensión de listas de generador v / s
  5. Python Data Science Hack # 5 – Estructuras de datos de impresión bonita
  6. Python Data Science Hack # 6 – Seguimiento del tiempo para bucles anidados
  7. Python Data Science Hack # 7 – Bibliotecas de ciencia de datos de importación perezosa usando Pyforest

Python Data Science Hack # 1 – El zen de Python

Si en algún momento buscó obtener algunos consejos acerca de cómo convertirse en un mejor desarrollador de Python, este es el lugar. Este truco en sí mismo te dará 20 consejos de una vez.

El Zen de Python, escrito por Tim Peters, proporciona un conjunto bellamente escrito de 20 principios rectores para escribir programas de computadora que influyen en el diseño del lenguaje Python.

Notarás que de 20 principios, solo 19 se han escrito. Tim dejó el principio número 20 para que Guido van Rossum (autor del lenguaje Python) lo completara, pero lo dejó vacío.

Esto se incluye como un huevo de pascua en el intérprete de Python al que puede entrar escribiendo import this.

Nota: Estas no son reglas estrictas y rápidas, pero será beneficioso para usted convertir estos principios en su hábito debido a que son los principios rectores que influyen en el diseño del lenguaje Python.

Python Data Science Hack # 2 – Formatee su código usando Black

Imagínese vivir en una casa mágica que se limpia automáticamente cuando se despierta. La sábana está doblada, la vajilla está lista y puedes disfrutar de tu café de la mañana. ¿No suena genial?

¡Eso es lo que el negro puede hacer con tu código! El negro se llama a sí mismo «El formateador de código intransigente» lo que creo que se debe a que me ha simplificado la vida y a mis colegas que leen mi código.

Black es un formateador de código automático para Python, por eso, simplemente escribe código en tu estilo y posteriormente lo formatea en negro en un código formateado de manera consistente. Esto verdaderamente ayuda a enfocarse en el contenido más que en la estructura. Al mismo tiempo, hace que la revisión del código sea más rápida. Puedes ver este fantástico parque infantil que muestra el poder del negro.

Siga estos pasos para formatear su código automáticamente:

  1. Guarde su archivo Python con la extensión .py.
  2. Ve a la terminal y escribe: «negro [filename.py]»
  3. ¡Felicitaciones! Su archivo ahora está formateado

Python Data Science Hack # 3 – Depuración de código con Python Debugger

Todos hemos experimentado momentos en los que estamos atrapados en un error bastante persistente y pasamos mucho tiempo en StackOverflow tratando de hallar una solución. El depurador de Python le facilitará la vida en estas situaciones.

pdp es un depurador interactivo para programas Python. Siempre que encuentre un error, puede utilizar pdb para inspeccionar su código línea por línea. En este ejemplo, he usado% pdb, que es un comando mágico en los cuadernos de Jupyter para invocar el depurador estándar de Python.

Hack de ciencia de datos n. ° 4: generadores de Python o comprensiones de listas

El generador de Python produce un elemento al mismo tiempo y los genera solo cuando hay demanda. Los generadores, por eso, son mucho más eficientes en memoria. ¿Ya lo ha utilizado en su ciclo de programación diario?

Si no es así, intentaré darte razones para incorporarlo en tu práctica por medio de este código en el que comparé el uso de memoria y el consumo de tiempo de la comprensión de listas y los generadores de Python.

Hack de ciencia de datos n. ° 5: estructuras de datos de impresión bonita en Python

pprint es un módulo integrado en Python. Le brinda la capacidad de imprimir estructuras de datos arbitrarias en un formato «bonito» que está bien formateado y es mucho más legible.

Veámoslo en este ejemplo en el que intentamos imprimir una biblioteca anidada. Este es un truco de Python bastante útil para comprender mejor las estructuras de datos.

Hack de ciencia de datos n. ° 6: seguimiento del tiempo para bucles anidados

La mayoría de ustedes debe haber oído hablar del tqdm Biblioteca de Python y es factible que inclusive la esté usando para realizar un seguimiento del progreso de la ejecución permanente de bucles ‘for’. La mayoría de las veces escribimos funciones complejas con bucles «for» anidados. tqdm posibilita rastrear eso además.

Así es como puede rastrear bucles anidados usando tdqm en Pitón:

Python Data Science Hack # 7: bibliotecas de ciencia de datos de importación perezosa usando Pyforest

¿Ha estado en una situación en la que siente que está pasando demasiado tiempo pensando en qué bibliotecas importar al comienzo de cualquier proyecto de ciencia de datos? ¡Nos pasa a la mayoría de nosotros!

Tengo una noticia increíble para ti: ¡PyForest es la respuesta para todos tus problemas de importación de bibliotecas!

PyForest importa todas las bibliotecas de ciencia de datos populares a su entorno de trabajo SÓLO cuando las necesita. Esto se conoce como importación diferida en Python. No se preocupe, no importa toda la lista de bibliotecas al mismo tiempo. No importará las bibliotecas o funciones de las bibliotecas que no haya importado.

Mira este video para saber más sobre él:

Notas finales

En este post, cubrimos 7 trucos, consejos y trucos de ciencia de datos de Python para convertirnos en un científico de datos mejor y más eficiente. Espero que estos trucos te ayuden con las tareas de nicho del día a día y te ahorren mucho tiempo.

¡Cuéntame tus trucos, consejos y trucos de ciencia de datos en la sección de comentarios a continuación!

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.