Cómo comencé a ganar concursos de ciencia de datos

Contenidos

Visión general

  • Ganar concursos de ciencia de datos puede ser un procedimiento complejo, pero puede llegar al top 3 si tiene un marco a seguir.
  • Escuche a un experto en hackatones de ciencia de datos y cómo pasó de cero a ganar concursos de ciencia de datos

Introducción

No hay alternativa al aprendizaje por medio de la experiencia. ¡Especialmente en la industria de la ciencia de datos!

Recientemente gané el primer premio en el desafío de recomendación de seguros Zimnat de Zindi, un logro que ocupa el primer lugar entre los resultados de mi competencia de ciencia de datos de todos los tiempos.

En números puros, este no fue mi primer resultado superior, sino solo uno de los más de 30 resultados entre los 3 primeros que he tenido en mi propio viaje de competencia de ciencia de datos. Durante este período de comenzar desde cero y categorizar en los escalones más altos de las tablas de clasificación del hackathon de aprendizaje automático, me he dado cuenta de la relevancia de aprender por medio de la experiencia y no puedo enfatizar lo suficiente en lo importante que es la cita anterior.

Ganar un concurso de ciencia de datos es un viaje lleno de estorbos. ¡Está compitiendo contra las mentes científicas de datos más importantes de todas partes, está trabajando en un obstáculo de ciencia de datos que no se ha resuelto antes y está haciendo todo esto con una fecha límite estricta para arrancar!

Pero puedo asegurarles que obtener los 3 primeros lugares en la tabla de clasificación es absolutamente alcanzable, si sabe lo que está haciendo.

No se pretende que sea una publicación técnica. Se trata de mi viaje hacia las competiciones de ciencia de datos. Y, desde luego, cómo y por qué debería comenzar ahora mismo. Como principiante, ciertamente no querrá perderse la lectura de esto. Pronto aparecerán posts técnicos para los lectores más avanzados, ¡por lo tanto estad atentos!

Como mencioné, no hay mejor manera de aprender ciencia de datos que practicándola. Los animo a unirse a nosotros este fin de semana extendido para un hackathon comunitario guiado donde los expertos en competencia de ciencia de datos lo llevarán por medio de todo el procedimiento del hackathon EN VIVO:

Y siempre puedes visitar el Plataforma DataHack para practicar sus habilidades en ciencia de datos o participar en hackatones.

Mi viaje en la competencia de ciencia de datos: de cero a experto

Uno de nuestros profesores me presentó la ciencia de datos al comienzo del tercer semestre en la universidad. Estaba usando Machine Learning para descubrir planetas similares a la Tierra y la oportunidad de vida extraterrestre.

La curiosidad me siguió y me llevó a sumergirme en el famoso curso de Andrew Ng sobre aprendizaje automático. Me presentaron varias aplicaciones del aprendizaje automático, como el pronóstico del precio del mercado de valores y los automóviles autónomos, por nombrar algunas.

Buscando más en el buscador de Google sobre posibilidades potenciales en este campo, descubrí plataformas como Kaggle y DataPeaker. Añadió más combustible a mi creciente interés en la ciencia de datos. Competir y mejorar constantemente contra el tiempo y una tabla de clasificación fue el próximo desafío; sí, ¡estoy hablando de hackatones de ciencia de datos!

La mayoría de los principiantes con los que he interactuado sienten que primero deben conocer los entresijos del aprendizaje automático. Solo entonces podrás comenzar a competir en Data Science.

Eso es un gran error.

“Para formar parte en concursos de ciencia de datos, solo necesita el impulso de aprender y mejorar constantemente. Conseguirás una buena clasificación «.

Mi primera competencia: el desafío de predicción de malware de Microsoft de Kaggle

Permítanme hablar rápidamente sobre mi primera competencia seria en Kaggle: la competencia de predicción de malware de Microsoft. Esto se produjo meses después de fracasar en una gama de concursos de ciencia de datos. Pero la experiencia adquirida en todas las competiciones hasta ese momento había ayudado.

En solo 2 semanas y con algunas presentaciones en la mano, salté al top 20 de la clasificación pública.

A medida que pasaba el tiempo, formé un equipo con un estudiante de Singapur, un maestro de Kaggle y dos líderes de la industria de Londres, Nueva York y Pune. Trabajar juntos en diferentes zonas horarias fue un desafío en sí mismo, pero logramos discutir e poner en práctica estrategias y modelos día y noche en Slack.

Y en conclusión, conmigo liderando el equipo, terminamos en el puesto 25 en la clasificación privada. Esto estuvo bastante cerca de nuestra clasificación pública de clasificación de 21. Fue un muy buen resultado, considerando que apenas 10 equipos entre los 100 primeros en la clasificación pública pudieron mantener su posición en la clasificación privada.

Avance rápido hasta el día actual, he terminado entre los 3 primeros en más de 30 hackatones de ciencia de datos en varias plataformas. Esto incluye la primera posición en casi todas las plataformas importantes en las que he participado (y sí, dos primeros puestos en la serie JantaHack de DataPeaker).

Este es un breve resumen de mi viaje para conquistar las competencias de ciencia de datos desde cero. A continuación, entendamos cómo puede usted, como principiante, comenzar a participar en concursos de ciencia de datos.

¿Cómo comienzo las competencias de ciencia de datos si soy un principiante?

Aquí hay un consejo que desearía que alguien me hubiera dado cuando comencé a competir en hackatones de ciencia de datos: inscríbase en cualquier competencia con la que se sienta cómodo. Lo más importante es que empieces.

Analítica de Vidhya JanataHack es una serie de competiciones para principiantes que se celebra cada semana. Al final, muchos ganadores además disponen la amabilidad de publicar sus soluciones.

Cualquiera que esté comenzando debe asegurarse de pasar por soluciones ganadoras para concursos de ciencia de datos anteriores. Cuando se encuentre con alguna idea o concepto nuevo, búsquelo en el buscador de Google y tómese el tiempo para comprenderlo. Si no puede transferir su aprendizaje de una competencia a otra, no ha utilizado su tiempo correctamente.

Transferir el aprendizaje es muy importante, desde el aprendizaje profundo hasta el aprendizaje.

¿Cómo me acerco a los concursos de ciencia de datos?

Aquí, he escrito algunos consejos clave que debe prestar atención al comenzar una nueva competencia de ciencia de datos.

  1. Regularmente empiezo con un modelo de línea de base simple. Solo eche un vistazo a los datos, después cree un modelo sin ninguna limpieza de datos o ingeniería de características
  2. A continuación, el objetivo se convierte en comprender el problema y los datos para crear un buen conjunto de validación. Un buen conjunto de validación es imprescindible. Solo entonces podrá confiar en sus resultados locales. Caso contrario, prepárate para una reorganización privada de la tabla de clasificación.
  3. Ingeniería de características es el siguiente paso clave. Las buenas características siempre diferencian entre un ganador y un top 100
  4. A medida que se acerca el final de la competencia, por lo general trato de construir una gama de modelos como modelos de aumento de gradiente, redes neuronales, etc. Después sigue el apilamiento o combinación de estos resultados. Ensamblaje le da la ventaja para ganar una competencia. Por eso, es una herramienta que siempre querrá tener a mano.
  5. Una cosa de la que mucha gente no habla es la relevancia de una base de código. El tiempo es un factor muy importante en cualquier competencia de ciencia de datos. No debe perder el tiempo escribiendo los mismos fragmentos desde cero una y otra vez en múltiples competiciones. En su lugar, concentre su valioso tiempo en hacer algo nuevo y mejor

¿Cuáles son los beneficios de participar en concursos de ciencia de datos?

¡Esa es una pregunta válida! Los concursos de ciencia de datos requieren una cantidad significativa de su tiempo, entonces, ¿valen la pena? Permítanme compartir algunos beneficios de mi experiencia en esta sección.

1. Competir y aprender

Aprende mucho durante las competencias de ciencia de datos, desde la resolución de problemas hasta la construcción de modelos. Si pretendes aprender algo nuevo, los concursos son la mejor forma de hacerlo. En poco tiempo, estudiará y experimentará mucho, y se encontrará constantemente buscando mejores alternativas para mejorar su modelo.

2. Redes

Hasta el día de hoy, me he asociado con más de 25 personas diferentes de India, Singapur, EE. UU., Inglaterra, Francia y África en diferentes competencias de ciencia de datos. Estas personas van desde estudiantes hasta líderes de la industria.

Honestamente, la creación de redes es uno de los mayores beneficios de participar en estos hackatones. Conocer e interactuar con personas de ideas afines es indudablemente un gran activo para su futura carrera.

¡Conseguí mi trabajo actual en DataPeaker gracias a la creación de redes!

3. Creación de perfiles / Creación de currículums

Imagine un escenario en el que está contratando a un científico de datos y ha preseleccionado a dos grandes candidatos. Ambas personas disponen antecedentes similares en ciencia de datos. La primera persona ha completado algunos proyectos en ciencia de datos, mientras que la segunda persona ha completado proyectos similares, así como «Logró el rango» X «en una competencia de ciencia de datos compitiendo contra cientos de personas».

Entonces, ¿a cuál le gustaría dar más preferencia? Como gerente de contratación, la mayoría de las personas preferirían la segunda opción.

Esto no es para socavar la relevancia de un buen proyecto, pero una buena clasificación en una competencia de ciencia de datos definitivamente le da una ventaja frente a su competencia. En la actualidad, muchas compañías prefieren candidatos con experiencia en competencias de ciencia de datos. Como aspirante a Data Science, ¡es hora de que empieces además!

4. Obtener recompensas y ganar premios emocionantes

Por último, pero no menos importante, los competidores experimentados en ciencia de datos disponen mucho que ganar y ganar. Solo durante este encierro, gané suficiente dinero para comprarme un auto. Las plataformas como Kaggle disponen mucho para ti si crees que tienes la capacidad de solucionar los problemas de ciencia de datos más interesantes del mundo. ¿Qué estás esperando aún?

HackLive – ¡Hackathon comunitario guiado!

¿Qué pasaría si hubiera una sesión en vivo que pudiera alentar y ayudar a los principiantes a participar en hackatones de ciencia de datos y mejorar su clasificación? ¿No sería genial?

Desde sus inicios, DataPeaker ha estado tratando de decodificar los problemas que enfrenta la comunidad de ciencia de datos y presentar una solución viable para los mismos. Y la incapacidad para comenzar a participar en Data Science Hackathons ha sido frecuente. Entonces, como un paso para abordar este problema, permítanme presentarles: HackLive 2 – ¡Hackathon comunitario guiado!

Los científicos de datos de DataPeaker combinarán toda su experiencia y conocimiento de la industria para ayudar a la comunidad a responder 3 preguntas:

  • ¿Es importante destacar si tengo una mínima oportunidad de ganar?
  • ¿Como empiezo?
  • ¿Cómo puedo mejorar mi rango en el futuro?

¿Entonces, Qué esperas? Vaya y regístrese en el link de abajo:

Notas finales

Espero haberte dado suficiente motivación para comenzar tu propio viaje hacia las competiciones de ciencia de datos. Próximamente se publicarán más posts técnicos sobre las próximas competiciones de ciencia de datos. ¡Estoy emocionado de compartirlos contigo! Hasta entonces, puede comenzar con algunas de mis soluciones de hackathon en Github aquí.

¿Es un principiante que busca un lugar para comenzar su viaje por la ciencia de datos? Aquí hay un curso completo, lleno de conocimiento y aprendizaje de ciencia de datos, seleccionado solo para que usted aprenda ciencia de datos:

¿Ha participado antes en hackatones de ciencia de datos? ¿Cómo fue tu experiencia? ¡Comparta sus pensamientos con nosotros en la sección de comentarios a continuación y elegiremos los mejores!

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.