Tu mentor para convertirte en un experto en aprendizaje automático

Contenidos

¿Quiere aprender el aprendizaje automático en 2020? ¡Aquí está la ruta de aprendizaje completa y estructurada actualizada para dominar el dominio este año!

¡El aprendizaje automático es un tema complejo de dominar!

No solo hay una gran cantidad de recursos disponibles, sino que además envejecen muy rápido. Combine esto con mucha jerga técnica y podrá ver por qué las personas se pierden mientras persiguen el aprendizaje automático. A pesar de esto, esto es solo una parte de la historia. No puede dominar el aprendizaje automático sin pasar por la rutina usted mismo. Debe dedicar horas a comprender los matices de la ingeniería de funciones, su relevancia y el impacto que puede tener en sus modelos.

Por medio de esta ruta de aprendizaje, esperamos brindarle una respuesta a este problema. Hemos cargado deliberadamente esta ruta de aprendizaje con muchos proyectos prácticos. ¡No se puede dominar el aprendizaje automático con el trabajo duro! Pero una vez que lo hagas, serás una de las personas más buscadas.

Dado que este es un tema complejo, le sugerimos que siga estrictamente los pasos en orden secuencial. Considérelo su mentor para el aprendizaje automático. Solo omita un paso si ya conoce el tema mencionado en ese paso.

La mejor forma de aprender el aprendizaje automático

Calentamiento: ¿cómo es útil el aprendizaje automático?

Si eres un principiante completo en el aprendizaje automático, aquí tienes una buena charla de Jeremy Howard para comprender cómo el aprendizaje automático está cambiando este mundo. Jeremy analiza varias aplicaciones de aprendizaje automático y aprendizaje profundo. Jeremy, además analiza algunas formas en las que el aprendizaje automático puede afectar a este mundo.

Aún no estoy seguro, mira este video más pequeño en entrenar una máquina para jugar a Super Mario.

¿Emocionado por lo que puede lograr el aprendizaje automático? Veamos una ruta de aprendizaje para convertirlo en un experto en aprendizaje automático.

Lectura opcional: Conceptos básicos del aprendizaje automático para principiantes

Paso 0: Conceptos básicos de R / Python

Hay varios lenguajes que proporcionan capacidades de aprendizaje automático. Al mismo tiempo, se está realizando un trabajo de desarrollo a un ritmo rápido en varios idiomas. Actualmente «R» y «Pitón”Son los idiomas más utilizados y hay suficiente apoyo / comunidad disponible para ambos. Antes de entrar en el mundo de ML, le recomendaría que elija uno de estos dos lenguajes (R o Python) que pueden contribuir a centrarse en el aprendizaje automático (¿Cuál es mejor, R o Python?).

Mantenga su enfoque en comprender los conceptos básicos del lenguaje, las bibliotecas y la estructura de datos. Aquí está la guía paso a paso para aprender R y Python:

a) Ruta de aprendizaje en R: Paso 0 al paso 2

b) Ruta de aprendizaje en Python: Paso 0 al paso 2

Otros idiomas que puede considerar: Scala, Go / Julia en los próximos tiempos

Paso 1: Aprenda estadística descriptiva e inferencial básica

Comencemos o refresquemos nuestro aprendizaje estadístico. Es bueno comprender las estadísticas descriptivas e inferenciales antes de comenzar un desarrollo serio del aprendizaje automático. Udacity ofrece un curso sobre estadísticas descriptivas y Estadística inferencial. Ambos cursos utilizarían Excel para enseñarle todos los conceptos básicos de estadística. Si ya los conoce, puede actualizar u omitir este paso.

Asignación: Puede realizar asignaciones de ambos cursos usando el idioma que elija (R / Python). Puede consultar las bibliotecas y métodos estadísticos respectivos para ambos idiomas a continuación.

R: Estadisticas

Pitón: Scipy, Numpy, Pandas

Debe leer: ¿Diferencia entre aprendizaje automático y modelado estadístico?

Paso 2: exploración / limpieza / preparación de datos

Lo que diferencia a un buen profesional de aprendizaje automático de uno promedio es la calidad de la ingeniería de funciones y la limpieza de datos que ocurre en los datos originales. Cuanto más tiempo de calidad pases aquí, mejor será. Este paso además toma la mayor parte de su tiempo y, por eso, ayuda a estructurarlo. Puede consultar una serie de posts a continuación para conocer las diferentes etapas de la exploración de datos.

  1. Identificación de variables, análisis univariante y multivariado
  2. Tratamiento de valores perdidos
  3. Tratamiento de valores atípicos
  4. Ingeniería de funciones

Además puede consultar los métodos de exploración de datos en R y Python:

Ejercicio / tarea:

  1. Aborde el titánico problema de supervivencia de Kaggle, construya un conjunto de hipótesis y después limpie los datos, agregue nuevas funciones al conjunto de datos existente. Piense cuál es la mejor manera de imputar la edad perdida.
  2. De la misma forma, aborde el problema de pronóstico de la demanda de bicicletas compartidas y repita el ciclo mencionado previamente.

Paso 3: Introducción al aprendizaje automático

Ahora debería abrir las puertas al aprendizaje automático. Hay varios recursos disponibles para comenzar con las técnicas de aprendizaje automático. Le sugiero que elija una de las siguientes 2 formas según su estilo de aprendizaje:

  • Opción 1: Si eres de los que le gusta llevar el aprendizaje en pequeños pasos pequeños y necesita más agarre de la mano, debe comenzar desde Curso de aprendizaje automático de Andrew Ng: Es un buen curso para principiantes y fácil de comprender. El profesor Ng es increíble al hacer que los conceptos difíciles te lleguen tan fácilmente. El curso cubre todos los algoritmos básicos y además presenta algunos temas avanzados como redes neuronales, sistema de recomendación y aplicación de aprendizaje automático en grandes bases de datos usando Map Reduce. Él elige utilizar Octave / MATLAB en lugar de los más populares R o Python para enseñar el aprendizaje automático. Una vez completado, debe continuar con los ejercicios y tareas provistos en la Opción 2.
  • Opcion 2: Si es más independiente, le gustan los desafíos y puede luchar contra tareas difíciles, debe tomar Formulario de aprendizaje del curso de datos del profesor Yaser Abu-Mostafa: Este curso brinda un tratamiento asombroso de los conceptos detrás del aprendizaje automático, pero tenga en cuenta que este curso es bastante pesado en matemáticas y la teoría detrás del aprendizaje automático (cosas como la dimensión VC). Además necesita más conocimientos de programación y, por eso, es más avanzado en ese sentido. Este curso está cargado de trabajos a domicilio (lo cual no es necesariamente algo malo).

Ahora, conoce bien los algoritmos y las técnicas. Veamos las bibliotecas o paquetes disponibles en R o Python. Puede consultar la ruta de aprendizaje (paso 6) de R (al mismo tiempo, Algoritmos ML en R) y Python para explorar estos paquetes y las alternativas asociadas.

Paso 4: participar en la competencia Kaggle Knowledge

A estas alturas, tiene todas las herramientas que necesita para competir en los concursos de conocimientos de Kaggle. Estos concursos de conocimientos disponen un nivel de dificultad menor en comparación con los desafíos premiados. Además puede hallar varios recursos relacionados para comenzar su viaje de ciencia de datos. A continuación se muestra la lista de la competencia de conocimiento en este momento activa:

Debe leer: ¿Cómo comienzo mi viaje en Kaggle?

Paso 5: aprendizaje automático avanzado

Ahora que ha aprendido la mayoría de las técnicas de aprendizaje automático, es hora de explorar técnicas avanzadas de aprendizaje automático para comprender las diferentes estructuras de datos, como el aprendizaje profundo y el aprendizaje automático con Big Data.

Aprendizaje profundo

¿Conoce el aprendizaje profundo? si no es así, aquí hay una breve introducción al respecto y más detalles sobre el aprendizaje profundo. Ver video aquí. A continuación, se muestra la lista de recursos de aprendizaje profundo que lo ayudarán a comenzar:

Modelado de conjuntos

Aquí es donde un experto es distinto de un profesional promedio. El ensamble puede agregar mucho poder a tus modelos y ha sido una técnica muy exitosa en varias competiciones de Kaggle. Aquí está uno de los la mejor guía sobre el modelado de ensamblajes nos hemos hallado.

Aprendizaje automático con Big Data

Como sabe, el tamaño de los datos aumenta a un ritmo exponencial, pero los datos sin procesar no son útiles hasta que comience a obtener información de ellos. El aprendizaje automático no es más que aprender de los datos, generar conocimientos o identificar patrones en el conjunto de datos disponibles. Hay varias aplicaciones de algoritmos de aprendizaje automático como «detección de spam», «clasificación de documentos web», «detección de fraude», «sistema de recomendación» y muchos otros. A continuación se muestra la lista de tutoriales para lidiar con big data usando el aprendizaje automático.

Paso 6: participar en la competencia de Kaggle de la transmisión principal

Ahora tiene la mayoría de las habilidades técnicas y estadísticas. Es hora de comenzar a aprender de otros científicos de datos mientras compite con ellos. Kaggle Es un lugar semejante al que queremos una plataforma más activa, comprometida y competitiva. A los científicos de datos les apasiona el rendimiento de su rango y modelo. Ve, sumérgete en una de las competiciones en vivo que se llevan a cabo en este momento en Kaggle y prueba todo lo que has aprendido. ¡Buena suerte!

Paso opcional: minería de texto y bases de datos

Si necesita aplicar el aprendizaje automático a la minería de texto, puede consultar la próxima guía para limpiar datos de texto y crear modelos a partir de ellos. Además puede ver la próxima competencia de Kaggle:

La parte divertida

Ahora que entiendes qué y dónde aprender para convertirte en un profesional del aprendizaje automático, aquí tienes una pequeña simulación de cómo El robot basado en algoritmos genéticos aprendería a caminar.

Y algunas cosas serias

Ahora que conoce el potencial del aprendizaje automático, imagine el impacto que podría tener en el mundo actual. La charla de Jeremy menciona brevemente sobre esto. El siguiente post habla de esta evolución desde una perspectiva distinto: parte 1 Y parte 2

Espero que haya disfrutado de esta ruta de aprendizaje sobre el aprendizaje automático y el impacto que el aprendizaje automático puede tener en nuestro futuro. Si tiene alguna sugerencia para impulsar esta ruta de aprendizaje, no dude en compartirla por medio de los comentarios a continuación.

Si le gusta lo que acaba de leer y desea continuar con su aprendizaje sobre análisis, suscríbete a nuestros correos electrónicos, Síguenos en Twitter o como nuestro pagina de Facebook.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.