Introducción
Hay una cantidad abrumadora de recursos disponibles en estos días para aprender conceptos de visión por computadora. ¿Cómo eliges y eliges entre una multitud de tutoriales? ¿En qué vale la pena invertir tu tiempo?
Si estas preguntas le suenan familiares, ha venido al lugar correcto. Entendemos el dolor y el esfuerzo que implica utilizar cientos de recursos y elegir los que merecen su tiempo. Esa es una de las principales razones por las que lanzamos rutas de aprendizaje en primer lugar.
Hasta el año pasado, nos enfocamos ampliamente en dos caminos: aprendizaje automático y aprendizaje profundoEl aprendizaje profundo, una subdisciplina de la inteligencia artificial, se basa en redes neuronales artificiales para analizar y procesar grandes volúmenes de datos. Esta técnica permite a las máquinas aprender patrones y realizar tareas complejas, como el reconocimiento de voz y la visión por computadora. Su capacidad para mejorar continuamente a medida que se le proporcionan más datos la convierte en una herramienta clave en diversas industrias, desde la salud.... Pero nuestra comunidad quería caminos más granulares; también querían un camino de aprendizaje estructurado para la visión por computadora.
Y eso es comprensible. La demanda y el valor de un experto en visión por computadora es muy alto en la industria. Especialícese en visión por computadora y sus diferentes facetas, y verá una gran cantidad de reclutadores tratando de ponerle las manos encima.
Recuerdo cuando comencé mi propio viaje de visión por computadora. Me refería a múltiples recursos simultáneamente: libros, artículos (de los cuales no había muchos en ese momento), videos de YouTube, entre otras cosas. Fue un camino disperso para dominar la visión por computadora.
Por lo tanto, me complació tener la oportunidad de armar esta ruta de aprendizaje estructurada de visión por computadora para usted. Antes de adentrarnos en él, comprendamos el marco que he creado para agilizar su viaje de aprendizaje.
Nuestro marco para la ruta de aprendizaje de la visión por computadora
Cada mes también tiene una estructura. Así es como hemos categorizado los diferentes aspectos que debes conocer para cada mes:
- Objetivo: ¿Qué aprenderás en ese mes? ¿Cuáles son las conclusiones clave? ¿Cómo progresará su viaje de visión por computadora? Mencionamos esto al comienzo de cada mes para asegurarnos de que sepa dónde se encuentra y dónde estará al final de ese mes en particular.
- Hora sugerida: Cuánto tiempo en promedio debería dedicar a esa sección por semana
- Recursos para aprender: Una colección de los principales recursos para los temas de visión por computadora que aprenderá en ese mes. Esto incluye artículos, tutoriales, videos, trabajos de investigación y otros recursos similares.
Puedes descargar la infografía correspondiente de esta ruta de aprendizaje. aquí.
¿Busca otras rutas de aprendizaje en ciencia de datos? No se preocupe, lo tenemos cubierto:
Mes 1 – Cubriendo los conceptos básicos: Python y estadísticas
Objetivo: Al final del primer mes, tendrá un conocimiento básico de lo que es la visión por computadora. También se sentirá cómodo con Python y Estadísticas, ambos temas centrales en su viaje de visión por computadora.
Hora sugerida: 5-6 horas por semana
Introducción y motivación para la visión por computadora: Tutorial de SAS en Computer Vision: qué es y por qué es importante.
Requisitos previos:
Mes 2 – Resolviendo un Problema de clasificación de imágenes mediante el aprendizaje automático
Objetivo: Tendrá una comprensión básica del aprendizaje automático. Debe sentirse cómodo con las diferentes técnicas de preprocesamiento de imágenes y podrá resolver problemas de clasificación de imágenes utilizando modelos de aprendizaje automático.
Hora sugerida: 5-6 horas por semana
Conceptos básicos del aprendizaje automático:
Procesamiento previo de imágenes:
Clasificación de imágenes mediante aprendizaje automático:
Proyecto: Identificar las prendas
Mes 3 – Introducción a Keras y redes neuronales
Objetivo: Aprenderá una de las herramientas de aprendizaje profundo más utilizadas: Keras. También comprenderá qué son las redes neuronales y cómo funcionan. A finales de marzo, podrá resolver problemas de clasificación de imágenes utilizando redes neuronales.
Hora sugerida: 4-5 horas por semana
Sentirse cómodo con Keras:
Introducción a las redes neuronales:
- Redes neuronales de 3Blue1Brown:
Proyecto: Identificar las prendas
Mes 4: comprensión de las redes neuronales convolucionales (CNN), transferencia del aprendizaje y creación de su perfil
Objetivo: Me gusta llamar a este el mes «en movimiento» en su viaje de visión por computadora. Aquí es donde las cosas suben de nivel con la introducción a las redes neuronales convolucionales (CNN). Estas CNN están detrás de muchas de las aplicaciones recientes de visión por computadora que vemos a nuestro alrededor, incluida la detección de objetos. En este punto de su viaje, también debe comenzar a construir su perfil participando en concursos.
Hora sugerida: 6-7 horas por semana
Introducción a las redes neuronales convolucionales (CNN):
Introducción al aprendizaje transferidoEl aprendizaje transferido se refiere a la capacidad de aplicar conocimientos y habilidades adquiridos en un contexto a otro diferente. Este fenómeno es fundamental en la educación, ya que facilita la adaptación y resolución de problemas en diversas situaciones. Para optimizar el aprendizaje transferido, es importante fomentar conexiones entre los contenidos y promover la práctica en entornos variados, lo que contribuye al desarrollo de competencias transferibles....:
Proyecto: Identificar los dígitos
Construye tu perfil: participa en concursos:
Mes 5: resolución de problemas de detección de objetos
Objetivo: La detección de objetos es una técnica de visión por computadora ampliamente utilizada (quizás LA más utilizada). ¡Esto es lo que me atrajo a la visión por computadora en primer lugar! Este mes se trata de familiarizarse con los diferentes algoritmos de detección de objetos. Además, recomiendo encarecidamente escribir artículos sobre los conceptos que ha aprendido hasta ahora.
Hora sugerida: 6-7 horas por semana
Solución de problemas de detección de objetos:
Proyecto:
Comience a escribir artículos para interactuar con la comunidad, construir su perfil y solidificar su propia comprensión de los temas.
Mes 6: Comprensión de la segmentación de imágenes y los modelos de atención
Objetivo: En junio, aprenderá a resolver problemas de segmentaciónLa segmentación es una técnica clave en marketing que consiste en dividir un mercado amplio en grupos más pequeños y homogéneos. Esta práctica permite a las empresas adaptar sus estrategias y mensajes a las características específicas de cada segmento, mejorando así la eficacia de sus campañas. La segmentación puede basarse en criterios demográficos, psicográficos, geográficos o conductuales, facilitando una comunicación más relevante y personalizada con el público objetivo.... de imágenes. También comprenderá qué son los modelos de atención (tanto teórica como práctica). Aquí es donde su inmersión profunda en la visión por computadora realmente comienza a dar sus frutos.
Hora sugerida: 6-7 horas por semana
Introducción a la segmentación de imágenes:
Proyecto: Desafío de segmentación de COCO
Modelos de atención:
Mes 7: Explore las herramientas de aprendizaje profundo
Objetivo: ¡Un mes de aprendizaje realmente divertido! Hemos cubierto muchos conceptos de visión por computadora hasta ahora, ¡ahora es el momento de ponerse manos a la obra con los marcos de aprendizaje profundo de última generación! Esto se reduce a la elección, pero recomendamos los dos más comunes en la industria en este momento: PyTorch y TensorFlow. Intente implementar todos los conceptos que ha cubierto hasta ahora en cualquiera de estas herramientas.
Hora sugerida: 6-7 horas por semana
PyTorch:
TensorFlow:
Mes 8 – Comprensión de los conceptos básicos de PNL y subtítulos de imágenes
Objetivo: Aquí es donde comienza tu especialización. Aquí tiene la oportunidad de combinar su conocimiento de aprendizaje profundo con los conceptos de procesamiento del lenguaje natural (NLP) para resolver proyectos de subtítulos de imágenes.
Hora sugerida: 6-7 horas por semana
Conceptos básicos del procesamiento del lenguaje natural (PNL):
- Incrustaciones de palabras de Stanford:
- Introducción a las redes neuronales recurrentes (RNN):
Comprensión de los subtítulos de imágenes
Proyecto: Desafío de subtítulos de COCO
Mes 9 – Familiarizándose con las Redes Adversarias Generativas (GAN)
Objetivo: En septiembre, comprenderá acerca de las Redes Adversarias Generativas (GAN). Las GAN se han disparado desde que Ian Goodfellow las presentó oficialmente en 2014. Hay muchas aplicaciones de las GAN en el mundo real en estos días, incluida la pintura, la generación de imágenes, etc.
Hora sugerida: 6-7 horas por semana
Comprensión de las redes generativas de confrontación (GAN):
- Redes generativas de confrontación (GAN) por Ian Goodfellow:
Mes 10: Introducción a la analítica de video
Objetivo: El análisis de video es una aplicación próspera de la visión por computadora. La demanda de esta habilidad solo aumentará en 2020 (y más allá), por lo que es una buena idea tener al menos un conocimiento práctico de cómo trabajar con conjuntos de datos de video.
Hora sugerida: 5-6 horas por semana
Introducción a la analíticaLa analítica se refiere al proceso de recopilar, medir y analizar datos para obtener información valiosa que facilite la toma de decisiones. En diversos campos, como los negocios, la salud y el deporte, la analítica permite identificar patrones y tendencias, optimizar procesos y mejorar resultados. El uso de herramientas avanzadas y técnicas estadísticas es fundamental para transformar datos en conocimiento aplicable y estratégico.... de video:
Meses 11 y 12 – Resolviendo proyectos y construyendo su perfil
Objetivo: Los dos últimos meses se tratan de adquirir experiencia práctica y participar en múltiples proyectos y concursos. Hasta ahora hemos cubierto proyectos junto con conceptos de aprendizaje; ahora es el momento de dar rienda suelta a su aprendizaje en conjuntos de datos del mundo real.
Hora sugerida: 5-6 horas por semana
Infografía – Ruta de aprendizaje de visión artificial para 2020
Hacer un seguimiento de su progreso a medidaLa "medida" es un concepto fundamental en diversas disciplinas, que se refiere al proceso de cuantificar características o magnitudes de objetos, fenómenos o situaciones. En matemáticas, se utiliza para determinar longitudes, áreas y volúmenes, mientras que en ciencias sociales puede referirse a la evaluación de variables cualitativas y cuantitativas. La precisión en la medición es crucial para obtener resultados confiables y válidos en cualquier investigación o aplicación práctica.... que aprende cosas nuevas es clave para un proceso de aprendizaje estructurado. Me gusta mantener una lista de verificación a medida que aprendo, marcando cosas a medida que profundizo en el dominio. ¿Y qué mejor lista de verificación que una ilustrada con un desglose mes a mes de esta ruta de aprendizaje de visión por computadora? Aquí tienes: