Introducción a la ciencia de datos para principiantes

Contenidos

.

«Las empresas están invirtiendo enormemente en ciencia de datos».

Después de completar mi ingeniería y comenzar mi trabajo, fui bombardeado continuamente con estas declaraciones en Internet. Estaba desconcertado y, como el Señor Buda quería saber la verdad de la vida, también quería aclarar mis dudas. Para buscar respuestas, busqué en Internet y me acerqué a muchas personas dentro y fuera de este dominio.

En este artículo, he recopilado cómo decidí comenzar mi viaje hacia la ciencia de datos. Discutiremos cómo construir su perfil digital y

¿La ciencia de datos es real o simplemente vino viejo en una botella nueva?

843579-4586040

La ciencia de datos siempre estuvo presente entre nosotros. Excel, SQL, Estadísticas son las herramientas de la ciencia de datos para la edad temprana. Esto no hace que este campo sea obsoleto. La ciencia de datos siempre nos sorprenderá con trucos de magia nuevos y actualizados. Anteriormente, solíamos introducir datos en una hoja de Excel y luego trazar gráficos. Hoy en día, los datos se almacenan automáticamente y los gráficos se trazan automáticamente con herramientas de visualización avanzadas. Con el avance, la ciencia de datos nos ha dado muchas palabras de moda como aprendizaje automático, aprendizaje profundo, AIOps, etc. y seguirá haciéndolo.

No hay nada como una talla única para todos

487462-7964443

Para ser honesto, no hay un camino definido y tampoco debería haber uno. La verdadera esencia de la ciencia de datos son personas de diferentes orígenes y tecnicismos que trabajan juntas. De cualquier viaje que haya cubierto, puedo simplemente darle nombres de cursos y decirle que complete esos cursos y haga esos proyectos, pero esto se sentirá como una carga para usted. Estará en una carrera de ratas de completar los cursos y proyectos y, finalmente, se agotará. Soy un ingeniero electrónico cuyo proyecto de fin de año fue la puerta inteligente de reconocimiento facial con Raspberry Pi, cuyo interés lo llevó a aprender Machine Learning y Deep Learning. Tampoco seguí un camino específico, siempre fui con lo que me gustaba y me mantenía despierto por las noches.

Aprendiendo ciencia de datos: ¿Sí o NO?

257493-7103210

Muchos de ustedes podrían estar pensando si una persona que no es informática / informática puede aprender ciencia de datos o no. La respuesta es sí. Una persona que no sea CS / IT puede aprender ciencia de datos y no es una obligación para CS / IT aprender ciencia de datos.

No es necesario iniciar DS, ML o AI debido a la presión social. Es posible que se sienta excluido si no se está preparando ampliamente para la ira de la IA. Si eres bueno en lo que estás haciendo y te encanta lo que estás haciendo, entonces es increíble seguir haciendo lo que estás haciendo y mantenerte actualizado leyendo noticias y blogs.

Al igual que la biodiversidad es necesaria para equilibrar el ecosistema, de manera similar, la diversidad tecnológica es necesaria para una comunidad próspera. Siempre necesitaremos ingenieros mecánicos, eléctricos, artistas, desarrolladores web, desarrolladores de aplicaciones, creadores de contenido, médicos, cineastas, CA, atletas, etc.

¿Qué tan profundo debería sumergirse en la ciencia de datos?

605734-7628649

Entonces, echemos un vistazo a algunos dominios asociados con la ciencia de datos que se pueden seguir:

  • Ingeniería de datos y almacenamiento de datos: se ocupa de almacenar y consultar los datos para análisis futuros. Mantener los datos es tan importante como hacer predicciones. Un buen modelo de predicción requiere datos de buena calidad.
  • Computación distribuida y en la nube: si es un experto en redes de TI, familiarícese con el ciclo de vida del proyecto de ciencia de datos y podrá diseñar e implementar modelos de ciencia de datos para un fácil acceso.
  • Inteligencia y estrategia empresarial: si es un experto en el dominio, entonces es la columna vertebral de todo el proyecto de ciencia de datos. Un estratega de BI es responsable de administrar paneles, informar a las partes interesadas, probar y validar modelos y documentar.
  • Desarrolladores de IoT: si le gusta el hardware y le gusta construir circuitos y controladores, puede desempeñar el papel de recopilar los datos mediante sensores y prepararlos para su análisis o almacenamiento en tiempo real.
  • Visión por computadora: si le encanta el procesamiento de imágenes, puede aplicar conceptos de aprendizaje profundo y trabajar en la automatización de procesos y la construcción de modelos de detección de objetos.
  • ML Engineer: los ingenieros de aprendizaje automático introducen datos en modelos definidos por científicos de datos. También son responsables de tomar modelos teóricos de ciencia de datos y ayudar a escalarlos a modelos de nivel de producción que pueden manejar terabytes de datos en tiempo real.
  • Ingenieros de PNL: las responsabilidades de los ingenieros de PNL incluyen la transformación de datos en lenguaje natural en funciones útiles utilizando técnicas de PNL para alimentar algoritmos de clasificación.

En el futuro, habrá muchos más perfiles de trabajo nuevos que entrarán en escena, lo único que lo mantendrá listo para el trabajo es el aprendizaje continuo.

Entonces, ¿cuál es mi guía sobre aprendizaje automático?

Me inscribí en varios cursos a mi propio ritmo. No me restringí con los videos y las tareas que me daban los cursos, sino que después de un tiempo solía leer el nombre del tema y comencé a aprender de los trabajos de investigación, búsquedas en Internet, libros y otras fuentes. También puede seleccionar cualquier curso que se sienta bien y quepa en su bolsillo. Vea cómo se entrega el contenido y cuáles son los otros servicios que se ofrecen. Compartiré con ustedes mi hoja de ruta sobre cómo me preparé. No te limitaré a la rígida línea de tiempo, también puedes seguirla a tu propio ritmo.

203385-8121984

Matemáticas y Estadística

Aprenda los conceptos básicos de estadística y repasar las matemáticas de su escuela y universidad.

  1. Minimización de derivadas y funciones
  2. Vector y matrices
  3. Distribución de probabilidad
  4. Variables aleatorias
  5. Distribución normal
  6. Puntuación Z
  7. Prueba de hipótesis
  8. Prueba Z y prueba T
  9. Prueba de chi-cuadrado
  10. Prueba ANOVA
  11. Estadísticas F

Solo el conocimiento básico es suficiente de los temas anteriores.

Programacion basica

Puede seleccionar cualquier idioma de su elección. Elegí Python. Algunos conceptos fundamentales a conocer:

  1. Tipos de datos
  2. Condiciones
  3. Bucles
  4. Funciones
  5. Programación orientada a objetos
  6. Manejo de excepciones

No se preocupe si no se siente cómodo con estos conceptos al principio. Después de mucha práctica, estará seguro.

Aprendizaje automático

Comprenda cómo funcionan los diferentes algoritmos y cómo implementarlos:

  1. Regresión lineal
  2. Regresión logística
  3. Árbol de decisión
  4. Bosque aleatorio
  5. Conjunto, ensacado, impulso
  6. XGBoost
  7. Bayes ingenuo
  8. KNN
  9. Agrupación de K-medias
  10. Agrupación jerárquica
  11. DBSCAN
  12. Análisis de componentes principales
  13. Máquinas de vectores soporte
  14. Serie temporal y detección de anomalías

Los profesionales experimentados pueden comenzar con Excel avanzado y otras herramientas de visualización de datos como PowerBI y Tableau. Puede obtener muchas plataformas en las que puede realizar predicciones de ML sin conocimientos de codificación.

Si está más fresco, comience a aprender a programar y complete algunos cursos sobre ML. Experimenta mucho y sigue trabajando duro. Palabra de motivación para refrescar: «Si ML es tu pasión, entonces sé como Batman: haz tu trabajo de oficina durante el día y sigue tu pasión por la noche.

Si estás en la universidad, asiste a conferencias, talleres, festivales de tecnología, cursos completos, participa en hackatones, conoce a tanta gente como puedas y, lo más importante, disfruta del proceso.

Reteniendo lo que aprendes

Ahora que está en el aprendizaje, permítame compartir con usted algunos consejos sobre cómo retener lo que aprende:

  • Implementación práctica del proyecto. Empiece con un proyecto básico y amplíelo. Intégrelo con aplicaciones, impleméntelo en plataformas en la nube, etc.
  • Técnica de aprendizaje de Feynmann:
    • Elija un concepto sobre el que quiera aprender
    • Imagina que lo estás enseñando a un alumno de sexto grado.
    • Identifique las lagunas en su explicación; Regrese al material original para comprenderlo mejor.
    • Revisar y simplificar
  • Puede grabar videos de usted explicando conceptos y subirlos a YouTube. Al final, tendrá sus propias notas de video para referirse.
516506-4608854

No solo YouTube, puede elegir cualquier red social, como yo guardo mis notas digitales en Instagram y Facebook.

https://www.instagram.com/pandaspython/

https://www.facebook.com/pandaspython08

Construir su perfil digital no solo lo ayudará a retener cosas, sino que también lo ayudará mucho a establecer conexiones con otros en la industria. Puede mostrar su trabajo, colaborar con otros y trabajar en proyectos. Esta práctica desarrollará la comunicación y la habilidad general de la personalidad de la que muchas personas carecen.

Agrega todos y cada uno de los bits de código que haces en Github y escribe un buen readme.md al respecto. Empiece a escribir un blog o cree un sitio web para mostrar lo que está haciendo (los sitios de Google también son suficientes). Simplemente grabe digitalmente todas y cada una de sus actividades. Blogger, página mediana de Facebook que puede escribir en cualquier lugar que desee.

Notas finales

Así que este fue mi artículo sobre qué es la ciencia de datos y hasta qué punto uno debería aprender. También he mostrado cómo aprender de manera efectiva. Si tienes dudas y quieres sugerencias sobre qué libros o blogs seguir, pregúntame en la sección de comentarios. Por último, me gustaría decirles que disfruten el proceso en lugar de limitarse a los cursos.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.