Introducción
Varias compañías han invertido mucho en Big Data en los últimos años. Este aumento en el uso de análisis de big data ha resultado en una gran demanda de profesionales capacitados en big data. Aunque ha habido mucho debate sobre la utilidad de este gasto, hay un claro aumento en los trabajos en Big Data. Esto es lo que dice una búsqueda rápida:
Dado el fuerte aumento de la demanda, el big data se ha convertido en un área lucrativa para impulsar sus habilidades. A pesar de esto, si usted es alguien como yo, que necesita una buena descripción general y comprensión de los beneficios prácticos antes de aprender algo de una manera más formal, probablemente tendrá dificultades para hallar recursos estructurados como yo lo hice hace tiempo.
Hay muchas tecnologías y terminologías asociadas con Big Data, que pueden actuar como un estorbo adicional para comenzar. ¡Los nombres como Hadoop, MapReduce, Spark, MongoDB, Hive requieren algo de tiempo para acostumbrarse! Después de recibir una respuesta abrumadora en mi post anterior sobre los mejores videos de YouTube sobre aprendizaje automático, aprendizaje profundo, redes neuronales y observar la falta de recursos estructurados, ¡la solución fue simple! Aquí hay otro especial de YouTube para los aspirantes a Big Data: ¡simplemente mi opinión sobre sumergirse en Big Data!
Descargo de responsabilidad: NO tenemos la intención de promover ninguna marca o servicio por medio de este post. Los videos enumerados en este post se centran únicamente en su relevancia / utilidad para la audiencia.
¿Quién se espera que se beneficie más al ver estos videos?
He escrito este post teniendo en cuenta la fraternidad de principiantes del Big Data. Por eso, este post es más adecuado para los candidatos que deseen comenzar su carrera en el análisis de big data. Si ya es un profesional con experiencia en big data, es factible que este post no sea lo que está buscando. A pesar de esto, aún puede consumir «inspiración» de las charlas TED que se enumeran a continuación.
La estructura de este post está diseñada para otorgar una descripción completa de las diversas tecnologías utilizadas en Big Data Analytics. Las charlas TED que se muestran al principio están destinadas a agregar una pizca de inspiración a su camino de aprendizaje. Estas charlas le ofrecen imaginar un mundo apasionante impulsado por números, análisis y tecnologías de big data.
Charlas TED sobre Big Data
1. Introducción a Big Data por Hilary Mason, directora científica de datos de Bitly
Duración: 11:30 min
Resumen: En este breve video, Hilary habla sobre el auge del big data y cómo afectará nuestro entorno laboral. Además destaca los pequeños pero significativos cambios que trae el big data, que incluye CPU, datos y algoritmos. Más tarde, examina el perfil de un científico de datos en su estilo. Destaca las aplicaciones de big data y su uso en nuestro día a día.
2. Big Data, Small World: Kirk Borne en TEDxGeorgeMasonU
Duración: 22:00 min
Resumen: El Dr. Kirk Borne comienza hablando sobre su viaje para convertirse en científico de datos. Más tarde, cubre algunas de las mejores ideas aplicadas detrás de la minería de datos y cómo se puede aplicar a nuestra vida diaria. Además habla sobre el ‘fenómeno del mundo pequeño’ y la ‘separación de 6 grados’. Más tarde, revela algunas estadísticas sorprendentes de big data que aseguran que el mundo futuro estará impulsado por los datos.
3. Kenneth Cukier: Big Data son mejores datos
Duración: 16:00 min
Resumen: Kenneth se centra enormemente en el uso de datos disponibles a nivel granular. Cada byte de datos tiene algo que revelar, todo lo que necesita es un ingeniero para descubrir. Él cree que, con la cantidad de información disponible, podemos hallar respuestas a todas las preguntas en las que antes era difícil pensar. Los datos nos han hecho más poderosos. Los datos pueden ser nuestro mayor poder si los desechamos de forma intuitiva.
4. ¿Qué hacer con todo este Big Data?
Duración: 12:29 min
Resumen: Susan cree ‘No somos consumidores pasivos de datos y tecnología. Más bien, damos forma a los datos y les damos significado.‘. En este breve video, comparte su perspectiva sobre el auge del big data y las diferentes alternativas para usar los datos para su uso óptimo. Los datos no crean significado, nosotros sí. Los datos nos ofrecen un vasto océano de información que debe batirse para extraer información útil.
5. ¿Cómo encontrar el peor lugar para estacionar en la ciudad de Nueva York usando Big Data?
Duración: 11:53 min
Resumen: El título lo dice todo. El orador hace uso de estadísticas y visualización para inferir cuál es el peor lugar para estacionar en Nueva York. Se aseguró de no perderse ninguna información importante, por lo que capturó todas las variables importantes en sus representaciones gráficas. Si en algún momento quiso ver el uso de datos en tiempo real, no debe perderse.
Conozca las terminologías de Big Data
Recomiendo encarecidamente estos videos de YouTube a las personas que son nuevas en el análisis de big data. Ver estos videos rápidos (~ 3 minutos) le brindará una descripción general clara de las diferentes tecnologías de big data y las relaciones entre ellas.
1. ¿Qué es HBase? Duración – 3 minutos
2. ¿Qué es Hadoop? Duración – 3:12 min
3. ¿Qué es MapReduce? Duración – 2:39 min
4. ¿Qué es HDFS? Duración – 2:51 min
5. ¿Qué es Flume? Duración – 2:59 min
6. ¿Qué es PIG? Duración – 3:01 minutos
7. ¿Qué es Hive? Duración – 2:52 min
8. ¿Qué es Avro? Duración – 3:00 min
9. ¿Qué es Oozie? Duración – 2:28 min
10. ¿Qué es Zookeeper? Duración – 3:26 minutos
10 tutoriales sobre análisis de Big Data
1. Taller del curso intensivo de Hadoop
Duración – 55:32 minutos
Resumen: Como sugiere el nombre, este video cubre todo sobre Hadoop y el concepto relacionado en menos de una hora. El orador comienza con una introducción rápida de Hadoop, seguida de una explicación detallada del ecosistema y la distribución de Hadoop, HDFS. Más tarde, se explican múltiples componentes de Hadoop como Mapreduce, Yarn, Tez usando algunas historias interesantes. En conclusión, termina este curso acelerado revelando algunas de las formas no tan populares pero súper útiles de tener acceso a los datos.
2. Fundamentos de MapReduce
Duración – 32:03 minutos
Resumen: Este es un tutorial completo para aprender los conceptos básicos de MapReduce. Esta serie de tutoriales se divide en 5 partes, cada una de las cuales cubre un módulo específico de MapReduce. Este video introductorio sobre MapReduce proporciona una descripción detallada de su relevancia, las posibilidades laborales asociadas, las aplicaciones y el uso. A medida que navega por las siguientes partes, cubrirá los argumentos esenciales de MapReduce. ¡Consulte la sección Siguiente mientras está allí!
3. Habilitar R en Hadoop
Duración – 40:25 minutos
Resumen: Este tutorial le enseña el conocimiento de la integración de hadoop con R. El orador sigue un procedimiento paso a paso de instalación de Hadoop en R. Se han discutido conceptos como RHadoop, RHive y varias bibliotecas R asociadas. Al mismo tiempo, además analiza el uso variado de R y cómo la programación de R ha evolucionado a lo largo de los años.
4. Introducción al aprendizaje profundo en Hadoop
Duración – 41: 14mins
Resumen: El orador explica maravillosamente el concepto de aprendizaje profundo usando hadoop. El aprendizaje profundo es uno de los temas más comentados en la comunidad de ciencia de datos. Los científicos e investigadores están trabajando arduamente para descubrir nuevos patrones usando el aprendizaje profundo. El concepto de aprendizaje profundo se ha explicado de manera simplista en este video. Además se han discutido temas como las redes de creencias profundas, la implementación de Hadoop / YARN.
5. Introducción a Apache Cassandra
Duración – 1:15:06 hora
Resumen: He encontrado muy pocos videos sobre Apache Cassandra, pero esto lo compensa todo. Aquí hay una introducción completa a Apache Cassandra desde cero. El auge de Apache Cassandra está llamando la atención de compañías y profesionales de todas partes. En este video, el orador explica los algoritmos utilizados, sus características esenciales, beneficios y el concepto / causa detrás del lanzamiento de Apache Cassandra ~ 6 años atrás.
6. Introducción a PIG
Duración – 30:56 minutos
Resumen: Este es un tutorial completo para aprender sobre PIG. En este tutorial, el instructor comienza proporcionando una descripción general de Pig seguida de la comparación entre Pig y SQL. Dado que ambos son muy similares, hace una comparación interesante. Además explica sobre el uso de Pig latin. Especialmente esto, además se han ilustrado los pasos básicos de la instalación de Pig.
7. Una descripción general de Apache Spark
Duración – 1:06:14 hora
Resumen: Este tutorial justifica acertadamente su título al enseñar sobre la tecnología Spark y cómo puede ayudar a dar forma al mundo. La guía comienza con un repaso rápido de mapreduce seguido de spark y la ventaja de utilizar esta tecnología. El orador ha explicado maravillosamente estos conceptos.
8. Introducción a Hive y HiveQL
Duración – 1:06:19 hora
Resumen: Hive está construido sobre hadoop para proporcionar administración, consultas y análisis de datos. Este tutorial analiza la arquitectura de la colmena, las operaciones de la colmena y otras funciones asociadas. Este tutorial no solo lo enriquece con conocimientos teóricos, sino que además muestra el aspecto práctico y demuestra lo mismo en el terminal.
9. Introducción a NoSQL
Duración – 54:51 minutos
Resumen: Este es uno de los mejores videos que he encontrado en bases de datos NoSQL. Encontrará una introducción a las bases de datos NoSQL junto con todos los demás conocimientos esenciales de este concepto que debe poseer. Este tutorial cubre la aplicación, las ventajas, las desventajas, la compatibilidad, el uso, las características y otras características esenciales de NoSQL. Recomendaré este video para todos.
10. Tutorial de MongoDB para principiantes
Duración – 4:34:47 hora
Resumen: Si en algún momento anhelaste aprender MongoDB, aquí tienes el recurso completo. Este tutorial cubre de manera integral todos los aspectos de las bases de datos MongoDB y NoSQL. A pesar de esto, parece ser bastante largo (> 4 horas), puede ver estos tutoriales en los descansos. Un conocimiento previo de Javascript sería ventajoso para aprender MongoDB por medio de este tutorial. Este tutorial comienza con una introducción a las bases de datos NoSQL seguido de una explicación de mongodb, cómo ejecutar consultas de mongodb, node.js, procesamiento de datos avanzado y método para aprender mongodb en ubuntu en la nube.
Recurso alternativo: Curso de MongoDB sobre Udacity
Notas finales
Si ha visto los videos enumerados previamente, ya estará equipado con los ítems esenciales de Big Data. En este post, he destacado los videos de YouTube y las charlas TED más útiles que encontré en Internet. Los videos enumerados disponen la intención de desarrollar sus conceptos básicos de big data y facilitar su ruta de aprendizaje.
Si desea obtener los máximos beneficios de estos videos, insistiría en tomar notas y ensuciarse las manos mientras mira estos videos. En caso de que me haya perdido algún video importante, no dude en mencionarlo en la sección de comentarios a continuación.