Libros imprescindibles para principiantes sobre Big Data, Hadoop y Apache Spark

Contenidos

Introducción

¿Cuántos de ustedes estarían de acuerdo / en desacuerdo con esta afirmación?

¿Google te conoce y te comprende mejor que tú mismo?

Hágame saber sus puntos de vista a través de los comentarios a continuación.

He estado pensando en la declaración anterior durante algún tiempo y puede ser difícil adoptar una postura absoluta, pero el mismo hecho de que deba pensar en ello significa la importancia de los datos. Piénselo, nuestra opinión sobre nosotros mismos está sesgada por lo que queremos ser. Nuestra visión de nosotros mismos está influenciada por las emociones, la actualidad y las limitaciones de la memoria humana. ¡Pero Google no tiene estas limitaciones!

Las empresas ahora son más conscientes de nuestro estilo de vida, elecciones y rutina diaria que nosotros. Gracias a nuestros datos almacenados por teléfonos inteligentes, muñequeras, rastreador de ejercicios, facturas de compras, etc.

Pero, ¿de qué les servirán mis datos a estas empresas? Me hice la misma pregunta hasta que leí uno de los libros que se enumeran a continuación. Tecnologías como Hadoop, MapReduce, Apache Spark han supuesto una revolución en las formas de analizar big data. Spark, siendo el último, promete una ‘computación en clúster ultrarrápida’.

Este es probablemente el mejor momento para hacer carrera en Big Data. Creo que nada supera a los libros cuando se trata de aprender un concepto en su esencia. En este artículo, he enumerado los mejores libros para principiantes sobre Hadoop, Apache Spark y Big Data.

must-read-books_1-9360947

¿A quién va dirigido este artículo?

Este artículo es para principiantes completos en Big Data. No asume ningún conocimiento previo de big data.

Para simplificar la experiencia de aprendizaje, también dividí los libros en 2 grupos:

  • Big Data para Layman
  • Big Data para expertos en tecnología.

Como sugiere el nombre, el primer clúster presenta el enorme mundo de Big Data a la gente común. Estos libros no le enseñarán las técnicas para desarrollar capacidades de Big Data, pero le permitirán comprender el dominio.

El segundo grupo de libros está destinado a los expertos en tecnología: personas que buscan desarrollar una carrera en Big Data. Estos libros son tesoros de conocimientos técnicos, que deberían permitirle una brillante Impulsando una carrera por delante.

Big Data para Layman

El rostro humano de Big Data

112-235x300-8542676

Este libro está escrito por Rick Smolan y Jennifer Erwitt. En este libro, aprenderá acerca de formas interesantes en las que los macrodatos brindan una vida más saludable a los niños y las personas mayores. Cuenta con 10 ensayos e impresionantes infografías publicadas por destacados escritores de la industria. Conecta big data con historias reales de la vida humana y su transformación. Estoy seguro de que este libro definitivamente se sumará a su perspectiva actual de big data.

Big Data: una revolución que transformará la forma en que vivimos, trabajamos y pensamos

121-203x300-1379150

Este libro está escrito por Kenneth Cukier y Viktor Mayer Schonberger. Este libro lo lleva a un recorrido mundial por los valores agregados por el big data en todas las industrias. Este libro le ayudará a mantenerse a la vanguardia de las tendencias clave que definirán las empresas en los próximos años. Jeff Jonas, científico jefe de IBM Entity Analytics, dijo: “El libro está repleto de grandes conocimientos sobre las nuevas formas de aprovechar la información y ofrece una visión convincente del futuro. Es una lectura esencial para cualquiera que use, o se vea afectado por, big data ‘.

Datacylsm: quiénes somos (cuando creemos que nadie está mirando)

131-198x300-7084542

Este libro está escrito por Christian Rudder. Es un New York Times Mejor vendido. ¿Necesito decir algo más? ¡Bien! aquí hay un vistazo rápido. Este libro cubre algunos de los mejores casos de big data y su profundo impacto en nuestras vidas. Presenta un mundo que se basa principalmente en números y datos que solo los humanos. Definitivamente una necesidad para mantener el libro en su propio libro.

La señal y el ruido: por qué fallan tantas predicciones, pero algunas no

141-200x300-6428364

Este libro está escrito por Nate Silver. Se compone de casos interesantes impulsados ​​por estadísticas, economía, predicciones. También hace que uno sea consciente de los errores comunes que se deben evitar al realizar predicciones y ofrece una gran cantidad de conocimientos sobre predicción y previsión. Este es un libro de lectura obligada para científicos de datos, analistas, estadísticos y cualquiera que admire el poder de los datos.

La segunda era de las máquinas: trabajo, progreso y prosperidad en una época de tecnologías brillantes

151-214x300-3283889

Este libro está escrito por Erik Brynjolfsson, Andrew McAfee y Jeff Cummings. Antes de comenzar a leerlo, debe saber que es un audiolibro. Este libro da un gran salto hacia el futuro y muestra el reinado indomable de las máquinas y las computadoras en los humanos. Define la era de la revolución industrial y la próxima también (quizás próxima). Presenta una versión realista de los avances digitales en varias facetas de la vida humana.

Big Data para técnicos – Hadoop

Hadoop para tontos

61-233x300-2807648

Este libro está escrito por Dirk Deroos. Este libro es fácil de leer y comprender, y está destinado a principiantes (como sugiere el nombre). Hace que el lector comprenda el valor de big data y hadoop. Explica el origen de hadoop, sus beneficios, funcionalidad, aplicaciones prácticas y te hace sentir cómodo al manejarlo. También lo familiariza con el ecosistema de hadoop, clúster, mapreduce, patrones de diseño y muchas más operaciones con Hadoop.

Hadoop: la guía definitiva

18-150x150-8963254

Este libro está escrito por Tom White. Describe métodos útiles para construir, mantener sistemas confiables, escalables y distribuidos con Apache Hadoop. Explica el concepto de HDFS y Mapreduce con gran detalle. Este libro ofrece excelentes resultados cuando se lee con disciplina. A los principiantes les resultará difícil de entender al principio. Pero, a medida que lea los capítulos, comenzará a amarlos.

Operaciones de Hadoop

21-150x150-7365383

Este libro está escrito por Eric Sammer. Como sugiere el nombre, este libro le enseñará los métodos para mantener grupos de hadoop grandes y complejos. Eric no solo ha cubierto los aspectos esenciales de Hadoop, sino que también ha proporcionado algunos enfoques invaluables que pueden ayudar a una persona a realizar estas tareas de manera eficiente. Encontrará capítulos dedicados al mantenimiento, las copias de seguridad, la supervisión, la resolución de problemas, etc. Cubre todos los componentes posibles de Hadoop que un ingeniero de Big Data debería conocer.

Ciencia de datos ágil: creación de aplicaciones de análisis de datos con Hadoop

31-150x150-8724892

Este libro está escrito por Russell Jurney. Este libro le proporciona los conocimientos necesarios para crear aplicaciones analíticas eficaces utilizando Hadoop en un entorno empresarial. Utiliza herramientas como Python, Apache Pig, D3.js para crear un entorno ágil para la exploración de datos utilizando ejemplos. Estos códigos de ejemplo están disponibles en github. Este libro es adecuado para usuarios intermedios que tengan un buen conocimiento de la analítica de datos.

Hadoop en la práctica

41-241x300-2005624

Este libro está escrito por Alex Holmes. Este es probablemente el libro de mejores prácticas sobre Hadoop. Cuenta con 85 ejemplos en Hadoop en formato de preguntas y respuestas. Usando estos problemas, explorará los aspectos ocultos de hadoop y aprenderá las formas de construir e implementar una solución específica según las necesidades atendidas. Más que solo ejemplos, también le presentará los métodos para integrar MapReduce y R. Author ha explicado sin esfuerzo los conceptos complicados en un inglés simple y llano. Es muy recomendable para principiantes.

Soluciones Hadoop profesionales

51-241x300-9187154

Este libro está escrito por Boris Lublinsky, Kevin T Smith, Alexey Yakubovich. Este libro es una guía detallada que explica la integración del marco de trabajo de Hadoop y las API para proporcionar soluciones del mundo real. Además, expone el funcionamiento interno de las API para permitir a los arquitectos y desarrolladores aprovecharlas y personalizarlas mejor. Más que una simple implicación, enseña los mejores escenarios en los que se deben usar estos códigos (Java y XML).

Patrones de diseño de MapReduce: creación de algoritmos y análisis efectivos para Hadoop

7-230x300-9766197

Este libro está escrito por Donald Miner. Este libro asume que el lector tiene conocimientos básicos de hadoop. Es más adecuado para principiantes avanzados que deseen dominar los algoritmos de reducción de mapas. Describe varios usos de MapReduce con Hadoop. Contiene varias metodologías útiles para resolver rápidamente muchos problemas de hadoop. Resume estos conceptos con ejemplos interesantes.

Big Data para técnicos: Apache Spark

Learning Spark: Lightning-Fast Big Data Analysis

8-2850100

Este libro está escrito por Holden Karau, Andy Konwinski, Patrick Wendell y Matei Zaharia. Esto es más adecuado para personas nuevas en Spark. Explica conceptos difíciles en un inglés simple y fácil de entender. Recomiendo este libro para principiantes. Este libro le enseña a aprovechar las poderosas bibliotecas integradas de Spark, incluidas Spark SQL, Spark Streaming y Mlib. Sobre todo, le permitirá dominar temas como la partición de datos y las variables compartidas.

Spark: ¡Aprende Spark en un DÍA!

9-230x300-5373868

Este libro está escrito por Acodemy. Otro libro para principiantes. Este libro cubre lo básico de Spark y su componente relacionado. Es lo suficientemente bueno para comenzar con Spark, pero no puede esperar más que eso. Sigue un método paso a paso para explicar teorías y conceptos abstrusos. Al final, este libro le enseñará los métodos que debe utilizar para generar chispa en su máxima capacidad.

Análisis avanzado con Spark: patrones para aprender a partir de datos a escala

10-229x300-2050699

Este libro está escrito por Sandy Ryza, Uri Laserson, Sean Owen y Josh Wills. Una vez que haya leído cualquiera de los libros mencionados anteriormente, este es el siguiente paso natural. Es hora de aumentar sus conocimientos sobre la chispa. Este libro destaca el procedimiento para abordar el análisis de datos a gran escala con Spark. Junto con Spark, cubre métodos estadísticos para enseñar el enfoque analítico ideal. Este libro ofrece un conocimiento básico de aprendizaje automático, estadísticas, Java, Python o Scala.

Divulgación: Los enlaces de Amazon en este artículo son enlaces de afiliados. Si compra un libro a través de este enlace, nos pagarán a través de Amazon. Esta es una de las formas en que podemos cubrir nuestros costos mientras continuamos creando estos increíbles artículos. Además, la lista refleja nuestra recomendación basada en el contenido del libro y de ninguna manera está influenciada por la comisión.

Notas finales

En este artículo, he enumerado algunos de los mejores libros (que percibo) sobre Big Data, Hadoop y Apache Spark. Estos libros son imprescindibles para los principiantes que deseen construir una carrera exitosa en big data.

Los libros exigen disciplina y perseverancia. Yo no tenía ninguno. Hasta que escogí un libro y lo leí de cabo a rabo. Si aún no lo ha hecho, ahora es su turno. Los libros enumerados anteriormente comprenden todo el conocimiento esencial para dar el primer paso en big data. Tecnologías como Hadoop, Apache Spark tienen una gran demanda en todo el mundo. Las empresas tienen datos, incluso tienen tecnologías, pero no tienen mano de obra calificada para trabajar en ellos.

¿Dejé de lado algún libro útil sobre Big Data, Hadoop o Apache Spark? Comparta sus opiniones en la sección de comentarios a continuación.

Si le gusta lo que acaba de leer y desea continuar con su aprendizaje sobre análisis, suscríbete a nuestros correos electrónicos, Síguenos en Twitter o como nuestro pagina de Facebook.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.