9 libros de ingeniería de datos | Los mejores libros para ingenieros de datos

Contenidos

¿Sabía que ‘Ingeniero de datos’ es el rol de más rápido crecimiento en la industria?

Actualmente, la mayoría de los aspirantes a la ciencia de datos todavía están enfocados en conseguir el codiciado papel de científico de datos. Eso es comprensible: todo el bombo publicitario en los medios y la comunidad glorifica el papel de un científico de datos. Pero es el ingeniero de datos el que emergió como el caballo oscuro.

Lo que no es realmente sorprendente, ¿verdad? Ciencia de los datos Los profesionales dedican cerca del 60-70% de su tiempo a recopilar, limpiar y procesar datos, ¡eso es exactamente lo mismo que un ingeniero de datos!

Los gigantes tecnológicos como Netflix, Facebook, Amazon, Uber, etc.están recopilando datos a un ritmo sin precedentes, y están contratando ingenieros de datos como nunca antes. ¡No ha habido un mejor momento para adentrarse en este campo!

data-eng-1975383

Desafortunadamente, no existe un camino coherente diseñado para convertirse en un ingeniero de datos. La mayoría de los aspirantes a la ciencia de datos ni siquiera han oído hablar del puesto; tienden a aprender sobre él en el trabajo.

He reunido una lista de libros de ingeniería de datos para ayudarlo a comenzar con este próspero campo y asegurarme de que esté familiarizado con los diversos términos, habilidades y otros matices requeridos.

¿Y por qué los libros?

Mucha gente exitosa atribuye su éxito a la lectura de libros. De hecho, el fundador y director ejecutivo de DataPeaker, el Sr. Kunal Jain, lee un libro cada semana. No hay sustituto para los libros, sigue siendo uno de los mejores recursos que le gustaría tener en sus manos.

Los libros son una forma vital de absorber información sobre ingeniería de datos. ¡Vamos a empezar!

1. El libro de cocina de ingeniería de datos de Andreas Kretz

Existe mucha confusión sobre cómo convertirse en ingeniero de datos. ¡He conocido a muchos aspirantes a la ciencia de datos que ni siquiera sabían que existía este rol!

Aquí hay un libro electrónico de Andreas Kertz que tiene estudios de casos elaborados, códigos, podcasts, entrevistas, estudios de casos y más. Considero que este es un paquete completo para que cualquiera pueda convertirse en ingeniero de datos.

¿Y la guinda del pastel? ¡Este ebook es gratis! Sí, puede comenzar a usarlo instantáneamente. ¡Aprenda, practique y prepárese para su puesto de ingeniería de datos ahora!

screenshot-from-2020-02-06-11-23-19-9868726

Haga clic aquí para acceder – El libro de cocina de ingeniería de datos

2. DW 2.0 – La arquitectura para la próxima generación de almacenamiento de datos por el padre del almacenamiento de datos WH Inmon

Este libro describe el futuro del almacenamiento de datos que es tecnológicamente posible hoy, tanto a nivel arquitectónico como tecnológico.

Realmente me gusta cómo el libro está cuidadosamente estructurado y cubre la mayoría de los temas relacionados con la arquitectura de datos y sus desafíos subyacentes, cómo se puede usar el sistema existente y construir un almacén de datos a su alrededor, y las mejores prácticas para justificar los gastos de una manera muy manera práctica.

515pazk6l-_sx403_bo1204203200_-7316574

Este libro está diseñado para:

  • Cualquiera que aspire a convertirse en un profesional de la ingeniería de datos
  • Organizaciones que desean incorporar esta capacidad en sus sistemas.
  • Arquitectos de datos
  • DBA
  • Diseñadores de sistemas y
  • Profesionales de almacenamiento de datos

DW 2.0. es * Escrito por el «padre del almacén de datos», Bill Inmon, columnista y editor de boletines de The Bill Inmon Channel en Business Intelligence Network.

¡Este no se lo puede perder! Aquí es donde puede obtener una copia: Amazon.com.

3. Diseño ágil de almacén de datos: modelado dimensional colaborativo, desde la pizarra hasta el esquema en estrella de Lawrence Corr

Este es un gran libro. Lawrence Corr proporciona una guía completa y paso a paso para capturar los requisitos de almacenamiento de datos e inteligencia empresarial y convertirlos en modelos de alto rendimiento mediante el uso de una técnica llamada tormenta de modelos (modelo + lluvia de ideas).

Además, encontrará un concepto llamado BEAM, un enfoque ágil del modelado dimensional para mejorar la comunicación entre los diseñadores de almacenes de datos y las partes interesadas en inteligencia empresarial.

51wv5qjdbwl-_sx258_bo1204203200_-4719016

Obtenga este libro en Amazon.com

4.

¿Qué deseas como científico de datos?

¿Qué tal obtener datos limpios y confiables? Con todo el valor comercial capturado y presentado bien en los datos, definitivamente desearía modelos de datos precisos y sólidos, alta agilidad de aplicaciones y modelos bien diseñados como resultado final.

¿Cómo se sentiría si alguien le concediera estos deseos y hiciera realidad su sueño de convertirse en un ingeniero de datos campeón? Entonces, ¿por qué esperar a que ese ‘alguien’ le conceda sus deseos cuando puede encontrar una manera de marcar su camino y obtener estos deseos concedidos por usted mismo simplemente leyendo este libro?

Sí, este libro es la tercera edición, es una biblioteca completa de técnicas de modelado dimensional actualizadas, la colección más completa de la historia. Cubre patrones de modelado dimensional de esquemas en estrella nuevos y mejorados, agrega dos capítulos nuevos sobre técnicas ETL, incluye matrices comerciales nuevas y expandidas para 12 estudios de casos, y más.

51kieo3nr0l-_sx260_-6714156

Puede obtener una copia aquí: Amazon.com

5. Learning Spark de Holden Karau

Hoy en día, se generan grandes volúmenes de datos, una escala que solo podemos imaginar. Muchos datos juegan un papel vital en el aumento de la complejidad de las operaciones y eso ha provocado nuevos desarrollos en el campo de la ingeniería de datos.

Este excelente libro de Holden Karau ofrece una valiosa guía de referencia para todos los estudiantes graduados, investigadores y científicos interesados ​​en explorar el potencial de las aplicaciones de Big Data.

Sumérjase en el mundo de las innovaciones en la forma en que adquiere y masajea los datos, el objetivo final es obtener los mejores y más clasificados datos para su modelo de aprendizaje automático. Spark es el marco de procesamiento de datos más eficaz en las empresas en la actualidad.

51ay7lddigl-_sx379_bo1204203200_-2324249

¡Obtenga una copia hoy! – Amazon.com

La ingeniería de datos es un campo multidisciplinario con aplicaciones en control, teoría de decisiones y el área emergente de la bioinformática. No hay libros en el mercado que pongan el tema al alcance de los no expertos.

Entonces, si recién está comenzando y necesita un buen libro para aprender todo sobre la ingeniería de datos, entonces Spark, un marco de computación en clúster rápido que se utiliza para procesar, consultar y analizar big data, es la herramienta que debe aprender y esta es su libro para leer.

Toda la teoría y los conceptos prácticos se explican de una manera fácil de usar y en un lenguaje fácil de entender.

51dstfykrul-1801048

Obtenga una copia hoy en Amazon.com

7. Big Data: Principios y mejores prácticas de sistemas de datos escalables en tiempo real por Nathan Marz

Este libro está dirigido a gerentes, asesores, consultores, especialistas, profesionales y cualquier persona interesada en la evaluación de la ingeniería de datos.

Describe un enfoque escalable y fácil de entender para los sistemas de big data que puede crear y ejecutar un equipo pequeño. Siguiendo un ejemplo realista, este libro guía a los lectores a través de la teoría de los sistemas de big data, cómo implementarlos en la práctica y cómo implementarlos y operarlos una vez que están construidos.

Por lo tanto, si usted es el CEO / CXO de una organización y desea introducir la práctica de Ingeniería de datos en su organización, debe tomar este libro y acceder al patrón de ingeniería de datos de su empresa.

marz-bigdata-hi-png-2972822

Coge una copia aquí – Amazon.com

8.

Los conceptos de este libro giran en torno a la tarea de recopilar datos y extraer información útil de esos datos. Cinco secciones discretas cubiertas en este libro son:

  • Escalabilidad de datos
  • Consistencia
  • Fiabilidad
  • Eficiencia y
  • Mantenibilidad

Martin Kleppmann lo ayuda a navegar por este panorama diverso al examinar los pros y los contras de varias tecnologías para procesar y almacenar datos.

91pzjipjnl-229x300-8396344

Aquí es donde puede obtenerlo: Amazon.com

9. Big Data, Black Book: cubre Hadoop 2, MapReduce, Hive, YARN, Pig, R y visualización de datos

El objetivo de este libro es crear una nueva generación de analistas y desarrolladores de Big Data versátiles, que estén completamente familiarizados con las técnicas analíticas básicas y avanzadas para manipular y analizar datos.

Por lo tanto, si desea comenzar a aprender sobre herramientas de ingeniería de datos, este libro es una lectura obligada. Cubre de manera integral todas las herramientas que lo ayudan a entrometerse con los datos y las estrategias de elaboración para obtener una ventaja competitiva.

51urkz4eacl-_sx384_bo1204203200_-232x300-3279309

Obtenga su copia aquí – Amazon.com

Notas finales

Convertirse en ingeniero de datos no es una tarea fácil. Requiere una comprensión profunda de las herramientas, los procesos y las técnicas para poder extraer lo mejor de los datos estructurados / no estructurados.

Puede esbozar una ruta de ingeniería de datos por sí mismo leyendo este artículo exhaustivo: ¿Quiere convertirse en un ingeniero de datos? Aquí hay una lista completa de recursos para comenzar.

¡Espero que les haya gustado mi colección de libros de Ingeniería de datos! Definitivamente me gustaría saber si hay algún libro que recomendaría. Comparta los nombres en la sección de comentarios a continuación.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.