Libri essenziali per principianti sui Big Data, Hadoop e Apache Spark

Contenuti

introduzione

Quanti di voi sarebbero d'accordo / non sono d'accordo con questa affermazione?

Google ti conosce e ti capisce meglio di te??

Fatemi sapere le vostre opinioni attraverso i commenti qui sotto..

Ho pensato alla dichiarazione di cui sopra da un po' di tempo e può essere difficile prendere una posizione assoluta, ma il fatto stesso che devi pensarci significa l'importanza dei dati. Pensaci, la nostra opinione di noi stessi è influenzata da ciò che vogliamo essere. La nostra visione di noi stessi è influenzata dalle emozioni, l'attualità e i limiti della memoria umana. Ma Google non ha queste limitazioni!!

Le aziende ora sono più consapevoli del nostro stile di vita, scelte e routine quotidiana che noi. Grazie ai nostri dati archiviati dagli smartphone, braccialetti, fitness tracker, fatture di acquisto, eccetera.

Ma, A cosa serviranno i miei dati a queste aziende?? Mi sono posto la stessa domanda finché non ho letto uno dei libri elencati di seguito. Tecnologie come Hadoop, Riduci mappa, Apache Spark ha rivoluzionato il modo di analizzare i big data. Scintilla, essere l'ultimo, promette "un cluster computing fulmineo".

Questo è probabilmente il momento migliore per intraprendere una carriera nei Big Data. Penso che niente batte i libri quando si tratta di imparare un concetto alla base. In questo articolo, Ho elencato i migliori libri per principianti su Hadoop, Apache Spark e Big Data.

libri-da-leggere_1-9360947

A chi è rivolto questo articolo?

Questo articolo è per principianti assoluti in Big Data. Non presuppone alcuna conoscenza preliminare dei big data.

Per semplificare l'esperienza di apprendimento, Ho anche diviso i libri in 2 gruppi:

  • Big Data per i non addetti ai lavori
  • Big Data per esperti di tecnologia.

Come suggerisce il nome, il primo cluster introduce l'immenso mondo dei Big Data alla gente comune. Questi libri non ti insegneranno le tecniche per sviluppare capacità di Big Data., ma ti permetteranno di capire il dominio.

Il secondo gruppo di libri è destinato agli esperti di tecnologia: persone che cercano di sviluppare una carriera nei Big Data. Questi libri sono tesori di conoscenza tecnica, che dovrebbe permetterti di brillante Guidare una carriera in avanti.

Big Data per i non addetti ai lavori

Il volto umano dei Big Data

112-235x300-8542676

Questo libro è scritto da Rick Smolan e Jennifer Erwitt. In questo libro, scopri i modi interessanti in cui i big data rendono la vita più sana per bambini e anziani. Esso ha 10 saggi e splendide infografiche pubblicate dai principali scrittori del settore. Connetti i big data con storie reali della vita umana e della sua trasformazione. Sono sicuro che questo libro si aggiungerà sicuramente alla tua attuale prospettiva sui big data..

Grandi dati: una rivoluzione che trasformerà il nostro modo di vivere, lavoriamo e pensiamo

121-203x300-1379150

Questo libro è scritto da Kenneth Cukier e Viktor Mayer Schonberger. Questo libro ti porta in un tour globale dei valori aggiunti dai big data in tutti i settori.. Questo libro ti aiuterà a stare al passo con le tendenze chiave che definiranno le aziende negli anni a venire.. Jeff Jonas, Capo scienziato, IBM Entity Analytics, disse: “Il libro è ricco di grandi intuizioni su nuovi modi di sfruttare le informazioni e offre una visione avvincente del futuro. È una lettura essenziale per chiunque usi, o essere influenzato da, grandi dati '.

Datacylsm: chi siamo (quando pensiamo che nessuno stia guardando)

131-198x300-7084542

Questo libro è scritto da Christian Rudder. È un New York Times il più venduto. Devo dire qualcos'altro?? Bene! ecco una rapida occhiata. Questo libro copre alcuni dei migliori casi di big data e il suo profondo impatto sulle nostre vite.. Presenta un mondo che si basa principalmente su numeri e dati che solo gli umani. Sicuramente un must per tenere il libro nel tuo libro.

Segnale e rumore: perché così tante previsioni falliscono?, ma alcuni non lo fanno

141-200x300-6428364

Questo libro è scritto da Nate Silver. È composto da casi interessanti guidati dalle statistiche, economia, predizioni. Inoltre, rende consapevoli degli errori comuni da evitare quando si effettuano previsioni e offre un patrimonio di conoscenze su previsioni e previsioni.. Questo è un libro da leggere assolutamente per i data scientist, analisti, statistici e chiunque ammiri il potere dei dati.

La seconda era delle macchine: lavoro, progresso e prosperità in un'era di tecnologie brillanti

151-214x300-3283889

Questo libro è scritto da Erik Brynjolfsson, Andrew McAfee e Jeff Cummings. Prima di iniziare a leggerlo, dovresti sapere che è un audiolibro. Questo libro fa un salto da gigante nel futuro e mostra il regno indomabile di macchine e computer negli esseri umani.. Definisce l'era della rivoluzione industriale e anche quella successiva (forse il prossimo). Presenta una versione realistica dei progressi digitali in vari aspetti della vita umana.

Big Data per i tecnici – Hadoop

Hadoop per i manichini

61-233x300-2807648

Questo libro è scritto da Dirk Deroos. Questo libro è facile da leggere e capire, ed è destinato ai principianti (Come suggerisce il nome). Fa capire al lettore il valore dei big data e dell'hadoop. Spiega l'origine di hadoop, i suoi benefici, funzionalità, applicazioni pratiche e ti fa sentire a tuo agio quando lo maneggia. Ti permette anche di familiarizzare con l'ecosistema hadoop, grappolo, Riduci mappa, modelli di layout e molte altre operazioni Hadoop.

Hadoop: la guida definitiva

18-150x150-8963254

Questo libro è scritto da Tom White. Descrive metodi utili per costruire, mantenere sistemi affidabili, scalabile e distribuito con Apache Hadoop. Spiega il concetto di HDFS e Mapreduce in grande dettaglio. Questo libro offre ottimi risultati se letto con disciplina. I principianti troveranno difficile da capire all'inizio. Ma, mentre leggi i capitoli, comincerà ad amarli.

Operazioni Hadoop

21-150x150-7365383

Questo libro è scritto da Eric Sammer. Come suggerisce il nome, Questo libro ti insegnerà i metodi per mantenere gruppi hadoop grandi e complessi. Eric non ha solo coperto l'essenziale di Hadoop, ha anche fornito alcuni approcci inestimabili che possono aiutare una persona a svolgere questi compiti in modo efficiente. Troverai capitoli dedicati alla manutenzione, i backup, la supervisione, risoluzione dei problemi, eccetera. Copre tutti i possibili componenti Hadoop che un ingegnere dei big data dovrebbe conoscere.

Scienza dei dati agile: creazione di applicazioni di analisi dei dati con Hadoop

31-150x150-8724892

Questo libro è scritto da Russell Jurney. Questo libro fornisce le conoscenze necessarie per creare potenti applicazioni analitiche utilizzando Hadoop in un ambiente aziendale.. Usa strumenti come Python, Maiale Apache, D3.js per creare un ambiente agile per l'esplorazione dei dati utilizzando esempi. Questi codici di esempio sono disponibili su github. Questo libro è adatto a utenti intermedi che hanno una buona conoscenza dell'analisi dei dati.

Hadoop in pratica

41-241x300-2005624

Questo libro è scritto da Alex Holmes. Questo è probabilmente il libro di best practice su Hadoop. Esso ha 85 Esempi Hadoop in formato domanda e risposta. Usando questi problemi, esplorerai gli aspetti nascosti di hadoop e imparerai i modi per costruire e implementare una soluzione specifica in base alle esigenze servite. Più che semplici esempi, Ti introdurrà anche ai metodi per integrare MapReduce e R. L'autore ha spiegato senza sforzo concetti complicati in un inglese semplice e chiaro. È altamente raccomandato per i principianti.

Soluzioni Hadoop professionali

51-241x300-9187154

Questo libro è scritto da Boris Lublinsky, Kevin T Smith, Alexey Yakubovich. Questo libro è una guida dettagliata che spiega come integrare il framework Hadoop e le API per fornire soluzioni reali.. Cosa c'è di più, espone il funzionamento interno delle API per consentire ad architetti e sviluppatori di sfruttarle e personalizzarle meglio. Più di una semplice implicazione, insegna i migliori scenari in cui questi codici dovrebbero essere usati (Java e XML).

MappaRiduci i modelli di progettazione: creazione di algoritmi e analisi efficaci per Hadoop

7-230x300-9766197

Questo libro è scritto da Donald Miner. Questo libro presuppone che il lettore abbia una conoscenza di base di hadoop. È più adatto per i principianti avanzati che vogliono padroneggiare gli algoritmi di riduzione delle mappe. Descrive vari usi di MapReduce con Hadoop. Contiene diverse metodologie utili per risolvere rapidamente molti problemi di hadoop. Riassumi questi concetti con esempi interessanti.

Big Data per i tecnici: Apache Spark

Scintilla di apprendimento: Analisi dei Big Data fulminea

8-2850100

Questo libro è stato scritto da Holden Karau, Andy Konwinski, Patrick Wendell e Matei Zaharia. Questo è più adatto per le persone che non conoscono Spark. Spiega concetti difficili in un inglese semplice e di facile comprensione. Consiglio questo libro ai principianti. Questo libro ti insegna come sfruttare le potenti librerie integrate di Spark, include Spark SQL, Spark Streaming e Mlib. Soprattutto, ti permetterà di padroneggiare argomenti come il partizionamento dei dati e le variabili condivise.

Scintilla: Impara Spark in un GIORNO!

9-230x300-5373868

Questo libro è scritto da Acodemy. Un altro libro per principianti. Questo libro tratta le basi di Spark e dei suoi componenti correlati. È abbastanza buono per iniziare con Spark, ma non vedo l'ora di più. Segui un metodo passo passo per spiegare teorie e concetti astrusi. Alla fine, Questo libro ti insegnerà i metodi da utilizzare per generare Spark al massimo delle sue potenzialità..

Analisi avanzata con Spark: modelli per imparare dai dati su larga scala

10-229x300-2050699

Questo libro è scritto da Sandy Ryza, Uri Laserson, Sean Owen e Josh Wills. Dopo aver letto uno dei libri sopra menzionati, questo è il prossimo passo naturale. È ora di aumentare la tua conoscenza della scintilla. Questo libro evidenzia la procedura per avvicinarsi all'analisi dei dati su larga scala con Spark. Insieme a Spark, copre i metodi statistici per insegnare l'approccio analitico ideale. Questo libro offre una comprensione di base dell'apprendimento automatico, statistiche, Giava, Python o Scala.

Divulgazione: I link di Amazon in questo articolo sono link di affiliazione. Se acquisti un libro tramite questo link, ci pagheranno tramite Amazon. Questo è uno dei modi in cui possiamo coprire i nostri costi mentre continuiamo a creare questi fantastici articoli.. Cosa c'è di più, l'elenco riflette la nostra raccomandazione basata sul contenuto del libro e non è in alcun modo influenzato dalla commissione.

Note finali

In questo articolo, Ho elencato alcuni dei migliori libri (cosa percepisco) sui big data, Hadoop e Apache Spark. Questi libri sono un must per i principianti che vogliono costruire una carriera di successo nei big data..

I libri richiedono disciplina e perseveranza. non ne avevo. Finché non ho scelto un libro e l'ho letto dall'inizio alla fine. Se non l'hai già fatto, ora è il tuo turno. I libri sopra elencati comprendono tutte le conoscenze essenziali per fare il primo passo nei big data. Tecnologie come Hadoop, Apache Spark è molto richiesto in tutto il mondo. Le aziende hanno dati, hanno anche le tecnologie, ma non hanno manodopera qualificata per lavorare su di loro.

Ho tralasciato un libro utile sui Big Data, Hadoop o Apache Spark? Condividi i tuoi pensieri nella sezione commenti qui sotto..

Se ti piace quello che hai appena letto e vuoi continuare a imparare l'analisi, iscriviti alle nostre email, Seguici su Twitter o come il nostro pagina Facebook.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.