introduzione
Quanti di voi sarebbero d'accordo / non sono d'accordo con questa affermazione?
Google ti conosce e ti capisce meglio di te??
Fatemi sapere le vostre opinioni attraverso i commenti qui sotto..
Ho pensato alla dichiarazione di cui sopra da un po' di tempo e può essere difficile prendere una posizione assoluta, ma il fatto stesso che devi pensarci significa l'importanza dei dati. Pensaci, la nostra opinione di noi stessi è influenzata da ciò che vogliamo essere. La nostra visione di noi stessi è influenzata dalle emozioni, l'attualità e i limiti della memoria umana. Ma Google non ha queste limitazioni!!
Le aziende ora sono più consapevoli del nostro stile di vita, scelte e routine quotidiana che noi. Grazie ai nostri dati archiviati dagli smartphone, braccialetti, fitness tracker, fatture di acquisto, eccetera.
Ma, A cosa serviranno i miei dati a queste aziende?? Mi sono posto la stessa domanda finché non ho letto uno dei libri elencati di seguito. Tecnologie come Hadoop, Riduci mappaMapReduce è un modello di programmazione progettato per elaborare e generare in modo efficiente set di dati di grandi dimensioni. Sviluppato da Google, Questo approccio suddivide il lavoro in attività più piccole, che sono distribuiti tra più nodi in un cluster. Ogni nodo elabora la sua parte e poi i risultati vengono combinati. Questo metodo consente di scalare le applicazioni e gestire enormi volumi di informazioni, essere fondamentali nel mondo dei Big Data...., Apache SparkApache Spark è un motore di elaborazione dati open source che consente l'analisi di grandi volumi di informazioni in modo rapido ed efficiente. Il suo design si basa sulla memoria, che ottimizza le prestazioni rispetto ad altri strumenti di elaborazione batch. Spark è ampiamente utilizzato nelle applicazioni di big data, Apprendimento automatico e analisi in tempo reale, grazie alla sua facilità d'uso e... han supuesto una revolución en las formas de analizar big data. Scintilla, essere l'ultimo, promete una ‘computación en grappoloUn cluster è un insieme di aziende e organizzazioni interconnesse che operano nello stesso settore o area geografica, e che collaborano per migliorare la loro competitività. Questi raggruppamenti consentono la condivisione delle risorse, Conoscenze e tecnologie, promuovere l'innovazione e la crescita economica. I cluster possono coprire una varietà di settori, Dalla tecnologia all'agricoltura, e sono fondamentali per lo sviluppo regionale e la creazione di posti di lavoro.... ultrarrápida’.
Questo è probabilmente il momento migliore per intraprendere una carriera nei Big Data. Penso che niente batte i libri quando si tratta di imparare un concetto alla base. In questo articolo, Ho elencato i migliori libri per principianti su Hadoop, Apache Spark e Big Data.
A chi è rivolto questo articolo?
Questo articolo è per principianti assoluti in Big Data. Non presuppone alcuna conoscenza preliminare dei big data.
Per semplificare l'esperienza di apprendimento, Ho anche diviso i libri in 2 gruppi:
- Big Data per i non addetti ai lavori
- Big Data per esperti di tecnologia.
Come suggerisce il nome, il primo cluster introduce l'immenso mondo dei Big Data alla gente comune. Questi libri non ti insegneranno le tecniche per sviluppare capacità di Big Data., ma ti permetteranno di capire il dominio.
Il secondo gruppo di libri è destinato agli esperti di tecnologia: persone che cercano di sviluppare una carriera nei Big Data. Questi libri sono tesori di conoscenza tecnica, che dovrebbe permetterti di brillante Guidare una carriera in avanti.
Big Data per i non addetti ai lavori
Il volto umano dei Big Data
Questo libro è scritto da Rick Smolan e Jennifer Erwitt. In questo libro, scopri i modi interessanti in cui i big data rendono la vita più sana per bambini e anziani. Esso ha 10 saggi e splendide infografiche pubblicate dai principali scrittori del settore. Connetti i big data con storie reali della vita umana e della sua trasformazione. Sono sicuro che questo libro si aggiungerà sicuramente alla tua attuale prospettiva sui big data..
Grandi dati: una rivoluzione che trasformerà il nostro modo di vivere, lavoriamo e pensiamo
Questo libro è scritto da Kenneth Cukier e Viktor Mayer Schonberger. Questo libro ti porta in un tour globale dei valori aggiunti dai big data in tutti i settori.. Questo libro ti aiuterà a stare al passo con le tendenze chiave che definiranno le aziende negli anni a venire.. Jeff Jonas, Capo scienziato, IBM Entity Analytics, disse: “Il libro è ricco di grandi intuizioni su nuovi modi di sfruttare le informazioni e offre una visione avvincente del futuro. È una lettura essenziale per chiunque usi, o essere influenzato da, grandi dati '.
Datacylsm: chi siamo (quando pensiamo che nessuno stia guardando)
Questo libro è scritto da Christian Rudder. È un New York Times il più venduto. Devo dire qualcos'altro?? Bene! ecco una rapida occhiata. Questo libro copre alcuni dei migliori casi di big data e il suo profondo impatto sulle nostre vite.. Presenta un mondo che si basa principalmente su numeri e dati che solo gli umani. Sicuramente un must per tenere il libro nel tuo libro.
Segnale e rumore: perché così tante previsioni falliscono?, ma alcuni non lo fanno
Questo libro è scritto da Nate Silver. È composto da casi interessanti guidati dalle statistiche, economia, predizioni. Inoltre, rende consapevoli degli errori comuni da evitare quando si effettuano previsioni e offre un patrimonio di conoscenze su previsioni e previsioni.. Questo è un libro da leggere assolutamente per i data scientist, analisti, statistici e chiunque ammiri il potere dei dati.
La seconda era delle macchine: lavoro, progresso e prosperità in un'era di tecnologie brillanti
Questo libro è scritto da Erik Brynjolfsson, Andrew McAfee e Jeff Cummings. Prima di iniziare a leggerlo, dovresti sapere che è un audiolibro. Questo libro fa un salto da gigante nel futuro e mostra il regno indomabile di macchine e computer negli esseri umani.. Definisce l'era della rivoluzione industriale e anche quella successiva (forse il prossimo). Presenta una versione realistica dei progressi digitali in vari aspetti della vita umana.
Big Data per i tecnici – Hadoop
Hadoop per i manichini
Questo libro è scritto da Dirk Deroos. Questo libro è facile da leggere e capire, ed è destinato ai principianti (Come suggerisce il nome). Fa capire al lettore il valore dei big data e dell'hadoop. Spiega l'origine di hadoop, i suoi benefici, funzionalità, applicazioni pratiche e ti fa sentire a tuo agio quando lo maneggia. Ti permette anche di familiarizzare con l'ecosistema hadoop, grappolo, Riduci mappa, modelli di layout e molte altre operazioni Hadoop.
Hadoop: la guida definitiva
Questo libro è scritto da Tom White. Descrive metodi utili per costruire, mantenere sistemi affidabili, scalabile e distribuito con Apache Hadoop. Explica el concepto de HDFSHDFS, o File system distribuito Hadoop, Si tratta di un'infrastruttura chiave per l'archiviazione di grandi volumi di dati. Progettato per funzionare su hardware comune, HDFS consente la distribuzione dei dati su più nodi, garantire un'elevata disponibilità e tolleranza ai guasti. La sua architettura si basa su un modello master-slave, dove un nodo master gestisce il sistema e i nodi slave memorizzano i dati, facilitare l'elaborazione efficiente delle informazioni.. y Mapreduce con gran detalle. Questo libro offre ottimi risultati se letto con disciplina. I principianti troveranno difficile da capire all'inizio. Ma, un misuraIl "misura" È un concetto fondamentale in diverse discipline, che si riferisce al processo di quantificazione delle caratteristiche o delle grandezze degli oggetti, fenomeni o situazioni. In matematica, Utilizzato per determinare le lunghezze, Aree e volumi, mentre nelle scienze sociali può riferirsi alla valutazione di variabili qualitative e quantitative. L'accuratezza della misurazione è fondamentale per ottenere risultati affidabili e validi in qualsiasi ricerca o applicazione pratica.... que lea los capítulos, comincerà ad amarli.
Operazioni Hadoop
Questo libro è scritto da Eric Sammer. Come suggerisce il nome, Questo libro ti insegnerà i metodi per mantenere gruppi hadoop grandi e complessi. Eric non ha solo coperto l'essenziale di Hadoop, ha anche fornito alcuni approcci inestimabili che possono aiutare una persona a svolgere questi compiti in modo efficiente. Troverai capitoli dedicati alla manutenzione, i backup, la supervisione, il risoluzioneIl "risoluzione" si riferisce alla capacità di prendere decisioni ferme e raggiungere gli obiettivi prefissati. In contesti personali e professionali, Implica la definizione di obiettivi chiari e lo sviluppo di un piano d'azione per raggiungerli. La risoluzione è fondamentale per la crescita personale e il successo in vari ambiti della vita, In quanto ti permette di superare gli ostacoli e mantenere la concentrazione su ciò che conta davvero.... di problemi, eccetera. Copre tutti i possibili componenti Hadoop che un ingegnere dei big data dovrebbe conoscere.
Scienza dei dati agile: creazione di applicazioni di analisi dei dati con Hadoop
Questo libro è scritto da Russell Jurney. Questo libro fornisce le conoscenze necessarie per creare potenti applicazioni analitiche utilizzando Hadoop in un ambiente aziendale.. Usa strumenti come Python, Apache MaialeEl cerdo, un mamífero domesticado de la familia Suidae, es conocido por su versatilidad en la agricultura y la producción de alimentos. Originario de Asia, su cría se ha extendido por todo el mundo. Los cerdos son omnívoros y poseen una alta capacidad de adaptación a diversos hábitats. Cosa c'è di più, juegan un papel importante en la economía, proporcionando carne, cuero y otros productos derivados. Su inteligencia y comportamiento social también son..., D3.js per creare un ambiente agile per l'esplorazione dei dati utilizzando esempi. Questi codici di esempio sono disponibili su github. Este libro es adecuado para usuarios intermedios que tengan un buen conocimiento de la analiticoL'analisi si riferisce al processo di raccolta, Misura e analizza i dati per ottenere informazioni preziose che facilitano il processo decisionale. In vari campi, come business, Salute e sport, L'analisi può identificare modelli e tendenze, Ottimizza i processi e migliora i risultati. L'utilizzo di strumenti avanzati e tecniche statistiche è fondamentale per trasformare i dati in conoscenze applicabili e strategiche.... di dati.
Hadoop in pratica
Questo libro è scritto da Alex Holmes. Questo è probabilmente il libro di best practice su Hadoop. Esso ha 85 Esempi Hadoop in formato domanda e risposta. Usando questi problemi, esplorerai gli aspetti nascosti di hadoop e imparerai i modi per costruire e implementare una soluzione specifica in base alle esigenze servite. Più che semplici esempi, Ti introdurrà anche ai metodi per integrare MapReduce e R. L'autore ha spiegato senza sforzo concetti complicati in un inglese semplice e chiaro. È altamente raccomandato per i principianti.
Soluzioni Hadoop professionali
Questo libro è scritto da Boris Lublinsky, Kevin T Smith, Alexey Yakubovich. Questo libro è una guida dettagliata che spiega come integrare il framework Hadoop e le API per fornire soluzioni reali.. Cosa c'è di più, espone il funzionamento interno delle API per consentire ad architetti e sviluppatori di sfruttarle e personalizzarle meglio. Più di una semplice implicazione, insegna i migliori scenari in cui questi codici dovrebbero essere usati (Java e XML).
MappaRiduci i modelli di progettazione: creazione di algoritmi e analisi efficaci per Hadoop
Questo libro è scritto da Donald Miner. Questo libro presuppone che il lettore abbia una conoscenza di base di hadoop. È più adatto per i principianti avanzati che vogliono padroneggiare gli algoritmi di riduzione delle mappe. Descrive vari usi di MapReduce con Hadoop. Contiene diverse metodologie utili per risolvere rapidamente molti problemi di hadoop. Riassumi questi concetti con esempi interessanti.
Big Data per i tecnici: Apache Spark
Scintilla di apprendimento: Analisi dei Big Data fulminea
Questo libro è stato scritto da Holden Karau, Andy Konwinski, Patrick Wendell e Matei Zaharia. Questo è più adatto per le persone che non conoscono Spark. Spiega concetti difficili in un inglese semplice e di facile comprensione. Consiglio questo libro ai principianti. Questo libro ti insegna come sfruttare le potenti librerie integrate di Spark, include Spark SQL, Spark Streaming e Mlib. Soprattutto, ti permetterà di padroneggiare argomenti come il partizionamento dei dati e le variabili condivise.
Scintilla: Impara Spark in un GIORNO!
Questo libro è scritto da Acodemy. Un altro libro per principianti. Questo libro tratta le basi di Spark e dei suoi componenti correlati. È abbastanza buono per iniziare con Spark, ma non vedo l'ora di più. Segui un metodo passo passo per spiegare teorie e concetti astrusi. Alla fine, Questo libro ti insegnerà i metodi da utilizzare per generare Spark al massimo delle sue potenzialità..
Analisi avanzata con Spark: modelli per imparare dai dati su larga scala
Questo libro è scritto da Sandy Ryza, Uri Laserson, Sean Owen e Josh Wills. Dopo aver letto uno dei libri sopra menzionati, questo è il prossimo passo naturale. È ora di aumentare la tua conoscenza della scintilla. Questo libro evidenzia la procedura per avvicinarsi all'analisi dei dati su larga scala con Spark. Insieme a Spark, copre i metodi statistici per insegnare l'approccio analitico ideale. Questo libro offre una comprensione di base dell'apprendimento automatico, statistiche, Giava, Python o Scala.
Divulgazione: I link di Amazon in questo articolo sono link di affiliazione. Se acquisti un libro tramite questo link, ci pagheranno tramite Amazon. Questo è uno dei modi in cui possiamo coprire i nostri costi mentre continuiamo a creare questi fantastici articoli.. Cosa c'è di più, l'elenco riflette la nostra raccomandazione basata sul contenuto del libro e non è in alcun modo influenzato dalla commissione.
Note finali
In questo articolo, Ho elencato alcuni dei migliori libri (cosa percepisco) sui big data, Hadoop e Apache Spark. Questi libri sono un must per i principianti che vogliono costruire una carriera di successo nei big data..
I libri richiedono disciplina e perseveranza. non ne avevo. Finché non ho scelto un libro e l'ho letto dall'inizio alla fine. Se non l'hai già fatto, ora è il tuo turno. I libri sopra elencati comprendono tutte le conoscenze essenziali per fare il primo passo nei big data. Tecnologie come Hadoop, Apache Spark è molto richiesto in tutto il mondo. Le aziende hanno dati, hanno anche le tecnologie, ma non hanno manodopera qualificata per lavorare su di loro.
Ho tralasciato un libro utile sui Big Data, Hadoop o Apache Spark? Condividi i tuoi pensieri nella sezione commenti qui sotto..