Livros essenciais para iniciantes em Big Data, Hadoop e Apache Spark

Conteúdo

Introdução

Quantos de vocês concordariam / discordo desta afirmação?

O Google conhece e entende você melhor do que você mesmo??

Deixe-me saber suas opiniões através dos comentários abaixo..

Eu tenho pensado sobre a afirmação acima por algum tempo e pode ser difícil tomar uma posição absoluta, mas o próprio fato de você ter que pensar sobre isso significa a importância dos dados. Pense nisso, nossa opinião sobre nós mesmos é influenciada pelo que queremos ser. Nossa visão de nós mesmos é influenciada por emoções, a realidade e as limitações da memória humana. Mas o Google não tem essas limitações!!

As empresas estão agora mais conscientes do nosso estilo de vida, escolhas e rotina diária que. Graças aos nossos dados armazenados por smartphones, pulseiras, rastreador de fitness, Faturas de compra, etc.

Mas, Qual será a utilidade dos meus dados para essas empresas?? Eu me fiz a mesma pergunta até ler um dos livros listados abaixo. Tecnologias como Hadoop, MapReduce, Apache Spark revolucionou as formas de análise de big data. Fagulha, sendo o último, promete 'computação em cluster ultrarrápida'.

Este é provavelmente o melhor momento para fazer carreira em Big Data. Acredito que nada supera os livros quando se trata de aprender um conceito em sua essência. Neste artigo, Eu listei os melhores livros para iniciantes no Hadoop, Apache Spark e Big Data.

livros obrigatórios_1-9360947

Para quem é este artigo??

Este artigo é para iniciantes completos em Big Data. Não assume nenhum conhecimento prévio de big data.

Para simplificar a experiência de aprendizagem, Eu também dividi os livros em 2 grupos:

  • Big Data para Leigos
  • Big Data para especialistas em tecnologia.

Como o nome sugere, o primeiro cluster apresenta o enorme mundo do Big Data para pessoas comuns. Esses livros não ensinarão as técnicas para criar recursos de Big Data, mas eles permitirão que você entenda o domínio.

O segundo grupo de livros é destinado a especialistas em tecnologia: pessoas que desejam desenvolver uma carreira em Big Data. Esses livros são tesouros de conhecimento técnico, que eles permitam brilhante Conduzindo uma corrida à frente.

Big Data para Leigos

A face humana do Big Data

112-235x300-8542676

Este livro é escrito por Rick Smolan e Jennifer Erwitt. Neste livro, aprenda sobre maneiras interessantes de como o big data está trazendo vidas mais saudáveis ​​para crianças e idosos. Conta com 10 ensaios e infográficos impressionantes publicados pelos principais escritores do setor. Conecte big data com histórias reais da vida humana e sua transformação. Tenho certeza de que este livro definitivamente aumentará sua perspectiva atual sobre big data..

Big Data: uma revolução que transformará a maneira como vivemos, trabalhamos e pensamos

121-203x300-1379150

Este livro foi escrito por Kenneth Cukier e Viktor Mayer Schonberger. Este livro leva você a um tour global pelo valor agregado do big data em todos os setores.. Este livro irá ajudá-lo a ficar à frente das principais tendências que definirão os negócios nos próximos anos.. Jeff Jonas, Cientista-chefe na IBM Entity Analytics, Ele disse: “O livro está repleto de grandes insights sobre novas maneiras de aproveitar as informações e oferece uma visão convincente do futuro. É leitura essencial para quem usa, ou é afetado por, grandes dados'.

Datacilismo: quem somos (quando pensamos que ninguém está assistindo)

131-198x300-7084542

Este livro foi escrito por Christian Rudder. É um New York Times mais vendidos. preciso dizer mais alguma coisa? Nós vamos! aqui está uma olhada rápida. Este livro aborda alguns dos melhores casos de big data e seu profundo impacto em nossas vidas.. Apresenta um mundo que se baseia principalmente em números e dados que apenas os humanos. Definitivamente uma obrigação para manter o livro em seu próprio livro.

sinal e ruído: por que tantas previsões falham, mas alguns não

141-200x300-6428364

Este livro foi escrito por Nate Silver. É composto de casos interessantes impulsionados por estatísticas, economia, previsões. Ele também torna a pessoa ciente das armadilhas comuns a serem evitadas ao fazer previsões e oferece uma riqueza de previsões e insights de previsão.. Este é um livro de leitura obrigatória para cientistas de dados, analistas, estatísticos e qualquer pessoa que admire o poder dos dados.

A segunda era das máquinas: trabalho, progresso e prosperidade em uma era de tecnologias brilhantes

151-214x300-3283889

Este livro foi escrito por Erik Brynjolfsson, Andrew McAfee e Jeff Cummings. Antes de começar a lê-lo, você deve saber que é um audiolivro. Este livro dá um grande salto para o futuro e mostra o reinado indomável de máquinas e computadores em humanos.. Define a era da revolução industrial e a próxima também (talvez na próxima). Apresenta uma versão realista dos avanços digitais em várias facetas da vida humana.

Big Data para técnicos – Hadoop

hadoop para manequins

61-233x300-2807648

Este livro foi escrito por Dirk Deroos. Este livro é fácil de ler e entender, e é destinado a iniciantes (como o nome sugere). Faz o leitor entender o valor do big data e do hadoop. Explique a origem do hadoop, seus benefícios, funcionalidade, aplicações práticas e faz você se sentir confortável ao manuseá-lo. Também o familiariza com o ecossistema hadoop, cacho, mapreduzir, padrões de design e muito mais operações com o Hadoop.

Hadoop: o guia definitivo

18-150x150-8963254

Este livro foi escrito por Tom White. Descreve métodos úteis para construir, manter sistemas confiáveis, escalável e distribuído com Apache Hadoop. Explica o conceito de HDFS e Mapreduce em grande detalhe. Este livro oferece excelentes resultados quando lido com disciplina. Iniciantes acharão difícil entender no início. Mas, enquanto você lê os capítulos, vai começar a amá-los.

Operações do Hadoop

21-150x150-7365383

Este livro foi escrito por Eric Sammer. Como o nome sugere, este livro ensinará os métodos para manter grupos de hadoop grandes e complexos. Eric não cobriu apenas o essencial do Hadoop, também forneceu algumas abordagens inestimáveis ​​que podem ajudar uma pessoa a executar essas tarefas com eficiência. Você encontrará capítulos dedicados à manutenção, os backups, a supervisão, Solução de problemas, etc. Abrange todos os componentes possíveis do Hadoop que um engenheiro de Big Data deve conhecer.

Ciência de dados ágil: criando aplicativos de análise de dados com o Hadoop

31-150x150-8724892

Este livro foi escrito por Russell Jurney. Este livro fornece o conhecimento para criar aplicativos analíticos poderosos usando o Hadoop em um ambiente corporativo.. Use ferramentas como Python, Porco Apache, D3.js para criar um ambiente ágil para exploração de dados usando exemplos. Esses códigos de amostra estão disponíveis no github. Este livro é adequado para usuários intermediários que têm um bom entendimento de análise de dados.

Hadoop na prática

41-241x300-2005624

Este livro foi escrito por Alex Holmes. Este é provavelmente o livro de melhores práticas no Hadoop. Conta com 85 exemplos no Hadoop em formato de pergunta e resposta. Usando esses problemas, você explorará os aspectos ocultos do hadoop e aprenderá as maneiras de criar e implementar uma solução específica com base nas necessidades atendidas. Mais do que apenas exemplos, também apresentará a você os métodos para integrar MapReduce e R. O autor explicou sem esforço conceitos complicados em inglês claro e simples. É altamente recomendado para iniciantes.

Soluções profissionais de Hadoop

51-241x300-9187154

Este livro foi escrito por Boris Lublinsky, Kevin T Smith, Alexey Yakubovich. Este livro é um guia detalhado que explica a integração da estrutura e APIs do Hadoop para fornecer soluções do mundo real.. O que mais, expõe o funcionamento interno das APIs para permitir que arquitetos e desenvolvedores as aproveitem e personalizem melhor. Mais do que apenas envolvimento, ensina os melhores cenários em que esses códigos devem ser usados (Java e XML).

Padrões de Design MapReduce: construindo algoritmos e análises eficazes para o Hadoop

7-230x300-9766197

Este livro é escrito por Donald Miner. Este livro pressupõe que o leitor tenha uma compreensão básica do hadoop. É mais adequado para iniciantes avançados que desejam dominar algoritmos de redução de mapa. Descreve vários usos do MapReduce com o Hadoop. Contém várias metodologias úteis para resolver rapidamente muitos problemas de hadoop. Resuma esses conceitos com exemplos interessantes.

Big Data para técnicos: Apache Spark

Faísca de Aprendizagem: Análise de Big Data extremamente rápida

8-2850100

Este livro foi escrito por Holden Karau, Andy Konwinski, Patrick Wendell e Matei Zaharia. Isso é mais adequado para pessoas novas no Spark. Explica conceitos difíceis em inglês simples e fácil de entender. Recomendo este livro para iniciantes. Este livro ensina como aproveitar as poderosas bibliotecas internas do Spark., inclui Spark SQL, Spark Streaming e Mlib. Sobre tudo, permitirá que você domine tópicos como particionamento de dados e variáveis ​​compartilhadas.

Fagulha: Aprenda Spark em um DIA!

9-230x300-5373868

Este livro foi escrito pela Acodemy. Mais um livro para iniciantes. Este livro aborda os fundamentos do Spark e seus componentes relacionados. É bom o suficiente para começar com o Spark, mas não posso esperar por mais do que isso. Siga um método passo a passo para explicar conceitos e teorias obscuros. Ao final, este livro ensinará os métodos que você deve usar para gerar faísca em sua capacidade máxima.

Análise avançada com Spark: padrões para aprender com dados em escala

10-229x300-2050699

Este livro foi escrito por Sandy Ryza, Uri Laserson, Sean Owen e Josh Wills. Depois de ler qualquer um dos livros mencionados acima, este é o próximo passo natural. Hora de aumentar seu conhecimento sobre faíscas. Este livro destaca como lidar com a análise de big data com o Spark. Junto com Spark, abrange métodos estatísticos para ensinar a abordagem analítica ideal. Este livro oferece uma compreensão básica do aprendizado de máquina, Estatisticas, Java, Python ou Scala.

Divulgação: Os links da Amazon neste artigo são links de afiliados. Se você comprar um livro através deste link, eles vão nos pagar através da amazon. Essa é uma das maneiras de cobrirmos nossos custos à medida que continuamos a criar esses itens incríveis.. O que mais, a lista reflete nossa recomendação com base no conteúdo do livro e de forma alguma é influenciada pela comissão.

Notas finais

Neste artigo, Eu listei alguns dos melhores livros (o que eu percebo) sobre Big Data, Hadoop e Apache Spark. Esses livros são obrigatórios para iniciantes que desejam construir uma carreira de sucesso em big data..

Livros exigem disciplina e perseverança. eu não tinha nenhum. Até que eu peguei um livro e li de capa a capa. Se você ainda não, agora é sua vez. Os livros listados acima reúnem todo o conhecimento essencial para dar o primeiro passo em big data. Tecnologias como Hadoop, Apache Spark estão em alta demanda em todo o mundo. As empresas têm dados, eles ainda têm tecnologias, mas eles não têm mão de obra qualificada para trabalhar neles.

Deixei de fora algum livro útil sobre Big Data, Hadoop ou Apache Spark? Compartilhe seus pensamentos na seção de comentários abaixo..

Se você gostou do que acabou de ler e deseja continuar seu aprendizado sobre análise, inscreva-se em nossos e-mails, Siga-nos no Twitter ou como o nosso página do Facebook.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.