Introdução
Quantos de vocês concordariam / discordo desta afirmação?
O Google conhece e entende você melhor do que você mesmo??
Deixe-me saber suas opiniões através dos comentários abaixo..
Eu tenho pensado sobre a afirmação acima por algum tempo e pode ser difícil tomar uma posição absoluta, mas o próprio fato de você ter que pensar sobre isso significa a importância dos dados. Pense nisso, nossa opinião sobre nós mesmos é influenciada pelo que queremos ser. Nossa visão de nós mesmos é influenciada por emoções, a realidade e as limitações da memória humana. Mas o Google não tem essas limitações!!
As empresas estão agora mais conscientes do nosso estilo de vida, escolhas e rotina diária que. Graças aos nossos dados armazenados por smartphones, pulseiras, rastreador de fitness, Faturas de compra, etc.
Mas, Qual será a utilidade dos meus dados para essas empresas?? Eu me fiz a mesma pergunta até ler um dos livros listados abaixo. Tecnologias como Hadoop, MapReduceMapReduce es un modelo de programación diseñado para procesar y generar grandes conjuntos de datos de manera eficiente. Desarrollado por Google, este enfoque Divide el trabajo en tareas más pequeñas, las cuales se distribuyen entre múltiples nodos en un clúster. Cada nodo procesa su parte y luego se combinan los resultados. Este método permite escalar aplicaciones y manejar volúmenes masivos de información, siendo fundamental en el mundo del Big Data...., Apache SparkO Apache Spark é um mecanismo de processamento de dados de código aberto que permite a análise de grandes volumes de informações de forma rápida e eficiente. Seu design é baseado na memória, que otimiza o desempenho em comparação com outras ferramentas de processamento em lote. O Spark é amplamente utilizado em aplicativos de big data, Aprendizado de máquina e análise em tempo real, graças à sua facilidade de uso e... han supuesto una revolución en las formas de analizar big data. Fagulha, sendo o último, promete una ‘computación en cachoUm cluster é um conjunto de empresas e organizações interconectadas que operam no mesmo setor ou área geográfica, e que colaboram para melhorar sua competitividade. Esses agrupamentos permitem o compartilhamento de recursos, Conhecimentos e tecnologias, Promover a inovação e o crescimento económico. Os clusters podem abranger uma variedade de setores, Da tecnologia à agricultura, e são fundamentais para o desenvolvimento regional e a criação de empregos.... ultrarrápida’.
Este é provavelmente o melhor momento para fazer carreira em Big Data. Acredito que nada supera os livros quando se trata de aprender um conceito em sua essência. Neste artigo, Eu listei os melhores livros para iniciantes no Hadoop, Apache Spark e Big Data.
Para quem é este artigo??
Este artigo é para iniciantes completos em Big Data. Não assume nenhum conhecimento prévio de big data.
Para simplificar a experiência de aprendizagem, Eu também dividi os livros em 2 grupos:
- Big Data para Leigos
- Big Data para especialistas em tecnologia.
Como o nome sugere, o primeiro cluster apresenta o enorme mundo do Big Data para pessoas comuns. Esses livros não ensinarão as técnicas para criar recursos de Big Data, mas eles permitirão que você entenda o domínio.
O segundo grupo de livros é destinado a especialistas em tecnologia: pessoas que desejam desenvolver uma carreira em Big Data. Esses livros são tesouros de conhecimento técnico, que eles permitam brilhante Conduzindo uma corrida à frente.
Big Data para Leigos
A face humana do Big Data
Este livro é escrito por Rick Smolan e Jennifer Erwitt. Neste livro, aprenda sobre maneiras interessantes de como o big data está trazendo vidas mais saudáveis para crianças e idosos. Conta com 10 ensaios e infográficos impressionantes publicados pelos principais escritores do setor. Conecte big data com histórias reais da vida humana e sua transformação. Tenho certeza de que este livro definitivamente aumentará sua perspectiva atual sobre big data..
Big Data: uma revolução que transformará a maneira como vivemos, trabalhamos e pensamos
Este livro foi escrito por Kenneth Cukier e Viktor Mayer Schonberger. Este livro leva você a um tour global pelo valor agregado do big data em todos os setores.. Este livro irá ajudá-lo a ficar à frente das principais tendências que definirão os negócios nos próximos anos.. Jeff Jonas, Cientista-chefe na IBM Entity Analytics, Ele disse: “O livro está repleto de grandes insights sobre novas maneiras de aproveitar as informações e oferece uma visão convincente do futuro. É leitura essencial para quem usa, ou é afetado por, grandes dados'.
Datacilismo: quem somos (quando pensamos que ninguém está assistindo)
Este livro foi escrito por Christian Rudder. É um New York Times mais vendidos. preciso dizer mais alguma coisa? Nós vamos! aqui está uma olhada rápida. Este livro aborda alguns dos melhores casos de big data e seu profundo impacto em nossas vidas.. Apresenta um mundo que se baseia principalmente em números e dados que apenas os humanos. Definitivamente uma obrigação para manter o livro em seu próprio livro.
sinal e ruído: por que tantas previsões falham, mas alguns não
Este livro foi escrito por Nate Silver. É composto de casos interessantes impulsionados por estatísticas, economia, previsões. Ele também torna a pessoa ciente das armadilhas comuns a serem evitadas ao fazer previsões e oferece uma riqueza de previsões e insights de previsão.. Este é um livro de leitura obrigatória para cientistas de dados, analistas, estatísticos e qualquer pessoa que admire o poder dos dados.
A segunda era das máquinas: trabalho, progresso e prosperidade em uma era de tecnologias brilhantes
Este livro foi escrito por Erik Brynjolfsson, Andrew McAfee e Jeff Cummings. Antes de começar a lê-lo, você deve saber que é um audiolivro. Este livro dá um grande salto para o futuro e mostra o reinado indomável de máquinas e computadores em humanos.. Define a era da revolução industrial e a próxima também (talvez na próxima). Apresenta uma versão realista dos avanços digitais em várias facetas da vida humana.
Big Data para técnicos – Hadoop
hadoop para manequins
Este livro foi escrito por Dirk Deroos. Este livro é fácil de ler e entender, e é destinado a iniciantes (como o nome sugere). Faz o leitor entender o valor do big data e do hadoop. Explique a origem do hadoop, seus benefícios, funcionalidade, aplicações práticas e faz você se sentir confortável ao manuseá-lo. Também o familiariza com o ecossistema hadoop, cacho, mapreduzir, padrões de design e muito mais operações com o Hadoop.
Hadoop: o guia definitivo
Este livro foi escrito por Tom White. Descreve métodos úteis para construir, manter sistemas confiáveis, escalável e distribuído com Apache Hadoop. Explica el concepto de HDFSHDFS, o Sistema de Arquivos Distribuído Hadoop, É uma infraestrutura essencial para armazenar grandes volumes de dados. Projetado para ser executado em hardware comum, O HDFS permite a distribuição de dados em vários nós, garantindo alta disponibilidade e tolerância a falhas. Sua arquitetura é baseada em um modelo mestre-escravo, onde um nó mestre gerencia o sistema e os nós escravos armazenam os dados, facilitando o processamento eficiente de informações.. y Mapreduce con gran detalle. Este livro oferece excelentes resultados quando lido com disciplina. Iniciantes acharão difícil entender no início. Mas, uma mediro "medir" É um conceito fundamental em várias disciplinas, que se refere ao processo de quantificação de características ou magnitudes de objetos, Fenômenos ou situações. Na matemática, Usado para determinar comprimentos, Áreas e volumes, enquanto nas ciências sociais pode se referir à avaliação de variáveis qualitativas e quantitativas. A precisão da medição é crucial para obter resultados confiáveis e válidos em qualquer pesquisa ou aplicação prática.... que lea los capítulos, vai começar a amá-los.
Operações do Hadoop
Este livro foi escrito por Eric Sammer. Como o nome sugere, este livro ensinará os métodos para manter grupos de hadoop grandes e complexos. Eric não cobriu apenas o essencial do Hadoop, também forneceu algumas abordagens inestimáveis que podem ajudar uma pessoa a executar essas tarefas com eficiência. Você encontrará capítulos dedicados à manutenção, os backups, a supervisão, a resoluçãoo "resolução" refere-se à capacidade de tomar decisões firmes e atingir metas estabelecidas. Em contextos pessoais e profissionais, Envolve a definição de metas claras e o desenvolvimento de um plano de ação para alcançá-las. A resolução é fundamental para o crescimento pessoal e o sucesso em várias áreas da vida, pois permite superar obstáculos e manter o foco no que realmente importa.... de problemas, etc. Abrange todos os componentes possíveis do Hadoop que um engenheiro de Big Data deve conhecer.
Ciência de dados ágil: criando aplicativos de análise de dados com o Hadoop
Este livro foi escrito por Russell Jurney. Este livro fornece o conhecimento para criar aplicativos analíticos poderosos usando o Hadoop em um ambiente corporativo.. Use ferramentas como Python, Apache PorcoEl cerdo, un mamífero domesticado de la familia Suidae, es conocido por su versatilidad en la agricultura y la producción de alimentos. Originario de Asia, su cría se ha extendido por todo el mundo. Los cerdos son omnívoros y poseen una alta capacidad de adaptación a diversos hábitats. O que mais, juegan un papel importante en la economía, proporcionando carne, cuero y otros productos derivados. Su inteligencia y comportamiento social también son..., D3.js para criar um ambiente ágil para exploração de dados usando exemplos. Esses códigos de amostra estão disponíveis no github. Este libro es adecuado para usuarios intermedios que tengan un buen conocimiento de la analíticaAnalytics refere-se ao processo de coleta, Meça e analise dados para obter insights valiosos que facilitam a tomada de decisões. Em vários campos, como negócio, Saúde e esporte, A análise pode identificar padrões e tendências, Otimize processos e melhore resultados. O uso de ferramentas avançadas e técnicas estatísticas é essencial para transformar dados em conhecimento aplicável e estratégico.... De dados.
Hadoop na prática
Este livro foi escrito por Alex Holmes. Este é provavelmente o livro de melhores práticas no Hadoop. Conta com 85 exemplos no Hadoop em formato de pergunta e resposta. Usando esses problemas, você explorará os aspectos ocultos do hadoop e aprenderá as maneiras de criar e implementar uma solução específica com base nas necessidades atendidas. Mais do que apenas exemplos, também apresentará a você os métodos para integrar MapReduce e R. O autor explicou sem esforço conceitos complicados em inglês claro e simples. É altamente recomendado para iniciantes.
Soluções profissionais de Hadoop
Este livro foi escrito por Boris Lublinsky, Kevin T Smith, Alexey Yakubovich. Este livro é um guia detalhado que explica a integração da estrutura e APIs do Hadoop para fornecer soluções do mundo real.. O que mais, expõe o funcionamento interno das APIs para permitir que arquitetos e desenvolvedores as aproveitem e personalizem melhor. Mais do que apenas envolvimento, ensina os melhores cenários em que esses códigos devem ser usados (Java e XML).
Padrões de Design MapReduce: construindo algoritmos e análises eficazes para o Hadoop
Este livro é escrito por Donald Miner. Este livro pressupõe que o leitor tenha uma compreensão básica do hadoop. É mais adequado para iniciantes avançados que desejam dominar algoritmos de redução de mapa. Descreve vários usos do MapReduce com o Hadoop. Contém várias metodologias úteis para resolver rapidamente muitos problemas de hadoop. Resuma esses conceitos com exemplos interessantes.
Big Data para técnicos: Apache Spark
Faísca de Aprendizagem: Análise de Big Data extremamente rápida
Este livro foi escrito por Holden Karau, Andy Konwinski, Patrick Wendell e Matei Zaharia. Isso é mais adequado para pessoas novas no Spark. Explica conceitos difíceis em inglês simples e fácil de entender. Recomendo este livro para iniciantes. Este livro ensina como aproveitar as poderosas bibliotecas internas do Spark., inclui Spark SQL, Spark Streaming e Mlib. Sobre tudo, permitirá que você domine tópicos como particionamento de dados e variáveis compartilhadas.
Fagulha: Aprenda Spark em um DIA!
Este livro foi escrito pela Acodemy. Mais um livro para iniciantes. Este livro aborda os fundamentos do Spark e seus componentes relacionados. É bom o suficiente para começar com o Spark, mas não posso esperar por mais do que isso. Siga um método passo a passo para explicar conceitos e teorias obscuros. Ao final, este livro ensinará os métodos que você deve usar para gerar faísca em sua capacidade máxima.
Análise avançada com Spark: padrões para aprender com dados em escala
Este livro foi escrito por Sandy Ryza, Uri Laserson, Sean Owen e Josh Wills. Depois de ler qualquer um dos livros mencionados acima, este é o próximo passo natural. Hora de aumentar seu conhecimento sobre faíscas. Este livro destaca como lidar com a análise de big data com o Spark. Junto com Spark, abrange métodos estatísticos para ensinar a abordagem analítica ideal. Este livro oferece uma compreensão básica do aprendizado de máquina, Estatisticas, Java, Python ou Scala.
Divulgação: Os links da Amazon neste artigo são links de afiliados. Se você comprar um livro através deste link, eles vão nos pagar através da amazon. Essa é uma das maneiras de cobrirmos nossos custos à medida que continuamos a criar esses itens incríveis.. O que mais, a lista reflete nossa recomendação com base no conteúdo do livro e de forma alguma é influenciada pela comissão.
Notas finais
Neste artigo, Eu listei alguns dos melhores livros (o que eu percebo) sobre Big Data, Hadoop e Apache Spark. Esses livros são obrigatórios para iniciantes que desejam construir uma carreira de sucesso em big data..
Livros exigem disciplina e perseverança. eu não tinha nenhum. Até que eu peguei um livro e li de capa a capa. Se você ainda não, agora é sua vez. Os livros listados acima reúnem todo o conhecimento essencial para dar o primeiro passo em big data. Tecnologias como Hadoop, Apache Spark estão em alta demanda em todo o mundo. As empresas têm dados, eles ainda têm tecnologias, mas eles não têm mão de obra qualificada para trabalhar neles.
Deixei de fora algum livro útil sobre Big Data, Hadoop ou Apache Spark? Compartilhe seus pensamentos na seção de comentários abaixo..