Introdução ao R Cloud Computing

Conteúdo

Introdução

Quase todos os domínios / os negócios atuais estão sendo transformados por meio do SMAC. SMAC é um termo coletivo que se refere às mudanças que ocorrem em Soficial, METROobile, UMAanalítico e CForte. O impacto dessa mudança foi generalizado: organizações, pessoas e produtos. No artigo de hoje, Vamos permitir que você leve seus recursos analíticos para o próximo nível usando a computação em nuvem.

Explicamos o conceito de computação em nuvem usando programação R e RStudio usando uma metodologia passo a passo. O que mais, você também aprenderá sobre os benefícios de usar R na nuvem em comparação ao desktop tradicional ou arquitetura de cliente / servidor local.

final-new-1702064

Nuvem: uma plataforma habilitadora para ciência de dados:

A computação em nuvem tem visto um crescimento e penetração sem precedentes nos últimos anos. Tem permitido que as organizações aumentem de forma rápida e fácil. Ao usar serviços em nuvem, empresas coletam, armazenar e analisar uma grande quantidade de dados, o que era quase impensável antes. Porém, com serviços de empresas como a Amazon, Google e Microsoft, serviços em nuvem agora estão acessíveis a qualquer analista.

Já se foi o tempo em que você comprava um servidor para uma capacidade específica e precisava comprar um novo, quando a capacidade anterior foi esgotada. Por exemplo, a maior parte da análise que faço normalmente é baseada em alguns GB de dados, o suficiente para rodar diretamente no meu laptop. Porém, recentemente a Microsoft postou ~ 400 GB de dados de malware e vírus no Kaggle. Se eu tivesse pensado em resolver este problema no meu laptop, Eu teria ficado sem plano de internet apenas baixando o conjunto de dados. Analisá-lo é um desafio separado por si só.

Mesmo se eu tivesse baixado o conjunto de dados, a única maneira de fazer o cálculo de significados de uma forma não baseada na nuvem era comprar uma nova máquina, o que não é uma solução muito prática. É aqui que entra a computação em nuvem!!

Deve ler: guia passo a passo para aprender a programar em R

Por que você precisa da 'nuvem'?

Conforme discutido no estudo de caso anterior, a nuvem é mais barata para lidar com big data do que armazenamento de desktop, laptops o servidores locales. Espero. Big Data? sim! Big Data é um termo geral que basicamente denota dados cujo volume, variedade e velocidade são maiores do que as fontes de dados convencionais e requerem computação distribuída como Hadoop e armazenamento não RDBMS como bancos de dados NoSQL.

Deve ler: um guia para iniciantes no uso de big data usando MongoDB

O que é computação em nuvem?

De acordo com Definição NIST de computação em nuvem,

A computação em nuvem é um modelo para permitir o acesso à rede sob demanda, conveniente e onipresente para um pool compartilhado de recursos de computação configuráveis (por exemplo, redes, servidores, armazenar, aplicativos e serviços) que pode ser provisionado e liberado rapidamente com o mínimo de esforço de administração ou interação com o provedor de serviços. Este modelo de nuvem é composto por cinco características essenciais, três modelos de serviço e quatro modelos de implantação.

A computação em nuvem consiste em 3 componentes:

  • Infraestrutura como um serviço (IaaS)
  • Plataforma como serviço (PaaS)
  • Software como serviço (SaaS)

IaaS– Para implementar seus aplicativos, os usuários da nuvem instalam imagens do sistema operacional e seu software de aplicativo na infraestrutura da nuvem. Neste modelo, o usuário da nuvem corrige e mantém sistemas operacionais e software de aplicativo.

PaaS– Provedores de nuvem oferecem uma plataforma de computação, que geralmente inclui o sistema operacional, o ambiente de tempo de execução da linguagem de programação, o banco de dados e o servidor web. Os desenvolvedores de aplicativos podem desenvolver e executar suas soluções de software em uma plataforma em nuvem sem o custo e a complexidade de comprar e gerenciar as camadas de hardware e software subjacentes.

SaaS – Em software como serviço (SaaS), os usuários têm acesso a bancos de dados e software de aplicação. Os provedores de nuvem gerenciam a infraestrutura e as plataformas que executam os aplicativos. SaaS às vezes é chamado “software sob demanda”.

pic-1-2668012

Quais são as vantagens e desvantagens de usar a computação em nuvem com R em comparação com outros aplicativos?

Python é grátis assim como R, mas a principal razão pela qual as pontuações R é que a biblioteca estatística de pacotes R é muito mais extensa. SAS continua sendo a linguagem líder para análises corporativas no desktop, mas ainda é caro para pequenas empresas e tem uma desvantagem significativa no compromisso de despesas de capital devido à estrutura de licença anual em vez da taxa de licença única.

Deve ler: um guia rápido sobre SAS vs R vs Python

Quais são as vantagens de usar R na nuvem em comparação com o desktop?

  1. Uma vez que sabemos que R está limitado a lidar com dados tão grandes quanto o tamanho da RAM, a nuvem nos oferece uma solução rápida para lidar com a ciência de Big Data usando R. Isso pode ser feito simplesmente aumentando a RAM na instância da máquina virtual. Você pode ver os vários tipos de opções de RAM disponíveis na nuvem que simplesmente não são acessíveis na máquina local.
  2. Para grandes conjuntos de dados, é melhor usá-lo na nuvem do que baixar o conjunto de dados, processe-o e avalie-o. Por exemplo, se você tem uma competição que usa 30 GB de dados, é melhor você usar na nuvem. Portanto, a nuvem é uma ótima maneira de aprender sobre big data sem ter que se preocupar com a velocidade da internet.
  3. A nuvem tem uma velocidade de largura de banda muito melhor. Portanto, instalar software e transferir dados é muito mais rápido na nuvem.
  4. Você pode usar serviços adicionais como AzureML com R na nuvem em vez de criar seu próprio serviço de aprendizado de máquina do zero. Você pode isso tutorial para mais informacao.
  5. A nuvem é muito mais escalonável para mudanças no volume de dados ou velocidade.

Faça o teste: Devo me tornar um cientista de dados?

Como usar a programação R na nuvem?

Você pode criar uma instância (uma máquina virtual que você acessa remotamente) sobre Amazon Cloud, ou Microsoft Azure ou Google Cloud. Mais tarde, você pode simplesmente instalar o R ​​da mesma maneira que você usa em seu desktop local. Conecta-se à sua máquina remota via SSH ou Remote Desktop.

A seguir, um processo passo a passo é mostrado para criar uma instância de nuvem na Amazon Web Services.

Observação: A Amazon tem um nível gratuito que permite que você experimente a nuvem Amazon gratuitamente durante 1 ano. Porém, isso é apenas para micro instâncias que têm muito pouca RAM e muito pouco espaço em disco. Para mais RAM e mais armazenamento, deve pagar mais. Para ver as diferentes instâncias e seus preços por hora, você pode visitar a página aqui. Basicamente, as taxas são cobradas em unidades de cálculo, mas este site torna mais fácil calcular os custos.

pic-2-2358997

Você deve primeiro criar seu ID da Amazon. Quando eu terminar, siga as etapas abaixo para criar uma instância de nuvem nos serviços da web da Amazon:

    1. Faça login no console do Amazon Web Services (AWS)
    2. Clique em Executar Instância
    3. Escolha o sistema operacional para sua máquina virtual que você acessará remotamente. Aqui eu escolhi Amazon Linux.
    4. Escolha o tipo de instância (Tamanho da RAM e memória necessária). Assistir aqui comparar preços.
      pic-3-3893831
    5. Crie uma chave de segurança. Isso é necessário para um login seguro à prova de crackers na máquina remota. Observe que você pode usar a área de trabalho remota para sistemas operacionais Windows, mas você precisará usar SSH para instâncias do Linux.pic-4-1201368
    6. Clique em Iniciar instância
    7. Conecte-se à instância usando sua chave de segurança seguindo as instruções fornecidas.pic-5-2746552
    8. Agora trabalhe em sua máquina remota como faria em uma máquina local.pic-6-7804408
    9. Aqui estou tentando instalar o R pic-7-8002216
    10. Depois de terminar seu trabalho- rLembre-se de fechar a instância para que você não incorra em uma alta conta mensal.

Você pode escolher instâncias sob demanda, ou até mesmo ter instâncias reservadas (reservar uma máquina virtual por um período fixo de tempo e, portanto, com um desconto considerável).

Faça o teste: Devo me tornar um cientista de dados?

Como usar R na nuvem usando RStudio?

A edição RStudio Server é executada apenas em Linux. Portanto, escolhemos a instância do Linux na nuvem e, em seguida, configuramos o R Studio Server. Então, podemos nos conectar ao servidor RStudio remoto via navegador e usá-lo da mesma maneira.

Aqui está uma maneira passo a passo de executar o RStudio na nuvem.

  • Observação: nós instalamos o R já usando sudo yum install R
  • Baixe o servidor RStudio em sua máquina virtual e instale o servidor RStudio
$ wget http://download2.rstudio.org/rstudio-server-rhel5-0.99.442-i686.rpm
$ sudo yum install --nogpgcheck rstudio-server-rhel5-0.99.442-i686.rpm
  • Você verifica a instalação
$ sudo rstudio-server verificar-instalação
  • Abra a porta 8787 usando o grupo de segurança no AWS Console (grupos de segurança do banco esquerdo) criar uma regra TCP personalizada (clique em Editar na guia abaixo)

pic-8-7717825

  • Crie um novo usuário com uma nova senha usando o terminal SSH para sua instância de máquina virtual na nuvem
  1. sudo useradd newuser1
  2. sudo passwd newuser1
  • O endereço IP público da instância de nuvem pode ser encontrado na guia Instâncias no lado esquerdo.

pic-9-9179741

  • Abra seu navegador em IPAddress: 8787 e, em seguida, faça login com o ID de usuário e senha criados anteriormente

pic-10-4339480

  • Agora você está pronto para usar R usando a nuvem por meio de um navegador

pic-11-2436655

Usando R através da nuvem biocondutora?

A nuvem biocondutora é uma maneira incrível de lançar R na nuvem. Você pode ver as instruções aqui.

Quais são as outras opções de computação em nuvem?

Você também pode usar as opções do Google Cloud e do Windows Azure. Porém, a maior parte do espaço é dominado pela Amazon Web Services.

Quaisquer exemplos de uso de R com plataformas e outro software como serviço?

sim, podemos usar Azure Machine Learning com R na nuvem e também usar Google Big Query com R.

Qualquer exemplo de Big Data usando R na nuvem?

sim, existem muitos exemplos. Recurso 1 e Recurso 2.

Notas finais

A estas alturas, Eu já teria uma visão geral de como implementar a computação em nuvem usando R and R Studio. Eu realmente gostei de escrever e selecionar os recursos úteis neste artigo.. Este artigo também aborda perguntas que as pessoas costumam fazer enquanto aprendem computação em nuvem em R. Portanto, Tentei abordá-los todos neste artigo.. De acordo com minha experiência pessoal, Descobri que demonstrar nuvem em R é relativamente mais fácil em comparação com outros softwares.

Espero que este artigo tenha ajudado você a se familiarizar com a computação em nuvem. Gostaríamos muito de ouvir de você.. Você achou útil? Sinta-se à vontade para postar suas idéias através dos comentários abaixo..

Se você gosta do que acabou de ler e deseja continuar seus ganhos analíticos, inscreva-se em nossos e-mails, Siga-nos no Twitter ou como o nosso página do Facebook.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.