Introduzione a R Cloud Computing

Contenuti

introduzione

Quasi tutti i domini / le attività attuali si stanno trasformando attraverso SMAC. SMAC è un termine collettivo che si riferisce ai cambiamenti che avvengono in Sufficiale, METROobile, UNanalitico e Cforte. L'impatto di questo cambiamento è stato diffuso: organizzazioni, persone e prodotti. Nell'articolo di oggi, Ti consentiremo di portare le tue capacità di analisi al livello successivo utilizzando il cloud computing.

Abbiamo spiegato il concetto di cloud computing utilizzando la programmazione R e RStudio utilizzando una metodologia passo passo. Cosa c'è di più, imparerai anche i vantaggi dell'utilizzo di R nel cloud rispetto all'architettura desktop o client tradizionale / server locale.

finale-nuovo-1702064

Nube: una piattaforma abilitante per la scienza dei dati:

Il cloud computing ha visto una crescita e una penetrazione senza precedenti negli ultimi anni. Ha consentito alle organizzazioni di scalare rapidamente e facilmente. Quando si utilizzano i servizi cloud, le aziende raccolgono, archiviare e analizzare una grande quantità di dati, quello che era quasi impensabile prima. tuttavia, con servizi di aziende come Amazon, Google e Microsoft, i servizi cloud sono ora accessibili a qualsiasi analista.

Sono finiti i giorni in cui avresti acquistato un server per una determinata capacità e poi dovevi acquistarne uno nuovo, quando la capacità precedente era esaurita. Ad esempio, la maggior parte delle analisi che faccio normalmente si basa su pochi GB di dati, abbastanza per funzionare direttamente sul mio laptop. tuttavia, recentemente Microsoft ha pubblicato ~ 400 GB di malware e dati sui virus in Kaggle. Se avessi pensato di risolvere questo problema sul mio laptop, Avrei esaurito il piano Internet semplicemente scaricando il set di dati. Analizzarlo è di per sé una sfida separata.

Anche se avessi scaricato il set di dati, l'unico modo per fare il calcolo dei significati attraverso un modo non basato su cloud era acquistare una nuova macchina, che non è una soluzione molto pratica. È qui che entra in gioco il cloud computing!!

Devi leggere: guida passo passo per imparare a programmare in R

Perché hai bisogno della "nuvola"?

Come discusso nel caso di studio precedente, il cloud è più economico per gestire i big data rispetto allo storage desktop, laptop o server locali. Aspettarsi. Grandi dati? sì! Big Data è un termine generico che sostanzialmente denota dati il ​​cui volume, la varietà e la velocità sono maggiori rispetto alle origini dati convenzionali e richiedono l'elaborazione distribuita come Hadoop e l'archiviazione non RDBMS come i database NoSQL.

Devi leggere: una guida per principianti all'utilizzo dei big data utilizzando MongoDB

Cos'è il cloud computing??

Secondo il Definizione NIST di Cloud Computing,

Il cloud computing è un modello per consentire l'accesso alla rete su richiesta, conveniente e onnipresente per un pool condiviso di risorse di elaborazione configurabili (ad esempio, reti, server, Conservazione, applicazioni e servizi) che può essere fornito e rilasciato rapidamente con il minimo sforzo di amministrazione o interazione con il fornitore di servizi. Questo modello cloud è composto da cinque caratteristiche essenziali, tre modelli di servizio e quattro modelli di distribuzione.

Il cloud computing consiste in 3 componenti:

  • Infrastruttura come servizio (IaaS)
  • Piattaforma come servizio (PaaS)
  • Software come un servizio (SaaS)

IaaS– Per implementare le tue applicazioni, gli utenti cloud installano immagini del sistema operativo e del loro software applicativo sull'infrastruttura cloud. In questo modello, l'utente cloud aggiorna e mantiene i sistemi operativi e il software applicativo.

PaaS– I fornitori di cloud offrono una piattaforma informatica, che di solito include il sistema operativo, l'ambiente runtime del linguaggio di programmazione, il database e il server web. Gli sviluppatori di applicazioni possono sviluppare ed eseguire le proprie soluzioni software su una piattaforma cloud senza il costo e la complessità dell'acquisto e della gestione dei livelli hardware e software sottostanti.

SaaS – Nel software come servizio (SaaS), gli utenti hanno accesso a database e software applicativi. I provider cloud gestiscono l'infrastruttura e le piattaforme che eseguono le applicazioni. A volte viene chiamato SaaS “software su richiesta”.

foto-1-2668012

Quali sono i vantaggi e gli svantaggi dell'utilizzo del cloud computing con R rispetto ad altre applicazioni?

Python è gratuito proprio come R, ma il motivo principale per cui i punteggi R è che la libreria statistica dei pacchetti R è molto più ampia. SAS rimane il linguaggio principale per l'analisi aziendale sul desktop, ma è ancora costoso per le piccole imprese e presenta uno svantaggio significativo nell'impegno di spesa in conto capitale a causa della struttura della licenza annuale piuttosto che del canone una tantum.

Devi leggere: una guida rapida su SAS vs R vs Python

Quali sono i vantaggi dell'utilizzo di R nel cloud rispetto al desktop?

  1. Poiché sappiamo che R è limitato alla gestione di dati grandi quanto la dimensione della RAM, il cloud ci offre una soluzione rapida per gestire Big Data Science utilizzando R. Questo può essere fatto semplicemente aumentando la RAM sull'istanza della macchina virtuale. Puoi vedere i vari tipi di opzioni RAM disponibili nel cloud che semplicemente non sono convenienti sulla macchina locale.
  2. Per grandi set di dati, è meglio usarlo nel cloud che scaricare il set di dati, elaboralo e poi votalo. Ad esempio, se hai una concorrenza che usa 30 GB di dati, faresti meglio a usarlo nel cloud. Perciò, il cloud è un ottimo modo per conoscere i big data senza doversi preoccupare della velocità di Internet.
  3. Il cloud ha una velocità di larghezza di banda molto migliore. Perciò, l'installazione di software e il trasferimento dei dati è molto più veloce nel cloud.
  4. Puoi usare servizi aggiuntivi come AzureML con R nel cloud invece di creare da zero il tuo servizio di machine learning. puoi questo tutorial per maggiori informazioni.
  5. Il cloud è molto più scalabile per i cambiamenti nel volume o nella velocità dei dati.

Fai il test: Dovrei diventare uno scienziato dei dati??

Come utilizzare la programmazione R nel cloud?

Puoi creare un'istanza (una macchina virtuale a cui accedi da remoto) Su Amazon Cloud, o Microsoft Azure o Google Cloud. Dopo, puoi semplicemente installare R nello stesso modo in cui lo usi sul desktop locale. Si connette al tuo computer remoto tramite SSH o Desktop remoto.

Prossimo, viene mostrato un processo passo passo per creare un'istanza cloud su Amazon Web Services.

Nota: Amazon ha un livello gratuito che ti consente di provare gratuitamente il cloud di Amazon durante 1 anno. tuttavia, questo è solo per le micro istanze che hanno pochissima RAM e pochissimo spazio su disco. Per più RAM e più spazio di archiviazione, deve pagare di più. Per vedere le diverse istanze e i loro prezzi orari, puoi visitare la pagina qui. Fondamentalmente, le tariffe sono addebitate in unità di calcolo, ma questo sito web semplifica il calcolo dei costi.

pic-2-2358997

Devi prima creare il tuo ID Amazon. Una volta che ho finito, segui i passaggi seguenti per creare un'istanza cloud sui servizi web Amazon:

    1. Accedi alla console di Amazon Web Services (AWS)
    2. Fare clic su Esegui istanza
    3. Scegli il sistema operativo per la tua macchina virtuale a cui accederai da remoto. Qui ho scelto Amazon Linux.
    4. Scegli il tipo di istanza (Dimensioni della RAM e memoria richiesta). Orologio qui per confrontare i prezzi.
      pic-3-3893831
    5. Crea una chiave di sicurezza. Ciò è necessario per un accesso sicuro a prova di cracker sulla macchina remota. Nota che puoi utilizzare il desktop remoto per i sistemi operativi Windows, ma dovrai usare SSH per le istanze Linux.pic-4-1201368
    6. Fare clic su Avvia istanza
    7. Connettiti all'istanza utilizzando la tua chiave di sicurezza seguendo le istruzioni fornite.pic-5-2746552
    8. Ora lavora sulla tua macchina remota come faresti su una macchina locale.foto-6-7804408
    9. Qui sto cercando di installare R pic-7-8002216
    10. Una volta terminato il tuo lavoro- RRicordati di chiudere l'istanza per non incorrere in una bolletta mensile elevata.

Puoi scegliere le istanze su richiesta, o anche avere istanze riservate (prenotare una macchina virtuale per un periodo di tempo fisso e, così, con un notevole sconto).

Fai il test: Dovrei diventare uno scienziato dei dati??

Come usare R nel cloud usando RStudio?

L'edizione RStudio Server funziona solo su Linux. Perciò, scegliamo l'istanza Linux nel cloud e poi configuriamo R Studio Server. Quindi possiamo connetterci al server RStudio remoto tramite browser e utilizzarlo allo stesso modo.

Ecco un modo passo passo per eseguire RStudio nel cloud.

  • Nota: installiamo R già usando sudo yum install R
  • Scarica il server RStudio sulla tua macchina virtuale e quindi installa RStudio Server
$ wget http://download2.rstudio.org/rstudio-server-rhel5-0.99.442-i686.rpm
$ sudo yum install --nogpgcheck rstudio-server-rhel5-0.99.442-i686.rpm
  • Verifichi l'installazione
$ sudo rstudio-server verifica-installazione
  • Apri il porto 8787 utilizzando il gruppo di sicurezza nella Console AWS (gruppi di sicurezza della banca sinistra) creazione di una regola TCP personalizzata (fai clic su Modifica nella scheda in basso)

pic-8-7717825

  • Crea un nuovo utente con una nuova password utilizzando il terminale SSH per l'istanza cloud della tua macchina virtuale
  1. sudo useradd newuser1
  2. sudo passwd newuser1
  • L'indirizzo IP pubblico dell'istanza cloud può essere trovato nella scheda Istanze sul lato sinistro.

pic-9-9179741

  • Apri il tuo browser su IPAddress: 8787 e quindi accedi con l'ID utente e la password creati in precedenza

pic-10-4339480

  • Ora sei pronto per utilizzare R utilizzando il cloud tramite un browser

pic-11-2436655

Utilizzo di R attraverso il cloud bioconduttore?

Il cloud bioconduttore è un modo fantastico per lanciare R nel cloud. Puoi vedere le istruzioni qui.

Quali sono le altre opzioni di cloud computing?

Puoi anche utilizzare le opzioni Google Cloud e Windows Azure. tuttavia, la maggior parte dello spazio è dominata da Amazon Web Services.

Qualsiasi esempio di utilizzo di R con piattaforme e altri software come servizio?

sì, possiamo usare Azure Machine Learning con R nel cloud e anche utilizzare Google Big Query con R.

Qualsiasi esempio di Big Data che utilizza R nel cloud?

sì, ci sono molti esempi. Risorsa 1 e Risorsa 2.

Note finali

In questa fase, Avrei già una panoramica su come implementare il cloud computing utilizzando R e R Studio. Mi è piaciuto molto scrivere e selezionare le risorse utili in questo articolo.. Questo articolo copre anche le domande che le persone spesso pongono durante l'apprendimento del cloud computing in R. Perciò, Ho cercato di trattarli tutti in questo articolo.. Secondo la mia esperienza personale, Ho scoperto che dimostrare il cloud in R è relativamente più semplice rispetto ad altri software.

Spero che questo articolo ti abbia aiutato a familiarizzare con il cloud computing. Ci piacerebbe avere tue notizie.. Lo hai trovato utile? Sentiti libero di postare i tuoi pensieri tramite i commenti qui sotto..

Se ti piace quello che hai appena letto e vuoi continuare i tuoi guadagni analitici, iscriviti alle nostre email, Seguici su Twitter o come il nostro pagina Facebook.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.