introduzione
Quasi tutti i domini / le attività attuali si stanno trasformando attraverso SMAC. SMAC è un termine collettivo che si riferisce ai cambiamenti che avvengono in Sufficiale, METROobile, UNanaliticoL'analisi si riferisce al processo di raccolta, Misura e analizza i dati per ottenere informazioni preziose che facilitano il processo decisionale. In vari campi, come business, Salute e sport, L'analisi può identificare modelli e tendenze, Ottimizza i processi e migliora i risultati. L'utilizzo di strumenti avanzati e tecniche statistiche è fondamentale per trasformare i dati in conoscenze applicabili e strategiche.... e Cforte. L'impatto di questo cambiamento è stato diffuso: organizzazioni, persone e prodotti. Nell'articolo di oggi, Ti consentiremo di portare le tue capacità di analisi al livello successivo utilizzando il cloud computing.
Abbiamo spiegato il concetto di cloud computing utilizzando la programmazione R e RStudio utilizzando una metodologia passo passo. Cosa c'è di più, imparerai anche i vantaggi dell'utilizzo di R nel cloud rispetto all'architettura desktop o client tradizionale / server locale.
Nube: una piattaforma abilitante per la scienza dei dati:
Il cloud computing ha visto una crescita e una penetrazione senza precedenti negli ultimi anni. Ha consentito alle organizzazioni di scalare rapidamente e facilmente. Quando si utilizzano i servizi cloud, le aziende raccolgono, archiviare e analizzare una grande quantità di dati, quello che era quasi impensabile prima. tuttavia, con servizi di aziende come Amazon, Google e Microsoft, i servizi cloud sono ora accessibili a qualsiasi analista.
Sono finiti i giorni in cui avresti acquistato un server per una determinata capacità e poi dovevi acquistarne uno nuovo, quando la capacità precedente era esaurita. Ad esempio, la maggior parte delle analisi che faccio normalmente si basa su pochi GB di dati, abbastanza per funzionare direttamente sul mio laptop. tuttavia, recentemente Microsoft ha pubblicato ~ 400 GB di malware e dati sui virus in Kaggle. Se avessi pensato di risolvere questo problema sul mio laptop, Avrei esaurito il piano Internet semplicemente scaricando il set di dati. Analizzarlo è di per sé una sfida separata.
Anche se avessi scaricato il set di dati, l'unico modo per fare il calcolo dei significati attraverso un modo non basato su cloud era acquistare una nuova macchina, che non è una soluzione molto pratica. È qui che entra in gioco il cloud computing!!
Devi leggere: guida passo passo per imparare a programmare in R
Perché hai bisogno della "nuvola"?
Come discusso nel caso di studio precedente, il cloud è più economico per gestire i big data rispetto allo storage desktop, laptop o server locali. Aspettarsi. Grandi dati? sì! Big Data è un termine generico che sostanzialmente denota dati il cui volume, la varietà e la velocità sono maggiori rispetto alle origini dati convenzionali e richiedono l'elaborazione distribuita come Hadoop e l'archiviazione non RDBMS come i database NoSQL.
Devi leggere: una guida per principianti all'utilizzo dei big data utilizzando MongoDB
Cos'è il cloud computing??
Secondo il Definizione NIST di Cloud Computing,
Il cloud computing è un modello per consentire l'accesso alla rete su richiesta, conveniente e onnipresente per un pool condiviso di risorse di elaborazione configurabili (ad esempio, reti, server, Conservazione, applicazioni e servizi) che può essere fornito e rilasciato rapidamente con il minimo sforzo di amministrazione o interazione con il fornitore di servizi. Questo modello cloud è composto da cinque caratteristiche essenziali, tre modelli di servizio e quattro modelli di distribuzione.
Il cloud computing consiste in 3 componenti:
- Infrastruttura come servizio (IaaSLa Infraestructura como Servicio (IaaS) es un modelo de computación en la nube que proporciona recursos informáticos virtualizados a través de Internet. Permite a las empresas acceder a servidores, almacenamiento y redes sin necesidad de invertir en hardware físico. Esto ofrece flexibilidad y escalabilidad, permitiendo a los usuarios ajustar los recursos según sus necesidades. IaaS es ideal para startups y empresas que buscan optimizar costos y mejorar su capacidad operativa....)
- Piattaforma come servizio (PaaSPlataforma como Servicio (PaaS) es un modelo de computación en la nube que proporciona una plataforma completa para desarrollar, probar y desplegar aplicaciones. PaaS ofrece herramientas y servicios que permiten a los desarrolladores centrarse en la creación de software sin preocuparse por la infraestructura subyacente. Este enfoque agiliza el proceso de desarrollo, reduce costos operativos y facilita la colaboración en equipos dispersos geográficamente....)
- Software come un servizio (SaaSEl Software como Servicio (SaaS) es un modelo de distribución de software que permite a los usuarios acceder a aplicaciones a través de Internet. En lugar de instalar y mantener programas en sus dispositivos, los usuarios pueden utilizar soluciones alojadas en la nube, lo que facilita la colaboración y reduce costos. Este enfoque se ha vuelto popular en diversas industrias, ofreciendo flexibilidad y escalabilidad a empresas de todos los tamaños....)
IaaS– Per implementare le tue applicazioni, gli utenti cloud installano immagini del sistema operativo e del loro software applicativo sull'infrastruttura cloud. In questo modello, l'utente cloud aggiorna e mantiene i sistemi operativi e il software applicativo.
PaaS– I fornitori di cloud offrono una piattaforma informatica, che di solito include il sistema operativo, l'ambiente runtime del linguaggio di programmazione, il Banca datiUn database è un insieme organizzato di informazioni che consente di archiviare, Gestisci e recupera i dati in modo efficiente. Utilizzato in varie applicazioni, Dai sistemi aziendali alle piattaforme online, I database possono essere relazionali o non relazionali. Una progettazione corretta è fondamentale per ottimizzare le prestazioni e garantire l'integrità delle informazioni, facilitando così il processo decisionale informato in diversi contesti.... y el servidor web. Gli sviluppatori di applicazioni possono sviluppare ed eseguire le proprie soluzioni software su una piattaforma cloud senza il costo e la complessità dell'acquisto e della gestione dei livelli hardware e software sottostanti.
SaaS – Nel software come servizio (SaaS), gli utenti hanno accesso a database e software applicativi. I provider cloud gestiscono l'infrastruttura e le piattaforme che eseguono le applicazioni. A volte viene chiamato SaaS “software su richiesta”.
Quali sono i vantaggi e gli svantaggi dell'utilizzo del cloud computing con R rispetto ad altre applicazioni?
Python è gratuito proprio come R, ma il motivo principale per cui i punteggi R è che la libreria statistica dei pacchetti R è molto più ampia. SAS rimane il linguaggio principale per l'analisi aziendale sul desktop, ma è ancora costoso per le piccole imprese e presenta uno svantaggio significativo nell'impegno di spesa in conto capitale a causa della struttura della licenza annuale piuttosto che del canone una tantum.
Devi leggere: una guida rapida su SAS vs R vs Python
Quali sono i vantaggi dell'utilizzo di R nel cloud rispetto al desktop?
- Poiché sappiamo che R è limitato alla gestione di dati grandi quanto la dimensione della RAM, il cloud ci offre una soluzione rapida per gestire Big Data Science utilizzando R. Questo può essere fatto semplicemente aumentando la RAM sull'istanza della macchina virtuale. Puoi vedere i vari tipi di opzioni RAM disponibili nel cloud che semplicemente non sono convenienti sulla macchina locale.
- Per grandi set di dati, è meglio usarlo nel cloud che scaricare il set di dati, elaboralo e poi votalo. Ad esempio, se hai una concorrenza che usa 30 GB di dati, faresti meglio a usarlo nel cloud. Perciò, il cloud è un ottimo modo per conoscere i big data senza doversi preoccupare della velocità di Internet.
- Il cloud ha una velocità di larghezza di banda molto migliore. Perciò, l'installazione di software e il trasferimento dei dati è molto più veloce nel cloud.
- Puoi usare servizi aggiuntivi come AzureML con R nel cloud invece di creare da zero il tuo servizio di machine learning. puoi questo tutorial per maggiori informazioni.
- Il cloud è molto più scalabile per i cambiamenti nel volume o nella velocità dei dati.
Fai il test: Dovrei diventare uno scienziato dei dati??
Come utilizzare la programmazione R nel cloud?
Puoi creare un'istanza (una macchina virtuale a cui accedi da remoto) Su Amazon Cloud, o Microsoft Azure o Google Cloud. Dopo, puoi semplicemente installare R nello stesso modo in cui lo usi sul desktop locale. Si connette al tuo computer remoto tramite SSH o Desktop remoto.
Prossimo, viene mostrato un processo passo passo per creare un'istanza cloud su Amazon Web Services.
Nota: Amazon ha un livello gratuito che ti consente di provare gratuitamente il cloud di Amazon durante 1 anno. tuttavia, questo è solo per le micro istanze che hanno pochissima RAM e pochissimo spazio su disco. Per più RAM e più spazio di archiviazione, deve pagare di più. Per vedere le diverse istanze e i loro prezzi orari, puoi visitare la pagina qui. Fondamentalmente, le tariffe sono addebitate in unità di calcolo, ma questo sito web semplifica il calcolo dei costi.
Devi prima creare il tuo ID Amazon. Una volta che ho finito, segui i passaggi seguenti per creare un'istanza cloud sui servizi web Amazon:
- Inicie sessioneIl "Sessione" È un concetto chiave nel campo della psicologia e della terapia. Si riferisce a un incontro programmato tra un terapeuta e un cliente, dove si esplorano i pensieri, Emozioni e comportamenti. Queste sessioni possono variare in durata e frequenza, e il suo scopo principale è quello di facilitare la crescita personale e la risoluzione dei problemi. L'efficacia delle sessioni dipende dalla relazione tra il terapeuta e il terapeuta.. en la consola de Amazon Web Services (AWS)
- Fare clic su Esegui istanza
- Scegli il sistema operativo per la tua macchina virtuale a cui accederai da remoto. Qui ho scelto Amazon Linux.
- Scegli il tipo di istanza (Dimensioni della RAM e memoria richiesta). Orologio qui per confrontare i prezzi.
- Crea una chiave di sicurezza. Ciò è necessario per un accesso sicuro a prova di cracker sulla macchina remota. Nota che puoi utilizzare il desktop remoto per i sistemi operativi Windows, ma dovrai usare SSH per le istanze Linux.
- Fare clic su Avvia istanza
- Connettiti all'istanza utilizzando la tua chiave di sicurezza seguendo le istruzioni fornite.
- Ora lavora sulla tua macchina remota come faresti su una macchina locale.
- Qui sto cercando di installare R
- Una volta terminato il tuo lavoro- RRicordati di chiudere l'istanza per non incorrere in una bolletta mensile elevata.
Puoi scegliere le istanze su richiesta, o anche avere istanze riservate (prenotare una macchina virtuale per un periodo di tempo fisso e, così, con un notevole sconto).
Fai il test: Dovrei diventare uno scienziato dei dati??
Come usare R nel cloud usando RStudio?
L'edizione RStudio Server funziona solo su Linux. Perciò, scegliamo l'istanza Linux nel cloud e poi configuriamo R Studio Server. Quindi possiamo connetterci al server RStudio remoto tramite browser e utilizzarlo allo stesso modo.
Ecco un modo passo passo per eseguire RStudio nel cloud.
- Nota: installiamo R già usando sudo yum install R
- Scarica il server RStudio sulla tua macchina virtuale e quindi installa RStudio Server
$ wget http://download2.rstudio.org/rstudio-server-rhel5-0.99.442-i686.rpm $ sudo yum install --nogpgcheck rstudio-server-rhel5-0.99.442-i686.rpm
- Verifichi l'installazione
$ sudo rstudio-server verifica-installazione
- Apri il porto 8787 utilizzando il gruppo di sicurezza nella Console AWS (grupos de seguridad del margenEl margen es un término utilizado en diversos contextos, como la contabilidad, la economía y la impresión. En contabilidad, se refiere a la diferencia entre los ingresos y los costos, lo que permite evaluar la rentabilidad de un negocio. En el ámbito editorial, el margen es el espacio en blanco alrededor del texto en una página, que facilita la lectura y proporciona una presentación estética. Su correcta gestión es esencial... A sinistra) creazione di una regola TCP personalizzata (fai clic su Modifica nella scheda in basso)
- Crea un nuovo utente con una nuova password utilizzando il terminale SSH per l'istanza cloud della tua macchina virtuale
- sudo useradd newuser1
- sudo passwd newuser1
- L'indirizzo IP pubblico dell'istanza cloud può essere trovato nella scheda Istanze sul lato sinistro.
- Apri il tuo browser su IPAddress: 8787 e quindi accedi con l'ID utente e la password creati in precedenza
- Ora sei pronto per utilizzare R utilizzando il cloud tramite un browser
Utilizzo di R attraverso il cloud bioconduttore?
Il cloud bioconduttore è un modo fantastico per lanciare R nel cloud. Puoi vedere le istruzioni qui.
Quali sono le altre opzioni di cloud computing?
Puoi anche utilizzare le opzioni Google Cloud e Windows Azure. tuttavia, la maggior parte dello spazio è dominata da Amazon Web Services.
Qualsiasi esempio di utilizzo di R con piattaforme e altri software come servizio?
sì, possiamo usare Azure Machine Learning con R nel cloud e anche utilizzare Google Big Query con R.
Qualsiasi esempio di Big Data che utilizza R nel cloud?
sì, ci sono molti esempi. Risorsa 1 e Risorsa 2.
Note finali
In questa fase, Avrei già una panoramica su come implementare il cloud computing utilizzando R e R Studio. Mi è piaciuto molto scrivere e selezionare le risorse utili in questo articolo.. Questo articolo copre anche le domande che le persone spesso pongono durante l'apprendimento del cloud computing in R. Perciò, Ho cercato di trattarli tutti in questo articolo.. Secondo la mia esperienza personale, Ho scoperto che dimostrare il cloud in R è relativamente più semplice rispetto ad altri software.
Spero che questo articolo ti abbia aiutato a familiarizzare con il cloud computing. Ci piacerebbe avere tue notizie.. Lo hai trovato utile? Sentiti libero di postare i tuoi pensieri tramite i commenti qui sotto..