Introduction au R Cloud Computing

Contenu

introduction

Presque tous les domaines / les entreprises actuelles se transforment grâce au SMAC. SMAC est un terme collectif qui fait référence aux changements qui se produisent dans Ssociale, MÉTROobile, UNEanalytique et Cfort. L'impact de ce changement a été généralisé: organisations, personnes et produits. Dans l'article d'aujourd'hui, Nous vous permettrons de faire passer vos capacités d'analyse au niveau supérieur en utilisant le cloud computing.

Nous avons expliqué le concept de cloud computing en utilisant la programmation R et RStudio en utilisant une méthodologie étape par étape. En outre, vous découvrirez également les avantages de l'utilisation de R dans le cloud par rapport à l'architecture traditionnelle de bureau ou de client / serveur local.

final-nouveau-1702064

Nuage: une plate-forme habilitante pour la science des données:

Le cloud computing a connu une croissance et une pénétration sans précédent ces dernières années. A permis aux organisations d'évoluer rapidement et facilement. Lors de l'utilisation des services cloud, les entreprises collectent, stocker et analyser une grande quantité de données, ce qui était presque impensable avant. Cependant, avec des services d'entreprises comme Amazon, Google et Microsoft, les services cloud sont désormais accessibles à tout analyste.

Fini le temps où vous achetiez un serveur pour une capacité particulière et deviez ensuite en acheter un nouveau, lorsque la capacité précédente était épuisée. Par exemple, la plupart des analyses que je fais normalement sont basées sur quelques Go de données, assez pour fonctionner directement sur mon ordinateur portable. Cependant, récemment Microsoft a publié ~ 400 Go de données sur les logiciels malveillants et les virus dans Kaggle. Si j'avais pensé à résoudre ce problème sur mon portable, J'aurais manqué de forfait Internet simplement en téléchargeant l'ensemble de données. L'analyser est un défi distinct en soi.

Même si j'avais téléchargé le jeu de données, la seule façon de faire le calcul des significations par une méthode non basée sur le cloud était d'acheter une nouvelle machine, ce qui n'est pas une solution très pratique. C'est là qu'intervient le cloud computing !!

Doit lire: guide pas à pas pour apprendre à programmer en R

Pourquoi avez-vous besoin du « cloud »?

Comme discuté dans l'étude de cas précédente, le cloud est moins cher pour gérer le big data que le stockage de bureau, ordinateurs portables ou serveurs locaux. attendre à. Big Data? Oui! Big Data est un terme général qui désigne essentiellement des données dont le volume, la variété et la vitesse sont supérieures aux sources de données conventionnelles et nécessitent une informatique distribuée comme Hadoop et un stockage non SGBDR comme les bases de données NoSQL.

Doit lire: un guide du débutant sur l'utilisation du Big Data avec MongoDB

Qu'est-ce que le cloud computing?

Selon le Définition NIST du cloud computing,

Le cloud computing est un modèle pour permettre l'accès au réseau à la demande, pratique et omniprésent à un pool partagé de ressources informatiques configurables (par exemple, réseaux, les serveurs, stockage, applications et services) qui peut être approvisionné et publié rapidement avec un effort minimal d'administration ou d'interaction avec le fournisseur de services. Ce modèle de cloud est composé de cinq caractéristiques essentielles, trois modèles de service et quatre modèles de déploiement.

Le cloud computing consiste à 3 Composants:

  • Infrastructure en tant que Service (IaaS)
  • Plateforme en tant que service (PaaS)
  • Logiciel en tant que service (SaaS)

IaaS– Pour mettre en œuvre vos applications, les utilisateurs du cloud installent des images du système d'exploitation et de leur logiciel d'application sur l'infrastructure du cloud. Dans ce modèle, l'utilisateur du cloud corrige et maintient les systèmes d'exploitation et les logiciels d'application.

PaaS– Les fournisseurs de cloud proposent une plateforme informatique, qui inclut généralement le système d'exploitation, l'environnement d'exécution du langage de programmation, la base de données et le serveur web. Les développeurs d'applications peuvent développer et exécuter leurs solutions logicielles sur une plate-forme cloud sans le coût et la complexité de l'achat et de la gestion des couches matérielles et logicielles sous-jacentes.

SaaS – Dans le logiciel en tant que service (SaaS), les utilisateurs ont accès aux bases de données et aux logiciels d'application. Les fournisseurs de cloud gèrent l'infrastructure et les plateformes qui exécutent les applications. Le SaaS est parfois appelé “logiciel à la demande”.

pic-1-2668012

Quels sont les avantages et les inconvénients de l'utilisation du cloud computing avec R par rapport à d'autres applications?

Python est gratuit tout comme R, mais la principale raison pour laquelle R scores est que la bibliothèque statistique des packages R est beaucoup plus étendue. SAS reste le langage leader pour l'analyse d'entreprise sur le bureau, mais cela reste cher pour les petites entreprises et présente un inconvénient important dans l'engagement de dépenses en capital en raison de la structure de licence annuelle plutôt que des frais de licence uniques.

Doit lire: un guide rapide sur SAS vs R vs Python

Quels sont les avantages d'utiliser R dans le cloud par rapport au bureau?

  1. Puisque nous savons que R est limité à la gestion de données aussi grandes que la taille de la RAM, le cloud nous offre une solution rapide pour gérer le Big Data Science avec R. Cela peut être fait en augmentant simplement la RAM sur l'instance de machine virtuelle. Vous pouvez voir les différents types d'options de RAM disponibles dans le cloud qui ne sont tout simplement pas abordables sur la machine locale.
  2. Pour les grands ensembles de données, il est préférable de l'utiliser dans le cloud plutôt que de télécharger le jeu de données, le traiter puis le noter. Par exemple, si vous avez une compétition qui utilise 30 Go de données, tu ferais mieux de l'utiliser dans le cloud. Donc, le cloud est un excellent moyen d'en savoir plus sur les mégadonnées sans avoir à se soucier de la vitesse d'Internet.
  3. Le cloud a une bien meilleure vitesse de bande passante. Donc, l'installation de logiciels et le transfert de données sont beaucoup plus rapides dans le cloud.
  4. Vous pouvez utiliser des services supplémentaires comme AzureML avec R dans le cloud au lieu de créer votre propre service d'apprentissage automatique à partir de zéro. Vous pouvez ceci Didacticiel pour plus d'informations.
  5. Le cloud est beaucoup plus évolutif pour les changements de volume ou de vitesse de données.

Passer l'examen: Dois-je devenir data scientist?

Comment utiliser la programmation R dans le cloud?

Vous pouvez créer une instance (une machine virtuelle à laquelle vous accédez à distance) dans Amazon Cloud, ou Microsoft Azure ou Google Cloud. Alors, vous pouvez simplement installer R de la même manière que vous l'utilisez sur votre bureau local. Se connecte à votre machine distante via SSH ou Remote Desktop.

Ensuite, un processus étape par étape est illustré pour créer une instance cloud sur Amazon Web Services.

Noter: Amazon propose un niveau gratuit qui vous permet de tester gratuitement le cloud Amazon pendant 1 année. Cependant, c'est uniquement pour les micro-instances qui ont très peu de RAM et très peu d'espace disque. Pour plus de RAM et plus de stockage, doit payer plus. Pour voir les différentes instances et leurs tarifs horaires, vous pouvez visiter la page ici. Essentiellement, les tarifs sont facturés en unités de calcul, mais ce site Web permet de calculer facilement les coûts.

pic-2-2358997

Vous devez d'abord créer votre identifiant Amazon. Une fois que j'ai fini, suivez les étapes ci-dessous pour créer une instance cloud sur les services Web Amazon:

    1. Connectez-vous à la console Amazon Web Services (AWS)
    2. Cliquez sur Exécuter l'instance
    3. Choisissez le système d'exploitation de votre machine virtuelle auquel vous accéderez à distance. Ici, j'ai choisi Amazon Linux.
    4. Choisissez le type d'instance (Taille de la RAM et mémoire requise). Regarder ici comparer les prix.
      pic-3-3893831
    5. Créer une clé de sécurité. Ceci est nécessaire pour une connexion sécurisée à l'épreuve des pirates sur la machine distante. Notez que vous pouvez utiliser le bureau à distance pour les systèmes d'exploitation Windows, mais vous devrez utiliser SSH pour les instances Linux.pic-4-1201368
    6. Cliquez sur Démarrer l'instance
    7. Connectez-vous à l'instance à l'aide de votre clé de sécurité en suivant les instructions données.pic-5-2746552
    8. Travaillez maintenant sur votre machine distante comme vous le feriez sur une machine locale.pic-6-7804408
    9. Ici, j'essaie d'installer R pic-7-8002216
    10. Une fois que vous avez terminé votre travail- rN'oubliez pas de fermer l'instance de peur que vous encouriez une facture mensuelle élevée.

Vous pouvez choisir des instances à la demande, ou même avoir des instances réservées (réserver une machine virtuelle pour une durée déterminée et, donc, avec une remise considérable).

Passer l'examen: Dois-je devenir data scientist?

Comment utiliser R dans le cloud avec RStudio?

L'édition RStudio Server ne fonctionne que sous Linux. Donc, nous choisissons l'instance Linux dans le cloud puis configurons R Studio Server. Ensuite, nous pouvons nous connecter au serveur distant RStudio via un navigateur et l'utiliser de la même manière.

Voici une méthode étape par étape pour exécuter RStudio dans le cloud.

  • Noter: nous installons déjà R en utilisant sudo yum installer R
  • Téléchargez le serveur RStudio sur votre machine virtuelle, puis installez RStudio Server
$ wget http://download2.rstudio.org/rstudio-server-rhel5-0.99.442-i686.rpm
$ sudo yum install --nogpgcheck rstudio-server-rhel5-0.99.442-i686.rpm
  • Vous vérifiez l'installation
$ vérification-installation du serveur sudo rstudio
  • Ouvrir le port 8787 en utilisant le groupe de sécurité dans la console AWS (groupes de sécurité rive gauche) création d'une règle TCP personnalisée (cliquez sur Modifier dans l'onglet ci-dessous)

pic-8-7717825

  • Créez un nouvel utilisateur avec un nouveau mot de passe à l'aide du terminal SSH pour votre instance cloud de machine virtuelle
  1. sudo useradd newuser1
  2. sudo passwd newuser1
  • L'adresse IP publique de l'instance cloud se trouve dans l'onglet Instances sur le côté gauche.

pic-9-9179741

  • Ouvrez votre navigateur à l'adresse IP: 8787 puis connectez-vous avec l'identifiant et le mot de passe créés précédemment

pic-10-4339480

  • Vous êtes maintenant prêt à utiliser R en utilisant le cloud via un navigateur

pic-11-2436655

Utilisation de R via le cloud de bioconducteurs?

Le cloud bioconducteur est un moyen incroyable de lancer R dans le cloud. Vous pouvez voir les instructions ici.

Quelles sont les autres options de cloud computing?

Vous pouvez également utiliser les options Google Cloud et Windows Azure. Cependant, la plupart de l'espace est dominé par Amazon Web Services.

Des exemples d'utilisation de R avec des plates-formes et d'autres logiciels en tant que service?

Oui, on peut utiliser Azure Machine Learning avec R dans le cloud et utilisez également Google Big Query avec R.

Tout exemple de Big Data utilisant R dans le cloud?

Oui, il y a beaucoup d'exemples. Ressource 1 Oui Ressource 2.

Remarques finales

À ce point, J'aurais déjà un aperçu de la façon de mettre en œuvre le cloud computing à l'aide de R et R Studio. J'ai vraiment aimé écrire et sélectionner les ressources utiles dans cet article.. Cet article couvre également les questions que les gens se posent souvent lorsqu'ils apprennent le cloud computing dans R. Donc, J'ai essayé de les couvrir tous dans cet article.. D'après mon expérience personnelle, J'ai trouvé que la démonstration du cloud dans R est relativement plus facile par rapport à d'autres logiciels.

J'espère que cet article vous a aidé à vous familiariser avec le cloud computing. Nous serions ravis de vous entendre.. Avez-vous trouvé cela utile? N'hésitez pas à poster vos réflexions via les commentaires ci-dessous..

Si vous aimez ce que vous venez de lire et souhaitez continuer vos gains analytiques, abonnez-vous à nos e-mails, Suivez-nous sur Twitter ou comme le nôtre page le Facebook.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.