Alternatives à Google Colab | Alternatives à Google Colab

Contenu

Vue d'ensemble

  • Comprendre ce qu'est Google Colab
  • Obtenez une liste des meilleures alternatives à Google Colab
  • Cette liste n'est en aucun cas exhaustive.. N'hésitez pas à en ajouter plus dans les commentaires ci-dessous..

introduction

Pour toute personne ayant des problèmes de stockage ou n'ayant pas les moyens de s'offrir un système répondant à ses exigences en matière de travail de science des données, Google Colab a été une bénédiction.

Featured_image-2-8594261

Travailler avec Colab m'a ouvert tellement de voies que je pensais auparavant impossibles. Nous n'avons plus la restriction d'une faible puissance de calcul dans nos machines. Et les GPU gratuits sont à portée de main.

Mais, en tant que data scientists, il est important de connaître toutes les alternatives disponibles pour un outil particulier. Ensuite, dans cet article, Nous allons explorer certaines des alternatives largement utilisées à Google Colab.

Table des matières

1- Qu'est-ce que Google Colaboratory?

2- Alternatives à Google Colab

  • Amazon SageMaker
  • CoCalc
  • Noyau de Kaggle
  • Liant

3- Autres alternatives

1- Qu'est-ce que Google Colaboratory?

Collaboratif Google o Google Colab est un environnement Jupyter Notebook gratuit. C'est un service gratuit basé sur le cloud de Google, ce qui signifie que vous n'avez rien à payer. L'un des avantages de Colab est que vous n'avez rien à installer au préalable. En réalité, de nombreuses bibliothèques de science des données et d'apprentissage automatique, comme Prespirer, NumPy, Tensorflow, Dur, OpenCV ils sont pré-installés avec Colab.

Les blocs-notes que vous créez sont enregistrés sur votre Google Drive. Donc, Colab tire également parti des fonctionnalités de collaboration de Google Docs, où vous pouvez facilement partager votre ordinateur portable avec plusieurs personnes et tout le monde peut travailler sur le même ordinateur portable en même temps sans aucun problème.

Google propose également l'utilisation d'un GPU NVIDIA Tesla K80 gratuit. Si vous connectez Colab à Google Drive, tu monteras jusqu'à 15 Go d'espace disque pour stocker vos ensembles de données. Vous pouvez exécuter la session dans un carnet Colab interactif pour 12 Heures, ce qui est suffisant pour un débutant. Google a ses propres puces sur mesure appelées TPU.

Une autre chose à garder à l'esprit est que tL'ensemble de données que vous importez dans le notebook Colab est supprimé une fois la session terminée.

Cependant, peut passer à la version Pro, qui soi-disant vous donne accès à des GPU plus rapides: GPU NVIDIA TESLA T4 ou P100, des temps d'exécution plus longs allant jusqu'à 24 heures et plus de RAM.

Vous pouvez en savoir plus sur Google Colab dans l'article suivant:

Alternatives à Google Colab

Dans la section suivante, nous discutons du 5 meilleures alternatives à google colab.

1. Amazon SageMaker

sans titre-design-86-3710169

Amazon SageMaker Il s'agit également d'une plate-forme d'apprentissage automatique basée sur le cloud développée par Amazon en novembre. 2017. Blocs-notes Jupyter hébergés ne nécessitant aucune configuration. Mais ce n'est pas gratuit. Oui, doivent payer pour leurs services, bien que l'essai soit gratuit (pendant les deux premiers mois).

“SageMaker Studio est gratuit à utiliser, vous ne payez que pour les services AWS que vous utilisez dans Studio”.

aws-e1605700472725-7578808

Avantages:

  • Avec des frameworks d'apprentissage en profondeur comme Tensorflow, scikit apprendre, PyTorch et XGBoost, qui sont fournis par Google Colab, SageMaker fournit également MXNet, Chainer et SparkML.
  • Offre les fonctionnalités suivantes: Vérité au sol Amazon SageMaker, IA augmentée d'Amazon, Carnets Amazon SageMaker Studio, Prétraitement, Expériences Amazon SageMaker et plus.

Les inconvénients:

  • Si vous entraînez votre modèle à l'aide quelque chose d'incorporé de SageMaker, vous ne pouvez pas l'implémenter en dehors de SageMaker. C'est aussi le cas pour l'AutoML de Google, bien que tous les modèles formés sur le moteur ML (y compris ceux qui utilisent le TensorFlow-hub modules) peut être déployé n'importe où.
  • L'optimisation automatique des hyperparamètres fonctionne mieux dans Colab, en termes de résultats produits et de temps requis.
  • Vous obtenez les nouvelles versions de Tensorflow de SageMaker des semaines après les avoir obtenues de Colab.

Voici la guider sur la façon d'utiliser SageMaker et ses fonctions.

2. CoCalc

280px-cocalc_logo-9913266

CoCalc ou l'informatique collaborative est l'informatique en nuage basée sur le Web (SaaS) et plateforme de gestion pour les cours de mathématiques computationnelles. C'est un logiciel open source hébergé par SageMath Inc. Le créateur et développeur principal de CoCalc est William Stein, ancien professeur de mathématiques à l'Université de Washington. Avec le cahier Jupyter, prend en charge l'édition des feuilles de calcul Sage et Latex documents.

capture d

Avantages:

  • Offre une collaboration en temps réel, ce qui signifie que vous pouvez partager votre bloc-notes avec d'autres et que tout le monde peut le modifier en même temps.
  • Pour le forfait gratuit offert par CoCalc, les sessions se termineront après 30 minutes d'inactivité, bien qu'ils puissent durer jusqu'à 24 Heures, ce qui est deux fois le temps que Colab offre.
  • Il dispose d'une fonction de journal d'historique qui enregistre toutes vos modifications sur l'ordinateur portable en détail et vous permet d'explorer ces modifications à l'aide d'un curseur intuitif..
  • Langues proposées: Python, sauge, R, Octave et bien d'autres.

Les inconvénients:

  • Le service n'est pas gratuit. Cependant, il y a un plan gratuit mais un Projet d'essai avec certaines restrictions, en particulier, votre projet s'exécute sur une qualité d'hébergement inférieure et vous n'avez pas accès à Internet pour télécharger des données à partir d'autres serveurs.
  • Le GPU n'est pas disponible, ni dans le plan gratuit ni dans la version améliorée.

Vous pouvez commencer avec CoCalc à partir de ici.

3. Noyau de Kaggle

kaggle-logo-transparent-300-8080898

Kaggle est une plateforme populaire pour vos concours de science des données, cependant, ils offrent aussi Grain o Notebooks pour effectuer toutes les tâches d'apprentissage automatique et de science des données, quelles que soient les compétences. Kaggle Kernels est une plate-forme gratuite pour exécuter des blocs-notes Jupyter dans le navigateur. Colab et Kaggle sont tous deux des produits de Google et présentent de nombreuses similitudes.

Kaggle a mis à jour ses cœurs pour avoir plus de puissance de calcul et de mémoire. Base de données 20 FR, 5 Go d'espace disque, 9 heures de fonctionnement et 4 CPU avec 16 Go de RAM o, quand le GPU est allumé, il y a 2 Cœurs de processeur avec 13 Go de RAM.

capture d

Avantages:

  • Kaggle fournit un accès gratuit aux GPU NVIDIA TESLA P100 sur les cœurs. Ce benchmark montre que l'activation d'un GPU dans votre noyau entraîne une accélération de 12,5X tout en formant un modèle d'apprentissage en profondeur.
  • Prend en charge deux des principaux langages dans le domaine de la science des données: Ry Python.
  • La plupart des raccourcis clavier de Jupyter Notebook sont presque similaires dans Kaggle Kernels, rendre plus facile pour quelqu'un qui travaille chez Jupyter Notebooks de travailler chez Kaggle.
  • Kaggle a une grande communauté à soutenir, apprendre et valider les compétences en science des données.

Les inconvénients:

  • En général, Kaggle a un décalage en cours d'exécution et est plus lent que Colab.
  • Kaggle limite généralement le temps d'exécution du noyau à 9 Heures, avec un temps d'attente après 1 temps d'inactivité.
  • Un gros inconvénient des deux plates-formes est que les ordinateurs portables ne peuvent pas être téléchargés dans d'autres formats utiles.

4. Dossier

Liant est alimenté par BinderHub, qui est un outil open source qui implémente le service Binder dans le cloud. Binder vous permet de créer des environnements informatiques personnalisés qui peuvent être partagés et utilisés par de nombreux utilisateurs distants. Vous permet d'entrer l'URL de n'importe quel référentiel Git public et il l'ouvrira dans l'interface native de Jupyter Notebook. Vous pouvez exécuter n'importe quel bloc-notes dans le référentiel, bien que les modifications que vous apportez ne seront pas enregistrées dans le référentiel.

Cela peut être utile lorsque vous avez un référentiel complet de Jupyter Notebooks. Bien qu'il y ait une limite d'utilisateurs de 100 utilisateurs pour un référentiel (qu'est-ce qui suffit, je suppose).

capture d

Avantages:

  • Langues prises en charge: Python, R et Julia.
  • Puisqu'il s'agit d'un projet open source, est libre.
  • Binder peut exécuter vos blocs-notes directement depuis GitHub.

Les inconvénients:

  • La collaboration avec les autres n'est pas disponible.
  • Les sessions se termineront après 20 minutes d'inactivité, bien qu'ils puissent durer 12 heures ou plus.
  • Ne convient pas pour travailler avec de grands ensembles de données.

Autres alternatives

Certaines des autres alternatives que je n'ai pas mentionnées dans cet article peuvent être:

1- Nuage de Saturne

2- Ordinateurs portables IBM Dataplatform

3- Datalore

Regarde-les.

Remarques finales

Le but de cet article était seulement de donner une idée sur les alternatives possibles de Google Collaboratory, la décision finale vous appartient, celle que vous préférez en fonction de vos besoins. J'espère que vous explorerez toutes ces plateformes et identifierez les avantages et les inconvénients de votre métier..

Faites-moi également savoir quelle plate-forme vous préférez / utiliser et pourquoi.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.