Vue d'ensemble
- Comprendre ce qu'est Google Colab
- Obtenez une liste des meilleures alternatives à Google Colab
- Cette liste n'est en aucun cas exhaustive.. N'hésitez pas à en ajouter plus dans les commentaires ci-dessous..
introduction
Pour toute personne ayant des problèmes de stockage ou n'ayant pas les moyens de s'offrir un système répondant à ses exigences en matière de travail de science des données, Google Colab a été une bénédiction.
Travailler avec Colab m'a ouvert tellement de voies que je pensais auparavant impossibles. Nous n'avons plus la restriction d'une faible puissance de calcul dans nos machines. Et les GPU gratuits sont à portée de main.
Mais, en tant que data scientists, il est important de connaître toutes les alternatives disponibles pour un outil particulier. Ensuite, dans cet article, Nous allons explorer certaines des alternatives largement utilisées à Google Colab.
Table des matières
1- Qu'est-ce que Google Colaboratory?
2- Alternatives à Google Colab
- Amazon SageMaker
- CoCalc
- Noyau de Kaggle
- Liant
3- Autres alternatives
1- Qu'est-ce que Google Colaboratory?
Collaboratif Google o Google Colab est un environnement Jupyter Notebook gratuit. C'est un service gratuit basé sur le cloud de Google, ce qui signifie que vous n'avez rien à payer. L'un des avantages de Colab est que vous n'avez rien à installer au préalable. En réalité, de nombreuses bibliothèques de science des données et d'apprentissage automatique, comme Prespirer, NumPy, Tensorflow, Dur, OpenCV ils sont pré-installés avec Colab.
Les blocs-notes que vous créez sont enregistrés sur votre Google Drive. Donc, Colab tire également parti des fonctionnalités de collaboration de Google Docs, où vous pouvez facilement partager votre ordinateur portable avec plusieurs personnes et tout le monde peut travailler sur le même ordinateur portable en même temps sans aucun problème.
Google propose également l'utilisation d'un GPU NVIDIA Tesla K80 gratuit. Si vous connectez Colab à Google Drive, tu monteras jusqu'à 15 Go d'espace disque pour stocker vos ensembles de données. Vous pouvez exécuter la session dans un carnet Colab interactif pour 12 Heures, ce qui est suffisant pour un débutant. Google a ses propres puces sur mesure appelées TPU.
Une autre chose à garder à l'esprit est que tEl conjunto de datos que carga en el cuaderno Colab se elimina una vez que finaliza la sessionLa "Session" C’est un concept clé dans le domaine de la psychologie et de la thérapie. Fait référence à une rencontre programmée entre un thérapeute et un client, où les pensées sont explorées, Émotions et comportements. La durée et la fréquence de ces séances peuvent varier, et son objectif principal est de faciliter la croissance personnelle et la résolution de problèmes. L’efficacité des séances dépend de la relation entre le thérapeute et le thérapeute...
Cependant, peut passer à la version Pro, qui soi-disant vous donne accès à des GPU plus rapides: GPU NVIDIA TESLA T4 ou P100, des temps d'exécution plus longs allant jusqu'à 24 heures et plus de RAM.
Vous pouvez en savoir plus sur Google Colab dans l'article suivant:
Alternatives à Google Colab
Dans la section suivante, nous discutons du 5 meilleures alternatives à google colab.
1. Amazon SageMaker
Amazon SageMaker Il s'agit également d'une plate-forme d'apprentissage automatique basée sur le cloud développée par Amazon en novembre. 2017. Blocs-notes Jupyter hébergés ne nécessitant aucune configuration. Mais ce n'est pas gratuit. Oui, doivent payer pour leurs services, bien que l'essai soit gratuit (pendant les deux premiers mois).
“SageMaker Studio est gratuit à utiliser, vous ne payez que pour les services AWS que vous utilisez dans Studio”.
Avantages:
- Avec des frameworks d'apprentissage en profondeur comme Tensorflow, scikit apprendre, PyTorch et XGBoost, qui sont fournis par Google Colab, SageMaker fournit également MXNet, Chainer et SparkML.
- Offre les fonctionnalités suivantes: Vérité au sol Amazon SageMaker, IA augmentée d'Amazon, Carnets Amazon SageMaker Studio, Prétraitement, Expériences Amazon SageMaker et plus.
Les inconvénients:
- Si vous entraînez votre modèle à l'aide quelque chose d'incorporé de SageMaker, vous ne pouvez pas l'implémenter en dehors de SageMaker. C'est aussi le cas pour l'AutoML de Google, bien que tous les modèles formés sur le moteur ML (y compris ceux qui utilisent le TensorFlow-hub modules) peut être déployé n'importe où.
- L'optimisation automatique des hyperparamètres fonctionne mieux dans Colab, en termes de résultats produits et de temps requis.
- Vous obtenez les nouvelles versions de Tensorflow de SageMaker des semaines après les avoir obtenues de Colab.
Voici la guider sur la façon d'utiliser SageMaker et ses fonctions.
2. CoCalc
CoCalc ou l'informatique collaborative est l'informatique en nuage basée sur le Web (SaaS) et plateforme de gestion pour les cours de mathématiques computationnelles. C'est un logiciel open source hébergé par SageMath Inc. Le créateur et développeur principal de CoCalc est William Stein, ancien professeur de mathématiques à l'Université de Washington. Avec le cahier Jupyter, prend en charge l'édition des feuilles de calcul Sage et Latex documents.
Avantages:
- Offre une collaboration en temps réel, ce qui signifie que vous pouvez partager votre bloc-notes avec d'autres et que tout le monde peut le modifier en même temps.
- Pour le forfait gratuit offert par CoCalc, les sessions se termineront après 30 minutes d'inactivité, bien qu'ils puissent durer jusqu'à 24 Heures, ce qui est deux fois le temps que Colab offre.
- Il dispose d'une fonction de journal d'historique qui enregistre toutes vos modifications sur l'ordinateur portable en détail et vous permet d'explorer ces modifications à l'aide d'un curseur intuitif..
- Langues proposées: Python, sauge, R, Octave et bien d'autres.
Les inconvénients:
- Le service n'est pas gratuit. Cependant, il y a un plan gratuit mais un Projet d'essai avec certaines restrictions, en particulier, votre projet s'exécute sur une qualité d'hébergement inférieure et vous n'avez pas accès à Internet pour télécharger des données à partir d'autres serveurs.
- Le GPU n'est pas disponible, ni dans le plan gratuit ni dans la version améliorée.
Vous pouvez commencer avec CoCalc à partir de ici.
3. Noyau de Kaggle
Kaggle est une plateforme populaire pour vos concours de science des données, cependant, ils offrent aussi Grain o Notebooks pour effectuer toutes les tâches d'apprentissage automatique et de science des données, quelles que soient les compétences. Kaggle Kernels est une plate-forme gratuite pour exécuter des blocs-notes Jupyter dans le navigateur. Colab et Kaggle sont tous deux des produits de Google et présentent de nombreuses similitudes.
Kaggle a mis à jour ses cœurs pour avoir plus de puissance de calcul et de mémoire. Base de données 20 FR, 5 Go d'espace disque, 9 heures de fonctionnement et 4 CPU avec 16 Go de RAM o, quand le GPU est allumé, il y a 2 Cœurs de processeur avec 13 Go de RAM.
Avantages:
- Kaggle fournit un accès gratuit aux GPU NVIDIA TESLA P100 sur les cœurs. Este punto de referencia muestra que habilitar una GPU en su Kernel da como resultado una aceleración de 12.5X durante el entraînementLa formation est un processus systématique conçu pour améliorer les compétences, connaissances ou aptitudes physiques. Il est appliqué dans divers domaines, Comme le sport, Éducation et développement professionnel. Un programme d’entraînement efficace comprend la planification des objectifs, Pratique régulière et évaluation des progrès. L’adaptation aux besoins individuels et la motivation sont des facteurs clés pour obtenir des résultats réussis et durables dans toutes les disciplines.... de un modelo de l'apprentissage en profondeurL'apprentissage en profondeur, Une sous-discipline de l’intelligence artificielle, s’appuie sur des réseaux de neurones artificiels pour analyser et traiter de grands volumes de données. Cette technique permet aux machines d’apprendre des motifs et d’effectuer des tâches complexes, comme la reconnaissance vocale et la vision par ordinateur. Sa capacité à s’améliorer continuellement au fur et à mesure que de nouvelles données lui sont fournies en fait un outil clé dans diverses industries, de la santé....
- Prend en charge deux des principaux langages dans le domaine de la science des données: Ry Python.
- La plupart des raccourcis clavier de Jupyter Notebook sont presque similaires dans Kaggle Kernels, rendre plus facile pour quelqu'un qui travaille chez Jupyter Notebooks de travailler chez Kaggle.
- Kaggle a une grande communauté à soutenir, apprendre et valider les compétences en science des données.
Les inconvénients:
- En général, Kaggle a un décalage en cours d'exécution et est plus lent que Colab.
- Kaggle limite généralement le temps d'exécution du noyau à 9 Heures, avec un temps d'attente après 1 temps d'inactivité.
- Un gros inconvénient des deux plates-formes est que les ordinateurs portables ne peuvent pas être téléchargés dans d'autres formats utiles.
4. Dossier
Liant est alimenté par BinderHub, qui est un outil open source qui implémente le service Binder dans le cloud. Binder vous permet de créer des environnements informatiques personnalisés qui peuvent être partagés et utilisés par de nombreux utilisateurs distants. Vous permet d'entrer l'URL de n'importe quel référentiel Git public et il l'ouvrira dans l'interface native de Jupyter Notebook. Vous pouvez exécuter n'importe quel bloc-notes dans le référentiel, bien que les modifications que vous apportez ne seront pas enregistrées dans le référentiel.
Cela peut être utile lorsque vous avez un référentiel complet de Jupyter Notebooks. Bien qu'il y ait une limite d'utilisateurs de 100 utilisateurs pour un référentiel (qu'est-ce qui suffit, je suppose).
Avantages:
- Langues prises en charge: Python, R et Julia.
- Puisqu'il s'agit d'un projet open source, est libre.
- Binder peut exécuter vos blocs-notes directement depuis GitHub.
Les inconvénients:
- La collaboration avec les autres n'est pas disponible.
- Les sessions se termineront après 20 minutes d'inactivité, bien qu'ils puissent durer 12 heures ou plus.
- Ne convient pas pour travailler avec de grands ensembles de données.
Autres alternatives
Certaines des autres alternatives que je n'ai pas mentionnées dans cet article peuvent être:
2- Ordinateurs portables IBM Dataplatform
3- Datalore
Regarde-les.
Remarques finales
Le but de cet article était seulement de donner une idée sur les alternatives possibles de Google Collaboratory, la décision finale vous appartient, celle que vous préférez en fonction de vos besoins. J'espère que vous explorerez toutes ces plateformes et identifierez les avantages et les inconvénients de votre métier..
Faites-moi également savoir quelle plate-forme vous préférez / utiliser et pourquoi.
En rapport
Articles Similaires:
- Conseils Google Colab | Trucs et astuces de Google Colab
- Utiliser Google Colab pour les modèles d'apprentissage en profondeur et d'apprentissage automatique
- 2 alternatives pour identifier les données erronées dans une entreprise
- Gestionnaire des tâches Mac OS et alternatives à la surveillance du système