Alternative a Google Colab | Alternative a Google Colab

Contenuti

Panoramica

  • Scopri cos'è Google Colab
  • Ottieni un elenco delle migliori alternative a Google Colab
  • Questo elenco non è affatto esaustivo.. Sentiti libero di aggiungere altro nei commenti qui sotto..

introduzione

Per chiunque abbia problemi di archiviazione o non sia in grado di permettersi un sistema che soddisfi i propri requisiti per il lavoro di data science, Google Colab è stata una benedizione.

feature_image-2-8594261

Lavorare con Colab mi ha aperto così tante strade che prima pensavo non fossero possibili. Non abbiamo più la restrizione della scarsa potenza di calcolo nelle nostre macchine. E le GPU gratuite sono a portata di mano.

Ma, come scienziati dei dati, è importante conoscere tutte le alternative disponibili per uno strumento particolare. Quindi, in questo articolo, Esploreremo alcune delle alternative ampiamente utilizzate a Google Colab.

Sommario

1- Che cos'è Google Colaboratory?

2- Alternative a Google Colab

  • Amazon SageMaker
  • CoCalc
  • Kernel de Kaggle
  • Raccoglitore

3- Altre alternative

1- Che cos'è Google Colaboratory?

Google Collaborativo o Google Colab è un ambiente Jupyter Notebook gratuito. È un servizio gratuito basato su cloud di Google, il che significa che non devi pagare nulla. Una delle cose migliori di Colab è che non è necessario installare nulla in anticipo. Infatti, molte delle librerie di data science e machine learning, come Prespirare, NumPy, Tensorflow, Duro, OpenCV vengono preinstallati con Colab.

I taccuini che crei vengono salvati sul tuo Google Drive. Perciò, Colab sfrutta anche le funzionalità di collaborazione di Google Docs, dove puoi condividere facilmente il tuo laptop con più persone e tutti possono lavorare sullo stesso laptop contemporaneamente senza alcun problema.

Google fornisce anche l'utilizzo di una GPU NVIDIA Tesla K80 gratuita. Se colleghi Colab a Google Drive, ti alzerai 15 GB di spazio su disco per archiviare i tuoi set di dati. Puoi eseguire la sessione in un Colab Notebook interattivo per 12 ore, quanto basta per un principiante?. Google ha i suoi chip personalizzati chiamati TPU.

Un'altra cosa da tenere a mente è che tIl set di dati caricato nel notebook Colab viene eliminato dopo il sessione.

tuttavia, può aggiornare alla versione Pro, che presumibilmente ti dà accesso a GPU più veloci: GPU NVIDIA TESLA T4 o P100, tempi di esecuzione più lunghi fino a 24 ore e più RAM.

Puoi leggere di più su Google Colab nel seguente articolo:

Alternative a Google Colab

Nella prossima sezione, discutiamo di 5 migliori alternative a google colab.

1. Amazon SageMaker

untitled-design-86-3710169

Amazon SageMaker È anche una piattaforma di machine learning basata su cloud sviluppata da Amazon a novembre 2017. Notebook Jupyter ospitati che non richiedono configurazione. Ma non è gratis. sì, devono pagare per i loro servizi, anche se la prova è gratuita (durante i primi due mesi).

“SageMaker Studio è gratuito, paghi solo per i servizi AWS che utilizzi in Studio”.

aws-e1605700472725-7578808

Professionisti:

  • Insieme a framework di deep learning come Tensorflow, scikit impara, PyTorch e XGBoost, che sono forniti da Google Colab, SageMaker fornisce anche MXNet, Chainer e SparkML.
  • Offre le seguenti caratteristiche: Amazon SageMaker Ground Truth, IA aumentata di Amazon, Taccuini Amazon SageMaker Studio, Pre-elaborazione, Esperimenti Amazon SageMaker e altro.

Contro:

  • Se alleni il tuo modello usando qualcosa di incorporato de SageMaker, non puoi implementarlo al di fuori di SageMaker. Questo è anche il caso di AutoML di Google, sebbene tutti i modelli siano stati addestrati sul motore ML (compresi quelli che usano il TensorFlow-hub moduli) può essere distribuito ovunque.
  • L'ottimizzazione automatica degli iperparametri funziona meglio in Colab, in termini di risultati prodotti e tempo richiesto.
  • Ottieni nuove versioni di Tensorflow da SageMaker settimane dopo averle ottenute da Colab.

Ecco il guida su come usare SageMaker e le sue funzioni.

2. CoCalc

280px-cocalc_logo-9913266

CoCalc o il computing collaborativo è il cloud computing basato sul web (SaaS) e piattaforma gestionale per corsi di matematica computazionale. È un software open source ospitato da SageMath Inc. Il creatore e sviluppatore principale di CoCalc è William Stein, ex professore di matematica all'Università di Washington. Insieme al taccuino Jupyter, supporta la modifica dei fogli di lavoro Sage e lattice documenti.

screenshot-da-2020-11-18-16-15-08-2660967

Professionisti:

  • Offre collaborazione in tempo reale, il che significa che puoi condividere il tuo taccuino con altri e tutti possono modificarlo contemporaneamente.
  • Per il piano gratuito offerto da CoCalc, le sessioni si chiuderanno dopo 30 minuti di inattività, anche se possono durare fino a 24 ore, che è il doppio del tempo che offre Colab.
  • Ha una funzione di registro della cronologia che registra tutte le modifiche apportate al laptop in modo molto dettagliato e ti consente di esplorare tali modifiche utilizzando un dispositivo di scorrimento intuitivo..
  • Lingue offerte: Pitone, saggio, R, Octave e molti altri.

Contro:

  • Il servizio non è gratuito. tuttavia, c'è un piano gratuito ma a Progetto di prova con alcune restrizioni, in particolare, il tuo progetto è in esecuzione su una qualità di hosting inferiore e non hai accesso a Internet per scaricare dati da altri server.
  • GPU non disponibile, né nel piano gratuito né nella versione aggiornata.

Puoi iniziare con CoCalc da qui.

3. Kernel di Kaggle

kaggle-logo-trasparente-300-8080898

Kaggle è una piattaforma popolare per i tuoi concorsi di data science, tuttavia, offrono anche Grano o Notebook per eseguire tutte le attività di Machine Learning e Data Science, indipendentemente dalle abilità. Kaggle Kernels è una piattaforma gratuita per l'esecuzione di notebook Jupyter nel browser. Sia Colab che Kaggle sono prodotti di Google e hanno molte somiglianze.

Kaggle ha aggiornato i suoi core per avere più potenza di calcolo e memoria. Set di dati 20 GB, 5 GB di spazio su disco, 9 ore di autonomia e 4 CPU con 16 GB di RAM spenti, quando la GPU è accesa, ci sono 2 Core della CPU con 13 GB di RAM.

screenshot-da-2020-11-18-16-10-09-8062786

Professionisti:

  • Kaggle fornisce l'accesso gratuito alle GPU NVIDIA TESLA P100 sui core. Questo benchmark mostra che l'abilitazione di una GPU nel kernel si traduce in un'accelerazione 12,5X durante il addestramento di un modello di apprendimento profondo.
  • Supporta due dei principali linguaggi nel campo della scienza dei dati: R e Python.
  • La maggior parte delle scorciatoie da tastiera di Jupyter Notebook sono quasi simili in Kaggle Kernels, rendere più facile per chi lavora in Jupyter Notebooks lavorare in Kaggle.
  • Kaggle ha una grande community da supportare, apprendere e convalidare le competenze di data science.

Contro:

  • Generalmente, Kaggle ha un ritardo durante la corsa ed è più lento di Colab.
  • Kaggle generalmente limita il runtime del kernel a 9 ore, con un tempo di attesa dopo 1 tempo di inattività.
  • Un grosso svantaggio di entrambe le piattaforme è che i laptop non possono essere scaricati in altri formati utili.

4. File

Raccoglitore è alimentato da BinderHub, che è uno strumento open source che implementa il servizio Binder nel cloud. Binder consente di creare ambienti di elaborazione personalizzati che possono essere condivisi e utilizzati da molti utenti remoti. Ti consente di inserire l'URL di qualsiasi repository Git pubblico e lo aprirà all'interno dell'interfaccia nativa di Jupyter Notebook. Puoi eseguire qualsiasi notebook nel repository, anche se le modifiche apportate non verranno salvate nel repository.

Può essere utile quando hai un repository completo di Jupyter Notebooks. Sebbene ci sia un limite utente di 100 utenti per un repository (quanto basta?, Credo).

screenshot-da-2020-11-18-16-12-19-3962041

Professionisti:

  • Lingue supportate: Pitone, R e Giulia.
  • Dal momento che è un progetto open source, è libero.
  • Binder può eseguire i tuoi taccuini direttamente da GitHub.

Contro:

  • La collaborazione con altri non è disponibile.
  • Le sessioni si chiuderanno dopo 20 minuti di inattività, anche se possono durare 12 ore o più.
  • Non adatto per lavorare con grandi set di dati.

Altre alternative

Alcune delle altre alternative che non ho menzionato in questo articolo potrebbero essere:

1- Saturno nuvola

2- Portatili IBM Dataplatform

3- Datalore

Guardali.

Note finali

Lo scopo di questo articolo era solo quello di dare un'idea sulle possibili alternative di Google Collaboratory, la decisione finale spetta a te quale preferire in base alle tue esigenze. Spero che tu esplori tutte queste piattaforme e identifichi i pro e i contro del tuo lavoro..

Fammi anche sapere quale piattaforma preferisci / uso e perché?.

Iscriviti alla nostra Newsletter

Non ti invieremo posta SPAM. Lo odiamo quanto te.