Visão geral
- Entenda o que é Google Colab
- Obtenha uma lista das principais alternativas ao Google Colab
- Esta lista não é exaustiva.. Sinta-se à vontade para adicionar mais nos comentários abaixo..
Introdução
Para quem tem problemas de armazenamento ou não pode pagar um sistema que atenda aos seus requisitos para o trabalho de ciência de dados, Google Colab tem sido uma bênção.
Trabalhar com Colab abriu tantos caminhos para mim que antes eu pensava que não seriam possíveis. Não temos mais a restrição de baixo poder computacional em nossas máquinas. E as GPUs gratuitas estão ao seu alcance.
Mas, como cientistas de dados, é importante conhecer todas as alternativas disponíveis para uma determinada ferramenta. Então, neste artigo, Exploraremos algumas das alternativas amplamente utilizadas para o Google Colab.
Tabela de conteúdo
1- O que é o Google Colaboratory??
2- Alternativas ao Google Colab
- Amazon SageMaker
- CoCalc
- Kernel de Kaggle
- Encadernador
3- Outras alternativas
1- O que é o Google Colaboratory??
Google Collaborative o Google Colab é um ambiente Jupyter Notebook gratuito. É um serviço gratuito baseado em nuvem do Google, o que significa que você não tem que pagar nada. Uma das melhores coisas sobre o Colab é que você não precisa instalar nada com antecedência. De fato, muitas das bibliotecas de ciência de dados e aprendizado de máquina, como Prespirar, NumPy, Tensorflow, Duro, OpenCV eles vêm pré-instalados com Colab.
Os blocos de anotações que você cria são salvos no Google Drive. Portanto, O Colab também aproveita os recursos de colaboração do Google Docs, onde você pode compartilhar seu laptop com várias pessoas facilmente e todos podem trabalhar no mesmo laptop ao mesmo tempo sem nenhum problema.
O Google também oferece o uso de uma GPU NVIDIA Tesla K80 gratuita. Se você conectar o Colab ao Google Drive, você vai se levantar para 15 GB de espaço em disco para armazenar seus conjuntos de dados. Você pode executar a sessão em um Notebook Colab interativo para 12 horas, o que é suficiente para um iniciante. O Google tem seus próprios chips personalizados, chamados TPU.
Mais uma coisa a ter em mente é que tO conjunto de dados que você carrega no bloco de anotações do Colab é excluído após o sessãoo "Sessão" É um conceito-chave no campo da psicologia e da terapia. Refere-se a uma reunião agendada entre um terapeuta e um cliente, onde os pensamentos são explorados, Emoções e comportamentos. Essas sessões podem variar em duração e frequência, e seu principal objetivo é facilitar o crescimento pessoal e a resolução de problemas. A eficácia das sessões depende da relação entre o terapeuta e o terapeuta...
Porém, pode atualizar para a versão Pro, que supostamente dá acesso a GPUs mais rápidas: GPU NVIDIA TESLA T4 ou P100, tempos de execução mais longos de até 24 horas e mais RAM.
Você pode ler mais sobre o Google Colab no seguinte artigo:
Alternativas ao Google Colab
Na próxima seção, nós discutimos o 5 melhores alternativas para colab do google.
1. Amazon SageMaker
Amazon SageMaker É também uma plataforma de aprendizado de máquina baseada em nuvem desenvolvida pela Amazon em novembro 2017. Notebooks Jupyter hospedados que não requerem configuração. Mas não é de graça. sim, deve pagar por seus serviços, embora o teste seja gratuito (durante os primeiros dois meses).
“SageMaker Studio é grátis para usar, você só paga pelos serviços da AWS que usa no Studio”.
Prós:
- Junto com frameworks de aprendizado profundo, como Tensorflow, scikit aprender, PyTorch e XGBoost, que são fornecidos pelo Google Colab, SageMaker também fornece MXNet, Chainer y SparkML.
- Oferece os seguintes recursos: Amazon SageMaker Ground Truth, IA aumentada de Amazon, Notebooks Amazon SageMaker Studio, Pré-processando, Experimentos do Amazon SageMaker e muito mais.
Contras:
- Se você treinar seu modelo usando algo incorporado de SageMaker, você não pode implementá-lo fora do SageMaker. Este também é o caso do AutoML do Google, embora todos os modelos tenham sido treinados no motor ML (incluindo aqueles que usam o TensorFlow-hub módulos) pode ser implantado em qualquer lugar.
- A otimização automática de hiperparâmetros funciona melhor no Colab, em termos de resultados produzidos e tempo necessário.
- Você obtém novas versões do Tensorflow do SageMaker semanas depois de obtê-las do Colab.
Aqui esta ele guia sobre como usar o SageMaker e suas funções.
2. CoCalc
CoCalc ou computação colaborativa é a computação em nuvem baseada na web (SaaS) e plataforma de gestão para cursos de matemática computacional. É um software de código aberto hospedado por SageMath Inc. O criador e desenvolvedor líder do CoCalc é William Stein, ex-professor de matemática da Universidade de Washington. Junto com o caderno Jupyter, suporta a edição de planilhas Sage e Látex documentos.
Prós:
- Oferece colaboração em tempo real, o que significa que você pode compartilhar seu bloco de notas com outras pessoas e todos podem editá-lo ao mesmo tempo.
- Para o plano gratuito oferecido pelo CoCalc, as sessões vão fechar depois 30 minutos de inatividade, embora possam durar até 24 horas, que é o dobro do tempo que o Colab oferece.
- Possui um recurso de registro de histórico que registra todas as suas alterações no laptop em grande detalhe e permite que você explore essas alterações usando um controle deslizante intuitivo..
- Idiomas oferecidos: Pitão, sábio, R, Octave e muitos mais.
Contras:
- O serviço não é gratuito. Porém, existe um plano gratuito, mas um Projeto de teste com certas restrições, em particular, seu projeto está rodando em uma qualidade de hospedagem inferior e você não tem acesso à internet para baixar dados de outros servidores.
- GPU não está disponível, nem no plano gratuito nem na versão atualizada.
Você pode começar com CoCalc de aqui.
3. Kaggle Kernel
Kaggle é uma plataforma popular para seus concursos de ciência de dados, porém, eles também oferecem Grão o Notebooks para realizar todas as tarefas de aprendizado de máquina e ciência de dados, independentemente das habilidades. Kaggle Kernels é uma plataforma gratuita para executar notebooks Jupyter no navegador. Colab e Kaggle são produtos do Google e têm muitas semelhanças.
Kaggle atualizou seus núcleos para ter mais poder de computação e memória. Conjunto de dados 20 GB, 5 GB de espaço em disco, 9 horas de execução e 4 CPU com 16 GB de RAM o, quando a GPU está ligada, existem 2 Núcleos de CPU com 13 GB de RAM.
Prós:
- Kaggle fornece acesso gratuito a GPUs NVIDIA TESLA P100 nos núcleos. Este benchmark mostra que habilitar uma GPU em seu Kernel resulta em aceleração de 12,5X durante o TreinamentoO treinamento é um processo sistemático projetado para melhorar as habilidades, Conhecimento ou habilidades físicas. É aplicado em várias áreas, como esporte, Educação e desenvolvimento profissional. Um programa de treinamento eficaz inclui planejamento de metas, prática regular e avaliação do progresso. A adaptação às necessidades individuais e a motivação são fatores-chave para alcançar resultados bem-sucedidos e sustentáveis em qualquer disciplina.... de um modelo de aprendizado profundoAqui está o caminho de aprendizado para dominar o aprendizado profundo em, Uma subdisciplina da inteligência artificial, depende de redes neurais artificiais para analisar e processar grandes volumes de dados. Essa técnica permite que as máquinas aprendam padrões e executem tarefas complexas, como reconhecimento de fala e visão computacional. Sua capacidade de melhorar continuamente à medida que mais dados são fornecidos a ele o torna uma ferramenta fundamental em vários setores, da saúde....
- Suporta duas das principais linguagens no campo da ciência de dados: R y Python.
- A maioria dos atalhos de teclado do Jupyter Notebook são quase semelhantes no Kaggle Kernels, tornando mais fácil para alguém que trabalha na Jupyter Notebooks trabalhar na Kaggle.
- Kaggle tem uma ótima comunidade para apoiar, aprender e validar habilidades de ciência de dados.
Contras:
- Em geral, Kaggle tem um atraso durante a execução e é mais lento que Colab.
- O Kaggle geralmente limita o tempo de execução do kernel para 9 horas, com um tempo de espera depois 1 tempo de inatividade.
- Uma grande desvantagem de ambas as plataformas é que os laptops não podem ser baixados em outros formatos úteis.
4. Arquivo
Encadernador é alimentado por BinderHub, que é uma ferramenta de código aberto que implementa o serviço Binder na nuvem. O Binder permite que você crie ambientes de computação personalizados que podem ser compartilhados e usados por muitos usuários remotos. Permite que você insira o URL de qualquer repositório Git público e ele irá abri-lo na interface nativa do Jupyter Notebook. Você pode executar qualquer bloco de notas no repositório, embora as mudanças que você fizer não serão salvas no repositório.
Pode ser útil quando você tem um repositório completo de Jupyter Notebooks. Embora haja um limite de usuário de 100 usuários para um repositório (o que é suficiente, Eu suponho).
Prós:
- Idiomas suportados: Pitão, R e Julia.
- Por ser um projeto de código aberto, é grátis.
- O Binder pode executar seus notebooks diretamente do GitHub.
Contras:
- A colaboração com outras pessoas não está disponível.
- As sessões serão encerradas após 20 minutos de inatividade, embora possam durar 12 horas ou mais.
- Não é adequado para trabalhar com grandes conjuntos de dados.
Outras alternativas
Algumas das outras alternativas que não mencionei neste artigo podem ser:
3- Datalore
Olhe para eles.
Notas finais
O objetivo deste artigo foi apenas dar uma ideia sobre as possíveis alternativas do Google Collaboratory, a decisão final é com você qual você prefere com base na sua necessidade. Espero que você explore todas essas plataformas e identifique os prós e os contras de sua linha de trabalho..
Também me diga qual plataforma você prefere / usar e porque.