As 28 Melhores Cheat Sheets para Machine Learning, Ciência de Dados & Big Data

Conteúdo

Visão geral

  • A ciência de dados está em constante evolução com novas ferramentas, Frameworks & Tecnologias.
  • Cada ferramenta / O técnico tem seu próprio caso de uso exclusivo, juntamente com recursos e funções
  • Confira esta lista exaustiva de cheat sheets sobre conceitos populares de ciência de dados.

Introdução

A ciência de dados é um campo em constante crescimento, Existem inúmeras ferramentas e técnicas para lembrar. Não é possível que ninguém se lembre de todos os recursos, Operações e fórmulas de cada conceito. É por isso que temos cheat sheets. Mas há uma infinidade de cheat sheets disponíveis, Escolher o cheat sheet certo é uma tarefa difícil. Então, Decidi escrever este artigo.

Aqui eu selecionei as folhas de cheat com os seguintes critérios: Exaustividade, Clareza e conteúdo.

Depois de aplicar estes filtros, Eu compilei alguns 28 Folhas de trapaças de aprendizado de máquina, ciência de dados, probabilidade, SQL e Big Data. Para sua conveniência, Separei as folhas de cheat separadamente para cada um dos tópicos acima. Há cheat sheets em ferramentas e técnicas, Várias bibliotecas e idiomas.

Continue lendo para descobrir qual cheat sheet usar para um tema específico.

Python para Cheat Sheets de Ciência de Dados

1.Guia rápido para aprender Python para ciência de dados Píton3-300x300-6625041

Se você está apenas começando a aprender Python, Este cheat sheet é o melhor recurso para você. Neste cheat sheet, você encontrará um guia passo-a-passo para aprender Python. Ofereça recursos a seguir, Bibliotecas Python que você deve conhecer e algumas dicas úteis.

2. Folha de cheat Python para ciência de dados Píton2-300x98-5338230

Este cheat sheet do Datacamp cobre todos os conceitos básicos de Python necessários para a ciência de dados. Se você está apenas começando a trabalhar em Python, Guarde isso para consulta rápida. Salve esses códigos de interceptação para variáveis e funções de tipo de dados, Operação em Cadeia, Conversão de Tipo, Listas e operações do NumPy comumente usadas. O aspecto único desta folha de cheat é que ela lista bibliotecas Python importantes e fornece códigos de trapaça para selecionar e importar essas bibliotecas.

3. Python para Ciência de Dados Cheat Sheet NumPy numpy_project_page-300x169-4019693

NumPy é uma biblioteca central para computação científica em Python. Neste cheat sheet do DataCamp, você encontrará códigos de trapaça para criar matrizes NumPy, Realizar operações matemáticas em matrizes, subconjuntos, Segmentações, Indexação e manipulação de arrays. O aspecto único desta folha de cheat é que cada recurso foi categorizado e explicado em inglês simples.

4. Análise exploratória de dados em Python exploração de dados-300x226-7967592

Seu melhor recurso para executar a exploração de dados em Python usando NumPy, Pandas e Matplotlib. Com este cheat sheet, saiba como fazer upload de arquivos em Python, Converter variáveis, Classificar dados, Criar gráficos, Criar conjuntos de dados de exemplo, Lidando com valores perdidos e muito mais. É um dos cheat sheets simplificados na exploração de dados.

5. Exploração de dados usando Pandas em Python pandas_logo-300x61-5148637

Pandas é uma das importantes bibliotecas Python. Este cheat sheet sobre a operação de exploração de dados em Python usando Pandas é o seu recurso para conhecer cada etapa envolvida na exploração de dados. Você encontrará códigos de trapaça para ler e gravar dados, Visualizar quadros de dados, Renomear colunas no quadro de dados, Adicionando os dados, etc.

6. Visualização de dados em Python visualizações de dados-usando-python-1-638-300x225-8865563

Se você é um cientista de dados ou um não-técnico, Ambos interpretam facilmente a visualização. Em gráficos e diagramas visuais, Os dados ganham vida e falam por si. Neste cheat sheet, saiba como executar a visualização de dados em Python. Explore as diferentes maneiras de plotar seus dados. Encontre uma abordagem passo a passo para plotar histogramas, gráficos de barras, gráficos de linha, gráficos de dispersão, etc.

7. Python para Ciência de Dados Cheat Sheet Bokeh bokeh-300x200-4345729

Este cheat sheet em Bokeh, uma biblioteca de visualização interativa em Python, É especialmente útil com grandes conjuntos de dados. Neste cheat sheet do DataCamp, Você terá os passos básicos para plotar, Renderizar & Personalizar visualmente, Salvar gráficos e criar gráficos estatísticos.

8. Cábula: Scikit Aprenda scikit-aprender-logo-300x107-8859310

Aqui está uma folha de cheat no scikit-learn para cada técnica em Python. Fornece diferentes funções usadas para pré-processamento, regressão, classificação, agrupamento, redução de dimensionalidade, Seleção de modelos e métricas, juntamente com sua descrição. O aspecto único desta folha de cheat é que ela descreve os estágios completos do aprendizado de máquina.

9. Etapas para executar a limpeza de dados de texto em Python mineração de texto-300x218-4348560

A limpeza de texto pode ser um processo complicado. E conhecer os procedimentos certos é a chave para obter o resultado desejado. Confira este cheat sheet para executar a limpeza de dados de texto em Python passo-a-passo. Siga esta folha de cheat para saber quando você remove palavras de parada, Pontuação, Expressões, etc. O aspecto único desta folha de cheat é que cada etapa foi explicada com códigos e exemplos.

R para Cheat Sheets de Ciência de Dados

1.Cartão de Referência R RLOGO-300x263-1886869

Use esta folha de cheat para códigos de trapaça para todas as funções e operadores em R. Entenda o que significam os diferentes termos em R. Explica todas as funções na criação de dados, processamento de dados, Manipulação de dados, Função de modelo, seleção e muito mais.

2. Importando dados para o R data-importação-3748391

Saiba como importar dados com o readr, Tibble e Tidyr. Encontre funções para escrever e ler funções no tibble. Ele também fornece argumentos úteis, Remodelando dados, Combinando células com Tidyr.

3. Transformação de dados com dplyr datatranfo-300x97-2563966

Este cheat sheet RStudio é um material de referência para transformação de dados com dplyr. Obtenha shortcodes e operadores para todas as operações em transformação de dados. Mais tarde, estar resumindo os casos, Agrupamento de Casos, manipular, Vetorizar e combinar variáveis.

4. Cábula: 11 Etapas para exploração de dados em R (com códigos) Datavisualizationwithr-300x169-4929053

Este cheat sheet fornece um guia passo-a-passo para a exploração de dados em R. Saiba como carregar arquivos no R, Converter variáveis em diferentes tipos de dados, Transpor um conjunto de dados, Classificar quadros de dados, Crie gráficos e muito mais.

5. Visualização de dados em R visualização de dados em-r-14-638-300x169-5180706

Acima vimos um cheat sheet sobre visualização de dados em Python. Aqui está uma folha de verificação de visualização de dados para fornecer os diferentes gráficos pelos quais você pode plotar os dados. Com algumas linhas de código, Você pode criar belos gráficos e histórias de dados. O R tem bibliotecas incríveis para criar visualizações básicas e mais evoluídas, como gráfico de barras, histograma, Diagrama de dispersão, Visualização de Mapa, diagrama de mosaico e vários outros.

6. Visualização de dados com ggplot2 ggplot2-300x144-8109682

Este cheat sheet é especificamente para criar uma visualização R usando ggplot2. ggplot2 trabalha com a gramática de gráficos e é baseado em um conjunto de marcações visuais que representam pontos de dados. Obter códigos de trapaça para criar uma variável e dois componentes gráficos variáveis. Juntamente com diferentes técnicas para a criação de parcelas em R.

7. Cábula: Pacote Caret caret_r-300x226-7810308

O pacote Caret fornece um conjunto de recursos que simplifica o processo de criação de modelos preditivos. Cheat sheet inclui recursos para divisão de dados, Pré-processamento, Seleção de recursos, Ajuste e visualização de modelos.

8. Cartão de referência R para mineração de dados Captura2-6253435

Esta folha de cheat fornece funções para mineração de texto, Detecção de outlier, agrupamento, classificação, Análise de Redes Sociais, big data, computação paralela usando R. Esta folha de cheat dá-lhe todas as funções e operadores usados para mineração de dados em R.

9. Guia para aprender rapidamente computação em nuvem na programação R computação em nuvem-1484538_960_720-300x169-8066596

A computação em nuvem facilitou o acesso aos nossos arquivos e dados de qualquer lugar. Neste cheat sheet, saiba como usar a computação em nuvem no R. Siga este guia passo a passo para usar a programação R na AWS.

Folhas de trapaças de aprendizado de máquina

1.Cábula: Códigos Python e R para algoritmos comuns de aprendizado de máquinaML-300X93-7003108

Neste cheat sheet, você receberá códigos em Python & R para vários algoritmos de aprendizado de máquina comumente usados. Os algoritmos incluídos são regressão linear, Regressão logística, árvore de decisão, SVM, Baías ingénuas, KNN, K-means, Random Forest e alguns outros.

2. Scikit Aprenda Algoritmo Cheat Sheet drop_shadows_background-300x167-4236242

Este cheat sheet é fornecido pelos criadores oficiais do scikit-learn. Muitas pessoas se deparam com o problema de escolher um algoritmo de aprendizado de máquina específico para diferentes tipos de dados e problemas. Com a ajuda deste cheat sheet, Você tem o fluxo completo para resolver um problema de aprendizado de máquina.

3. Aprendizado de Máquina do Microsoft Azure: Algoritmos Cheat Sheet azure-300x69-4953287

Esta folha de cheat ajuda você a escolher o melhor algoritmo do Estúdio de Aprendizado de Máquina do Azure para sua solução de análise preditiva. Desenvolvido pela própria equipe do Microsoft Azure, A folha de cheat fornece um caminho claro com base na natureza dos dados.

Folhas de Probabilidade Cheat

1. Folha de Fraude Básica de Probabilidade PROB21-300X225-9994674

Este cheat sheet fornece material de referência abrangente sobre probabilidade e estatística. Cada conceito foi lindamente explicado com uma explicação esquemática. Abrange tudo, desde regras básicas de probabilidade até conceitos estatísticos avançados de uma forma muito precisa e exata. Desenvolvido pela Universidade da Pensilvânia, É um dos cheat sheets mais abrangentes que você pode colocar as mãos.

2. Folha de Probabilidade para Distribuição PROB31-300X198-6407768

Confira este cheat sheet para uma rápida visão geral da distribuição de Poisson, distribuição normal, Distribuição binomial, distribuição geométrica e muito mais. Fornece notação, fórmulas e uma breve explicação em inglês simples para cada distribuição.

Folhas de cheat SQL e MySQL

1. Folha de cheat do SQL sql_database_shortcut_icon-5319555

Neste cheat sheet, saiba como executar operações básicas no SQL. Obtenha o recurso Inserir Dados, atualizar dados, Limpar dados, Dados do grupo, Classificar dados, etc. Se você começou a usar o SQL, Este é o melhor guia de referência.

2. Folha de cheat do MySQL e SQL mysql-svg_-300x155-9398392

Neste cheat sheet, você encontrará os comandos MySQL e SQL comumente usados. Obter códigos de trapaça para a função matemática MySQL, a função de cadeia de caracteres do MySQL, os comandos básicos do MySQL. Você também encontrará comandos SQL para modificar e consultar.

Planilhas de trapaças de Big Data

1. Folha de cheat do Hadoop 2000px-hadoop_logo-svg_-300x78-9277000

Diz-se, com razão, que o Hadoop tem um vasto ecossistema e inclui várias operações. Conheça os diferentes operadores, como funcionam e por qual operação são responsáveis. O cheat sheet foi dividido em uma respectiva função geral, como sistemas distribuídos, processamento de dados, entrada / Gerenciamento de Saída de Dados &.

2. Folha de cheat do Apache Spark faísca-logo-marca registrada-300x160-8431579

Aqui está uma folha de cheat para o Apache Spark para várias operações, como transformação, Ações, Métodos de persistência, Transformação e Ações Adicionais, RDD estendido, Transformação da Transmissão, Persistência RDD, etc.

3. Folha de cheat da função do Hive HIVE-300X99-8241932

Neste cheat sheet, obter comandos para funções do Hive. Fornece códigos de interceptação para funções de dados, Função Matemática, Função Cadeia, Função de coleta, Built-in Função adicionada, Função de geração de tabela integrada, Função condicional e funções para análise de texto.

Notas finais

Eu espero que você tenha gostado de ler este artigo. Se eu perdi algum cheat sheets que eu acho que deveria ser incluído na lista. Em seguida, poste-os na seção de comentários. O outro leitor e eu gostaríamos de saber sobre eles.

Se você tem alguma sugestão / comentário, Não se esqueça de compartilhá-lo inserindo seus comentários. Diga-nos o que mais cheat sheets você gostaria que publicássemos.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.