Os melhores pacotes R | 10 r pacotes que todo cientista de dados deveria conhecer

Conteúdo

Introdução

R é uma das linguagens de programação mais famosas para análise estatística e computação.. Porque ele oferece muitos recursos, pesquisadores e cientistas de dados o usam para ciência de dados e aprendizado de máquina. Alguns desses recursos incluem bibliotecas de visualização interativa, rápido e de código aberto, execução de código sem compilador, boa comunidade e muito mais.

Uma das principais razões pelas quais está se tornando muito famoso é o grande número de pacotes R para projetos de ciência de dados., aprendizado de máquina e inteligência artificial. Ao usar esses pacotes, modelos preditivos podem ser desenvolvidos de forma fácil e eficiente. Este blog lista os 10 Principais pacotes R que você deve conhecer 2021 para ciência de dados e aprendizado de máquina.

54263intro-4-6126338

Tabela de conteúdo

  1. Dplyr
  2. ggplot2
  3. KernLab
  4. explorador de dados
  5. Acento circunflexo
  6. randomForest
  7. Brilhante
  8. aumentar
  9. Completamente
  10. SuperML
82897intro-2-4527417

Dplyr

É um dos pacotes R mais usados ​​para tarefas de ciência de dados e aprendizado de máquina.. Este pacote é escrito por Hadley Wickham. É usado para resolver tarefas de manipulação de dados. Possui um conjunto de funções para manipulação de dados. Também chamada de gramática de manipulação de dados. Possui um conjunto de verbos que nos ajudam a resolver as tarefas de manipulação de dados mais desafiadoras, como mutate (), selecionar (), filtro (), resumir (), organizar ().

Para instalar este pacote, use o seguinte código:

install.packages('dplyr')
95101dplyr-1-5866941
38409dplyr-2-9677062

Para maiores informações, veja o link abaixo: Introdução ao dplyr

ggplot2

Um dos pacotes R mais populares e amplamente usados ​​para visualização de dados e análise exploratória de dados. Você pode criar visualizações de dados interativas com este pacote. Fornece uma ampla gama de belos enredos que cuidam de detalhes minuciosos e desenham legendas. Este pacote funciona sob uma gramática profunda chamada “Gramática de gráficos”. Fornece uma ampla variedade de gráficos, como gráficos de dispersão e gráficos de bolhas. Os diagramas de flutuação são gráficos, histogramas, parcelas de densidade, plotagens de caixa, diagramas de violino, dendrogramas e muito mais.

Para instalar este pacote, use o seguinte código:

install.packages('gglpot2')

Abaixo estão alguns exemplos de plotagens usando este pacote:

30782ggplot-1-4387283
62550ggplot-2-4614047

Para maiores informações, veja o link abaixo: ggplot2

KernLab

Este pacote também é chamado de laboratório de aprendizado de máquina baseado em kernel. Este pacote é usado para regressão, classificação, redução de dimensionalidade, detecção de anomalia, agrupamento. Se você quiser usar algoritmos que envolvem uma abordagem baseada em kernel, você pode usá-lo como SVM, algoritmo de classificação, análise de recursos do kernel e muito mais. É amplamente utilizado para implementações SVM. Possui uma ampla gama de funções do kernel, como para a função de kernel polinomial, podemos usar polydot (), a função de kernel tangente hiperbólica para tanhdot (), etc.

Para instalar este pacote, use o seguinte código:

install.packages('kernlab')
o 10 melhores pacotes R SVM

Para maiores informações, veja o link abaixo: pacote kernellab

explorador de dados

Este pacote R é um dos mais fáceis de usar para ciência de dados e aprendizado de máquina. Este pacote concentra-se principalmente em três objetivos:

  1. Análise exploratória de dados
  2. Engenharia de funções
  3. relatório de dados

Este pacote automatizou a análise exploratória de dados para modelagem preditiva e tarefas de análise visualizando cada recurso presente em nosso conjunto de dados.

Para instalar este pacote, use o seguinte código:

install.packages('Data Explorer')

Para encontrar uma visão geral ampla do nosso conjunto de dados, podemos usar o seguinte código:

introduzir(dados)
85069from-1-3062253

Para exibir a tabela anterior, use o seguinte código:

plot_intro(dados)
80889de-2-9592146

Para maiores informações, veja o link abaixo: Introdução ao DataExplorer

Acento circunflexo

Isso também é chamado Treinamento de clasificación y regresión. É um dos melhores pacotes para tarefas de ciência de dados e aprendizado de máquina. Contém um conjunto de funções usadas para criar modelos preditivos. Tem outras funcionalidades, bem como a seleção de recursos, divisão de dados, pré-processamento de dados, ajuste do modelo, importância dos recursos e muito mais.

Para instalar este pacote, use o seguinte código:

install.packages('caret')
55236acento circunflexo-7845711

Para maiores informações, veja o link abaixo: acento circunflexo do pacote

randomForest

Random Forest é um dos pacotes R mais populares para aprendizado de máquina.. Este pacote é usado para criar florestas aleatórias em R. Pode ser usado para tarefas de classificação e regressão. Também podemos usá-lo para treinar valores ausentes e outliers. Este pacote usa o algoritmo de floresta aleatória Breiman para construir árvores de decisão..

Para encontrar uma visão geral ampla do nosso conjunto de dados, podemos usar o seguinte código:

install.packages('randomForest')
67970rf-8684404

Para maiores informações, veja o link abaixo: Floresta aleatória

Brilhante

87499brilhante-2985063

É um pacote R usado para criar uma aplicação web interativa para ciência de dados. Ele nos ajuda a criar aplicativos web R sem muito esforço. Shiny cria aplicativos da Web que são implantados na Web usando seu servidor ou serviços de hospedagem R brilhantes. Os recursos do Shiny R incluem a criação de um aplicativo com menos conhecimento de ferramentas da web, fornece visualizações ao vivo, funções de renderização e muito mais.

Exemplo de aplicação web com shiny:

51991sh-1-2349198
67102sh-2-9225181

Para maiores informações, veja o link abaixo: Brilhante

aumentar

Este paquete se utiliza en ciencia de datos para paquetes de impulso basados ​​en modelos y tiene un algoritmo funcional de descenso de gradiente para optimizar los árboles de decisión. También proporciona un modelo de interacción para datos potencialmente de alta dimensão.

Para instalar este pacote, use o seguinte código:

install.packages('impulsionar')
84361impulso-2843191
90326boost-1-9651129

Para maiores informações, veja o link abaixo: aumentar

Completamente

É uma biblioteca de gráficos que cria gráficos interativos. É uma interface de alto nível para plotly.js, baseado em d3.js. Fornece uma interface de usuário fácil de usar para gerar gráficos D3 interativos elegantes. Esses gráficos interativos fornecem muitas funcionalidades, como a capacidade de aumentar e diminuir o zoom de gráficos, passe o mouse sobre um ponto para obter informações adicionais, filtrar dados e muito mais.

56890plotly-7978258

Fornece um exemplo de gráficos, como gráficos de dispersão, diagramas de linha, gráficos de barra, carrinhos circulares, diagramas de bolhas, plotagens de caixa, histogramas, Barras de erro, diagramas de violino e muito mais.

67890plotly-1-2275707

Para maiores informações, veja o link abaixo: Completamente

SuperML

Superml é um dos famosos pacotes R para IA que fornece uma interface padrão para clientes que usam dialetos de programação Python e R para construir modelos de IA.. Este pacote essencialmente fornece os destaques do Scikit Learn e a interface de previsão para preparar modelos de IA em R. Além de construir modelos de IA, existem funcionalidades convenientes para executar a engenharia de funções.

Para instalar este pacote, use o seguinte código:

install.packages('superml')

Para maiores informações, veja o link abaixo: SuperML

Obrigado por ler este artigo e por sua paciência.. Deixe-me na seção de comentários sobre comentários. Compartilhe este artigo, isso me motivará a escrever mais blogs para a comunidade de ciência de dados.

Obrigado por ler isso. se você gosta deste item, Compartilhe com seus amigos. Em caso de alguma sugestão / dúvida, Comente abaixo.
Identificação de e-mail: [e-mail protegido]
Me siga no LinkedIn: LinkedIn

A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.

Assine a nossa newsletter

Nós não enviaremos SPAM para você. Nós odiamos isso tanto quanto você.