Introdução
R é uma das linguagens de programação mais famosas para análise estatística e computação.. Porque ele oferece muitos recursos, pesquisadores e cientistas de dados o usam para ciência de dados e aprendizado de máquina. Alguns desses recursos incluem bibliotecas de visualização interativa, rápido e de código aberto, execução de código sem compilador, boa comunidade e muito mais.
Uma das principais razões pelas quais está se tornando muito famoso é o grande número de pacotes R para projetos de ciência de dados., aprendizado de máquina e inteligência artificial. Ao usar esses pacotes, modelos preditivos podem ser desenvolvidos de forma fácil e eficiente. Este blog lista os 10 Principais pacotes R que você deve conhecer 2021 para ciência de dados e aprendizado de máquina.
Tabela de conteúdo
- Dplyr
- ggplot2
- KernLab
- explorador de dados
- Acento circunflexo
- randomForest
- Brilhante
- aumentar
- Completamente
- SuperML
Dplyr
É um dos pacotes R mais usados para tarefas de ciência de dados e aprendizado de máquina.. Este pacote é escrito por Hadley Wickham. É usado para resolver tarefas de manipulação de dados. Possui um conjunto de funções para manipulação de dados. Também chamada de gramática de manipulação de dados. Possui um conjunto de verbos que nos ajudam a resolver as tarefas de manipulação de dados mais desafiadoras, como mutate (), selecionar (), filtro (), resumir (), organizar ().
Para instalar este pacote, use o seguinte código:
install.packages('dplyr')
Para maiores informações, veja o link abaixo: Introdução ao dplyr
ggplot2
Um dos pacotes R mais populares e amplamente usados para visualização de dados e análise exploratória de dados. Você pode criar visualizações de dados interativas com este pacote. Fornece uma ampla gama de belos enredos que cuidam de detalhes minuciosos e desenham legendas. Este pacote funciona sob uma gramática profunda chamada “Gramática de gráficos”. Fornece uma ampla variedade de gráficos, como gráficos de dispersão e gráficos de bolhas. Os diagramas de flutuação são gráficos, histogramas, parcelas de densidade, plotagens de caixa, diagramas de violino, dendrogramas e muito mais.
Para instalar este pacote, use o seguinte código:
install.packages('gglpot2')
Abaixo estão alguns exemplos de plotagens usando este pacote:
Para maiores informações, veja o link abaixo: ggplot2
KernLab
Este pacote também é chamado de laboratório de aprendizado de máquina baseado em kernel. Este pacote é usado para regressão, classificação, redução de dimensionalidade, detecção de anomalia, agrupamento. Se você quiser usar algoritmos que envolvem uma abordagem baseada em kernel, você pode usá-lo como SVM, algoritmo de classificação, análise de recursos do kernel e muito mais. É amplamente utilizado para implementações SVM. Possui uma ampla gama de funções do kernel, como para a função de kernel polinomial, podemos usar polydot (), a função de kernel tangente hiperbólica para tanhdot (), etc.
Para instalar este pacote, use o seguinte código:
install.packages('kernlab')
Para maiores informações, veja o link abaixo: pacote kernellab
explorador de dados
Este pacote R é um dos mais fáceis de usar para ciência de dados e aprendizado de máquina. Este pacote concentra-se principalmente em três objetivos:
- Análise exploratória de dados
- Engenharia de funções
- relatório de dados
Este pacote automatizou a análise exploratória de dados para modelagem preditiva e tarefas de análise visualizando cada recurso presente em nosso conjunto de dados.
Para instalar este pacote, use o seguinte código:
install.packages('Data Explorer')
Para encontrar uma visão geral ampla do nosso conjunto de dados, podemos usar o seguinte código:
introduzir(dados)
Para exibir a tabela anterior, use o seguinte código:
plot_intro(dados)
Para maiores informações, veja o link abaixo: Introdução ao DataExplorer
Acento circunflexo
Isso também é chamado de treinamento de classificação e regressão.. É um dos melhores pacotes para tarefas de ciência de dados e aprendizado de máquina. Contém um conjunto de funções usadas para criar modelos preditivos. Tem outras funcionalidades, bem como a seleção de recursos, divisão de dados, pré-processamento de dados, ajuste do modelo, importância dos recursos e muito mais.
Para instalar este pacote, use o seguinte código:
install.packages('caret')
Para maiores informações, veja o link abaixo: acento circunflexo do pacote
randomForest
Random Forest é um dos pacotes R mais populares para aprendizado de máquina.. Este pacote é usado para criar florestas aleatórias em R. Pode ser usado para tarefas de classificação e regressão. Também podemos usá-lo para treinar valores ausentes e outliers. Este pacote usa o algoritmo de floresta aleatória Breiman para construir árvores de decisão..
Para encontrar uma visão geral ampla do nosso conjunto de dados, podemos usar o seguinte código:
install.packages('randomForest')
Para maiores informações, veja o link abaixo: Floresta aleatória
Brilhante
É um pacote R usado para criar uma aplicação web interativa para ciência de dados. Ele nos ajuda a criar aplicativos web R sem muito esforço. Shiny cria aplicativos da Web que são implantados na Web usando seu servidor ou serviços de hospedagem R brilhantes. Os recursos do Shiny R incluem a criação de um aplicativo com menos conhecimento de ferramentas da web, fornece visualizações ao vivo, funções de renderização e muito mais.
Exemplo de aplicação web com shiny:
Para maiores informações, veja o link abaixo: Brilhante
aumentar
Este pacote é usado em ciência de dados para pacotes boost baseados em modelo e possui um algoritmo de descida de gradiente funcional para otimizar árvores de decisão. Ele também fornece um modelo de interação para dados de dimensões potencialmente altas..
Para instalar este pacote, use o seguinte código:
install.packages('impulsionar')
Para maiores informações, veja o link abaixo: aumentar
Completamente
É uma biblioteca de gráficos que cria gráficos interativos. É uma interface de alto nível para plotly.js, baseado em d3.js. Fornece uma interface de usuário fácil de usar para gerar gráficos D3 interativos elegantes. Esses gráficos interativos fornecem muitas funcionalidades, como a capacidade de aumentar e diminuir o zoom de gráficos, passe o mouse sobre um ponto para obter informações adicionais, filtrar dados e muito mais.
Fornece um exemplo de gráficos, como gráficos de dispersão, diagramas de linha, gráficos de barra, carrinhos circulares, diagramas de bolhas, plotagens de caixa, histogramas, Barras de erro, diagramas de violino e muito mais.
Para maiores informações, veja o link abaixo: Completamente
SuperML
Superml é um dos famosos pacotes R para IA que fornece uma interface padrão para clientes que usam dialetos de programação Python e R para construir modelos de IA.. Este pacote essencialmente fornece os destaques do Scikit Learn e a interface de previsão para preparar modelos de IA em R. Além de construir modelos de IA, existem funcionalidades convenientes para executar a engenharia de funções.
Para instalar este pacote, use o seguinte código:
install.packages('superml')
Para maiores informações, veja o link abaixo: SuperML
Obrigado por ler este artigo e por sua paciência.. Deixe-me na seção de comentários sobre comentários. Compartilhe este artigo, isso me motivará a escrever mais blogs para a comunidade de ciência de dados.
Obrigado por ler isso. se você gosta deste item, Compartilhe com seus amigos. Em caso de alguma sugestão / dúvida, Comente abaixo.
Identificação de e-mail: [e-mail protegido]
Me siga no LinkedIn: LinkedIn
A mídia mostrada neste artigo não é propriedade da DataPeaker e é usada a critério do autor.