Meilleurs forfaits R | 10 r packages que tout data scientist devrait connaître

Contenu

introduction

R est l’un des langages de programmation les plus célèbres pour l’analyse statistique et l’informatique. Parce qu’il fournit beaucoup de fonctions, les chercheurs et les scientifiques des données l’utilisent pour la science des données et l’apprentissage automatique. certaines de ces fonctionnalités incluent des bibliothèques d’affichage interactives, rapide et open source, exécution de code sans compilateur, bonne communauté et bien d’autres.

L’une des principales raisons pour lesquelles il devient très célèbre est le grand nombre de packages R pour les projets de science des données., apprentissage automatique et intelligence artificielle. Lors de l’utilisation de ces packages, les modèles prédictifs peuvent être développés facilement et efficacement. Ce blog répertorie les 10 Top R packages que vous devriez connaître dans 2021 pour la science des données et l’apprentissage automatique.

54263intro-4-6126338

Table des matières

  1. Dplyr
  2. ggplot2
  3. KernLab
  4. Explorateur de données
  5. Signe de classement
  6. au hasardForêt
  7. Brillant
  8. mboost
  9. comploter
  10. SuperML
82897intro-2-4527417

Dplyr

C’est l’un des packages R les plus utilisés pour les tâches de science des données et d’apprentissage automatique.. Ce paquet est écrit par Hadley Wickham. Utilisé pour résoudre des tâches de manipulation de données. Dispose d’un ensemble de fonctions pour la manipulation des données. Aussi appelé grammaire de manipulation de données. Il a un ensemble de verbes qui nous aident à résoudre les tâches de manipulation de données les plus difficiles comme la mutation. (), pour sélectionner (), filtre (), résumer (), organiser ().

Pour installer ce package, utilisez le code suivant:

install.paquets('dplyr')
95101dplyr-1-5866941
38409dplyr-2-9677062

Pour plus d'informations, voir le lien ci-dessous: Introduction à dplyr

ggplot2

L’un des packages R les plus populaires et les plus utilisés pour la visualisation de données et l’analyse exploratoire de données. Vous pouvez créer des visualisations de données interactives avec ce package. Il fournit un large éventail de belles intrigues qui prennent soin des moindres détails et dessinent des légendes. Ce paquet fonctionne sous une grammaire profonde appelée “Graphiques de grammaire”. Fournit un large éventail de graphiques tels que des graphiques en nuages de points et des graphiques à bulles. Les diagrammes de fluctuation sont des graphiques, histogrammes, diagrammes de densité, boîtes à moustaches, diagrammes de violon, dendrogrammes et bien d’autres.

Pour installer ce package, utilisez le code suivant:

install.paquets('gglpot2')

Vous trouverez ci-dessous quelques exemples de colis qui utilisent ce colis:

30782ggplot-1-4387283
62550ggplot-2-4614047

Pour plus d'informations, voir le lien ci-dessous: ggplot2

KernLab

Ce package est également appelé laboratoire d’apprentissage automatique basé sur le noyau. Ce package est utilisé pour la régression, classification, réduction de dimensionnalité, Détection d'une anomalie, regroupement. Si vous souhaitez utiliser des algorithmes qui impliquent une approche basée sur le noyau, peut l’utiliser comme SVM, algorithme de classification, analyse des fonctionnalités du noyau et bien d’autres. Il est largement utilisé pour les implémentations SVM. Possède un large éventail de fonctions du noyau, comme pour la fonction noyau polynomial, nous pouvons utiliser polydot (), la fonction de noyau tangent hyperbolique pour tanhdot (), etc.

Pour installer ce package, utilisez le code suivant:

install.paquets('kernlab')
Les 10 meilleurs packages R SVM

Pour plus d'informations, voir le lien ci-dessous: Package Kernlab

Explorateur de données

Ce package R est l’un des plus faciles à utiliser pour la science des données et l’apprentissage automatique. Ce paquet se concentre principalement sur trois objectifs:

  1. L'analyse exploratoire des données
  2. Ingénierie fonctionnelle
  3. Rapport de données

Ce package automatise l’analyse exploratoire des données pour les tâches de modélisation prédictive et d’analyse en visualisant chaque fonctionnalité présente dans notre ensemble de données..

Pour installer ce package, utilisez le code suivant:

install.paquets('DataExplorer')

Pour trouver un aperçu complet de notre ensemble de données, nous pouvons utiliser le code suivant:

Introduit(Les données)
85069Réf. 1-3062253

Pour afficher le tableau ci-dessus, utilisez le code suivant:

plot_intro(Les données)
80889de-2-9592146

Pour plus d'informations, voir le lien ci-dessous: Introduction à DataExplorer

Signe de classement

Cela s'appelle aussi entraînement de clasificación y regresión. C’est l’un des meilleurs packages pour les tâches de science des données et d’apprentissage automatique. Contient un ensemble de fonctions utilisées pour créer des modèles prédictifs. Il a d’autres fonctionnalités, ainsi que la sélection des fonctionnalités, division des données, prétraitement des données, réglage du modèle, importance des fonctionnalités et bien d’autres.

Pour installer ce package, utilisez le code suivant:

install.paquets('caret')
55236caret-7845711

Pour plus d'informations, voir le lien ci-dessous: Forfait Caret

au hasardForêt

Random Forest est l’un des packages R les plus populaires pour l’apprentissage automatique. ce package est utilisé pour créer des forêts aléatoires dans r. Peut être utilisé pour les tâches de classification et de régression. Nous pouvons également l’utiliser pour entraîner les valeurs perdues et les valeurs aberrantes. Ce paquet utilise l’algorithme de forêt aléatoire de Breiman pour construire des arbres de décision.

Pour trouver un aperçu complet de notre ensemble de données, nous pouvons utiliser le code suivant:

install.paquets('randomForest')
67970rf-8684404

Pour plus d'informations, voir le lien ci-dessous: Forêt aléatoire

Brillant

87499brillant-2985063

Il s’agit d’un package R utilisé pour créer une application Web interactive pour la science des données. Nous aide à créer des applications Web R sans trop d’efforts. Shiny crée des applications Web qui sont déployées sur le Web à l’aide de son serveur ou de ses services d’hébergement R shiny. Les fonctionnalités de R shiny incluent la création d’une application avec moins de connaissances sur les outils Web, fournit des vues en direct, fonctions de rendu et bien d’autres.

Exemple d’application Web Shiny:

51991Sh-1-2349198
67102Sh-2-9225181

Pour plus d'informations, voir le lien ci-dessous: Brillant

mboost

Este paquete se utiliza en ciencia de datos para paquetes de impulso basados ​​en modelos y tiene un algoritmo funcional de descenso de pente para optimizar los árboles de decisión. También proporciona un modelo de interacción para datos potencialmente de alta dimension.

Pour installer ce package, utilisez le code suivant:

install.paquets('mboost')
84361boost-2843191
90326boost-1-9651129

Pour plus d'informations, voir le lien ci-dessous: mboost

comploter

Il s’agit d’une bibliothèque graphique qui crée des graphiques interactifs. C’est une interface de haut niveau pour l’intrigue.js, basé sur d3.js. Fournit une interface utilisateur facile à utiliser pour générer des graphiques D3 interactifs élégants. Ces graphiques interactifs offrent de nombreuses fonctionnalités, tels que la possibilité de zoomer et de dézoomer sur les graphiques, survolez un point pour obtenir des informations supplémentaires, filtrer les données et bien plus encore.

56890parcelle-7978258

Fournit un exemple de graphiques sous forme de nuages de points, diagrammes linéaires, diagramme à barres, chariots circulaires, diagrammes à bulles, boîtes à moustaches, histogrammes, barres d’erreur, diagrammes de violon et bien plus encore.

67890parcelle-1-2275707

Pour plus d'informations, voir le lien ci-dessous: comploter

SuperML

Superml est l’un des célèbres packages R pour l’IA qui fournit une interface standard aux clients utilisant des dialectes de programmation Python et R pour construire des modèles d’IA.. Ce package fournit essentiellement les points forts de Scikit Learn et prédit l’interface pour la préparation des modèles d’IA dans R. En plus de construire des modèles d’IA, il existe des fonctionnalités pratiques pour effectuer l’ingénierie des fonctions.

Pour installer ce package, utilisez le code suivant:

install.paquets('superml')

Pour plus d'informations, voir le lien ci-dessous: SuperML

Merci d'avoir lu cet article et de votre patience.. Laissez-moi dans la section commentaire sur les commentaires. Partagez cet article, cela me donnera la motivation d'écrire plus de blogs pour la communauté de la science des données.

Merci d'avoir lu ceci. Si vous aimez cet article, Partage-le avec tes amis. En cas de suggestion / doute, commentaires ci-dessous.
Identification de l'e-mail: [email protégé]
Suivez-moi sur LinkedIn: LinkedIn

Les médias présentés dans cet article ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.