Mathématiques pour l'apprentissage automatique | Mathématiques pour la science des données

Contenu

Cet article a été publié dans le cadre du Blogathon sur la science des données

51102ml-8797358

Êtes-vous un scientifique des données en herbe qui est fasciné par la façon dont les choses fonctionnent dans le monde de la science des données et de l'apprentissage automatique ?? Bon, félicitations pour avoir choisi le bon cheminement de carrière qui répond le mieux à vos besoins en ce moment. Cependant, Saviez-vous que vous devez maîtriser les mathématiques pour l'apprentissage automatique et la science des données? Oui, tu as bien entendu.

Peu importe le type de relation amour-haine que vous avez eu avec les mathématiques à l'école. Les concepts de base utilisés en mathématiques et en statistiques sont en fait très utiles pour prendre des décisions stratégiques lors de la conception de modèles d'apprentissage automatique.. Ensuite, si vous avez décidé de choisir cette carrière dans le domaine de la science des données, vous devez commencer à aimer les concepts des mathématiques et les mettre en œuvre dans votre avenir, car c'est l'une des conditions préalables à l'apprentissage automatique.

Quelle est la corrélation entre l'apprentissage automatique et les mathématiques?

18057whatsapp20image202021-05-3120à208-41-4320pm201-6071198

L'apprentissage automatique est une question de mathématiques, qui à son tour aide à créer un algorithme qui peut apprendre des données pour faire une prédiction précise. La prédiction peut être aussi simple que de classer les chiens ou les chats à partir d'un certain ensemble d'images ou quels types de produits recommander à un client en fonction des achats précédents.. Donc, il est très important de bien comprendre les concepts mathématiques derrière tout algorithme d'apprentissage automatique de base. De cette façon, vous aide à choisir tous les bons algorithmes pour votre projet de science des données et de machine learning.

L'apprentissage automatique repose principalement sur des prérequis mathématiques, tant que vous pouvez comprendre pourquoi les mathématiques sont utilisées, tu le trouveras plus intéressant. Avec ça, vous comprendrez pourquoi nous choisissons un algorithme d'apprentissage automatique plutôt qu'un autre et comment il affecte les performances du modèle d'apprentissage automatique.

Points à couvrir dans cet article de blog

  1. Quels concepts mathématiques sont impliqués dans l'apprentissage automatique?

  2. Pourquoi avez-vous besoin de mathématiques dans les projets d'apprentissage automatique?

  3. Quelle est la bonne façon de l'apprendre?

Dans l'article de blog d'aujourd'hui, nous discuterons exactement de tous les concepts mathématiques dont vous avez besoin pour apprendre à maîtriser les concepts de science des données et d'apprentissage automatique. Nous apprendrons également pourquoi nous utilisons les mathématiques dans l'apprentissage automatique avec quelques exemples.

Commençons par examiner les nombreuses formes de mathématiques utilisées dans la science des données et l'apprentissage automatique afin que vous puissiez mieux comprendre ce que vous devez vraiment savoir sur les mathématiques pour la profession de la science des données..

Quels concepts mathématiques sont mis en œuvre dans la science des données et l'apprentissage automatique

L'apprentissage automatique est basé sur quatre concepts critiques et est statistique, algèbre linéaire, probabilité et calcul. Alors que les concepts statistiques sont la partie centrale de chaque modèle, le calcul nous aide à apprendre et à optimiser un modèle. L'algèbre linéaire est exceptionnellement utile lorsqu'il s'agit de traiter un grand ensemble de données, et la probabilité aide à prédire la survie des événements qui se produiront.. Ce sont les concepts mathématiques que vous rencontrerez assez souvent dans votre carrière en science des données et en apprentissage automatique..

Concepts mathématiques importants pour l'apprentissage automatique et la science des données:

  1. Algèbre linéaire

  2. Calcul

  3. Théorie des probabilités

  4. Mathématiques discrètes

  5. Statistiques

97735whatsapp20image202021-05-3120à208-41-4420pm-5736471

Concept d'algèbre linéaire en apprentissage automatique:

Comprendre comment construire des équations linéaires est un élément essentiel dans le développement d'algorithmes d'apprentissage automatique de base.. Ceux-ci seront utilisés pour évaluer et observer la collecte de données. L'algèbre linéaire est appliquée dans les algorithmes d'apprentissage automatique sur les fonctions de perte, régularisation, matrices de covariance, décomposition en valeur singulière (SVD), opérations matricielles et classification des machines à vecteurs de support. Il est également appliqué dans les algorithmes d'apprentissage automatique tels que la régression linéaire. Ce sont les concepts nécessaires pour comprendre les méthodes d'optimisation utilisées pour l'apprentissage automatique.

Pour effectuer une analyse en composantes principales qui est utilisée pour réduire la dimensionnalité des données, on utilise l'algèbre linéaire. L'algèbre linéaire est également largement utilisée dans les réseaux de neurones pour le rendu et le traitement des réseaux. Inutile de dire que vous devez être intéressé par l'algèbre linéaire, car il est largement utilisé dans le domaine de la science des données.

Cependant, ne sois pas intimidé par ça, car la compréhension des concepts sera importante, mais vous n'avez pas besoin d'être un expert en algèbre linéaire pour résoudre la plupart des problèmes. Seule une solide compréhension des concepts sera suffisante. Math for Machine Learning de Marc Peter deisenroth est un excellent livre qui vous aidera à démarrer ce voyage si vous avez des difficultés avec les mathématiques au début..

Calcul en machine learning:

De nombreux élèves qui n'aimaient pas apprendre le calcul qu'on leur a enseigné à l'école seront durement touchés., car il fait partie intégrante de l'apprentissage automatique. Heureusement, vous n'avez peut-être pas besoin d'être compétent en calcul, il est seulement important d'apprendre et de comprendre les principes du calcul. En outre, vous devez comprendre les applications pratiques de l'apprentissage automatique par le calcul lors de la construction du modèle.

Ensuite, si vous comprenez comment la dérivée de la fonction renvoie son taux de variation dans le calcul, comprendre le concept de descente de pente. Dans la descente de pente, nous devons trouver les minima locaux pour une fonction et ainsi de suite. Si vous avez des points de selle ou plusieurs minima, une descente de pente peut trouver un minimum local et non un minimum global, sauf si vous partez de plusieurs points. Certains des sujets nécessaires pour maîtriser la partie calcul en science des données sont le calcul différentiel et intégral, Dérivés partiels, Fonctions de valeur vectorielle, Dégradés directionnels.

Le calcul multivarié est utilisé dans l'apprentissage des algorithmes, ainsi que dans la descente de pentes. Dérivés, divergence, la courbure et les approximations quadratiques sont des concepts importants que vous pouvez apprendre et mettre en œuvre.

L'apprentissage automatique des mathématiques peut vous sembler intimidant en ce moment, cependant, vous serez en mesure de comprendre les concepts informatiques nécessaires pour créer un modèle d'apprentissage automatique réussi en quelques jours d'apprentissage constructif.

Utilisation de statistiques descriptives

Les statistiques descriptives sont un concept fondamental que tout chercheur de données en herbe doit apprendre à comprendre l'apprentissage automatique lorsqu'il travaille avec des classifications telles que la régression logistique., répartitions, analyse de discrimination et test d'hypothèse.

Si j'avais du mal avec les statistiques à l'école, alors vous devez mettre votre 200 pour cent pour apprendre la partie mathématique des statistiques, car il est essentiel pour vous de devenir un data scientist performant. Pour le dire plus simplement, les statistiques sont la partie principale des mathématiques pour l'apprentissage automatique. Certaines des statistiques fondamentales nécessaires au ML sont la combinatoire, Axiomes, Théorème de Bayes, Écart et attente, Variables aléatoires, Distributions conditionnelles et conjointes.

Mathématiques discrètes dans l'apprentissage automatique

Les mathématiques discrètes traitent des nombres non continus, la plupart du temps des entiers. De nombreuses applications nécessitent l'utilisation de nombres discrets. Lors de la planification d'une flotte de taxis, par exemple, ne peut pas être envoyé 0,34 Taxis; vous devez envoyer les complets. Je ne peux pas avoir la moitié du facteur ou lui faire visiter 1 lieux et demi pour livrer les lettres.

De nombreuses structures de l'intelligence artificielle sont discrètes. Una neuronal rouge, par exemple, a un nombre entier de nœuds et d'interconnexions. Ne peut pas avoir 0,65 nœuds ou un neuvième d'un lien. Par conséquent, les mathématiques utilisées pour construire un réseau de neurones doivent inclure un élément discret, l'entier représente le nombre de nœuds et d'interconnexions.

Vous pouvez vous en sortir avec les principes fondamentaux des mathématiques discrètes pour l'apprentissage automatique, sauf si vous voulez travailler avec des domaines relationnels, modèles graphiques, problèmes combinatoires, prédiction structurée, etc. Pour maîtriser ces notions, doit consulter des livres sur les mathématiques discrètes. Heureusement pour les diplômés en informatique, ces concepts sont suffisamment couverts dans votre université. Cependant, d'autres devront peut-être faire plus d'efforts pour comprendre ce sujet. Donc, les mathématiques discrètes sont une composante très importante de l'IA & ML.

11332qu

Théorie des probabilités en apprentissage automatique

Pour travailler correctement dans un projet de modélisation prédictive d'apprentissage automatique, il serait raisonnable de conclure que la probabilité est essentielle.

L'apprentissage automatique est le processus de création de modèles de prédiction à partir de données ambiguës. Travailler avec des informations erronées ou incomplètes est ce qui conduit à l'incertitude.

L'incertitude est cruciale pour l'apprentissage automatique, cependant, c'est l'un des éléments qui crée plus de difficultés pour les nouveaux arrivants, en particulier ceux qui viennent de l'expérience de programmation.

En apprentissage automatique, il y a trois sources principales d'incertitude: données bruyantes, couverture limitée de la zone à problème et, bien sûr, modèles imparfaits. Cependant, à l'aide des bons outils de probabilité, on peut estimer la solution du problème.

La probabilité est essentielle pour les tests d'hypothèses et de distributions telles que la distribution gaussienne et la fonction de densité de probabilité.

Regardons maintenant les applications une fois que nous avons analysé les types en mathématiques et en science des données.

Pourquoi devriez-vous vous soucier des mathématiques? Pourquoi avez-vous besoin de mathématiques dans les projets d'apprentissage automatique?

Il existe de nombreuses raisons pour lesquelles les mathématiques pour l'apprentissage automatique sont importantes, et je vais partager quelques-uns des conseils importants ci-dessous:

  • Choisir le meilleur algorithme nécessite de prendre en compte la précision, temps de formation, la complexité du modèle, le nombre de paramètres et le nombre de fonctions.

  • Choix des valeurs des paramètres et méthodes de validation.

  • Comprendre la compensation de biais-variance vous permet d'identifier les problèmes de surajustement et de mauvais ajustement qui se produisent généralement lors de l'exécution du programme.

  • Détermination de l'intervalle de confiance et de l'incertitude corrects.

Quelle est la bonne façon d'apprendre les mathématiques pour la science des données et l'apprentissage automatique?

24384stencil-default-8961707

Bien qu'il existe de nombreuses ressources précieuses disponibles sur Internet qui expliquent des concepts tels que le calcul de vecteurs de décomposition matricielle, la matrice géométrique analytique d'algèbre linéaire, les mathématiques derrière l'analyse en composantes principales et les machines à vecteurs de support. Toutes les ressources ne sont pas une solution complète pour votre compréhension. Donc, J'ai compilé une liste de livres, Sites Web et chaînes YouTube qui peuvent vous aider à améliorer votre concept théorique dans le domaine de l'intelligence artificielle.

  1. Mathématiques pour l'apprentissage automatique de Marc Peter Deisenroth est le livre qui peut vous aider à démarrer votre voyage en mathématiques. Les applications pratiques des algorithmes et les mathématiques qui les sous-tendent ont été clairement expliquées. Tous les concepts des mathématiques ont été expliqués correctement. Vous pouvez consulter le pdf en ligne ici -https: //mml-book.github.io/book/mml-book.pdf

  2. Calcul multivarié par l'Imperial College de Londres – L'Imperial College de Londres a essentiellement créé une série YouTube qui couvre les concepts importants du calcul multivarié et son application dans divers algorithmes ml.. Bien que l'ensemble du cours soit en collaboration avec Coursera, L'Imperial College London l'a mis gratuitement à la disposition de tous les étudiants curieux.

  3. Cours de la Khan Academy sur Algèbre linéaire, Probabilité et statistique, Calcul multivariable, Oui Amélioration– Une ressource très complète et gratuite disponible pour tous les étudiants pour approfondir leurs connaissances de concepts complexes tels que la matrice de géométrie analytique d'algèbre linéaire.

  4. Toutes les statistiques: un cours concis en inférence statistique par Larry Wasserman est censé être une autre ressource complète qui contient une explication détaillée de concepts importants tels que

  5. De Udacity Introduction aux statistiques– est une autre ressource gratuite grâce à laquelle vous pouvez acquérir un niveau initial de compréhension dans le domaine des statistiques qui est nécessaire pour la science des données.

conclusion

Il vous faudra entre 3 Oui 4 mois pour apprendre des concepts mathématiques et les mettre en pratique. Consultez les ressources mentionnées ci-dessus et n'oubliez pas de continuer à l'apprendre avec les algorithmes d'apprentissage automatique afin que vous puissiez comprendre quel est le bon algorithme à choisir pour votre modèle..

Les supports présentés dans cet article ne sont pas la propriété d'Analytics Vidhya et sont utilisés à la discrétion de l'auteur..

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.