Système de recommandations: comprendre les bases

Partager sur Facebook
Partager sur Twitter
Partager sur lié
Partager sur télégramme
Partager sur WhatsApp

Contenu

introduction

Dans ce blog, Je vais discuter de diverses choses sur le système de recommandation, comme quel est le système de recommandation? Quels sont vos cas d'utilisation? Combien de types de systèmes de recommandation et de métriques sont utilisés pour cela.

Dans l'image ci-dessus d'Amazon, vous avez peut-être vu cette page plusieurs fois en essayant d'acheter quelque chose sur Amazon. Ce sont les recommandations du produit que vous essayez d'acheter et vous serez surpris de savoir que le 35% des revenus d'Amazon proviennent de ces moteurs de recommandation. Vous avez peut-être remarqué la puissance du moteur de recommandation. Actuellement, toutes les petites et grandes entreprises utilisent un moteur de recommandation. Alors maintenant, permettez-moi de discuter de cela.

Quel est le système de recommandation?

Un système de recommandation est une sous-classe de systèmes de filtrage d'informations qui cherche à prédire la note ou la préférence qu'un utilisateur pourrait donner à une publication.. En mots simples, est un algorithme qui suggère des éléments pertinents pour les utilisateurs. Par exemple: dans le cas de Netflix, quel film regarder, dans le cas du commerce électronique, quel produit acheter, ou dans le cas du Kindle, quel livre lire, etc.

Cas d'utilisation du système de recommandation

Il existe de nombreux cas d'utilisation. Certains sont

ONGLE. Contenu personnalisé: Aide à améliorer l'expérience du site en créant des recommandations dynamiques pour différents types de publics comme le fait Netflix.

B. Meilleure expérience de recherche de produits: Aide à catégoriser le produit en fonction de ses caractéristiques. Par exemple: Matériel, saison, etc.

TYPES DE SYSTÈME DE RECOMMANDATION

1. Filtrage basé sur le contenu

Dans ce type de système de recommandation, les éléments pertinents sont affichés en utilisant le contenu des éléments précédemment recherchés par les utilisateurs. Ici, le contenu fait référence à l'attribut / étiquette du produit que l'utilisateur aime. Dans ce type de système, les produits sont étiquetés à l'aide de certains mots-clés, plus tard, le système essaie de comprendre ce que veut l'utilisateur et recherche sa base de données et essaie enfin de recommander différents produits que l'utilisateur veut.

Prenons un exemple du système de recommandation de films où chaque film est lié à ses genres, ce qu'on appelle dans le cas précédent une étiquette / les attributs. Supposons maintenant que l'utilisateur A vienne et qu'initialement le système ne dispose d'aucune donnée sur l'utilisateur A. donc au départ, le système essaie de recommander des films populaires aux utilisateurs ou le système essaie d'obtenir des informations de l'utilisateur en faisant remplir un formulaire par l'utilisateur. Après un certain temps, les utilisateurs ont peut-être donné une note à certains films, étant donné qu'il donne une bonne note aux films basés sur le genre action et une mauvaise note aux films basés sur le genre anime. Par conséquent, ici, le système recommande des films d'action aux utilisateurs. Mais ici, on ne peut pas dire que l'utilisateur n'aime pas les films d'animation car peut-être que l'utilisateur n'aime pas ce film pour une autre raison comme le jeu d'acteur ou l'histoire, mais en fait, vous aimez les films d'animation et avez besoin de plus de données dans cette circonstance.

Avantage

  • Le modèle n'a pas besoin de données d'autres utilisateurs car les recommandations sont spécifiques à un seul utilisateur.
  • Facilite l'adaptation à un grand nombre d'utilisateurs.
  • Le modèle peut capturer les intérêts spécifiques de l'utilisateur et peut recommander des éléments qui intéressent très peu d'utilisateurs..

Désavantage

  • La représentation des caractéristiques de l'article est conçue à la main dans une certaine mesure, cette technologie a besoin de beaucoup de connaissances dans le domaine.
  • Le modèle ne peut faire que des recommandations basées sur l'intérêt existant d'un utilisateur. En d'autres termes, le modèle a une capacité limitée à élargir les intérêts existants de l'utilisateur.

2. Filtrage basé sur la collaboration

Recommander de nouveaux éléments aux utilisateurs en fonction de l'intérêt et des préférences d'autres utilisateurs similaires est simplement un filtrage basé sur la collaboration. Par exemple: – Lorsque nous achetons sur Amazon, recommande de nouveaux produits qui disent “Le client qui a apporté ceci a également apporté” Comme indiqué ci-dessous.

Cela surmonte les inconvénients du filtrage basé sur le contenu, car il utilisera l'interaction utilisateur au lieu du contenu des éléments utilisés par les utilisateurs. Pour ca, vous n'avez besoin que des performances historiques des utilisateurs. Basé sur des données historiques, en supposant que l'utilisateur qui a donné son accord dans le passé tend à être également d'accord à l'avenir.

Il y a 2 types de filtrage collaboratif: –

UNE. Filtrage collaboratif basé sur les utilisateurs

La notation de la publication se fait en utilisant la notation des utilisateurs voisins. Brièvement, repose sur la notion de similitude des utilisateurs.

Voyons un exemple. Sur le côté gauche, vous pouvez voir une image où 3 enfants nommés A, B, C y 4 des fruits, En d'autres termes, raisin, fraise, pastèque et orange, respectivement.

Basé sur l'image, Supposons que A ait acheté le 4 des fruits, B n'a acheté que des fraises et C a acheté des fraises et de la pastèque. Voici un & C sont des types d'utilisateurs similaires car C Raisins et Orange seront recommandés comme indiqué sur la ligne pointillée.

B. Filtrage collaboratif basé sur les éléments

La note de l'article est prédite en utilisant la propre note de l'utilisateur sur les articles voisins. En mots simples, repose sur la notion de similarité d'item.

Voyons avec un exemple comme dit précédemment sur les utilisateurs et les éléments. Ici, la seule différence est que nous voyons des messages similaires, aucun utilisateur similaire, comme si tu voyais du raisin et de la pastèque, vous vous rendrez compte que la pastèque est achetée par tout le monde, mais les raisins sont achetés par les enfants A et B. Pour cela, Les enfants C sont des raisins recommandés.

À présent, après avoir compris les deux, vous pouvez vous demander lequel utiliser et quand. C'est la réponse si le nombre d'éléments est supérieur au nombre d'utilisateurs opte pour le filtrage collaboratif en fonction de l'utilisateur, car cela réduira la puissance de calcul et si le nombre d'utilisateurs est supérieur au nombre d'éléments, choisir le filtrage collaboratif basé sur les éléments. . Par exemple, Amazon a des centaines de millions de publications sur le marché, mais il a des centaines de millions de clients. Pour cela, Amazon utilise un filtrage collaboratif basé sur les éléments en raison de moins de non. de produits par rapport à vos clients.

Avantage

  • Fonctionne bien même si les données sont petites.
  • Ce modèle aide les utilisateurs à découvrir un nouvel intérêt pour un certain poste., mais il est possible que le modèle le recommande toujours car des utilisateurs similaires sont intéressés par ce poste.
  • Pas besoin de connaissance du domaine

Désavantage

  • Il ne peut pas gérer les nouveaux éléments car le modèle ne s'entraîne pas sur les éléments nouvellement ajoutés dans la base de données. Ce problème est connu sous le nom de problème de démarrage à froid..
  • Caractéristique secondaire Peu pertinent. Ici, les caractéristiques secondaires peuvent être le nom de l'acteur ou l'année de sortie dans le cadre de la recommandation du film.

MÉTRIQUES D'ÉVALUATION

Comment nous avons discuté des différents types de systèmes de recommandation, ses avantages et ses inconvénients, mais comment pouvons-nous examiner si le modèle donné recommande les bonnes choses ou non et combien de choses pertinentes ce système prédit et voici les métriques d'évaluation. Il existe plusieurs métriques pour examiner le modèle, mais ici nous discuterons 4 principales métriques.

1. Moyenne Précision moyenne en K

Donnez la pertinence de la liste des articles recommandés. Ici, la précision de K signifie les éléments recommandés dans les principaux ensembles de k qui sont pertinents..

2. Couverture

C'est le pourcentage d'éléments dans le modèle de données d'entraînement qui peut être recommandé dans les ensembles de test. Ou simplement, le pourcentage d'un système de recommandation réalisable peut prédire.

3. Personnalisation

Simplement, il s'agit du nombre d'articles identiques que le modèle recommande à différents utilisateurs. Ou la différence entre les listes d'utilisateurs et les recommandations.

4. Similitude intraliste

C'est une similitude du cosinus moyen de tous les éléments d'une liste de recommandations.

CONCLUSION

Ce blog a couvert de nombreux sujets liés aux moteurs de recommandation tels que ce qu'ils sont et leurs cas d'utilisation. A part ça, différents types de systèmes de recommandation tels que le filtrage basé sur le contenu et le filtrage basé sur la collaboration et le filtrage collaboratif ainsi que basé sur l'utilisateur et sur l'élément avec leurs exemples, avantages et inconvénients, et enfin les métriques d'évaluation pour examiner le modèle.

Les médias présentés dans cet article ne sont pas la propriété de DataPeaker et sont utilisés à la discrétion de l'auteur.

Abonnez-vous à notre newsletter

Nous ne vous enverrons pas de courrier SPAM. Nous le détestons autant que vous.