Sistema de recomendaciones: comprensión de los conceptos básicos

Contenidos

Introducción

En este blog, discutiré varias cosas sobre el sistema de recomendación, como ¿qué es el sistema de recomendación? ¿Cuáles son sus casos de uso? Cuántos tipos de sistemas de recomendación y métricas se usan para esto.

En la imagen de arriba de Amazon, es factible que haya visto esta página muchas veces cuando intenta comprar algo en Amazon. Estas son las recomendaciones del producto que está tratando de comprar y se sorprenderá al saber que el 35% de los ingresos de Amazon proviene de estos motores de recomendación. Ahora es factible que haya notado la potencia del motor de recomendaciones. En la actualidad, todas las compañías pequeñas y grandes usan un motor de recomendación. Por lo tanto ahora déjame discutir esto.

¿Qué es el sistema de recomendación?

Un sistema de recomendación es una subclase de sistemas de filtrado de información que busca predecir la calificación o la preferencia que un usuario podría dar a un post. En palabras simples, es un algoritmo que sugiere ítems relevantes para los usuarios. A modo de ejemplo: en el caso de Netflix, qué película ver, en el caso del comercio electrónico, qué producto comprar, o en el caso de kindle, qué libro leer, etc.

Casos de uso del sistema de recomendación

Hay muchos casos de uso. Algunos son

UNA. Contenido personalizado: Ayuda a mejorar la experiencia en el sitio al crear recomendaciones dinámicas para diferentes tipos de audiencias como lo hace Netflix.

B. Mejor experiencia de búsqueda de productos: Ayuda a categorizar el producto en función de sus características. A modo de ejemplo: material, temporada, etc.

TIPOS DE SISTEMA DE RECOMENDACIONES

1. Filtrado basado en contenido

En este tipo de sistema de recomendación, los ítems relevantes se muestran usando el contenido de los ítems previamente buscados por los usuarios. Aquí el contenido se refiere al atributo / etiqueta del producto que le gusta al usuario. En este tipo de sistema, los productos se etiquetan a través de determinadas palabras clave, posteriormente el sistema intenta comprender lo que quiere el usuario y busca en su base de datos y por último intenta recomendar diferentes productos que el usuario desea.

Tomemos un ejemplo del sistema de recomendación de películas en el que cada película está relacionada con sus géneros, lo que en el caso anterior se denomina etiqueta / atributos. Ahora supongamos que viene el usuario A e inicialmente el sistema no tiene ningún dato sobre el usuario A. por lo tanto inicialmente, el sistema intenta recomendar las películas populares a los usuarios o el sistema intenta obtener información del usuario al obtener un formulario llenado por el usuario. Después de un tiempo, los usuarios podrían haberle dado una calificación a algunas de las películas, dado que le da una buena calificación a las películas sustentadas en el género de acción y una mala calificación a las películas sustentadas en el género de anime. Por lo tanto aquí el sistema recomienda películas de acción a los usuarios. Pero aquí no se puede decir que al usuario no le gustan las películas de animación debido a que tal vez al usuario no le guste esa película debido a alguna otra razón como la actuación o la historia, pero en realidad le gustan las películas de animación y necesita más datos en esta circunstancia.

Ventaja

  • El modelo no necesita datos de otros usuarios dado que las recomendaciones son específicas para un solo usuario.
  • Facilita la ampliación a una gran cantidad de usuarios.
  • El modelo puede capturar los intereses específicos del usuario y puede recomendar ítems en los que muy pocos usuarios están interesados.

Desventaja

  • La representación de características de los ítems está diseñada a mano hasta cierto punto, esta tecnología necesita mucho conocimiento del dominio.
  • El modelo solo puede hacer recomendaciones sustentadas en el interés existente de un usuario. Dicho de otra forma, el modelo cuenta con una capacidad limitada para expandir los intereses existentes del usuario.

2. Filtrado basado en colaboración

Recomendar los nuevos ítems a los usuarios en función del interés y la preferencia de otros usuarios similares es simplemente un filtrado basado en la colaboración. A modo de ejemplo: – Cuando compramos en Amazon, recomienda nuevos productos que dicen «El cliente que trajo esto además trajo» Como se muestra abajo.

Esto supera la desventaja del filtrado basado en contenido, dado que utilizará la Interacción del usuario en lugar del contenido de los ítems utilizados por los usuarios. Para esto, solo necesita el desempeño histórico de los usuarios. Basado en los datos históricos, asumiendo que el usuario que ha estado de acuerdo en el pasado tiende a estar de acuerdo además en el futuro.

Hay 2 tipos de filtrado colaborativo: –

A. Filtrado colaborativo basado en el usuario

La calificación del post se realiza usando la calificación de los usuarios vecinos. Resumidamente, se basa en la noción de similitud de los usuarios.

Veamos un ejemplo. En el lado izquierdo, puede ver una imagen en la que 3 niños nombraron A, B, C y 4 frutas, dicho de otra forma, uvas, fresa, sandía y naranja, respectivamente.

Con base en la imagen, supongamos que A compró las 4 frutas, B compró solo fresa y C compró fresa y sandía. Aquí A & C son tipos similares de usuarios debido a que se recomendarán C Grapes y Orange como se muestra en la línea de puntos.

B. Filtrado colaborativo basado en ítems

La calificación del elemento se predice usando la propia calificación del usuario en los ítems vecinos. En palabras simples, se basa en la noción de similitud de ítems.

Veamos con un ejemplo como se dijo previamente sobre usuarios y ítems. Aquí la única diferencia es que vemos posts similares, no usuarios similares, como si ve uvas y sandía, se dará cuenta de que la sandía la compran todos, pero las uvas las compran los Niños A y B. Por eso, a los Niños C se les recomienda uvas.

Ahora, después de comprender ambos, es factible que se pregunte cuál utilizar y cuándo. Esta es la respuesta si el número de ítems es mayor que el número de usuarios opta por el filtrado colaborativo basado en el usuario, dado que reducirá la potencia de cálculo y si el número de usuarios es mayor que el número de ítems, elija el filtrado colaborativo basado en ítems. . A modo de ejemplo, Amazon tiene cientos de millones de posts para comercializar, pero tiene cientos de millones de clientes. Por eso, Amazon utiliza el filtrado colaborativo basado en ítems debido a menos no. de productos en comparación con sus clientes.

Ventaja

  • Funciona bien inclusive si los datos son pequeños.
  • Este modelo ayuda a los usuarios a descubrir un nuevo interés en un post determinado, pero es factible que el modelo aún lo recomiende debido a que usuarios similares están interesados ​​en ese post.
  • Sin necesidad de conocimientos de dominio

Desventaja

  • No puede manejar ítems nuevos debido a que el modelo no se entrena en los ítems recién agregados en la base de datos. Este problema se conoce como problema de arranque en frío.
  • Característica secundaria No tiene mucha relevancia. Aquí, las características secundarias pueden ser el nombre del actor o el año de estreno en el contexto de la recomendación de la película.

MÉTRICAS DE EVALUACIÓN

Como hemos discutido diferentes tipos de sistemas de recomendación, sus ventajas y desventajas, pero cómo podemos examinar si el modelo dado está recomendando las cosas correctas o no y cuántas cosas relevantes predice este sistema y aquí vienen las métricas de evaluación. Hay varias métricas para examinar el modelo, pero aquí discutiremos 4 métricas principales.

1. Media Precisión media en K

Da qué tan relevante es la lista de ítems recomendados. Aquí la precisión en K significa ítems recomendados en los k principales conjuntos que son relevantes.

2. Cobertura

Es el porcentaje de ítems en el modelo de datos de entrenamiento que se pueden recomendar en conjuntos de prueba. O simplemente, el porcentaje de un factible sistema de recomendación puede predecir.

3. Personalización

Simplemente, se trata de cuántos ítems iguales recomienda el modelo a diferentes usuarios. O la diferencia entre listas de usuarios y recomendaciones.

4. Similitud intralista

Es una similitud de coseno promedio de todos los ítems de una lista de recomendaciones.

CONCLUSIÓN

Este blog cubrió muchos temas relacionados con los motores de recomendación como Qué son y sus casos de uso. Aparte de esto, diferentes tipos de sistemas de recomendación como el filtrado basado en contenido y el filtrado basado en colaboración y en el filtrado colaborativo además basado en el usuario así como basado en ítems junto con sus ejemplos, ventajas y desventajas, y por último las métricas de evaluación para examinar el modelo.

Los medios que se muestran en este post no son propiedad de DataPeaker y se usan a discreción del autor.

Suscribite a nuestro Newsletter

No te enviaremos correo SPAM. Lo odiamos tanto como tú.